AI競賽如火如荼 Meta參戰推大型語言模型「LLaMA」
群媒體公司Meta昨天發佈報告,該公司推出用於AI相關研究應用工具LLaMA,並嘗試加入微軟、Google的行列。(圖/unsplash)
隨著微軟OpenAI的ChatGPT的推出,人工智慧(AI)瞬間成為最火熱的話題,包括Google甚至是中國百度都致力研發相關產品,AI顯然已成為科技行業投資的亮點。社群媒體公司Meta昨天(24日)發佈報告,該公司推出用於AI相關研究應用工具LLaMA,並嘗試加入微軟、Google的行列,在ChatGPT掀起的AI大戰中創造話題。
正在AI競賽如火如荼展開之際,Meta執行長祖克柏透過Instagram介紹這項名為「LLaMA」的大型語言模型,與ChatGPT或Bing不同,這不是一個任何人都可以與之交談的系統。它是一種研究工具,在產出文本、對話、整理文檔以及進行更複雜任務等方面展現巨大潛力,例如解決數學問題或是進行科學研究。
為此,Meta 在專注於研究用例的非商業許可下發布了 LLaMA(實際上不是一個系統,而是四個不同大小的模型),但目前LLaMA未應用於旗下產品,包含Facebook和 Instagram。公司計劃授予大學、非政府組織和行業實驗室等團體訪問權限。
該公司表示,整個人工智能社區例如學術研究人員、民間社會、政策制定者和行業必須共同努力,圍繞負責任的人工智慧,特別是負責任的大型語言模型,制定明確的指導方針。期待看到社區可以使用LLaMA學習並最終構建什麼。
大型語言模型形同大型 AI 系統,可透過吸收大量新聞文章、社群貼文或其他網路資源的數位文本進行資料訓練,近期討論度極高的ChatGPT,便是利用OpenAI的大型語言模型GPT-3開發出來的聊天機器人。
Meta的發布也很引人注目,部分原因是它錯過了圍繞AI聊天機器人的一些熱門話題。不過考慮到微軟因倉促推出Bing,而受到的批評以及谷歌在其聊天機器人在演示中出錯後股價暴跌,這可能不是件壞事。
Meta 過去曾推出名為「OPT-175B」的大型語言模型,但反響不佳。並在去年底發布另一款模型「Galactica」軟體,是用來寫科學論文的,但因經常分享具有偏見或不準確的訊息而被研究人員撤回。
從各大科技公司的積極動作來看,AI儼然已成為眾家競逐的一級戰區。微軟向OpenAI注資數十億美元後,本月稍早推出結合AI聊天機器人技術的新版搜尋引擎Bing。Google旗下也有名為LaMDA 的大型語言模型,並且正在測試一款以LaMDA為基礎的對話式搜尋引擎Bard。