首頁 > AI資訊 > 最新資訊 > 扎克伯格大招被扒光!開源大模型打臉GPT-4o商業化路徑也已隱現

扎克伯格大招被扒光!開源大模型打臉GPT-4o商業化路徑也已隱現

科創板日報    2024-11-18

《科創板日報》7月23日訊 扎克伯格的開源大模型豪賭贏了?

據美國科技網站The Information此前援引Meta員工的話稱,Meta計劃于當地時間7月23日發布LLaMA 3模型的最大版本。該版本擁有4050億個參數和多模態能力,能夠理解并生成圖像和文本。

不過,在正式發布前,這款模型就在開源AI社區Hugging Face上被泄露了,并迅速引起了轟動,Hugging Face網站隨即刪除了相關信息。

泄露的信息顯示,這款模型名稱從LLama 3 405B更名為LLama 3.1 405B。這款模型基于超過15T tokens進行訓練,微調數據包括公開微調數據集和1500萬個合成樣本。

回顧2024年4月,Meta推出了新一代的開源大模型LLaMA 3。盡管LLaMA 3前兩個型號,即LLaMA 3 8B和70B,當時在同類規模的LLMs中樹立了新的基準,但短短三個月內,已被其他大模型趕超。

然而,LLaMA 3.1 405B的泄露數據表明,這款模型在多個關鍵的AI基準測試中表現優異。

具體來說,經過調教的405B模型在MMLU-Pro評估中超過了Claude 3.5 Sonnet,設定了新的行業標桿(SOTA)。盡管在其他一些評估中,它仍略遜于3.5 Sonnet,但總體表現已在同一水平線上。

該模型在GSM8K、Hellaswag、Boolq、MMLU-humanities、MMLU-other、MMLU-stem和Winograd等多項測試中均優于OpenAI的GPT-4o,但在HumanEval和MMLU-social sciences方面略遜一籌。

這是開源大模型的一個重要里程碑,標志著開源模型首次可能擊敗當前最先進的閉源大模型。而且,這些數據來自LLama 3.1 405B的基本模型。隨著對該模型進行進一步的調教,其性能有望得到進一步提升。

不過,OpenAI即將推出的GPT-5預計將具備先進的推理能力,可能在上述項目追趕LLama 3.1 405B。

值得注意的是,Meta在LLaMA 3.1的社區許可協議中,取消了禁止使用LLaMA改進其他模型的規定。

另據TestingCatalog報道,Llama 3.1 405B可能是Meta AI Premium計劃的專屬模型,,Meta AI Premium計劃也可能在7月23日與LLaMA 3.1 405B同時發布。這意味著Meta正在積極為其AI產品探索商業化路徑。

此外,Meta還為Meta AI開發視頻生成功能。用戶除了可以進行文字對話外,還可以點擊“想象”按鈕生成圖片,并進而通過提示詞,生成多個視頻鏡頭,最后將視頻鏡頭合并,生成視頻。

同時,Meta還被指正在開發面向開發者的獨立產品AI Studio,該產品允許開發者試用Meta AI模型,并將其無縫集成到自己的產品中。

值得注意的是,開源AI賽道正變得日益擁擠,谷歌、馬斯克的xAI和Mistral等競爭對手也在積極布局開源大模型產品。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章