首頁 > AI資訊 > 最新資訊 > 馬斯克發布Grok2測試版邏輯能力更強新增文生圖功能

馬斯克發布Grok2測試版邏輯能力更強新增文生圖功能

科創板日報    2024-11-16

《科創板日報》8月14日訊(編輯 宋子喬) 北京時間8月14日下午,馬斯克旗下xAI公司的第二代AI大模型Grok 2測試版本正式發布,包括Grok 2和Grok 2 mini兩個版本,實測支持中文提問和中文回答,目前僅X Premium及Premium+用戶可體驗,非X訂閱用戶可以在LMSYS大模型競技場(Auto Arena of LLMs,專為大模型設計的評估平臺)中,免費體驗Grok 2的早期版本模型sus-column-r。

馬斯克在去年4月注冊了xAI公司,今年5月,xAI官宣獲得60億美元的B輪融資,這輪融資使該公司的估值達到約240億美元。xAI在今年先后推出了Grok 1和升級版Grok 1.5。

馬斯克盛贊:“Grok是火箭速度”。

評測顯示,Grok 2測試版的邏輯推理能力有較大提升,該模型還具備文生圖能力,信息顯示其使用Black Forest Labs 的FLUX.1模型生成圖像。

Grok 2測試版不僅準確解答了“9.8和9.11哪個大”,還能數清草莓(strawberry)里有多少個“r”,這些可謂人類測試大模型的經典難題。

X平臺的用戶已經上傳了許多由Grok 2測試版模型生成的照片。

在GPQA、MMLU、MMLU-Pro、MATH、MathVista等多項測評中,Grok 2的得分都超過了GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5等主流模型。另據知名度較高的研究機構Large Model Systems Organization(簡稱LMSYS)最新發布的評測數據,Grok 2早期版本(代號sus-column-r)已經殺入LMSYS推出的大模型競技場Chatbot Arena排行榜前三,與GPT-4o并列。

Grok 2早期版本sus-column-r的Elo得分情況

Grok 2測試版本的發布,標志著該模型距離正式商用又邁出一步。

xAI計劃在本月稍晚時候,推出Grok 2正式版本的企業API。xAI表示將強化安全功能,包括強制性的多因素身份驗證(如Yubikey、Apple TouchID或TOTP),并提供了詳盡的流量統計數據和高級計費分析服務,支持數據導出。

另外,馬斯克此前透露后者將在今年年底左右發布更新版本的大模型Grok 3。

今年4月,馬斯克在接受挪威主權基金負責人Nicolai Tangen采訪時表示,Grok 2需要大約2萬張H100來進行訓練。Grok 3所需的算力資源只多不少,馬斯克在上個月稱,xAI公司一直在訓練Grok 3,該模型將使用10萬塊英偉達H100芯片進行訓練,其水平將與尚未發布的OpenAI GPT-5相匹敵,甚至超越GPT-5。

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章