国产一区日韩,国产热re99久久6国产精品首页,国产原创视频

首頁 > AI資訊 > 最新資訊 > 馬斯克發布Grok2測試版邏輯能力更強新增文生圖功能

馬斯克發布Grok2測試版邏輯能力更強新增文生圖功能

科創板日報 2024-11-16

《科創板日報》8月14日訊（編輯宋子喬）北京時間8月14日下午，馬斯克旗下xAI公司的第二代AI大模型Grok 2測試版本正式發布，包括Grok 2和Grok 2 mini兩個版本，實測支持中文提問和中文回答，目前僅X Premium及Premium+用戶可體驗，非X訂閱用戶可以在LMSYS大模型競技場（Auto Arena of LLMs，專為大模型設計的評估平臺）中，免費體驗Grok 2的早期版本模型sus-column-r。

馬斯克在去年4月注冊了xAI公司，今年5月，xAI官宣獲得60億美元的B輪融資，這輪融資使該公司的估值達到約240億美元。xAI在今年先后推出了Grok 1和升級版Grok 1.5。

馬斯克盛贊：“Grok是火箭速度”。

評測顯示，Grok 2測試版的邏輯推理能力有較大提升，該模型還具備文生圖能力，信息顯示其使用Black Forest Labs 的FLUX.1模型生成圖像。

Grok 2測試版不僅準確解答了“9.8和9.11哪個大”，還能數清草莓（strawberry）里有多少個“r”，這些可謂人類測試大模型的經典難題。

X平臺的用戶已經上傳了許多由Grok 2測試版模型生成的照片。

在GPQA、MMLU、MMLU-Pro、MATH、MathVista等多項測評中，Grok 2的得分都超過了GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5等主流模型。另據知名度較高的研究機構Large Model Systems Organization（簡稱LMSYS）最新發布的評測數據，Grok 2早期版本（代號sus-column-r）已經殺入LMSYS推出的大模型競技場Chatbot Arena排行榜前三，與GPT-4o并列。

Grok 2早期版本sus-column-r的Elo得分情況

Grok 2測試版本的發布，標志著該模型距離正式商用又邁出一步。

xAI計劃在本月稍晚時候，推出Grok 2正式版本的企業API。xAI表示將強化安全功能，包括強制性的多因素身份驗證（如Yubikey、Apple TouchID或TOTP），并提供了詳盡的流量統計數據和高級計費分析服務，支持數據導出。

另外，馬斯克此前透露后者將在今年年底左右發布更新版本的大模型Grok 3。

今年4月，馬斯克在接受挪威主權基金負責人Nicolai Tangen采訪時表示，Grok 2需要大約2萬張H100來進行訓練。Grok 3所需的算力資源只多不少，馬斯克在上個月稱，xAI公司一直在訓練Grok 3，該模型將使用10萬塊英偉達H100芯片進行訓練，其水平將與尚未發布的OpenAI GPT-5相匹敵，甚至超越GPT-5。

Tags:

GPT 邏輯能力

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

馬斯克發布Grok2測試版邏輯能力更強新增文生圖功能

深信服專家：以AI對抗AI提升開源軟件防護能力

AI心理推斷能力或與人類相當

賽意信息“基于善謀GPT的PCB行業大模型及應用”入選2024年人工智能先鋒案例集

AI教育大爆發前夜，智譜華章攜手豆神教育的背后邏輯

專家談電商新商業環境：AI加速數字供應鏈發展，用戶邏輯取代流量邏輯

熱門文章