馬斯克,放大招!Grok-3來了
馬斯克,放大招!
北京時間2月18日中午,馬斯克旗下人工智能初創公司xAI開發的Grok-3模型正式發布。此前,馬斯克將Grok-3描述為“地球上最聰明的AI”。他在X平臺上表示:“自己整個周末都在和團隊打磨產品”。
北京時間12:18,Grok-3發布會正式開始。在發布會背景板上,寫著"our mission is to understand universe(我們的使命是了解宇宙)"。馬斯克曾表示,xAI公司的目標就是“了解宇宙”。截至發稿時,直播觀看人次超300萬次。
xAI在X平臺直播,馬斯克到場(圖片來源:X平臺)
馬斯克在直播中表示,Grok的名字來自海因萊因的小說《異鄉異客》,主角是一個在上長大的人類,而Grok這個詞代表了全面深刻地理解事物。
xAI團隊介紹,Grok-3的性能比Grok-2提升了一個數量級,和Grok-3聊天會覺得非常有趣。
xAI團隊在直播中展示稱,Grok-3和Grok-3 mini在多方面的測試得分上都超過或媲美Gemini和ChatGPT等對手。在訓練Grok的過程中,團隊搭建了大型算力集群,并克服了散熱、電力等問題帶來的挑戰,用了122天讓首批10萬張GPU投入使用并正常運行,現在他們計劃將集群規模繼續擴大一倍。
團隊還演示用Grok-3生成代碼,并運行了這段代碼。畫面上顯示出了飛船在地球和間往返的動畫。隨后,Gork-3又演示了制作一款類似于俄羅斯方塊的游戲。馬斯克稱,將在xAI推出一個人工智能游戲工作室。
飛船在地球和間往返的動畫直播截圖(圖片來源:X平臺)
此外,xAI宣布推出名為Deepsearch的Grok-3智能搜索引擎。名字和最近大熱的Deepseek頗有幾分相似。
Grok 3聰明在哪?
在此前舉行的世界政府峰會上,馬斯克通過視頻通話表示,Grok-3是“地球上最聰明的人工智能”。他表示,Grok-3將在推理、編程能力以及文本和圖像分析等多模態能力方面有顯著提升,它的表現“優于目前所有已發布的產品”。
馬斯克強調,Grok-3可以減少AI幻覺,方法是通過來回檢查數據并嘗試實現邏輯一致性。他還透露,訓練Grok-3所使用的算力遠多于此前的版本,并使用了大量合成數據。
不同于DeepSeek的算法優化路徑(DeepSeek-V3用2048個H800 GPU,訓練2788千小時),xAI透露,Grok-3的開發的得益于用8個月時間建成的Colossus超級計算機,它由10萬個英偉達的H100 GPU驅動,為訓練提供了2億個GPU小時,比Grok-2多十多倍。
2023年7月,馬斯克成立xAI公司。2023年11月,xAI發布第一款大模型 Grok-1,擁有3140億參數,成為當時參數量最大的開源大語言模型;2024年8月發布的Grok-2,在性能上與ChatGPT最新模型相媲美。該系列大模型可以通過聯網獲取實時信息,瀏覽和使用X平臺(原推特)上的資訊,使其具有信息獲取的時效性。
AI大模型群雄逐鹿
馬斯克的xAI成為AI大模型領域強有力的競爭者,同樣參與這場競技的還有OpenAI、谷歌、Anthropic以及近期引發全球關注的中國初創企業DeepSeek。
OpenAI于近日宣布,公司將在未來幾個月內推出新一代人工智能模型GPT-5和GPT-4.5。據稱,GPT-5將整合OpenAI的多項核心技術,包括o3推理模型。
OpenAI首席執行官兼聯合創始人SamAltman今日凌晨在社交平臺表示:“對于高要求的測試者來說,試用GPT-4.5的體驗,遠比我預期的要深刻得多!”業內人士預計,這說明GPT-4.5已經進入測試階段,離正式發布非常近了。
2月初,DeepSeek新模型發布后,谷歌公司發布Gemini2.0系列模型,該系列模型強化了編碼與推理能力,全面開放使用并降低成本。
另有消息稱,Anthropic計劃在未來幾周內發布新的混合型大模型Claude 4,用戶可以自行控制使用時的推理成本。
當地時間本周一,總部位于法國巴黎的Mistral發布名為Mistral Saba的定制大模型,特點是具有高準確率的阿拉伯語交互能力。
今年春節以來,中國初創企業DeepSeek發布新模型DeepSeek-R1,以極低的訓練成本和使用成本,超越OpenAI對標模型,攪動AI大模型競爭,也在國內各大行業帶起了大模型接入潮。
據不完全統計,已經有數百家公司正式接入DeepSeek研發的大模型。包括國內三大基礎運營商、超過15家芯片廠商,以及包括云服務、網絡科技、金融在內的200多家企業,多個手機廠商和車企,地方政府政務系統,以及微軟、英偉達、亞馬遜等世界級云計算巨頭都宣布接入DeepSeek。
騰訊集團確認,微信自2月15日起開始灰度測試接入DeepSeek-R1模型,增強其搜索功能。消息一出,引發騰訊股價大漲。2月16日晚間,百度搜索宣布將全面接入DeepSeek和文心大模型最新的深度搜索功能。
智能、免費
大模型加速走入日常生活
值得關注的是,在DeepSeek的推動下,大模型正朝著越來越智能且免費的方向發展,這也加快了大模型走入日常生活的腳步。
百度官方宣布,文心一言將于4月1日起全面免費,所有PC端和APP端用戶均可體驗其最新模型,包括超長文檔處理、專業檢索增強、高級AI繪畫、多語種對話等功能。2月13日凌晨,OpenAI也公布了GPT-5的最新消息,OpenAI將在未來幾個月內推出GPT-5的模型,免費版ChatGPT能在標準智能設置下無限制地使用GPT-5進行對話。此外,谷歌也在早些時候宣布其最新AI模型套件Gemini 2.0正式向所有用戶開放使用。
中國信息通信研究院技術與標準研究所工程師龔正表示,AI技術的成熟正在改寫商業模式,DeepSeek等開源模型的崛起正在重構行業生態。OpenAI首席執行官薩姆·奧爾特曼則預言,使用AI的成本每12個月下降10倍。
走向免費的大模型如何賺錢?一位關注AI創新的投資服務業人士告訴記者:“AI大模型實際從去年就開始了降價潮,而大模型企業目前還沒有完成商業化?!彼硎荆癆I大模型企業要想掙錢,可以提供面向企業端的解決方案,同時大模型企業的估值也不是根據模型,而是看其生態?!?
上述業內人士稱,對于大模型企業來說,未來的估值將不再單純依賴于模型本身,而是更多地關注其生態建設、用戶規模、數據質量以及增值服務的盈利能力。擁有龐大用戶基礎和完善生態的企業,將在未來的市場競爭中占據優勢。
產業鏈迎來更多機會
國信證券表示,三大運營商年后陸續接入DeepSeek,運營商龐大的數據有助于為DeepSeek的模型訓練與優化提供豐富素材,運營商接入DeepSeek有助于開發新的AI驅動型業務,運營商云平臺有望實現AI能力深度集成,加速云業務增長,促進運營商第二曲線增長。
在內容創作領域,大模型可以幫助企業快速生成文案、圖片、視頻等內容,提高創作效率。在智能客服領域,大模型可以實現更智能的交互,提升客戶滿意度。在金融領域,大模型可以用于風險評估、投資決策等,提高金融機構的運營效率和風險管理能力。
清華大學公共管理學院教授、清華大學人工智能國際治理研究院副院長梁正在近期采訪中談到,AI未來的發展將向終端化與輕量化發展,隨著多模態、強化學習等技術進步,服務機器人、無人駕駛車輛、無人機的規模化部署將成為可能。
隨著AI大模型快速發展,相關產業鏈迎來更多機會。路博邁基金認為,短期內,半導體行業將面臨顯著波動,市場正在重新評估DeepSeek的技術突破對更廣泛AI生態系統可能產生的影響;但從中期來看,隨著代理型AI的崛起,對先進推理算法及其下一代芯片的需求將繼續增長。摩根資產管理稱,將關注以人工智能為驅動力的科技產業、新能源產業、高端制造業以及以創新藥為主的醫療健康產業。
(文章來源:中國證券報)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。