首頁 > AI資訊 > 最新資訊 > 大模型只剩DS、阿里、字節,李開復說了句大實話

大模型只剩DS、阿里、字節,李開復說了句大實話

新火種    2025-05-19

國內的基座大模型大概率將會只剩下DeepSeek、阿里巴巴、字節跳動三家,這是創新工場董事長李開復近日在接受彭博社采訪時做出的判斷。

在人工智能走紅后,李開復與周鴻祎、李彥宏等人一道,成為了國內互聯網行業中經常對其評頭論足的大佬。那么這一次他關于未來國內大模型市場將從群雄逐鹿的“百模大戰”發展至只剩下DeepSeek、阿里巴巴、字節跳動的三足鼎立,到底是無稽之談、還是不可避免呢?

事實上,李開復對于這番論斷極有可能是很有信心的,如若不然,他領導的零一萬物也不會成為全面擁抱DeepSeek旗下大模型的第一個“AI六小虎”。早在今年年初,也就是DeeppSeek-R1尚未出圈時,李開復就已宣布零一萬物未來不會再做萬億參數模型的預訓練,而是將專注在務實的、小而快的、能夠以商業性價比來評估的模型。

其實不僅僅是零一萬物,在大名鼎鼎的“AI六小虎”里,除了得到一眾資方支持的智譜,已經有四家在大模型的迭代這件事上都按下了暫停鍵。至于在“AI六小虎”之外的其他中小規模AI廠商,現在在大模型這件事也幾乎都已經沒有了聲響。從某種意義上來說,在2023年如火如荼的“百模大戰”反而是個特殊現象。

此前在2023年春季,國內AI賽道的“百模大戰”之所以會迅速成型,蓋因苦于缺乏標的的投資機構終于有了一個看起來無比光明的賽道可以押注,蜂擁而至的資本正是“百模大戰”的導火索。彼時,狂飆突進十余年的互聯網行業投資踩下急剎車,大消費賽道業已經偃旗息鼓,以至于國內投資圈流傳出了這樣一句話,“現在沒啥好項目,凡是能跑出來的東西早被投完了?!?/p>

這時候ChatGPT的出現就給市場注入了強心劑,投資機構則期盼AI能夠成為下一個互聯網。當ChatGPT的開發商OpenAI在做大語言模型(LLM)的情況下,擅長Copy To China的部分國內企業自然有樣學樣,搞起了那時候時髦的大模型。

只可惜AI大模型與互聯網雖然同屬于廣義上的科技,但兩者的底層邏輯完全不同,互聯網是輕資產的代表,而大模型卻是技術與資本雙密集。大模型的訓練不僅是個技術活,需要有懂芯片、推理、模型、算法的人才,還有資源密集型的特征,要耗費海量的電力、冷卻水,以及算力。

以Meta的LLama3為例,其8B和70B模型的訓練就累積耗費了770萬個GPU訓練時長(GPU Hours),用的是英偉達的H100-80GB顯卡,按照AWS上12美元/機時的價格來算,這一訓練的花費高達9240萬美元。也難怪從2024年開始,一級市場的投資者開始對大模型望而卻步,就正是因為訓練大模型其實是巨頭才能玩得轉的游戲。

更加致命的是,這些巨頭還不太講武德,在2024年初夏搞起了價格戰,使得資源有限的中小廠商只能作壁上觀。到了2025年年初,DeepSeek憑借高效低成本的優勢一舉成為AI行業的新標桿,而更讓一眾AI廠商若坐針氈的是,DeepSeek的大模型還是開源的。

開源的DeepSeek就引發了基座大模型的價值重估,進而終結了“百模大戰”。有相當多的AI模型廠商都無法回答這樣一個問題,那就是“為什么要舍棄低成本且開源的DeepSeek,選擇你的模型?”

歸根結底,降成本、重落地路線的DeepSeek扛起了開源模型的大旗,并實現了與OpenAI并跑,這也是以往開源陣營的阿里Qwen、Meta LLama都未曾做到的事情。既然無法在短期內實現商業化,也沒辦法在DeepSeek的壓力下保持競爭力,處于二三線的國內AI廠商當然就前途無“亮”了。

那么問題就來了,為什么李開復會認為在一眾一線AI大廠里,最后可能只剩下DeepSeek、阿里巴巴、字節跳動呢?

畢竟DeepSeek目前勢頭最強,選它是很正常。而阿里巴巴的通義千問Qwen模型盡管屬于普通用戶可能不太了解,但在AI開發者社區卻享有盛譽,大量開發者甚至將其稱之為“源神”,他們最新的旗艦模型Qwen2.5-Max也已經在Hugging Face上“屠榜”。

所以李開復支持DeepSeek和阿里,其實是支持開源、信息平權路線。畢竟當訓練超大規模的AI模型成為了只有巨頭才能玩轉的燒錢游戲時,如果都不開源,他的零一萬物可能就得出局了。

至于說在DeepSeek和阿里之外,李開復選擇了字節跳動而非騰訊、百度,其實也有原因。不久前,百度文小言、騰訊元寶先后接入DeepSeek的決策,就已經表明了他們對于自研模型的疑慮。至于堅持閉源路線的字節跳動會被李開復選中,并不是因為豆包大模型本身的表現鶴立雞群,而是由于字節跳動旗下有抖音。

騰訊元寶在3月3日力壓DeepSeek,成為App Store國區免費下載榜的冠軍之后,旋即就被豆包反超。而字節跳動更是僅憑一招就扭轉了局勢,即在3月5日宣布抖音App接入豆包的AI能力,打通了流量平臺和AI產品。也就是說字節跳動方面不費吹灰之力,就讓豆包獲得了海量的用戶。

日均使用時長都突破150分鐘的抖音,無疑是字節跳動在AI大模型領域立于不敗之地的最大倚仗,并且為了豆包,他們甚至在抖音上拒絕了其他AI產品的投放。所以除非抖音失去了國內用戶的青睞,否則豆包大模型幾乎沒有失敗的道理。

一家技術領先(DeepSeek)、一家技術與資本兼備(阿里)、一家有著取之不盡的流量(字節跳動),李開復這次的選擇可謂是火眼金睛了。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章