熱錢仍在涌入大模型圈
作者 | 王欣
編輯 | 苗正卿
頭圖 |視覺中國
熱錢仍在涌入大模型圈,只不過,這次的主角從云端模型變成了端側模型。
今天,面壁智能宣布完成新一輪數億元融資。面壁智能CEO李大海在公開信中表示,將進一步提速以端側AI為代表的高效大模型商業化布局。
云端大模型市場卷生卷死,端側逐漸成為大模型公司的新戰場,已經有國內AI公司開始轉向端側,李大海感受到了水溫的變化——“2024年下半年,行業突然形成新共識,更高知識密度的小模型和端側智能,成為大模型發展的新階段”
從2023年末,面壁智能就聚焦端側大模型的研發,“不追熱點,不浪費人才與算力”,這讓它與同期專注通用大模型的公司相比,顯得有些另類。
另類還體現在面壁的很多細枝末節,面壁智能告訴虎嗅,不同于其他公司,他們有一個獨立的數據團隊,專門處理高質量數據來源和數據配比。因為對于端側模型來說,對高質量數據要求更高——他們的判斷是“密度定律推論,大模型隨著時間不斷增長,模型的能力密度每3.3個月翻一倍”。
這種另類從它的名字來歷也可見一斑,《三體》中面壁者通過獨立思考來抵御三體人的入侵,承擔的是人類歷史上最艱難的使命,肩負著拯救人類的責任。
而面壁則將AGI作為自己的長期使命。
硬幣的兩面
“你們相不相信AGI?面壁智能是不是要做AGI?”
這是在加入面壁智能前,李大海向每個核心成員發問的問題。在得到肯定答復后,他才決定加入面壁智能。
對面壁智能來說,商業化與實現AGI同樣重要。他們的策略是:一方面,他們依托面壁智能創始人、清華NLP實驗室劉知遠教授團隊來進行前沿技術的探索;另一方面,他們通過商業化落地保持資源競爭力與長期生存。
李大海認為“不管是端側模型還是云端模型,都需要盡快去把商業閉環先做起來,讓大家看到預期通路是通的,這是最重要的事情。”
這體現在面壁的組織架構上——其中研發團隊分為兩部分:一部分負責迭代基礎模型,比如優化MiniCPM的文本和多模態功能;另一部分形成了一個以技術專家為主導的交付團隊。
面壁智能告訴虎嗅,不同于銷售型為導向的To B交付團隊,面壁的交付團隊是工程師文化濃厚的專家型團隊。這意味著,他們能夠更高效率地做出針對性決策,內耗更少。
效率是面壁在組織和商業化落地上一直強調的關鍵詞,這顯然是吸取了大模型To B的一些教訓:為企業提供定制化服務的大模型公司,很難去有效壓縮成本。
一年前的面壁看到了什么
大模型的“To B”生意難以壓縮成本,是因為為了滿足不同企業的定制化需求時,大模型公司甚至需要派團隊入駐企業,這種商業模式很難控制人員與工程成本。
相對而言,面壁的優勢則在于標準化——他們的每個行業都有相對標準化的流程。端側終端行業的標準化,使得他們可以針對性地快速適配,不需要從0到1去做研發。
面壁智能向虎嗅舉了這樣一個例子:首先他們會按照終端客戶需求選擇適合的模型與功能,其次根據終端的芯片與配置,去做模型的適配與優化。
這樣的流程相對清晰。
另外,面壁與高通、聯發科等芯片廠商合作,在基座和多模態方面都進行了適配。
這意味著,在搭載這些芯片的終端上,可以直接復用之前的模型參數配置,只需要針對終端廠商的要求去做應用層的功能開發,而不需要再次進行底層的開發,能夠快速落地。
雖然行業內已經有公司開始轉向端側,但面壁對自己的壁壘依舊保持自信:
“端側模型的參數量更小,因此對模型的能力密度要求更高。并不是說原來大模型做得很好,能力就可以直接遷移到小模型。還需要豐富化的實驗手段積累,做一些有意思的洞察,然后慢慢做起來。”
因此,劉知遠教授團隊近期也在聚焦探索模型的能力密度的提升。他們提出了大模型的密度定律(densing law),引入了衡量大模型性價比的新指標——能力密度(capability density)。
面壁這樣像虎嗅解釋這項工作的重要性:“模型能力密度提升意味著——如果一個4B的模型能實現40B模型的效果,那么它能搭載運行的終端范圍會大大拓寬,比如原來服務器上的模型,就可以直接在手機上運行,它的應用范圍也就拓寬了。”
不止一家大模型公司,以及跟大模型有接觸的機構,都提出了一個相似觀點:目前行業的轉向部分原因在于,云端模型同質化嚴重,用戶看不到明顯的差異化,價格戰、刷榜等亂象橫生。
“云端模型的故事已經沒有太多可以講的了,卷價格、卷服務,卷到最后誰都沒錢賺。而終端落地更快、出貨量穩定的手機、PC、智能座艙硬件仍存在很大的市場增量空間。”
在一年前,面壁預判到了這一問題趨勢,也看到了沿Scaling Law卷大規模外的其他方向,因此從2023年底,他們開始聚焦端側模型。
這也能夠解釋,面壁智能脫胎于清華大學NLP實驗室,卻狂奔在端側模型的道路上。
大模型正在開始進入真刀真槍的比拼階段,從大躍進轉向持久戰。通往AGI道路仍然漫長,面壁也開始加快步伐。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。