首頁 > AI資訊 > 最新資訊 > 72B世界基座模型啟動,小鵬的端到端智駕正在驗證ScalingLaws

72B世界基座模型啟動,小鵬的端到端智駕正在驗證ScalingLaws

新火種    2025-04-17

最近一段時間,各家新勢力都在角力部署端到端的智能駕駛系統。

作為公認的新范式,它可以讓整個智能駕駛系統反應更快,更加擬人,能處理以往方法無法解決的大量 corner case,被認為是自動駕駛通向 L3、L4 的正確方向。

在國內,小鵬于去年 7 月就宣布了量產端到端大模型上車,并構建了從算力、算法到數據的全面體系,在端到端方向上一直保持著領先的身位。

本周,小鵬在 AI 技術分享會上介紹了自己在智能駕駛領域的重要突破和進展,首次披露了正在研發 720 億參數的超大規模自動駕駛大模型,即「小鵬世界基座模型」。

小鵬的技術人員表示,在物理世界,信息和模態的復雜程度要比數字世界復雜數倍,自動駕駛本質上是物理世界中的復雜 AI 問題,也是具身智能的第一步。

小鵬發展的云端世界基座模型以大語言模型為骨干,使用海量的優質多模態駕駛數據進行訓練,具備視覺理解、鏈式推理和動作生成能力。通過強化學習訓練,其基座模型可以不斷自我進化,逐步發展出更全面、更擬人的自動駕駛技術。

圖片

小鵬汽車自動駕駛負責人李力耘表示,小鵬早在去年就開始布局 AI 基礎設施,建成了國內汽車行業首個萬卡智算集群,用以支持基座模型的預訓練、后訓練、模型蒸餾、車端模型訓練等任務,小鵬將這套從云到端的生產流程稱為「云端模型工廠」。

端到端大模型雖然是各家車企的共識,但仍然面臨著算力等瓶頸。當前主流的智駕系統,如運行在 2× 英偉達 Orin 芯片上的系統,大部分只能支持 0.5-1 億參數,在部署時必須對學習到的知識進行取舍。相比之下,云端大模型體量可以達到車端模型的 140 倍以上。

自去年下半年開始,小鵬面向 L4 級別的自動駕駛啟動研發全新的「AI 大腦」,即小鵬世界基座模型。

其團隊利用優質自動駕駛訓練數據先后開發了多個尺寸的基座模型,目前正在著手推進 72B(72 Billion,即 720 億)超大規模參數世界基座模型的研發,參數量是主流 VLA 模型的 35 倍左右。

圖片

據介紹,該模型的一大優勢是具備鏈式推理能力(CoT),能在充分理解現實世界的基礎上像人類一樣進行復雜常識推理,并做出行動決策,如輸出方向盤、剎車等控制信號,實現和物理世界的交互。

小鵬希望通過基座模型的能力讓智駕系統從「模仿人類」進化到「超越人類」,最終能夠處理全場景的自動駕駛問題,包括一些模型從未在訓練數據中遇到的問題。

更進一步,端到端模型的研究也可以延伸到整個具身智能領域。李力耘表示:「世界基座模型是小鵬自動駕駛真正走向 L3、L4 的基礎,也會是未來小鵬所有物理 AI 終端的通用模型。」

從零打造云端模型工廠

小鵬的云端模型工廠「車間」涵蓋基座模型預訓練和后訓練(強化學習)、模型蒸餾、車端模型預訓練到部署上車的完整生產鏈路。整個體系采用強化學習、模型蒸餾的技術路線,能夠生產出小體量、高智能的端側模型,甚至為不同需求的汽車定制不同的「大腦」,讓「千人千面」的模型研發成為可能。

圖片

目前,小鵬依靠自有萬卡集群已擁有 10 EFLOPS 的算力,集群運行效率常年保持在 90% 以上,從云到端的全鏈路迭代周期可達平均 5 天一次。

小鵬世界基座模型負責人劉博士介紹,多模態模型訓練的主要瓶頸不僅是 GPU,也需要解決數據訪問的效率問題。小鵬汽車自主開發了底層的數據基礎設施(Data Infra),使數據上傳規模提升 22 倍、訓練中的數據帶寬提升 15 倍;通過聯合優化 GPU / CPU 以及網絡 I/O,最終使模型訓練速度提升了 5 倍。目前,小鵬汽車用于訓練基座模型的視頻數據量已達到 2000 萬 clips,這一數字今年還將增加到 2 億 clips。

依托強大的 AI 算力基礎設施和數據處理機制,小鵬開啟了全新的基座模型研發范式,從云端模型預訓練到車端模型部署,整個「云端模型工廠」的迭代周期達到平均 5 天一次。

三大階段性成果

在率先量產端到端大模型的同時,小鵬在物理世界大模型研發上也再進一步,其分享了基礎大模型研發的三個階段性成果:

驗證了 Scaling Laws 在自動駕駛領域持續生效:

圖片

在后裝算力的車端上成功實現基模控車:

圖片

啟動 72B 參數模型訓練,搭建針對強化學習的模型訓練框架:

圖片

規模法則(Scaling Law)揭示了大模型的性能隨著模型的計算量、訓練數據量和參數量的提升而提升,在大語言模型(LLM)領域一直是人們追逐的目標。而在自動駕駛領域上,訓練數據遠不止單模態的文本數據,還包括攝像頭、激光雷達等關于物理世界的多模態數據,本質上,這要求模型對物理世界形成認知和理解。

小鵬團隊首次驗證了 Scaling Laws 在自動駕駛領域持續生效,劉博士表示:「過去一年,我們做了大量實驗,在 10 億、30 億、70 億、720 億參數的模型上都看到了明顯的規模法則效應:參數規模越大,模型的能力越強。同樣的模型大小,訓練數據量越大,模型的能力也會越強。」

不久前,小鵬實踐了理論,在后裝算力的車端上用小尺寸模型實現了控車。盡管只是非常早期的實車測試,全新基模已經展現出令人驚訝的智駕能力。例如模型在未訓練的情況下就能適應香港的右舵駕駛環境。

在 AI 技術上,小鵬也一直在探索最新方向,自去年就已開始研發大模型中的強化學習技術。強化學習能夠幫助模型自我進化,學會處理訓練數據中未出現的長尾問題,做到更安全的自動駕駛。只有足夠強大的基座模型,才能被強化學習不斷激發出能力上限。這也是小鵬汽車選擇云端蒸餾路線的原因之一:在云端不計成本地訓練出高智能、泛化能力強的模型,再將其蒸餾到適配車端算力的小模型上,才可以讓車端模型的性能超越算力限制。

值得一提的是,強化學習、云端蒸餾等技術的思路,在今年初爆火的 DeepSeek R1 中得到了驗證,目前正在逐漸成為行業共識。

基礎模型是小鵬汽車 AI 化轉型的重要一步,不過在智能駕駛的大模型時代,過去規則時代的經驗仍能發揮作用。在開發強化學習的獎勵模型(Reward Model)時,小鵬研發團隊基于規則經驗設計了獎勵函數,將規則時代的沉淀轉化為了新的生產力。

圖片

小鵬也在推動世界模型(World Model)的研發,小鵬的世界模型是一種實時建模和反饋系統,能夠基于動作信號模擬出真實環境狀態,渲染場景,并生成場景內其他智能體(即交通參與者)的響應,從而構建一個閉環的反饋網絡,可以幫助基座模型不斷進化,逐漸突破過去「模仿學習」的天花板。

這也意味著人們能夠以更有效的方式構建新模型,產生新能力。小鵬工程師表示,我們或許可以像黃仁勛展望的那樣,用 AI 模型來生成一個新模型。

據介紹,小鵬世界基座模型研發和訓練成果更多的細節,預計還會再今年 6 月的全球 AI 頂會 CVPR 上進行分享。

昨天,小鵬又宣布開啟自研 AI 芯片計劃,預計將在 2025 年底在中國內地率先實現 L3 級智能駕駛落地。

圖片

未來,小鵬還希望通過云端蒸餾小模型的方式將基模部署到車端,給「AI 汽車」配備全新的大腦。這款模型的能力同時也將拓展至小鵬的 AI 機器人、飛行汽車等。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章