大模型“神仙打架”,實現無人駕駛或可換個新思路

走入“死胡同”的自動駕駛
工業和信息化部數據顯示,今年上半年,我國搭載輔助自動駕駛系統的智能網聯乘用車市場滲透率已達42.4%,預計到2025年乘用車L2及以上智能駕駛滲透率將達70%。輔助駕駛系統不斷普及,何小鵬卻發出“無人駕駛尚無完整邏輯”的感嘆。實際上,何小鵬并非第一個對無人駕駛發出質疑的車企高管。比亞迪董事長王傳福也曾表示:“無人駕駛都是扯淡,它就是一場皇帝的新裝。自動駕駛最終就是一個高級的輔助駕駛而已。”
回顧過往十余年的發展歷程,自動駕駛主要沿著兩大技術路線向無人駕駛邁進。一種是直奔高級別自動駕駛的躍進式路線,一種是從輔助駕駛不斷迭代的漸進式路線。如今,隨著L2輔助駕駛的不斷普及,以及國內外L3自動駕駛相關政策和測試牌照的相繼落地,漸進式路線取得較大進展。然而,以Robotaxi為主要落地形式的躍進式路線卻進展受阻。盡管國內百度、小馬智行、享道出行等自動駕駛企業不斷擴大Robotaxi的運營范圍和數量,但近段時間以來國外出現的Robotaxi相關事故迫使這一路線被“打入冷宮”。今年8月剛剛獲得舊金山全天候商業運營許可的Cruise,在不到3個月之內便接連發生多起熄火、拖拽行人等事故,被迫停止運營,重新引發公眾對自動駕駛的信任危機。
對此,中國生產力促進中心協會常務副理事長兼秘書長、研究員王羽認為,當下輔助駕駛系統的大規模量產看似形勢一片大好,但高級別自動駕駛由于技術仍在探索、產品成熟度不高,實則深陷困局。“漸進式路線上,更高級別自動駕駛還未經過足夠的驗證,量產還需時日。躍進式路線上,百度、小馬智行這些企業都還處在探索階段,大規模應用還不夠成熟?!蓖跤鸨硎荆詣玉{駛必須在確保安全性的基礎上推廣和應用,由于技術上的不成熟,當下兩條路線都不得不陷入停滯期。
除卻技術上的限制,中國科學院雄安創新研究院研究員黃武陵稱,無人駕駛的普及還需放到行業角度進行全局考察?!盁o人駕駛的落地應用誠然存在技術問題,但場景問題也不能忽視。”他認為,技術的缺陷使得當前自動駕駛企業無法生產符合部分場景功能需求的車輛,場景的缺陷則導致自動駕駛車輛無法在更大范圍得到普及應用。
黃武陵表示,無人駕駛的應用不僅僅關乎汽車行業本身,在聚焦于制造車輛方的同時,還需
百家爭鳴的AI大模型
如何跨越鴻溝,讓虛幻的自動駕駛更加具象?AI大模型的出現無疑讓自動駕駛行業重新看到曙光。毫末智行相關負責人在接受《中國汽車報》記者采訪時表示,自動駕駛經歷了以硬件驅動的1.0時代和以軟件驅動的2.0時代,現在正在邁向以數據驅動的3.0時代。在這一階段,只有以大模型、大數據、大算力為特點構建全新的自動駕駛技術范式,才有可能達成完全無人駕駛。
今年以來,毫末智行、商湯科技、科大訊飛等企業相繼發布汽車領域垂直大模型。今年4月,毫末智行發布行業首個自動駕駛生成式大模型DriveGPT“雪湖·海若”。毫末智行相關負責人稱,DriveGPT主要采用了海量的駕駛場景的感知數據和駕駛行為作為訓練數據,采用RLHF技術來引入人類司機的接管數據,來對自動駕駛決策進行持續優化。
商湯科技則開發了業內首個感知決策一體化的端到端自動駕駛解決方案——UniAD,在多目標跟蹤準確率、車道線預測準確率等多項關鍵技術指標上超越SOTA方法,整體系統和性能得到大幅提升。商湯科技聯合創始人、首席科學家、絕影智能汽車事業群總裁王曉剛此前表示,擺脫對高精地圖的依賴,用一個模型完成整個自動駕駛各個模塊,實現完整的數據驅動是未來的發展趨勢,商湯絕影將基于UniAD實現端到端自動駕駛模型的量產。
科大訊飛在10月的智能汽車發布會上圍繞“大模型上車”接連發布“智能駕駛”、“智能音效”、“智能座艙”三大產品。其中,在智能駕駛方面,基于訊飛星火認知大模型,科大訊飛帶來兩款行泊一體智駕解決方案——智駕STD和智駕PRO,配備了增強型高速NOA、記憶行車和記憶泊車等功能。
自動駕駛公司Wayve推出了首個自動駕駛的視覺語言動作模型(VLAM)——LINGO-1。該系統融合了大語言模型和自動駕駛技術,使其能夠以自然語言對駕駛行為進行解釋和描述,能夠顯著增強Wayve人工智能驅動程序的可解釋性。
自動駕駛公司max近日也上線了max大模型。max首席科學家成二康認為,大模型有三個支柱:生成式、基礎模型+提示學習、人類反饋強化學習。生成式,是指大模型創造并提供了比現實世界駕駛數據更豐富更極端更難以獲得的數據用來訓練自動駕駛模型;基礎模型+提示學習,是指大模型通過輸入提示,進行概念的理解及自我監督學習,從而解決自動駕駛各項任務,并提高了軟件性能和安全;人類反饋強化學習,是指大模型利用人類的反饋,可以讓人工智能駕駛員通過通用推理,在沒有經驗的情況下,在任何場景都能更好的安全駕駛,解決自動駕駛長尾問題。
大模型是新出路?
“AI大模型的應用還只是初期階段,如今面臨的階段性難題無法依靠大模型解決,正所謂‘遠水解不了近渴’?!蓖跤鸨硎荆珹I大模型發展尚不成熟,真正在自動駕駛上落地應用還需等待2~3年時間。天風證券研報也指出,當前大模型在智能汽車中的應用仍存在多模態數據融合、云端算力需求大、車端部署以及安全性和一致性等問題。
在黃武陵看來,采用跨模態模型和大語言模型等復雜算法,結合成本可控的高算力平臺參與計算,能夠在系統側逐步使得自動駕駛長尾問題得到收斂和解決,讓自動駕駛更方便地集成到交通、運輸的綜合解決方案之中。然而,他直言,現階段出現的各類汽車行業AI大模型都還是僅具備通用語言能力的模型,真正能夠在車載系統上應用的自動駕駛大模型還有待于進一步研發。對此,毫末智行相關負責人表示認可,他認為當前汽車行業大模型主要還是采用類似ChatGPT的方式,進行人機對話交互,實現自動駕駛還是需要單獨的功能模塊。
盡管尚處于初期發展階段,但大模型的誕生無疑為自動駕駛帶來了無限想象空間。max創始人徐雷稱:“無人駕駛的本質就是一個機器人幫人去開車。大模型的出現讓汽車擁有了一個大腦,具備了人類的常識,會加速智能駕駛的研發和驗證。”今年9月,韓國科學技術院(KAIST)研究人員便采用人工智能和大語言模型技術,開發了世界上首個人形機器人飛行員。KAIST研究團隊表示:“它們具有很強的適用性和實用性。我們希望它們未來還能夠應用于傳統汽車和軍用卡車等各種其他車輛,因為它們可以控制廣泛的設備。”
“在智能汽車領域,未來三年會是最殘酷的三年,也是最有機會的三年。核心不光要建立幾個長板,還要無任何短板?!迸c其在此猜測未來,不如像何小鵬所言,抓住時間補短板、鍛長板,也許關于自動駕駛未來的答案,即將揭曉。
文:張奕雯
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。