理想汽車?yán)钕胝刅LA司機(jī)大模型:這是進(jìn)化的過(guò)程
日前,“理想AI Talk第二季”舉行。此次,理想汽車董事長(zhǎng)兼CEO李想重點(diǎn)分享了對(duì)于人工智能的最新思考,VLA司機(jī)大模型的作用、訓(xùn)練方法和挑戰(zhàn),以及對(duì)于創(chuàng)業(yè)和個(gè)人成長(zhǎng)的見解。
李想將AI工具分為三個(gè)層級(jí),分別是信息工具、輔助工具和生產(chǎn)工具。目前,大多數(shù)人將AI作為信息工具使用,但信息工具常伴隨大量無(wú)效信息、無(wú)效結(jié)果和無(wú)效結(jié)論,僅具參考價(jià)值。成為輔助工具后,AI可以提升效率,例如現(xiàn)在的輔助駕駛,但仍需人類參與。未來(lái),AI發(fā)展為生產(chǎn)工具后,將能獨(dú)立完成專業(yè)任務(wù),顯著提升效率與質(zhì)量。
李想表示:“判斷Agent(智能體)是否真正智能,關(guān)鍵在于它是否成為生產(chǎn)工具。只有當(dāng)人工智能變成生產(chǎn)工具,才是其真正爆發(fā)的時(shí)刻。就像人類會(huì)雇傭司機(jī),人工智能技術(shù)最終也會(huì)承擔(dān)類似職責(zé),成為真正的生產(chǎn)工具。”
VLA全稱是Vision-Language-Action Model,即,視覺(jué)語(yǔ)言行動(dòng)模型。李想認(rèn)為,它能夠讓AI真正成為司機(jī),成為交通領(lǐng)域的專業(yè)生產(chǎn)工具。“對(duì)理想汽車而言,未來(lái)的VLA就是一個(gè)像人類一樣工作的司機(jī)大模型”。
李想介紹,VLA的實(shí)現(xiàn)不是一個(gè)突變的過(guò)程,是進(jìn)化的過(guò)程,經(jīng)歷了三個(gè)階段,對(duì)應(yīng)理想汽車輔助駕駛的昨天、今天和明天。第一階段,理想汽車自2021年起自研依賴規(guī)則算法和高精地圖的輔助駕駛,類似“昆蟲動(dòng)物智能”。第二階段,理想汽車自2023年起研究,并于2024年正式推送的端到端+VLM(Vision Language Model,視覺(jué)語(yǔ)言模型)輔助駕駛,接近“哺乳動(dòng)物智能”。
端到端模型在處理復(fù)雜問(wèn)題時(shí)存在局限,雖可借助VLM視覺(jué)語(yǔ)言模型輔助,但VLM使用開源模型,使其在交通領(lǐng)域的能力有限。同時(shí)端到端模型也難以與人類溝通。為了解決這些問(wèn)題并提升用戶的智能體驗(yàn),理想汽車自2024年起開展VLA研究,并在多項(xiàng)頂級(jí)學(xué)術(shù)會(huì)議上發(fā)表論文,夯實(shí)了理論基礎(chǔ)。
在端到端的基礎(chǔ)上,到第三階段,VLA將開啟“人類智能”的階段。它能通過(guò)3D和2D視覺(jué)的組合,完整地看到物理世界,而不像VLM僅能解析2D圖像。同時(shí),VLA擁有完整的腦系統(tǒng),具備語(yǔ)言、CoT(Chain of Thought,思維鏈)推理能力,既能看,也能理解并真正執(zhí)行行動(dòng),符合人類的運(yùn)作方式。
得益于DeepSeek的開源,理想汽車在VLA司機(jī)大模型的語(yǔ)言能力研發(fā)上提速顯著,節(jié)省了近9個(gè)月的時(shí)間和數(shù)億元成本。盡管如此,理想汽車仍選擇加大投入,在基座模型上投入超預(yù)期3倍的訓(xùn)練卡,專注打造適配多場(chǎng)景的自研模型。李想表示:“我們可以站在巨人的肩膀上,但它只是其中的一部分。”在受益開源的同時(shí),理想汽車也選擇開源自研的汽車操作系統(tǒng)——理想星環(huán)OS,回饋社會(huì)。
面對(duì)AI的發(fā)展,李想認(rèn)為,在AI面前所有的人性都應(yīng)被保留,無(wú)論好壞,因?yàn)橐磺腥诵远际俏幕⑸⑿愿瘛⒛芰Φ奶刭|(zhì),也是人類真正的生命力所在。
(文章來(lái)源:廣州日?qǐng)?bào)新花城)
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。