首頁(yè) > AI資訊 > 最新資訊 > 自動(dòng)駕駛的GPT時(shí)刻,來(lái)了嗎?

自動(dòng)駕駛的GPT時(shí)刻,來(lái)了嗎?

張雅琦    2024-12-11

近日,多家大廠(chǎng)都放出了在自動(dòng)駕駛領(lǐng)域的最新進(jìn)展。特斯拉最近推出了V12版本的FSD,在駕駛體驗(yàn)上有很大的提升。“蘿卜快跑”在武漢上路測(cè)試刷屏全網(wǎng),無(wú)人駕駛出租車(chē)訂單量激增。Robotaxi已經(jīng)成為自動(dòng)駕駛落地的一個(gè)重要場(chǎng)景。那么,自動(dòng)駕駛行業(yè)開(kāi)始進(jìn)入快速發(fā)展的階段了嗎?無(wú)人駕駛出租車(chē)(Robotaxi)距離真正的商業(yè)化還有多遠(yuǎn),將面臨哪些挑戰(zhàn)?

7月19日,騰訊研究院聯(lián)合騰訊科技,邀請(qǐng)AI及無(wú)人駕駛行業(yè)專(zhuān)家發(fā)起《AGI路線(xiàn)圖:自動(dòng)駕駛的GPT時(shí)刻來(lái)了嗎?》直播。

本期嘉賓

肖仰華 上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任/復(fù)旦大學(xué)計(jì)算機(jī)系教授

王琦 騰訊自動(dòng)駕駛決策規(guī)劃控制團(tuán)隊(duì)負(fù)責(zé)人

大衛(wèi) 惠爾智能 CEO 百萬(wàn)粉絲播客《大小馬聊科技》主理人

張俊偉 美國(guó)硅谷大廠(chǎng)工程師/天使投資人

觀點(diǎn)速讀

1.自動(dòng)駕駛技術(shù)進(jìn)步顯著:過(guò)去幾年中,無(wú)人駕駛技術(shù)取得了顯著進(jìn)步,尤其是大規(guī)模神經(jīng)網(wǎng)絡(luò)的端到端學(xué)習(xí)技術(shù)變得成熟,這對(duì)無(wú)人駕駛行業(yè)的發(fā)展至關(guān)重要。

2.技術(shù)與商業(yè)化的結(jié)合:自動(dòng)駕駛技術(shù)的商業(yè)化不僅依賴(lài)于技術(shù)進(jìn)步,還受到資本市場(chǎng)反應(yīng)和商業(yè)模式的影響。不同公司在技術(shù)路線(xiàn)選擇和商業(yè)化策略上存在差異。

3.端到端學(xué)習(xí)的重要性:端到端的方法在自動(dòng)駕駛中顯示出其優(yōu)勢(shì),能夠更好地處理交通環(huán)境中的復(fù)雜交互,提供更順滑的駕駛體驗(yàn)。

4.特斯拉的獨(dú)特優(yōu)勢(shì):特斯拉在自動(dòng)駕駛領(lǐng)域具有獨(dú)特的優(yōu)勢(shì),主要體現(xiàn)在其數(shù)據(jù)體系和算力的整合,以及其車(chē)型平臺(tái)的統(tǒng)一性。

5.Robotaxi的商業(yè)化挑戰(zhàn):Robotaxi的商業(yè)化不僅面臨技術(shù)挑戰(zhàn),還涉及成本、法規(guī)和社會(huì)接受度等多方面因素。

6.人與車(chē)輛的關(guān)系:人在開(kāi)車(chē)時(shí)不僅是完成駕駛?cè)蝿?wù),還是整個(gè)車(chē)輛的管理者。

7.無(wú)人駕駛的安全性問(wèn)題:自動(dòng)駕駛的安全性仍然是一個(gè)關(guān)鍵問(wèn)題,特別是在處理長(zhǎng)尾場(chǎng)景和特殊情況時(shí),需要結(jié)合端到端和傳統(tǒng)專(zhuān)家系統(tǒng)的方法來(lái)提高安全性。

8.未來(lái)自動(dòng)駕駛的愿景:未來(lái)自動(dòng)駕駛可能會(huì)改變城市交通和停車(chē)模式,減少城市擁堵和停車(chē)需求,提高城市空間的利用效率。

9.人機(jī)共存的未來(lái):自動(dòng)駕駛技術(shù)的發(fā)展不一定會(huì)完全取代人類(lèi)司機(jī),未來(lái)可能會(huì)是一個(gè)人機(jī)共存的局面,無(wú)人駕駛系統(tǒng)可以作為“機(jī)器外腦”,提高駕駛的安全性和效率。

10.技術(shù)成熟與社會(huì)適應(yīng):無(wú)人駕駛技術(shù)的成熟速度可能會(huì)比預(yù)期更快,但社會(huì)結(jié)構(gòu)和關(guān)系的適應(yīng)是一個(gè)緩慢的過(guò)程,這可能會(huì)影響無(wú)人駕駛技術(shù)的大規(guī)模普及。

自動(dòng)駕駛的發(fā)展現(xiàn)狀

徐思彥:對(duì)于自動(dòng)駕駛,很多人是既熟悉又陌生,自動(dòng)駕駛的熱潮比這一輪大模型要早開(kāi)始好幾年。但是在過(guò)去的幾年當(dāng)中,也遇到過(guò)很多的低谷,但隨著這一次Robotaxi再次進(jìn)入大家視野,我們驚喜地發(fā)現(xiàn),在過(guò)去的幾年,無(wú)人駕駛已經(jīng)進(jìn)步了很多。今天我們也非常開(kāi)心請(qǐng)到了四位行業(yè)內(nèi)的專(zhuān)家來(lái)跟我們共同探討無(wú)人駕駛的進(jìn)展。大衛(wèi)作為自動(dòng)駕駛領(lǐng)域的親歷者,你怎么看過(guò)去幾年自動(dòng)駕駛行業(yè)發(fā)展?fàn)顩r?

大衛(wèi):我覺(jué)得自動(dòng)駕駛的發(fā)展可以從三個(gè)角度看:技術(shù)、資本市場(chǎng)的反應(yīng)和商業(yè)化進(jìn)程。

首先,技術(shù)上,如果我們繼續(xù)采用車(chē)頂裝激光雷達(dá)和相機(jī)的方案,這種方法和特斯拉的無(wú)圖方案有很大區(qū)別,直接影響商業(yè)化進(jìn)程,因?yàn)槌杀静煌?guó)內(nèi)很多創(chuàng)業(yè)公司,包括百度,都是用類(lèi)似的方法,無(wú)論是大模型還是小模型,技術(shù)底層都差不多。

第二點(diǎn),資本市場(chǎng),自動(dòng)駕駛經(jīng)歷了多次波動(dòng)。從2017-2018年的創(chuàng)業(yè)潮,到疫情初期的冷卻,再到2021年的重新升溫,以及最近又因其他新技術(shù)的出現(xiàn)而降溫。資本市場(chǎng)的反應(yīng)對(duì)自動(dòng)駕駛公司非常重要,直接影響公司能否長(zhǎng)期發(fā)展。因?yàn)榧夹g(shù)還難以通過(guò)商業(yè)化自我維持。

第三點(diǎn),自動(dòng)駕駛的商業(yè)化程度。蘿卜快跑最近很火,但它的商業(yè)化數(shù)據(jù)有水分,只是覆蓋了單車(chē)的運(yùn)營(yíng)成本,離真正盈利還有距離。傳統(tǒng)做L4的公司如果轉(zhuǎn)向L2、L2+或L3的項(xiàng)目,已經(jīng)看到一些商業(yè)化的曙光。尤其在國(guó)內(nèi)激烈競(jìng)爭(zhēng)的電動(dòng)車(chē)市場(chǎng),技術(shù)發(fā)展遠(yuǎn)超北美。例如,我現(xiàn)在開(kāi)的韓國(guó)現(xiàn)代IONIQ 5在自動(dòng)駕駛和輔助駕駛上很弱,但價(jià)格接近6萬(wàn)美元。在中國(guó),這個(gè)價(jià)格的車(chē)體驗(yàn)完全不同。

我先講這三點(diǎn)。

徐思彥:從技術(shù)上的角度,現(xiàn)在自動(dòng)駕駛主流的發(fā)展路徑是什么樣的?

肖仰華:從人工智能的發(fā)展歷程來(lái)看,無(wú)人駕駛技術(shù)已經(jīng)發(fā)展了很多年。最近,大家覺(jué)得無(wú)人駕駛的落地速度在加快,一個(gè)重要原因是大規(guī)模神經(jīng)網(wǎng)絡(luò)的端到端學(xué)習(xí)技術(shù)變得成熟了。特別是在Sora出現(xiàn)后,它強(qiáng)大的世界建模能力對(duì)無(wú)人駕駛行業(yè)非常重要。

這是一個(gè)重要的轉(zhuǎn)折點(diǎn)。之前的大多數(shù)無(wú)人駕駛方案是非端到端的,各個(gè)模塊堆疊在一起。即使每個(gè)模塊的準(zhǔn)確率達(dá)到99%,整個(gè)方案的準(zhǔn)確率還是無(wú)法接受。所以,端到端的環(huán)境建模和還原是無(wú)人駕駛技術(shù)能夠落地的重要原因。這主要得益于近年來(lái)深度人工智能的發(fā)展。因此,現(xiàn)在談人工智能的落地,都離不開(kāi)這個(gè)大背景,這與以往的AI技術(shù)有本質(zhì)區(qū)別。

王琦:這兩年最大的一個(gè)變化就是從傳統(tǒng)方法向端到端的過(guò)渡。傳統(tǒng)方法現(xiàn)在遇到了一些瓶頸。傳統(tǒng)方法把各個(gè)模塊分開(kāi),比如感知、決策規(guī)劃和控制,特別是感知和決策規(guī)劃之間。傳統(tǒng)方法有一個(gè)清晰的定義,即比較顯式的定義。感知的輸出是一些物體,比如車(chē)輛、行人等,通常是以物理量輸出的,比如邊界框及其方向、加速度等。

我們?cè)跍y(cè)試過(guò)程中發(fā)現(xiàn),交通環(huán)境中的元素、人和車(chē)之間的互動(dòng)不是那么簡(jiǎn)單。我舉一個(gè)例子,我們的一輛測(cè)試車(chē)發(fā)生了接管事件。它是在一個(gè)很小的路口發(fā)生的,我們?cè)诤笈_(tái)查看接管后,分析為什么會(huì)接管。看所有的物理量和數(shù)據(jù)時(shí),無(wú)法理解為什么會(huì)接管。因?yàn)榉治霾怀鰜?lái),所以我們問(wèn)了安全員司機(jī),司機(jī)說(shuō),當(dāng)時(shí)車(chē)在行駛時(shí),對(duì)面來(lái)了一輛車(chē),想要左轉(zhuǎn),對(duì)面的司機(jī)提前打了一個(gè)手勢(shì)示意他要左轉(zhuǎn),希望讓一下,但從車(chē)輛的物理量上看不出任何變化,所以司機(jī)停下來(lái)讓他過(guò)去。

這是一個(gè)例子,包括在平時(shí)測(cè)試中經(jīng)過(guò)人行橫道時(shí),路邊有行人,其實(shí)也有交流,但不能體現(xiàn)在物理量的變化上。如果希望通過(guò)傳統(tǒng)方法去定義這些人的姿態(tài)甚至頭的朝向,太復(fù)雜了,幾乎無(wú)法想象。

端到端的方法可能是實(shí)現(xiàn)更高級(jí)自動(dòng)駕駛的好方案。比如,當(dāng)有交互時(shí),可以提前停車(chē),減速度更小,行車(chē)體驗(yàn)更好。如果等到物理量變化時(shí)再響應(yīng),時(shí)間很短,可能會(huì)產(chǎn)生急剎。

從這個(gè)角度來(lái)看,我覺(jué)得未來(lái)端到端可能是提高駕駛體驗(yàn)的好方法。從交通環(huán)境的復(fù)雜程度來(lái)看,人和人之間的交互不是冷冰冰的。傳統(tǒng)的模塊化方案,比如感知,定義好了接口,感知輸出什么樣的對(duì)象,就要對(duì)這些對(duì)象進(jìn)行標(biāo)注,訓(xùn)練人工標(biāo)注成本很高。希望模塊化最終實(shí)現(xiàn)單一模塊化,輸入一張圖像,輸出司機(jī)的行駛軌跡或油門(mén)剎車(chē),省去中間所有環(huán)節(jié)的標(biāo)注成本。

傳統(tǒng)的模塊化感知和PNC,或感知和控制,中間有灰色地帶,經(jīng)常有技術(shù)上的溝通問(wèn)題。如果是端到端,都可以省掉。謝謝。

徐思彥:在硅谷體驗(yàn)了幾個(gè)不同的無(wú)人駕駛的產(chǎn)品,你自己的體驗(yàn)是什么樣的?

張俊偉:我覺(jué)得開(kāi)起來(lái)很順滑。舊金山的路況跟重慶有點(diǎn)像,高低起伏很多,所以在那運(yùn)營(yíng)是個(gè)挑戰(zhàn)。我和之前的同事聊過(guò),他們覺(jué)得在舊金山達(dá)到現(xiàn)在的表現(xiàn)已經(jīng)很好了。Waymo在正式上線(xiàn)前,大多數(shù)情況下已經(jīng)達(dá)到了這個(gè)水平。這說(shuō)明他們?cè)谕茝V時(shí)并不激進(jìn),法規(guī)可能也走在前面。其次,特斯拉的FSD(完全自動(dòng)駕駛)確實(shí)很順滑,特別是在簡(jiǎn)單的道路上,基本可以不用管。

這件事的發(fā)生有很多原因。過(guò)去十年里,很多人做CV或現(xiàn)在做ARP。大家不斷改進(jìn)技術(shù),終于有了一個(gè)統(tǒng)一的CVARP transformer模型,結(jié)合了sales attention和cross attention,再加上黃教主的算力支持。現(xiàn)在有終端和云端的協(xié)同,國(guó)內(nèi)的地平線(xiàn)也有芯片制造經(jīng)驗(yàn)。各方面共享資源,加上資本和學(xué)界的推動(dòng),transformer相比于之前的rule-base有很多優(yōu)勢(shì)。

舉個(gè)例子,如果在夏天,一個(gè)人打轉(zhuǎn)向時(shí)突然雨刷動(dòng)了,self attention能知道這只是按錯(cuò)了,而以前的工程師寫(xiě)的代碼無(wú)法處理這種情況。

由于transformer的自適應(yīng)機(jī)制和算力提升,很多以前隱藏的問(wèn)題現(xiàn)在都可以描述出來(lái),讓駕駛體驗(yàn)更像人開(kāi)車(chē)一樣順滑。現(xiàn)在我們有大模型language LLM和VLM。在自動(dòng)駕駛中,安全性要求很高,不能有任何差錯(cuò)。以前的傳統(tǒng)算法無(wú)法處理很多長(zhǎng)尾場(chǎng)景,比如Waymo曾經(jīng)被驢撞的事故,這是很難預(yù)料的。

多模態(tài)輸入,比如圖像和點(diǎn)云,可以通過(guò)一個(gè)架構(gòu)處理,VLM可以幫助識(shí)別長(zhǎng)尾場(chǎng)景。比如前面貨車(chē)掉下一個(gè)BBQ架子,你要躲避,而掉下一個(gè)塑料袋則可以繼續(xù)前行。以前用點(diǎn)云檢測(cè)只能識(shí)別21個(gè)物體,現(xiàn)在VLM能提升自動(dòng)駕駛技術(shù)的長(zhǎng)尾場(chǎng)景識(shí)別。我們可以看到,資本、學(xué)術(shù)和工程各方面不斷努力,終于有了突破。

徐思彥:聽(tīng)了各位的分析,我們或許可以推斷,端到端在技術(shù)上是一種更合理的進(jìn)化方向。那么現(xiàn)在除了特斯拉以外,其他的廠(chǎng)商會(huì)不會(huì)考慮用端到端的解決方案?

大衛(wèi):我覺(jué)得大部分公司現(xiàn)在很難轉(zhuǎn)型到端到端。為什么這么說(shuō),因?yàn)樽詣?dòng)駕駛可以分成兩個(gè)方面。一個(gè)是像我們知道的Waymo。在國(guó)內(nèi)就是百度的蘿卜快跑,或者像文遠(yuǎn)、小馬這些公司提供的服務(wù)。這些公司提供的是出行服務(wù),而不是技術(shù)。你不關(guān)心車(chē)頂上的雷達(dá)和相機(jī),或背后的算法。

Waymo車(chē)后備箱里用了兩塊A100顯卡,每塊顯卡價(jià)格接近2萬(wàn)美元,光顯卡就快4萬(wàn)美元。整個(gè)Waymo車(chē)成本至少15萬(wàn)美元。你開(kāi)一臺(tái)奔馳S600在路上就是這個(gè)概念。在國(guó)內(nèi),這個(gè)成本基本上是人民幣50多萬(wàn)。所以出行服務(wù)公司為了提供良好的體驗(yàn),必須用大量傳感器和強(qiáng)大算力來(lái)支撐算法和車(chē)輛,以確保足夠的冗余,把你從A點(diǎn)送到B點(diǎn)。

對(duì)于大部分汽車(chē)公司來(lái)說(shuō),比如特斯拉或小鵬,它們的目標(biāo)不是提供出行服務(wù),而是賣(mài)車(chē)。賣(mài)多少車(chē)直接影響股價(jià)。我們要把這分成兩個(gè)世界來(lái)看:賣(mài)車(chē)的公司對(duì)成本非常敏感,每增加100塊人民幣對(duì)主機(jī)廠(chǎng)來(lái)說(shuō)都很重要,因?yàn)檫@直接影響利潤(rùn)率和消費(fèi)者是否愿意購(gòu)買(mǎi)大模型這套體系,或者說(shuō)以視覺(jué)加無(wú)圖和大模型為主的體系,不用激光雷達(dá)這些貴的傳感器,也不用高精地圖。這套體系省錢(qián),因?yàn)榇竽P偷挠?xùn)練成本長(zhǎng)期來(lái)說(shuō)小于傳統(tǒng)的基于規(guī)則的系統(tǒng)。

我覺(jué)得出行服務(wù)公司已經(jīng)無(wú)法轉(zhuǎn)型了,或者說(shuō)已經(jīng)在這條路上走得太遠(yuǎn),無(wú)法回頭。現(xiàn)在要做基于大模型的東西,可能要推翻之前的工作。市場(chǎng)和資本是否能支持推倒重來(lái)是一個(gè)問(wèn)題。

對(duì)于主機(jī)廠(chǎng)來(lái)說(shuō),我覺(jué)得它們還是有一個(gè)窗口期,特別是那些數(shù)據(jù)平臺(tái)做得比較好的公司。體系已經(jīng)搭建起來(lái)了,有不少車(chē)在路上跑,可以實(shí)現(xiàn)數(shù)據(jù)閉環(huán),再做算法閉環(huán)。這是可行的。如果車(chē)賣(mài)得不多,還要搞大模型就很難,因?yàn)椴罹嗵蟆?/p>

徐思彥:那我們是不是可以推斷,現(xiàn)在世界上只有特斯拉有這個(gè)能力去做端到端的模型,甚至在未來(lái)變成一家提供運(yùn)力的公司?

大衛(wèi):這個(gè)問(wèn)題非常好,說(shuō)實(shí)話(huà),我覺(jué)得特斯拉確實(shí)在這方面獨(dú)步天下。他們用了車(chē)載硬件,現(xiàn)在叫HW4.0,當(dāng)然HW5.0也有了。相比之下,和用Nvidia的公司比,從數(shù)據(jù)層面來(lái)看,HW4.0的絕對(duì)算力遠(yuǎn)低于英偉達(dá),甚至和地平線(xiàn)的J5差不多。為什么表現(xiàn)這么好?因?yàn)樗€有一個(gè)龐大的體系,就是它的數(shù)據(jù)體系和算力都是自己的。無(wú)論是DO有沒(méi)有出來(lái),這么多顯卡都是他的資產(chǎn),另外還有百萬(wàn)的車(chē)在路上跑,源源不斷地提供數(shù)據(jù)。實(shí)際上,特斯拉做的最正確的一件事就是沒(méi)有推出特別多的SKU。不像蔚來(lái)、小鵬或其他國(guó)內(nèi)造車(chē)新勢(shì)力瘋狂推新車(chē)。

特斯拉說(shuō)到底,Model 3和Model Y是同一個(gè)平臺(tái),你甚至可以理解Model Y就是Model 3,只是高度增加了,前向相機(jī)的Z軸稍微高了一點(diǎn)。大部分BEV的數(shù)據(jù)在這一個(gè)平臺(tái)都可以共用。從創(chuàng)業(yè)至今,特斯拉一款車(chē)型在路上跑,有幾百萬(wàn)車(chē)主給它源源不斷地貢獻(xiàn)數(shù)據(jù)。在這個(gè)級(jí)別,特斯拉在全世界是沒(méi)有對(duì)手的。豐田和本田雖然車(chē)賣(mài)得多,但那些車(chē)大多是非智能化的車(chē)。國(guó)內(nèi)可能賣(mài)得比較好的像理想這些公司,一個(gè)問(wèn)題是SKU有點(diǎn)多,比如L9和L6甚至是Mega并不在同一個(gè)數(shù)據(jù)平臺(tái)。雖然這些車(chē)每個(gè)月銷(xiāo)量過(guò)萬(wàn),在中國(guó)算是不錯(cuò)的銷(xiāo)量,但和Model Y這款“神車(chē)”比,量還是太小了。所以,如果在這個(gè)節(jié)點(diǎn)回答思彥的問(wèn)題,可能只有特斯拉有獨(dú)步天下的技術(shù)和前瞻性。

Robotaxi的商業(yè)化之路

徐思彥:剛剛第一個(gè)部分,大家已經(jīng)回顧了一下自動(dòng)駕駛整個(gè)的發(fā)展歷程,并且我覺(jué)得嘉賓們都有一個(gè)比較一致的判斷,端到端的這個(gè)架構(gòu)在自動(dòng)駕駛上是非常領(lǐng)先的,而且是未來(lái)的一個(gè)發(fā)展方方向,第二個(gè)部分,我們就想討探討一下robotaxi現(xiàn)在的發(fā)展情況和商業(yè)化之路。

徐思彥:如何看待之前的無(wú)人自駕駛出租車(chē)試運(yùn)營(yíng)?

肖仰華:從商業(yè)模式的角度來(lái)看,現(xiàn)在還很難說(shuō),因?yàn)榇蠹叶荚谠圏c(diǎn)階段。大家提到技術(shù)路線(xiàn)時(shí),說(shuō)到一種方法是端到端,但投入大成本高,只有像特斯拉這樣的巨頭才有資源。另一種是傳統(tǒng)的堆疊式方案,基于專(zhuān)家系統(tǒng)和規(guī)則,但隱性成本也高。我認(rèn)為這兩種路線(xiàn)的結(jié)合才能使無(wú)人駕駛最終安全可靠。99%的情況下,端到端駕駛就夠了,但1%的特殊情況還是需要傳統(tǒng)專(zhuān)家系統(tǒng)。哪怕只有1%的情況出問(wèn)題,也會(huì)對(duì)生命安全造成重大影響。尤其在我國(guó)的路況下,車(chē)與車(chē)、車(chē)與路、人與人之間的關(guān)系都很復(fù)雜。端到端模型只考慮車(chē)路環(huán)境和人的控制,但人為什么采取某些動(dòng)作,涉及到社會(huì)認(rèn)知。大模型在這方面能力有限,遠(yuǎn)不如人類(lèi)。所以,做好與人的協(xié)同和傳統(tǒng)專(zhuān)家系統(tǒng)的協(xié)同很關(guān)鍵。技術(shù)和安全的問(wèn)題,需要時(shí)間解決。無(wú)人駕駛落地需要安全可靠,可以先嘗試在一些受限場(chǎng)景中探索,比如固定路線(xiàn)的貨運(yùn)或者小開(kāi)放城鎮(zhèn)。

徐思彥:大衛(wèi)最早就是從特殊場(chǎng)景切入來(lái)做無(wú)人車(chē)的,可以分享一下你的經(jīng)歷?

大衛(wèi):最早我們做的是無(wú)人配送,叫最后一公里配送。從倉(cāng)庫(kù)或飯店把外賣(mài)或產(chǎn)品送到家門(mén)口,而不是做機(jī)器人出租車(chē)。我們發(fā)現(xiàn)機(jī)器人出租車(chē)并不是一個(gè)好生意,但我并不是反對(duì)同行做這個(gè)。我仍然非常尊敬那些公司,只是分享我的感受。

在美國(guó)情況是,因?yàn)檫\(yùn)力不足且客單價(jià)高。美國(guó)一英里大約一塊多美元,而中國(guó)的差距在于匯率。美國(guó)的出租車(chē)行業(yè)可能更容易盈利。而在日本,因?yàn)槔淆g化,出租車(chē)司機(jī)多為老年人,無(wú)人駕駛出租車(chē)會(huì)是一個(gè)增量市場(chǎng)。

還有一個(gè)誤區(qū)是把L4等同于無(wú)人出租車(chē)。L4是對(duì)車(chē)自動(dòng)化的一種分級(jí),滿(mǎn)足一定條件就是L4。特斯拉的FSD在宣傳上有一點(diǎn)誤導(dǎo),雖然在L2上做得很好,但不能完全滿(mǎn)足L4的要求。所以特斯拉用戶(hù)經(jīng)常會(huì)有驚喜,但這并不代表技術(shù)已經(jīng)很成熟。

最后,L4不等于無(wú)人出租車(chē)服務(wù)。無(wú)人出行服務(wù)涉及車(chē)內(nèi)外的多個(gè)維度。車(chē)內(nèi)的舒適度和服務(wù)質(zhì)量也很重要。例如,你在手機(jī)APP上定了一個(gè)位置,但車(chē)不能準(zhǔn)確到達(dá),這會(huì)影響用戶(hù)體驗(yàn)。所以我認(rèn)為L(zhǎng)4技術(shù)還有很長(zhǎng)的路要走。

徐思彥:我們的無(wú)人出租車(chē)服務(wù)到底需要什么級(jí)別的自動(dòng)化?未來(lái)的安全員和自動(dòng)駕駛系統(tǒng)應(yīng)該如何配合?

大衛(wèi):蘿卜快跑的無(wú)人出租車(chē)背后有一個(gè)實(shí)時(shí)控制系統(tǒng)。遇到問(wèn)題時(shí),比如前面有個(gè)老人摔倒了,你可以用這個(gè)方向盤(pán)來(lái)控制車(chē)。車(chē)會(huì)實(shí)時(shí)響應(yīng)你的操作。這個(gè)控制模塊連接到車(chē)的can bus,通過(guò)5G或4G連接到服務(wù)器,再到你的方向盤(pán)。就像直播一樣,是實(shí)時(shí)的。不過(guò)這很危險(xiǎn),一旦信號(hào)中斷,控制車(chē)就會(huì)有問(wèn)題。

美國(guó)公司有兩種技術(shù)路線(xiàn)。一種是半依賴(lài)車(chē)的自動(dòng)駕駛。在高精地圖上重新規(guī)劃路線(xiàn)。如果你不熟悉這個(gè)技術(shù),我可以解釋一下。車(chē)在高精地圖上有一條規(guī)劃線(xiàn),基于高清地圖和語(yǔ)義地圖,每個(gè)點(diǎn)都標(biāo)記好,車(chē)沿著這些點(diǎn)前進(jìn)。

一種技術(shù)路線(xiàn)是像美國(guó)的zoox,他們會(huì)幫你重新連接這些點(diǎn)。比如前面有個(gè)三角錐或老人擋住了,遠(yuǎn)程控制的人不是實(shí)時(shí)控制方向盤(pán),而是重新連接點(diǎn)。車(chē)不會(huì)從自動(dòng)駕駛模式切換到人工駕駛模式,而是繼續(xù)在自動(dòng)駕駛模式下,從新連接的點(diǎn)開(kāi)始走。另一種方法是我們的客戶(hù)使用的,車(chē)有自動(dòng)駕駛能力。你確認(rèn)后給一個(gè)指令,比如往左或往右拐,拐完后車(chē)會(huì)繼續(xù)自動(dòng)駕駛。這兩種方法都不是蘿卜快跑的實(shí)時(shí)控制。在我看來(lái),實(shí)時(shí)控制車(chē)非常危險(xiǎn)。

王琦:我比較同意大衛(wèi)的說(shuō)法,就是如果Robotaxi和L4本身這個(gè)技術(shù),其實(shí)在它的實(shí)現(xiàn)層面是有一定差的。我們現(xiàn)在要討論的一個(gè)問(wèn)題是,人對(duì)于一輛車(chē)到底意味著什么。在我看來(lái),人開(kāi)車(chē)的時(shí)候,不只是完成駕駛?cè)蝿?wù),他其實(shí)是整輛車(chē)的管理者。就像一輛列車(chē)一樣,它有一個(gè)列車(chē)長(zhǎng)。列車(chē)長(zhǎng)的作用不僅僅是開(kāi)車(chē),他還要負(fù)責(zé)關(guān)注車(chē)的行駛,以及管理很多其他的任務(wù)。車(chē)上的各種狀況他都要管理。

比如說(shuō)你今天接了一個(gè)乘客,這個(gè)乘客晚上喝了酒,上車(chē)就開(kāi)始睡覺(jué)。在下車(chē)的時(shí)候,如果沒(méi)有人在,你能僅僅用語(yǔ)音把他叫醒嗎?你可能得推他一下吧,如果推完他,他還沒(méi)醒,他的呼吸不正常,那你可能得把他送到醫(yī)院去。作為一個(gè)車(chē)的管理者,我們看到的有些場(chǎng)景是在路口發(fā)生擁堵時(shí),交警過(guò)來(lái)指揮。如果沒(méi)有人,你就無(wú)法與交警進(jìn)行有效的交互。甚至有一些情況,比如兩邊的路都堵了,只有一個(gè)單行道能通過(guò),對(duì)面也來(lái)車(chē)了。這時(shí)候如果有人的話(huà),你可能會(huì)把車(chē)窗搖下來(lái),跟對(duì)方說(shuō)話(huà),甚至下車(chē)與對(duì)方交涉,設(shè)計(jì)一個(gè)方案,讓出空位,才能通過(guò)。

人是車(chē)輛的管理者,駕駛只是他所有工作的一部分,雖然是最重要的任務(wù),但除此之外,還有很多其他任務(wù)。就像剛才舉的喝酒的例子,發(fā)生的概率非常小,可能你開(kāi)一兩個(gè)月才能遇上一次,但如果遇上了,你就必須解決,不能不管。這些事情是我們目前技術(shù)的發(fā)展還沒(méi)有很好解決的問(wèn)題。我對(duì)Robotaxi的看法是,如果你真的想替代現(xiàn)有的出租車(chē)業(yè)務(wù),這些問(wèn)題必須有一個(gè)合理的解決辦法。

徐思彥:未來(lái)可能出現(xiàn)沒(méi)有方向盤(pán)的無(wú)人出租車(chē)嗎?

王琦:我們?cè)谏钲谟幸粋€(gè)在建的辦公園區(qū),騰訊總部園區(qū)是一個(gè)半島,主要用于辦公和商業(yè)。我們的目標(biāo)是實(shí)現(xiàn)園區(qū)內(nèi)的接駁服務(wù),方便員工通勤和游客觀光。企鵝島未來(lái)可能會(huì)成為一個(gè)旅游景點(diǎn),所以周末會(huì)有游客。我們計(jì)劃推出自動(dòng)駕駛的觀光車(chē),并在觀光車(chē)上應(yīng)用一些現(xiàn)有的技術(shù)。

在研發(fā)過(guò)程中,我們遇到了一個(gè)有趣的場(chǎng)景。我們的車(chē)是獨(dú)立設(shè)計(jì)的,與普通車(chē)不同。它沒(méi)有前后之分,可以正著開(kāi),也可以倒著開(kāi),而且沒(méi)有方向盤(pán)。要實(shí)現(xiàn)端到端,首先需要人機(jī)共駕。而人機(jī)共駕的前提是需要方向盤(pán)和司機(jī)的輸入。現(xiàn)在的問(wèn)題是,我認(rèn)為未來(lái)自動(dòng)駕駛會(huì)發(fā)展到一個(gè)階段,與我們遇到的問(wèn)題類(lèi)似。你的自動(dòng)駕駛已經(jīng)非常好,不需要再和人類(lèi)學(xué)習(xí)。那時(shí)你會(huì)移除方向盤(pán)。這樣技術(shù)如何迭代就變得遙遠(yuǎn)了。目前我們主要解決端到端的問(wèn)題。未來(lái)沒(méi)有司機(jī)的輸入,移除方向盤(pán)后,它就不迭代了嗎?肯定會(huì)迭代,而且要比人做得更好。

還有一個(gè)問(wèn)題。現(xiàn)在評(píng)價(jià)端到端時(shí),大家常用一個(gè)詞:“他的駕駛行為更像人”。但像人就意味著更好嗎?當(dāng)然,人駕駛時(shí)往往是比較合理的,但人在車(chē)內(nèi)關(guān)注時(shí)有盲區(qū)。學(xué)車(chē)時(shí)教練常說(shuō):“讓速不讓路”。為什么?因?yàn)槿嗽谕粫r(shí)間只能關(guān)注一個(gè)方向,比如前面突然發(fā)生事故,你要急剎車(chē)。這時(shí)不能打方向盤(pán)跑到另一個(gè)車(chē)道,因?yàn)槟汴P(guān)注前面時(shí),無(wú)法關(guān)注左后方或右后方。這是人的注意力局限。

對(duì)于自動(dòng)駕駛,這種情況成立嗎?不成立。為什么?因?yàn)樽詣?dòng)駕駛是360度的,裝了許多傳感器,全部都能看到。我認(rèn)為端到端能學(xué)到人的優(yōu)秀駕駛行為,但人的駕駛局限性也可能會(huì)體現(xiàn)在端到端的模型里面。肖老師剛才提到,我們未來(lái)可能要結(jié)合這兩種方法,才能得到最優(yōu)的駕駛體驗(yàn)!

徐思彥:對(duì)于這個(gè)自動(dòng)駕駛來(lái)說(shuō),端到端現(xiàn)在能讓它更快的像人一樣去駕駛,但是這并不是最終的一個(gè)解決方案。馬斯克自己也說(shuō),他希望他的Robotaxi是沒(méi)有方向盤(pán),沒(méi)有后視鏡的。它的設(shè)計(jì)應(yīng)該跟現(xiàn)在的汽車(chē)是完全不一樣的,這樣子的未來(lái)離我們大概有多遠(yuǎn)?

張俊偉:馬老板之前說(shuō)8月8號(hào),但現(xiàn)在推到十月。他不知道原因,可能是技術(shù)不成熟,或者他自己想推遲。他說(shuō)要基于robot taxi,打造自己的原型車(chē)。馬老板每次都會(huì)提出大計(jì)劃,雖然有限交付,但已經(jīng)比很多人強(qiáng)。他當(dāng)時(shí)說(shuō)到100的時(shí)候,我們可以給他打一個(gè)折扣。

剛才王琦博士雖然舉了很多酒駕的例子,但我們不得不承認(rèn),在正常駕駛情況下,技術(shù)確實(shí)有幫助。比如,工程師寫(xiě)代碼時(shí),大家擔(dān)心大模型會(huì)導(dǎo)致失業(yè),初級(jí)工作會(huì)減少。比如在東南亞,我們公司以前有100個(gè)客服寫(xiě)手,現(xiàn)在可以減少到50個(gè)。駕駛方面也是這樣,技術(shù)進(jìn)步后,人們可以把時(shí)間和精力用在其他地方。這是一個(gè)事實(shí),不管我們?cè)覆辉敢狻N覀冃枰粩噙M(jìn)步,而不僅僅是討論問(wèn)題。明年我們?cè)诩寄苌峡傄冉衲暧兴M(jìn)步。自從進(jìn)入農(nóng)業(yè)社會(huì),人類(lèi)就一直在進(jìn)步,這是不可避免的。

徐思彥:我同意俊偉的看法,因?yàn)檫@件事的發(fā)展,有各方面在推動(dòng)。除了特斯拉這樣的車(chē)廠(chǎng),還有新的運(yùn)營(yíng)公司,他們都會(huì)在這個(gè)方向努力。不僅是中美,其他國(guó)家也會(huì)參與。當(dāng)越來(lái)越多的公眾覺(jué)得Robotaxi的成本低于傳統(tǒng)出租車(chē)時(shí),他們會(huì)在正常情況下嘗試Robotaxi的服務(wù)。它不一定要現(xiàn)在取代所有的出租車(chē)服務(wù),而是可能先從取代10%到20%開(kāi)始。

Robotaxi的社會(huì)影響

徐思彥:但是我們接下來(lái)要討論的第三個(gè)部分也是Robotaxi的社會(huì)影響和面臨的問(wèn)題。現(xiàn)在除了技術(shù),還有很多其他問(wèn)題,比如政策和法律。在美國(guó),大家一直認(rèn)為卡車(chē)是一個(gè)很好的應(yīng)用場(chǎng)景,因?yàn)殚L(zhǎng)途卡車(chē)司機(jī)容易疲勞,事故率也很高。但是到目前為止,我們還沒(méi)有看到自動(dòng)駕駛在卡車(chē)司機(jī)群體中的大規(guī)模應(yīng)用。是不是有工會(huì)或者其他因素的影響?

大衛(wèi):任何一個(gè)AI技術(shù),不僅是自動(dòng)駕駛,都可能影響人力。它是補(bǔ)充還是替代?首先,美國(guó)是一個(gè)資本主義社會(huì),工會(huì)力量大并不代表不可取代。比如,美國(guó)卡車(chē)司機(jī)的平均工資約為16萬(wàn)美元。這是因?yàn)樗麄兓撕芏鄷r(shí)間在路上,遠(yuǎn)離家庭,而且一天不能工作超過(guò)一定里程。對(duì)沃爾瑪、可口可樂(lè)等依賴(lài)卡車(chē)運(yùn)力的公司來(lái)說(shuō),如果新技術(shù)更便宜,他們肯定會(huì)采用。

另外,我想強(qiáng)調(diào)為什么美國(guó)沒(méi)有出現(xiàn)沖突。百度的蘿卜快跑在展示時(shí)采用了高補(bǔ)貼。一方面吸引普通消費(fèi)者,另一方面擠占市場(chǎng)。而中國(guó)公司在商業(yè)邏輯上和美國(guó)公司不同。比如,舊金山的Waymo和Uber價(jià)格一樣。Waymo背靠Google,卻沒(méi)有采用低價(jià)補(bǔ)貼,因?yàn)檫@不符合商業(yè)邏輯。美國(guó)公司不愿意這樣做,因?yàn)檫@會(huì)提高壓力閾值,長(zhǎng)期來(lái)說(shuō)傷害市場(chǎng)。

這是一個(gè)商業(yè)邏輯問(wèn)題。過(guò)去,人類(lèi)發(fā)展中,有電話(huà)接線(xiàn)員和打字員的工作消失了,但這些人并沒(méi)有餓死,而是去做了別的工作。每次產(chǎn)業(yè)革命都是增量市場(chǎng),不是存量市場(chǎng)博弈。

肖仰華:我認(rèn)為整個(gè)社會(huì)要考慮如何安置被新技術(shù)代替的勞動(dòng)力。我們應(yīng)該抓住這波人工智能的發(fā)展機(jī)遇,但是不能再走互聯(lián)網(wǎng)的老路。當(dāng)年互聯(lián)網(wǎng)的發(fā)展,比如電商,不管線(xiàn)下商店需不需要,我們直接代替了很多線(xiàn)下工作,看似提高了效率,但也帶來(lái)很多問(wèn)題。比如現(xiàn)在很多學(xué)生喜歡點(diǎn)外賣(mài),身體素質(zhì)下降,吃外賣(mài)的時(shí)間并沒(méi)有用來(lái)鍛煉身體,而是做了其他事,雖然效率提升了,但也帶來(lái)了社會(huì)問(wèn)題。

我認(rèn)為大模型或者人工智能的to C應(yīng)用要考慮社會(huì)成本和治理代價(jià)。但在工業(yè)、制造業(yè)、航天航空等領(lǐng)域,可以大規(guī)模推動(dòng)AI的生產(chǎn)力提升。在面向普通消費(fèi)者的應(yīng)用,尤其是涉及大量崗位的領(lǐng)域,我們要慎重。

徐思彥:最后,我想請(qǐng)大家暢想一下未來(lái)。五到十年后,如果自動(dòng)駕駛技術(shù)安全性超過(guò)了基準(zhǔn),它有可能大規(guī)模普及,甚至改變汽車(chē)的定義。馬斯克暢想過(guò)他的Robotaxi可以在空閑時(shí)間為車(chē)主帶來(lái)額外收益,成為一個(gè)生產(chǎn)力工具。這樣的未來(lái)有可能實(shí)現(xiàn)嗎?

王琦:我覺(jué)得很難預(yù)測(cè)實(shí)現(xiàn)的時(shí)間。雖然我們有很大進(jìn)步,但還有一些現(xiàn)實(shí)問(wèn)題。但從十年的跨度來(lái)看,還是有可能實(shí)現(xiàn)的。

我在視頻網(wǎng)站上看到一個(gè)國(guó)外專(zhuān)家分享未來(lái)自動(dòng)駕駛的愿景。他說(shuō)了很多,但有一點(diǎn)很吸引我。如果城市里所有的車(chē)都是自動(dòng)駕駛的,不管是出租車(chē)還是私家車(chē),就不需要在辦公區(qū)或家周?chē)\?chē)了。這樣城市里就不需要再有停車(chē)場(chǎng)了。大家可以想象,城市里很多地方被停車(chē)場(chǎng)占據(jù)。尤其是像北京的一些狹窄小區(qū),路邊到處都是車(chē)。如果實(shí)現(xiàn)自動(dòng)駕駛,車(chē)可以停在郊區(qū)的停車(chē)場(chǎng),早上來(lái)接你,送到辦公區(qū)后就離開(kāi),不需要停在辦公區(qū)周?chē)_@樣城市里會(huì)有很多空閑區(qū)域,可以變成公園或活動(dòng)場(chǎng)所,活動(dòng)空間會(huì)變大。這是我覺(jué)得很吸引人的一點(diǎn),城市環(huán)境會(huì)有很大變化。

還有一個(gè)問(wèn)題是馬斯克的共享出租車(chē)。我的理解是車(chē)空閑時(shí)可以替你跑出租。但我很難想象怎么操作,因?yàn)樗郊臆?chē)是私人空間,像手機(jī)和電腦。你能想象把空閑的手機(jī)或電腦租給別人用嗎?大部分人做不到。同樣,車(chē)對(duì)很多人來(lái)說(shuō)是第二個(gè)家,尤其有孩子后,后備箱可能有尿布或帳篷。如果要在空閑時(shí)租出去,這些事情怎么解決?

徐思彥:可能就像滴滴剛出現(xiàn)時(shí),大家談?wù)摰氖枪蚕斫?jīng)濟(jì)的概念,就是你有空時(shí)可以去跑滴滴。但后來(lái)你會(huì)發(fā)現(xiàn),大多數(shù)還是專(zhuān)業(yè)司機(jī)在開(kāi)車(chē)。無(wú)人出租車(chē)也許也會(huì)這樣演變,一開(kāi)始是共享的概念,最后變成大家把它當(dāng)作理財(cái)產(chǎn)品去投資,可能不是買(mǎi)一輛,而是買(mǎi)十輛。如果這個(gè)東西有利可圖的話(huà),這是我的猜測(cè)。

大衛(wèi):我覺(jué)得在一定范圍內(nèi),我們可以實(shí)現(xiàn)純商業(yè)化運(yùn)營(yíng)。比如在舊金山的市中心,或深圳的南山區(qū)和福田區(qū),這些高附加值區(qū)域,從技術(shù)層面是可行的,盡管可能會(huì)犧牲一些效率。比如說(shuō),robot taxi 可能需要20分鐘完成一個(gè)原本15分鐘的路程,但價(jià)格會(huì)便宜一些。我不確定具體哪年能實(shí)現(xiàn)商業(yè)化,之前我們說(shuō)2018年或2020年是自動(dòng)駕駛的元年,但現(xiàn)在是2024年了,所以具體哪一年并沒(méi)有意義。

但是我們會(huì)看到,L4級(jí)別的技術(shù)會(huì)大幅度提升乘用車(chē)和商用車(chē)輛的安全性。現(xiàn)在很多車(chē)都有高級(jí)輔助駕駛,你可以在車(chē)上做更多事情,比如聊天或看短視頻,而不用一直盯著路面。這也是一種駕駛體驗(yàn)的提升。同時(shí),L4級(jí)別的技術(shù)也會(huì)大幅度提高安全性,因?yàn)楦呒?jí)輔助駕駛可以將每個(gè)車(chē)主的駕駛行為數(shù)據(jù)化和可視化,這甚至?xí)淖儽kU(xiǎn)行業(yè)。

汽車(chē)保險(xiǎn)業(yè)之前是通過(guò)統(tǒng)計(jì)數(shù)據(jù)來(lái)估算保險(xiǎn)費(fèi)率,比如豐田凱美瑞的事故率和車(chē)主畫(huà)像。但特斯拉已經(jīng)開(kāi)始根據(jù)車(chē)主的具體行為來(lái)定制保險(xiǎn),這是一種更精準(zhǔn)的方法。高級(jí)輔助駕駛能提高車(chē)輛的安全性,同時(shí)根據(jù)具體車(chē)主的行為定制保險(xiǎn)。這些都是未來(lái)會(huì)出現(xiàn)的變化,但不會(huì)一下子就實(shí)現(xiàn)Robotaxi的全面普及。

徐思彥:謝謝,我覺(jué)得大衛(wèi)的總結(jié)非常好。我們不用站在這個(gè)事物的兩個(gè)對(duì)立面,并不是說(shuō)Robotaxi成熟了就一定取代司機(jī)了。我們首先面對(duì)的未來(lái)可能是人機(jī)共存的。之前WAIC上我們提了一個(gè)概念叫”機(jī)器外腦“,無(wú)人駕駛系統(tǒng)也是我們開(kāi)車(chē)的時(shí)候的外腦,可以使我們的駕駛過(guò)程變得更安全。

徐思彥:最后,我們請(qǐng)這個(gè)肖老師給我們這次的線(xiàn)上圓桌做一個(gè)簡(jiǎn)單的總結(jié)吧!

肖仰華:無(wú)人駕駛是一種先進(jìn)的技術(shù)和生產(chǎn)力,它遲早會(huì)實(shí)現(xiàn)。從技術(shù)角度來(lái)看,我認(rèn)為技術(shù)成熟的速度可能會(huì)比預(yù)期更快。最近幾年的技術(shù)進(jìn)展遠(yuǎn)超需求。關(guān)鍵在于誰(shuí)能把現(xiàn)有技術(shù)融合成成熟的產(chǎn)品,并利用大規(guī)模數(shù)據(jù)找到有效的落地模式。我相信技術(shù)很快會(huì)成熟。我認(rèn)為不需要十年。

真正阻礙無(wú)人駕駛大規(guī)模使用的更多是社會(huì)因素,比如保險(xiǎn)業(yè)。無(wú)人駕駛推廣后,保險(xiǎn)行業(yè)和出行行業(yè)都會(huì)發(fā)生變化。這些變化是社會(huì)問(wèn)題,需要緩慢有序地調(diào)整和過(guò)渡,否則會(huì)帶來(lái)社會(huì)震蕩。未來(lái)的問(wèn)題更多是該不該,而不是能不能。社會(huì)結(jié)構(gòu)和關(guān)系需要慢慢適應(yīng)這種先進(jìn)生產(chǎn)力,這可能是未來(lái)的重要問(wèn)題。這種考慮可能會(huì)讓無(wú)人駕駛的大規(guī)模普及成為一個(gè)十年周期的現(xiàn)象。

本文作者:騰訊研究院,來(lái)源:騰訊研究院,原文標(biāo)題:《自動(dòng)駕駛的GPT時(shí)刻,來(lái)了嗎?》

Tags:
相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴(lài)本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。

熱門(mén)文章