極越夏一平:未來汽車的OS,就是大模型
作者 | 周永亮 編輯 | 靖宇
「電動(dòng)化帶來的不只是能源的變化,這也是為什么極越覺得現(xiàn)在進(jìn)入汽車行業(yè)也不晚。」
10 月 27 日,極越品牌旗下首款車型極越 01 正式上市,一個(gè)多月后的極客公園創(chuàng)新大會(huì) 2024 上,集度 CEO、極越 CEO 夏一平就表示他們有信心,哪怕不久后特斯拉的自動(dòng)駕駛將進(jìn)入中國,但在智能駕駛體驗(yàn)上,極越將比特斯拉做得更好。
在 12 月 16 日舉辦的極客公園創(chuàng)新大會(huì) 2024 上,夏一平介紹了「極越」這個(gè)讓大多數(shù)人還有些陌生的汽車品牌。背靠在智能駕駛深耕多年的百度,極越在業(yè)內(nèi)第一個(gè)提出「汽車機(jī)器人」的概念,其內(nèi)核是載人機(jī)器人。這正是極越與其他新能源汽車品牌的不同之處。
夏一平認(rèn)為,智能化的汽車就是可以自然交流、自由移動(dòng)、自我成長的「機(jī)器人」,汽車將從過去冰冷的機(jī)器,變成有溫度的伙伴。
而在新能源汽車行業(yè)「風(fēng)生卷起」的當(dāng)下,夏一平和團(tuán)隊(duì)的思考回歸到了智能汽車本身:電動(dòng)化較之化學(xué)能源,帶來的不只是能源變化,而是范式轉(zhuǎn)換。未來汽車比拼的底層,已經(jīng)從操控變成了算力的競爭。
在各家比拼續(xù)航、三電、操控之時(shí),極越在思考車真正智能化的方向:智能不只是功能堆疊,也不是把車機(jī)當(dāng)成大屏手機(jī),而是充分利用高算力芯片,把車當(dāng)成一個(gè)完整的智能體,銜接上大模型的應(yīng)用,如同機(jī)器人一般,調(diào)動(dòng)起它的「全部感官」。
當(dāng)各家都在比拼智能駕駛「開城大戰(zhàn)」時(shí),夏一平認(rèn)為光看數(shù)字意義不大,而是要看智駕能覆蓋的范圍。當(dāng)特斯拉的 FSD(全自動(dòng)智能駕駛)入華的新聞傳來時(shí),夏一平認(rèn)為在中國,極越的智駕有信心做的比特斯拉更好。
以下是夏一平在極客公園創(chuàng)新大會(huì) 2024 上的演講實(shí)錄,由極客公園整理。
01 智能車,如何進(jìn)化成「機(jī)器人」
極越 01 在極客公園創(chuàng)新大會(huì) 2024 現(xiàn)場進(jìn)行展示|極客公園
張鵬:極越 01 已經(jīng)上市,很多人對(duì)于車的理解沒那么專業(yè),你作為產(chǎn)品的創(chuàng)造者解讀一下,在極越 01 的設(shè)計(jì)上是怎么思考的?
夏一平:極越這個(gè)品牌在誕生之初,品牌、服務(wù)、產(chǎn)品這三個(gè)體系就按照一整套的規(guī)范去打造。核心是希望突出它的科技感,所以無論是整車和品牌,還是線下門店和服務(wù),我們?cè)谠O(shè)計(jì)上融入了很多機(jī)器人相關(guān)的概念。
我們?cè)O(shè)計(jì)師最早在設(shè)計(jì)汽車時(shí),按照三個(gè)方向,第一是機(jī)器人化有未來感,這個(gè)車不是簡單的一臺(tái)冰冷的機(jī)器,它怎么跟人產(chǎn)生情感交流。
第二是未來汽車發(fā)展的形態(tài)。你要思考機(jī)器人擁有什么樣的能力才能被稱之為機(jī)器人,不管它是四個(gè)輪子汽車形態(tài),還是兩足、四足或是人形機(jī)器人,它跟人類共存的時(shí)候要具備基本的能力,比如自然語言交流,所以我們比較強(qiáng)調(diào)自然交流。我們認(rèn)為不管在任何的場景下,所有形態(tài)的機(jī)器人一定要實(shí)現(xiàn)自我行走,它本質(zhì)上就是自動(dòng)駕駛。
第三點(diǎn)很重要,它必須可以基于數(shù)據(jù)和場景自我學(xué)習(xí)和迭代。
這三點(diǎn)是我們公司開發(fā)產(chǎn)品的三大定律,也是我們對(duì)產(chǎn)品最底層最核心的定義:自然交流、自由移動(dòng)、自我成長。硬件、底層的架構(gòu)、軟件的智能化,再到上層各種模型的融合應(yīng)用,都是圍繞著這三個(gè)最核心的邏輯去打造的。
張鵬:之前大家可能還沒有在車和機(jī)器人兩者之間產(chǎn)生很強(qiáng)烈的關(guān)聯(lián),以前一說機(jī)器人就是掃地機(jī)器人,你認(rèn)為在一個(gè)家庭里,車其實(shí)就是機(jī)器人,車跟人有了關(guān)系的變化,這種關(guān)系到底變化在哪?
夏一平:過去我們?cè)谑褂密嚨臅r(shí)候,是我們?cè)隈{駛它,操縱它。而現(xiàn)在,車已經(jīng)不再是一個(gè)冰冷的機(jī)器,它更多是一個(gè)伙伴。我們的車語音助手叫 SIMO,就很多車主會(huì)認(rèn)為 SIMO 是一個(gè)有人性和感情的伙伴。
張鵬:類似于助理的角色。
夏一平:對(duì),因?yàn)椴恢管噧?nèi)可以交互,車外也可以交互,所以本質(zhì)上它不是一個(gè)簡單的接收指令的系統(tǒng),而能跟人產(chǎn)生交互的感覺。
張鵬:在車外能交互是一個(gè)改變?nèi)塑囮P(guān)系的重要點(diǎn),車內(nèi)交互時(shí)我會(huì)當(dāng)它是助理,但人在車外,車也能理解我嗎?
夏一平:是。差不多 2008、2009 年,智能汽車開始做語音交互,你會(huì)發(fā)現(xiàn)第一波做車內(nèi)語音的時(shí)候,那時(shí)候我們覺得已經(jīng)做得很強(qiáng)了。但那個(gè)時(shí)代沒人用語音交互,當(dāng)時(shí)不像現(xiàn)在,你在車?yán)锟梢噪S便說語音指令,現(xiàn)在的語音系統(tǒng)能理解自然語言。當(dāng)時(shí)的用戶必須記住每一條語音指令,這設(shè)計(jì)非常反人性而且用戶體驗(yàn)也不好?,F(xiàn)在語音是交互性的,而且還不是人和機(jī)器的交互,而是非常擬人化的交互。
張鵬:能夠自由的溝通,就會(huì)改變和拉近人車關(guān)系。
夏一平:對(duì),所以我們?cè)谌蠖x里的自然交流,是近乎于跟人對(duì)話一樣跟車自然交流。這是為什么我們很強(qiáng)調(diào)交流的速度,在我們車?yán)?,你用語音跟車機(jī)交互的反應(yīng)的速度在 500 毫秒到 700 毫秒之間,基本上等同于我們倆現(xiàn)在對(duì)談的反應(yīng)速度。
張鵬:人車關(guān)系的改變是可以被一些數(shù)據(jù)和明確的指標(biāo)衡量嗎?比如反饋的速度和語言交流的自然程度。
夏一平:是的。
集度 CEO、極越 CEO 夏一平和極客公園創(chuàng)始人兼總裁張鵬探討汽車的智能化轉(zhuǎn)向|極客公園
張鵬:智能汽車開發(fā)的范式,在今天發(fā)生了什么變化嗎?
夏一平:分兩個(gè)層面,2021 年 6 月我們正式開始啟動(dòng)極越 01 這個(gè)項(xiàng)目,那時(shí)只有三個(gè)人,極越 01 的第一行智能化代碼到今天軟件系統(tǒng)完成,是我們?cè)趦赡昶陂g里做出來的。
這里面很大的挑戰(zhàn)來自于兩個(gè)方面,第一是我們內(nèi)部的軟件團(tuán)隊(duì)是以周為單位來做軟件,一個(gè)版本開發(fā),一個(gè)版本測試,一個(gè)版本上車。但不是所有下游的產(chǎn)業(yè)鏈合作伙伴都能夠跟得上這種速度。過去汽車行業(yè)開發(fā)是一個(gè)微型模型,你給他一個(gè)需求,它要經(jīng)過需求的解讀、研發(fā)、單元測試、集成測試、上車測試,最后才能把軟件給你,這個(gè)周期很長。
所以不可能讓合作伙伴也以周為單位給我交付新版本。我們?cè)谥虚g有一段時(shí)間,整個(gè)團(tuán)隊(duì)代碼的 Bug 量累計(jì)到了一萬多,因?yàn)榈讓雍芏鄠鹘y(tǒng)的汽車的 MCU(電機(jī)控制單元)的控制邏輯沒解決,導(dǎo)致上游積累了很多應(yīng)用的問題。
張鵬:光靠一個(gè)體系跟著你走,你自己想快也快不起來。
夏一平:是,我覺得在新時(shí)代下,跟產(chǎn)業(yè)鏈整體的合作伙伴在一個(gè)步伐上造車真的很有挑戰(zhàn)。
第二個(gè)挑戰(zhàn)在于,現(xiàn)在汽車開發(fā)復(fù)雜度比以前高了很多。假設(shè)我們把過去整個(gè)開發(fā)看成一個(gè)方程式,它是比較固定的,但是你在 AI 時(shí)代,變量的結(jié)果可能是有各種可能性,而且可能性的出現(xiàn)的比例很大。
因?yàn)楸热缫粋€(gè)左轉(zhuǎn)動(dòng)作,左轉(zhuǎn)時(shí)光照、天氣情況、有沒有人、路況怎樣、有沒有車……同樣一個(gè)左轉(zhuǎn),結(jié)果就非常不一樣。
張鵬:所以這事怎么解呢?
夏一平:第一,我們現(xiàn)在叫泛化城市,需要實(shí)車跑大量路面測試。
第二,要做到快速軟件迭代,我們車上有一個(gè)功能,你在車上說「SIMO,我要報(bào)一個(gè)問題」就可以把開車過程中遇到的所有問題,通過語音系統(tǒng)報(bào)上來。我們會(huì)直接在系統(tǒng)里面生成一個(gè)程序,把這個(gè)問題通過系統(tǒng)自動(dòng)分配給它出現(xiàn)問題的工程師,不需要中間還有一個(gè)產(chǎn)品經(jīng)理去做問題分發(fā)。
張鵬:那你這個(gè)真的很極客,隨時(shí)報(bào) Bug。
夏一平:而且用戶在手機(jī)端就可以看到 Bug 解決的進(jìn)程。
張鵬:很極客。
夏一平:這個(gè)時(shí)代必須快速迭代,我們本月底會(huì)發(fā)布 1.3 版本的 OTA,光功能就加了四百多個(gè),我們就是在用這種方式加快軟件迭代。不可能我哪天左轉(zhuǎn)突然發(fā)現(xiàn)很危險(xiǎn)的問題,還得等半年時(shí)間讓軟件迭代。
02 極越?jīng)]遲到,時(shí)機(jī)剛剛好
張鵬:我再問一個(gè)大家可能關(guān)心的點(diǎn),你們今年 10 月底開始交車晚不晚?汽車行業(yè)已經(jīng)很卷了,交付上有沒有壓力?
夏一平:壓力肯定是有的,沒有壓力也不正常。我們一個(gè)很重要認(rèn)知是:整個(gè)汽車行業(yè)的發(fā)展,從當(dāng)年的油車到電動(dòng)化,再從電動(dòng)化早期大家比續(xù)航、三電、操控,現(xiàn)在在往智能化方面走,范式變化很大,電動(dòng)化帶來的不只是能源的變化。
在油車時(shí)代,我們很多的操控系統(tǒng)像是液壓轉(zhuǎn)向、液壓加速,本質(zhì)上是用化學(xué)物質(zhì)操控。從長期發(fā)展來講,自動(dòng)駕駛系統(tǒng)很難靠化學(xué)物質(zhì)控制精度。當(dāng)純電出來之后,把整個(gè)汽車的底層架構(gòu)全部數(shù)字化,化學(xué)狀態(tài)更容易不可控的要素,數(shù)字化把它變得更線性。所以現(xiàn)在的數(shù)字底盤、數(shù)字轉(zhuǎn)向、數(shù)控轉(zhuǎn)向、數(shù)控剎車,這些都是來解決整個(gè)車的數(shù)字化。
數(shù)字化解決之后是供電方式的變化。過去油車靠 12 伏小電池供電,發(fā)動(dòng)機(jī)不開都不敢開空調(diào),因?yàn)樾‰姵責(zé)o法長時(shí)間供電。但電車有可以高壓供電的大電池,在不啟動(dòng)車的時(shí)就能在車內(nèi)聽音樂、吹空調(diào)、看電影、打游戲。這是在油車時(shí)代無法享受的體驗(yàn),除非發(fā)動(dòng)機(jī)一直開著,但你也很難開著發(fā)動(dòng)機(jī)睡覺,噪音太大。
當(dāng)整個(gè)電車全部被數(shù)字化之后,大家比拼的是什么?這是我們要去思考的。我們認(rèn)為未來 5-10 年汽車產(chǎn)業(yè)發(fā)展的巔峰是無人化自動(dòng)駕駛。未來 10 年比拼的核心能力,已經(jīng)從過去的三電、操控性逐漸到了比拼算法、算力。在今天,百度對(duì)大模型、數(shù)據(jù)、地圖、算力的應(yīng)用,讓它具備未來智能汽車全鏈路上所有的核心競爭力,這也是為什么我們覺得現(xiàn)在進(jìn)入這個(gè)行業(yè)也不晚。
汽車在過去很長一段時(shí)間里算力非常低,在 2022 年底和 2023 年出現(xiàn)了兩個(gè)芯片,對(duì)整個(gè)行業(yè)產(chǎn)生很大影響。
一個(gè)是(高通)座艙 8295 芯片,這是汽車行業(yè)有史以來第一次在算力上超過手機(jī)。以前在(高通)8155 時(shí)代,汽車算力比手機(jī)弱很多,也不能同時(shí)支持座艙和智駕的大算力。另一個(gè)(英偉達(dá))Orin 芯片有 254 TOPS 的算力。正是這兩個(gè)芯片的出現(xiàn),得以讓過去只能在云端或者在高算力 PC 上跑的算法,能在車規(guī)級(jí)芯片上落地。如果沒有這兩個(gè)芯片,所謂智能化汽車還只是在功能上疊加,不能真正叫智能汽車,正是有了這兩個(gè)芯片,才有可能從底層軟件到上層應(yīng)用,重構(gòu)整個(gè)智能汽車。
張鵬:聽你剛才描述算力的變化,有點(diǎn)像當(dāng)年我們談?wù)撘苿?dòng)互聯(lián)網(wǎng)何時(shí)到來,4G 的出現(xiàn)解決了帶寬到數(shù)據(jù)的成本問題,移動(dòng)互聯(lián)網(wǎng)因此蓬勃發(fā)展起來。所以,汽車智能化會(huì)因?yàn)檫@兩個(gè)關(guān)鍵的算力芯片到位,在接下來進(jìn)一步提速?
夏一平:一定會(huì)進(jìn)一步提速?,F(xiàn)在 ChatGPT 背后邏輯也是因?yàn)榉?wù)器側(cè)的算力快速提升,成本快速降低。汽車也是一樣,可能今天我們用 8295 和 Orin 成本還是比較高,但是我相信未來一定是靠它們的算力(降低成本)。我們剛開始用 254 TOPS 芯片的時(shí)候,英偉達(dá)就推出了 1000 TOPS 的算力平臺(tái)。
我們的長期判斷,當(dāng)整個(gè)行業(yè)越來越智能化時(shí),芯片迭代速度也會(huì)非???,我們才用上 8295,8795 就出來了。大家對(duì)技術(shù)發(fā)展理解一致,就看行業(yè)發(fā)展能不能跟得上芯片發(fā)展速度,畢竟汽車還是再快也要注重安全性的產(chǎn)品,半年開發(fā)一款新車的可能性不大,至少都得經(jīng)過兩年時(shí)間才能開發(fā)一款新車。怎樣把科技和整車架構(gòu)銜接起來,我覺得這是整個(gè)行業(yè)下一步需要解決的問題。
夏一平認(rèn)為極越進(jìn)入汽車的時(shí)機(jī)剛剛好|極客公園
張鵬:那你來得剛剛好,正趕上了一個(gè)時(shí)代的切換。
夏一平:我覺得剛剛好,如果再早幾年,你讓我造一臺(tái)這樣的車,我沒有這么大的信心,最多就做一個(gè)跟其他車差不多的產(chǎn)品。因?yàn)楫?dāng)時(shí)就只有 8155 的芯片,差不多 7.5 TOPS 左右的算力,連復(fù)雜的 3D 渲染都做不了。我們之所以今天有能力直接基于 Unity 的 3D 引擎做 UI 開發(fā),從視覺上對(duì)車進(jìn)行 3D 渲染還原,能支持 6K 大屏全屏游戲,再到今天的智能駕駛,都是因?yàn)檐囈?guī)級(jí)芯片能力的大幅提升。
張鵬:之前的技術(shù)只能把智能當(dāng)成智能功能的堆疊,但還不具備做一臺(tái)「機(jī)器人」的能力。
夏一平:我覺得這是兩種思路,一種是把智能化當(dāng)做功能做到車?yán)锩嫒?。另一個(gè)是正向思考:我做一臺(tái)智能汽車,應(yīng)該怎么去開發(fā),這兩個(gè)產(chǎn)品有天壤之別。
03 論智駕,極越能贏特斯拉
張鵬:再說一個(gè)比較直接的問題,特斯拉的 FSD(Full Self-Driving Computer,全自動(dòng)駕駛)也要進(jìn)中國了,你們?cè)谧詣?dòng)駕駛層面上進(jìn)展如何?怎么衡量和特斯拉之間的距離?能和特斯拉同場競技嗎?
夏一平:我們的智能駕駛很大一部分是衍生自百度 Apollo L4(級(jí)別)的 RoboTaxi(自動(dòng)駕駛出租車),很多方面的能力是很強(qiáng)的,畢竟在中國能夠做規(guī)?;療o人車運(yùn)營的,可能只有百度一家。在過去很長一段時(shí)間里,百度積累的不止是智駕技術(shù)經(jīng)驗(yàn),還有安全經(jīng)驗(yàn),即怎么做智駕是最安全的。
同時(shí),為了保證長期的自動(dòng)駕駛技術(shù)泛化性,我們車上用了純視覺的技術(shù)方案,目前在中國肯定是第一梯隊(duì)。目前全球只有兩家在做智駕,一個(gè)是特斯拉,一個(gè)是我們。如果特斯拉 FSD 進(jìn)中國,我們有信心比他們要強(qiáng)。因?yàn)槲覀€(gè)人也經(jīng)常去美國試他們的產(chǎn)品,他們?cè)诿绹_實(shí)比較厲害。但在中國,最大的挑戰(zhàn)是中國的路況——中國城市道路結(jié)構(gòu)、道路規(guī)則,甚至紅綠燈識(shí)別語義都和美國不一樣。在泛化性這件事情上,特斯拉需要解決的問題還有很多。特斯拉對(duì)于一些通用場景的解決能力一定是比較強(qiáng)的,但不代表放到中國立馬就可以應(yīng)用。
所以,我覺得特斯拉進(jìn)入中國之后,要花很長時(shí)間去提升它在中國的泛化能力。在城市的高階智駕體驗(yàn)上,我并不覺得它馬上就能做到跟我們一模一樣的體驗(yàn)。
張鵬:我再追問一下,最近大家在車圈里聊 NOA(領(lǐng)航輔助駕駛)聊的很多,以后 NOA 會(huì)是核心看點(diǎn)嗎?
夏一平:我認(rèn)為長期來看,一個(gè)好的自動(dòng)駕駛一定是以覆蓋率為導(dǎo)向。
但一些企業(yè)把它當(dāng)成一種營銷手段,就不太合適了。我們現(xiàn)在的智駕已經(jīng)覆蓋了全中國 90% 的高速和城市高架,甚至是快速路,這是什么概念?如果智駕能夠覆蓋城市高架和城市快速路就算開辟了一座城的話,我們?cè)谥袊验_超過 200 城。
但是,我還是要強(qiáng)調(diào)一下智駕的安全性,我們?cè)趽肀б粋€(gè)非常好的智能化時(shí)代,但不宜在這個(gè)時(shí)刻讓用戶產(chǎn)生過高預(yù)期,因?yàn)橹悄荞{駛還是非常有挑戰(zhàn)性,解決自動(dòng)駕駛問題是人類 AI 歷史上的明珠,不是簡簡單單靠一個(gè)幾百人團(tuán)隊(duì)很快就能把事情做出來的。特別在自動(dòng)駕駛 AI 泛化性上,很具有挑戰(zhàn)性,不能一蹴而就。
我覺得從長期來看,智駕需要覆蓋更多的區(qū)域才是好的服務(wù)。為什么我們未來會(huì)做按日訂閱的模式,邏輯很簡單,你有什么樣的能力給大家提供智駕,覆蓋了什么區(qū)域,用戶會(huì)基于你的能力付費(fèi)。
比如我在一個(gè)沒有智駕覆蓋的三四線城市里生活,但是我今天要走高速去另一個(gè)城市出差。我們的智駕覆蓋了全程的高速高架,那就可以買一天的服務(wù)。要出去自駕游七天的時(shí)候,用戶就買個(gè)七天包。我是基于服務(wù)能力給大家提供服務(wù),不是花大錢終身買斷后發(fā)現(xiàn)各種地方都沒有覆蓋服務(wù),用戶就會(huì)想為什么要花那么多錢買一個(gè)這么多年都用不上的服務(wù)。
張鵬:所以本質(zhì)上更務(wù)實(shí)一點(diǎn),哪怕就這一段路能用智駕解決,用戶可以選擇用或不用,而不是空放個(gè)數(shù)字和概念。
夏一平:是的,我覺得數(shù)字沒有任何的意義,如果把智駕當(dāng)做一個(gè)服務(wù),我要考慮能給用戶在多大的區(qū)域里服務(wù)。
04 未來汽車的 OS,就是大模型
張鵬:我再追問一個(gè)問題,剛才聊到汽車機(jī)器人這個(gè)產(chǎn)品定義的概念,極越的車?yán)镆埠艽竽懙厝∠撕芏辔锢戆存I。你擔(dān)不擔(dān)心用戶覺得這種設(shè)計(jì)太激進(jìn)了,你怎么面對(duì)這個(gè)問題?
夏一平:在產(chǎn)品研發(fā)的過程中,糾結(jié)過很多次。曾經(jīng)有一段時(shí)間我都很懷疑,我經(jīng)常在反思,我們是不是做的過于超前了?但是整個(gè)團(tuán)隊(duì)還是比較堅(jiān)定,說實(shí)話,創(chuàng)新有時(shí)候就是這樣,當(dāng)你做創(chuàng)新的時(shí)候,一定有反共識(shí)的東西存在。如果創(chuàng)新都基于共識(shí)的話,那這個(gè)產(chǎn)品一定是平庸的。
就像我們?nèi)∠较虮P上的很多按鍵,把轉(zhuǎn)向燈放到方向盤上,選擇用屏幕換檔??赡艽蠹矣X得我們是在學(xué)別人,但學(xué)要學(xué)思考,不能只學(xué)個(gè)模樣。我們背后的思考很簡單,過去我們所有的應(yīng)用都是經(jīng)由手機(jī) OS,應(yīng)用本質(zhì)上是一個(gè)交互模式。很多汽車公司要和手機(jī)廠商合作,本質(zhì)上就在想能不能把手機(jī)應(yīng)用搬到車機(jī)上。但我們的觀點(diǎn)是,未來 3-5 年應(yīng)該是大模型的時(shí)代,大模型就是一個(gè) OS,過去的很多應(yīng)用都要重寫在大模型上,交互模式會(huì)發(fā)生變化,整個(gè)中間的交互過程會(huì)被省略,只要問它,它就會(huì)反饋結(jié)果,這是完全顛覆式的變革。
這里劇透一下,明年我們第二款車上市時(shí),整個(gè)模型會(huì)迭代到 2.0。語音系統(tǒng)會(huì)比現(xiàn)在更強(qiáng),現(xiàn)在的語音系統(tǒng)是基于四個(gè)小模型,明年第二款車上會(huì)完全變成一個(gè)大模型,中間小模型直接全部干掉,不需要識(shí)別在哪個(gè)區(qū),語音輸入之后直接出結(jié)果。明年還會(huì)做多模態(tài),圖片和語音同時(shí)識(shí)別。智駕在明年也會(huì)迭代一版,逐漸變成機(jī)器學(xué)習(xí)。我不是在這里畫餅,我們會(huì)讓應(yīng)用直接上車。
在今天,我們把車看成機(jī)器人,它的所有鏡頭就是它的眼睛,它很多的傳感器就是各種觸角,麥克風(fēng)就是它的耳朵,喇叭就是它對(duì)外發(fā)聲的嘴,交互的智能化核心算法就是大腦。我們智駕全域都是用一套視覺系統(tǒng)。同時(shí)我們把視覺的算法系統(tǒng)放到各種應(yīng)用里,大燈、遠(yuǎn)近燈光切換也是用同一套視覺系統(tǒng)。舉個(gè)例子,我們有兩個(gè)后向攝像頭,當(dāng)后方有電動(dòng)車來的時(shí)候,門是開不了的。
張鵬:防止「開門殺」。
夏一平認(rèn)為大模型,才是未來汽車真正的 OS|極客公園
夏一平:對(duì),我們同一套視覺系統(tǒng)已經(jīng)下放到了很多應(yīng)用里,下一步的視覺釋放是換檔和左右轉(zhuǎn)向,下一版軟件會(huì)把轉(zhuǎn)向半自動(dòng)化,視覺系統(tǒng)完全可以識(shí)別用戶什么時(shí)候左轉(zhuǎn),什么時(shí)候右轉(zhuǎn),什么時(shí)候左轉(zhuǎn)完,什么時(shí)候右轉(zhuǎn)完。
我們是有思考而不是拍著腦袋就做了這些設(shè)計(jì),這些能力都是預(yù)埋的。在月底的軟件發(fā)布后,會(huì)把左右轉(zhuǎn)向按鍵做到半自動(dòng)化。
我們能識(shí)別進(jìn)入車道前后自動(dòng)打滅燈,下一步就是自動(dòng)化撥桿,左轉(zhuǎn)或右轉(zhuǎn)不是用轉(zhuǎn)向角度來判斷,而是用視覺去判斷進(jìn)入哪邊車道,再來判斷左右轉(zhuǎn)。未來開車的時(shí)候,用戶不需要關(guān)注車是打左轉(zhuǎn)燈還是打右轉(zhuǎn)燈,也不需要關(guān)注滅燈。
同樣的能力我們還能下放到換擋,在很多場景下完全能夠判斷用戶要前進(jìn)還是后退,用同一套的視覺系統(tǒng)就能完全識(shí)別。類似的功能還有很多,很多算法的能力不是只能做一件事,而是讓同一套視覺算法盡可能讓車去實(shí)現(xiàn)更多的場景,這才是真正未來的智能汽車,這才是真正的智能機(jī)器人,它的視覺不止是做一件事,而是來做所有需要視覺去實(shí)現(xiàn)的事。
張鵬:到最后它本身是一個(gè)智能體,車就是智能的實(shí)體。在這個(gè)層面,確實(shí)需要更大膽,更非共識(shí)地推進(jìn)。
夏一平:我相信這一類現(xiàn)在看起來有違背于現(xiàn)實(shí)的非共識(shí),比如自動(dòng)撥桿,一旦做成后一定可以替代上下?lián)軛U。從交互體驗(yàn)上看,不需要人操作和讓人左右撥桿相比,一定是不需要操作的體驗(yàn)感更好,而且用戶一定會(huì)接受,因?yàn)橛脩粲肋h(yuǎn)會(huì)為好的體驗(yàn)買單。這也是為什么我們篤信,好的技術(shù)帶來的體驗(yàn)上的壁壘一定會(huì)讓產(chǎn)品成為最好的產(chǎn)品。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。