首頁 > AI資訊 > 最新資訊 > ICRA2024:「具身智能」熱度飆升,「學習」成機器人行業共識

ICRA2024:「具身智能」熱度飆升,「學習」成機器人行業共識

新火種    2024-05-19

作者:賴文昕

編輯:陳彩嫻

過去一周(5.13-5.17),國際頂級機器人學術會議 ICRA(IEEE International Conference on Robotics and Automation)在日本橫濱舉辦吸引了全球機器人領域的研究者、企業及學生,共同探討機器人領域最新的科學進展和產業成果。

今年 ICRA 大會的主題設定為「CONNECT+」。

大會最終截稿日期是 2023 年的 10 月 21 日,收到 3937 篇論文,與去年的 3125 篇相比,提交的論文數量漲了約 25.88%;經過一個月審核,最終接收 1765 篇論文,論文接收率為 45%,比去年略漲 2%,論文主題覆蓋了如雙足機器人、人體檢測和跟蹤、人機交互、機器人學習、安全和監控機器人系統、3D重建、無人機系統、人工智能、農業自動化、行為樹和大數據分析等等領域。

除論文數量的顯著增加外,本屆 ICRA 還有 119 家企業參與展會,吸引了美國亞馬遜、波士頓動力,德國庫卡,日本本田研究所,以及中國宇樹科技、非夕科技、逐際動力、艾歐智能、求之科技、方舟無限等等一眾機器人團隊的參會。

換言之,ICRA 2024 不僅展現了學術界的深度交流,更象征著全球工業領域機器人團隊之間的一場巔峰對決。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

在 ICRA 2024 的展會現場,參會者可以看到這樣的奇觀:

機器狗、輪式機器人、雙足機器人等等一眾「機器生命」在會場「自由走動」,參會者們聚集在它們身邊,儼然一場賽博朋克版的迪士尼花車巡游。

展會中大部分企業都選擇展示 live demo,且與往屆相比,demo 質量越來越高。

比如,逐際動力這款雙足機器人 P1,把在森林里怎么打都不倒的經典場景,在 ICRA 2024 現場再次重現。

「若干年前機器人會議上的機器人都只能打個招呼或者站著不動,這次出現的機器狗都能動、還能踹,說明魯棒性非常高。」清華大學交叉信息學院助理教授、具身智能實驗室主任及星海圖的聯創許華哲告訴 AI 科技評論。

此外,人形機器人也成為 ICRA 的亮點,如中國企業宇樹科技在大會期間發布的 9.9 萬人形機器人引起了國內外參會者的熱烈討論。不難看出,人形機器人成為機器人領域的一個新興方向,尤其在大模型風潮下與具身智能一同崛起。

一個趨勢正在發生:ICRA 上關于機器人的內容已經從以傳統的控制為主,到關注機器人的學習、操作等。國內外的機器人研究領域都在關注同一個問題:如何讓機器人更智能?

但與此同時,AI 科技評論也關注到,雖然大模型落地端側(如手機、機器人)是過去一年 AGI 討論中的重要主題之一,ICRA 2024 大會現場的「大模型蹤影」卻寥寥無幾。一方面,這是因為機器人的行業特點,「有自己的節奏」;另一方面,ICRA 聚焦在學術探討上,大模型在論文演講中的比重遠遠超過展區成果展示。

中國機器人企業正在崛起

邁入2024年后,人形機器人領域頻頻傳出重大進展:

特斯拉發布了更新版的擎天柱機器人行走視頻,其行走的穩定性和自信心態均有顯著提高,尤其在轉彎時的表現也相當出色;

人形機器人初創公司 FigureAI 宣布獲得了包括亞馬遜創始人貝索斯、英偉達、微軟以及 OpenAI 在內的投資,總額達6.75億美元;

英偉達于3月19日舉辦的2024年度GTC大會上,展出25款人形和機械臂機器人。

在 ICRA 2024 的機器人方陣中,最炫酷吸睛的絕對是與人類最相似的人形機器人。

值得關注的是,這次參會的雙足人形機器人企業主要是中國公司。

最受矚目的產品之一是宇樹科技的 G1 人形機器人。G1 以最低9.9萬元的售價,在機器人業內扔下一枚超高性價比的炸彈。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

與之相比,特斯拉的擎天柱機器人給出的目標價位為2.5萬美元,折合人民幣約18萬元。

傅立葉智能帶來的通用人形機器人 GR-1 高165厘米,重55公斤,最高行走速度為每小時5公里。使用電動執行器的 GR-1 本體擁有40個自由度,可承受近50公斤的重量。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

樂聚機器人推出的「夸父(KUAVO)」人形機器人則是一款全尺寸高動態雙足仿人形機器人,最大行走速度可達5km/h,跳躍高度可達20cm。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

「國內公司在硬件方面整體上優于國外,性價比較高,這是得益于國內的供應鏈優勢。」方舟無限創始人張鑫亮向 AI 科技評論分析中國企業崛起的原因。另外,中國公司還展出了很多機器人零部件和整體解決方案。

那為什么人形機器人會成為 ICRA 2024 的一大焦點呢?

實際上,電機和機械結構設計已發展多年,硬件早已不是問題。但在沒有大模型和 AI 的年代,機器人只能進行簡單的動作但無法做出智能決策,要應用傳統視覺技術,一個機械臂就足夠了。

因此,過去人形機器人可能沒有太大的意義,僅僅是硬件產品并沒有實際應用。

隨著 AI 技術的發展,機器人的能力上限不斷被突破。科研和商業探索的深入,也加速了人形機器人時代的到來,使得開發這一形態的產品變得有意義。

「大模型讓機器人可以不只是簡單動一動,而是有希望做一些智能決策,(以人形)收拾桌面或參與工廠工作。」張鑫亮說。

不難發現,人形機器人是 ICRA 2024 當時無愧的焦點,但從實用性角度出發,其實際場景應用及商業落地,卻一直備受爭議。

「展會上的人形機器人硬件沒問題,能動能走,但在智能化層面來講,離真的智能化機器人很遠。」地平線機器人事業部生態負責人胡春旭告訴 AI 科技評論。

特別是對于雙足人形機器人而言,腿上每個關節都需要電機,機身需承受高負載,這使得整體成本變得十分昂貴。

另外,雙足行走的控制算法開發難度大,需要大量時間進行迭代。即使上半身的控制算法已經完成,腿部的控制算法也無法簡單地遷移過來。

「為了滿足科研用戶在雙足運控算法上越來越強的需求,我們先對點式雙足機器人 P1 進行了產品化,這個獨特的形態,讓大家不需要一上來就做全尺寸人形、幾十個自由度的復雜算法研發,并配備豐富的二開接口和服務。」張力介紹到 P1 是逐際動力如何賦能人形機器人研發的定位。

出于以上種種考慮,本次參會的部分日本和歐洲公司也沒有涉足這一領域。

清華系的星海圖目前同樣也沒有開展腿部機器人項目的計劃。

聯創許華哲告訴 AI 科技評論,人形機器人在算法上很有趣,但需要投入大量的時間和精力。

「如果真正想將機器人技術應用到實際場景中,需要能快速產生效益和能力。」他分享道。

本次選擇通過日本代理商參會的明星公司波士頓動力也曾困于找不到盈利模式的難題。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

兩周前,波士頓動力的 CEO Robert Playter 來清華交流,告訴許華哲一定要找到賺錢的方法,否則公司就會被不停買賣。

不過,雙足人形機器人的產品市場契合度(PMF)其實并不低。

據參會者們分享,目前專注于足式人形機器人的公司主要面向科研市場,因為它們外形酷似人類,全球大量高校實驗室對此非常感興趣,清華大學就購買了許多人形機器人進行研究。

但若想讓機器人技術落地到工廠、家庭或超市等場景,就需要考慮更廣泛的商業化途徑。兼顧大型市場還是只專注于其中一個領域,這取決于機器人公司的戰略選擇和目標市場的差異。

具身智能「剛剛」開始

去年,大模型的成功展示了深度學習具有規模效應,即只要有足夠優秀的模型和海量數據,其潛力遠超過以往,也促使學術界與產業界對實現真正的通用人工智能(AGI)燃起了希望。

在大模型熱潮的影響下,一批機器人或者說是具身智能企業如雨后春筍般創立,希望能夠開發出能與物理世界進行交互的智能機器人,完成這個極具挑戰性的任務。

「大模型技術的爆發與硬件成本的降低表明了軟硬件技術都已走向成熟。」許華哲告訴 AI 科技評論,「過去創業者們常說 move bits not boxes,意指改變數字世界比改變物理世界要容易得多。雖然現在的技術尚未完全成熟到可以解決所有問題,但已足以讓人看到解決問題的希望,今年已到達一個成熟的轉折點,因此吸引了眾多公司投身于具身智能領域。」

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

在 ICRA 2024 的展會現場,「具身智能」成為了每位參會者熱議的話題。

地平線機器人事業部生態負責人胡春旭向 AI 科技評論分享了自己的觀察:「現在只要涉及機器人與環境交互,與 AI 結合,都要說具身智能,就跟前兩年大家都在說人工智能是一樣的。」

「無論是科學家、創業者還是學生,大家都在討論具身智能。」聯合創始人兼COO張力也感嘆,具身智能的興起是他本次參會所感受到最顯著的趨勢,「通用機器人是一個在技術和商業化落地都還沒有共識的賽道,但是在這次全球學者和機器人企業聚首一堂的活動上,我能感受到大家逐步從沒有共識,到開始進行收斂,這是一個非常好的現象。」

與傳統機器人公司相比,「新生代」的具身智能企業最大的區別在于是否采用了人工智能技術。

傳統機器人通常被設計來精確地完成特定任務,如工廠零件分揀機器人或家用掃地機器人,雖各有其功能,但其能力相對有限,內部預設的智能算法較為簡單。

新一代機器人的目標則更加通用以及「類人」,比如在家中充當保姆,在工廠中扮演工人,靈活響應各種需求。

「比如優必選更強調自身運動,非夕科技強調力控,展會上展示了控制盤子上的球,這些更多體現了機器人本身的運動能力跟對外界的感知、控制能力。」胡春旭認為,「現在的公司講具身智能,關注重心不是機器人自身的運動能力,更多的是如何跟外界互動,通過視覺識別外部環境后做抓取、放置等靈活的對外交互工作。」

艾歐智能便參與 ICRA 2024 最具有代表性的中國具身智能企業之一,將 AI 技術與機器人領域牢牢融合在一起。

創始成員都來自騰訊、小鵬團隊,艾歐智能通過具身數據采集,構建不同應用場景下的基礎數據集,為全球人工智能和機器人研發企業和研究機構提供基礎場景數據和驗證方案。

傳統動作捕捉通常使用光筆或攝像頭,限制了活動范圍,而艾歐智能則采用慣性捕捉方式,不受地形限制,可自由采集數據,更適合日常生活數據采集,在采集數據的同時還不限制人的行動。

而且,除了動作數據外,艾歐智能還采集視覺、觸覺和語言信息等多模態數據。

具體而言,艾歐智能使用安裝在頭盔上的多個相機來獲取視覺信息;通過自研數據手套與數據鞋底獲取觸覺信息;用麥克風記錄語言信息;最后混合所有信息進行機器人訓練。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

艾歐智能告訴 AI 科技評論,目前他們開源的數據集包含50萬條劇本式采集數據以及數百個小時的自由采集數據,涉及幾十種技能和數百種被操作對象,全部免費提供給社區供科研使用。

地平線機器人同樣也是具身智能企業的代表。

去年年末,地平線分拆了 AIoT(物聯網)團隊,成立地瓜機器人并對外融資,其定位是提供消費級機器人計算解決方案。

目前,地平線機器人正在研發著支持大模型部署的高性能機器人芯片。

在地平線機器人的事業部生態負責人胡春旭看來,具身智能意味著機器人一定會結合多模態大模型去理解周邊環境。

「過去機器人的智能化比較差,但這兩年機器人的運動能力已經被解決的相對比較好,現在大家都在關注智能化。」胡春旭向 AI 科技評論解釋,「提高機器人的智能化水平一定是基于多模態大模型的基座去做,目前雖然沒有很明確的落地案例,但這一定是未來趨勢,也是我們重點探索和布局的方向。」

胡春旭稱,「大模型芯片在機器人廠商中是剛需,關注的企業很多,但現在關鍵點在于,一是怎么把大模型調教后放在芯片里跑,二是跑下來后,怎么能很好調試服務于場景,讓原來的那些基本算法變得更好用。對于我們來講,現在可能重點放在前面,讓大模型在我們芯片跑得更好,說實話本身上限就是硬件芯片的實際能力、物理水平。」

方舟無限同樣是一家新興具身智能企業,是全球首家具身智能領域量產數據采集方案供應商。

「上一代機器人主要依靠視覺智能,語言智能尚未被整合進機器人系統中,人類大腦決策大部分是雙手執行,在機器人中可能是視覺智能和語言智能的結合,所以說 GPT 模型可能是推動具身智能發展的一個關鍵因素。」創始人張鑫亮談道,「我們之前理解的人形機器人、四足機器人等更多地偏向于控制上的優勢,具身智能機器人追求的是讓機器人的大腦更完善,這也是我們的目標。」

同為具身智能企業的逐際動力于2023年發布了其首款人形機器人CL-1,并于今年上半年接連公開該款機器人的遙操作及跑步等技術新進展。

「物理世界是圍繞人類設計的,人形機器人以類人的形態,更具有通用性和泛化性,將會成為未來落地應用的最佳載體。」張力談道。

在 ICRA 2024 上,參會者們聊得火熱,也出現了如艾歐智能、地平線、逐際動力與方舟無限這類新興具身智能企業,但具身智能作為一個新熱點,距離商業落地仍有不短的距離,核心技術大多掌握在高校手中,因此許多學者也會參與創業。

「與再次成為熱點的自動駕駛技術不同,具身智能尚未真正成熟并能實現量產,所以熱點更多地集中在學術界而非工業界。」橫跨學術與產業的許華哲解釋道。

ICRA 洞察:LLM 罕見,電驅主導,學習與操縱成新范式

在端側大模型中,盡管底層的 LLM 邏輯均為 MOE(混合專家模型),但在手機端和機器人端的落地路徑卻十分不同。

兩者的應用場景與需求都不同,機器人需要自主移動,因此一定會結合多模態大模型去對周邊環境做理解和交互(如怎么穿過椅子去抓取桌面上的物體),與不可能自己跟環境交互的手機端相比,機器人加大模型的組合更強調「具身」智能。

然而,與大模型人聲鼎沸的現狀不同,在 ICRA 2024中,LLM 在機器人領域的應用十分罕見。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

張鑫亮發現,ICRA 2024 會議更側重于機器人控制等硬件領域,軟硬件結合的應用在展會上較為罕見。

「除了我們的產品外,我幾乎找不到第二家在自主操作方面使用大模型的公司,除了少數做模仿學習和 Aloha 操作的公司。有的公司使用硬件機械臂進行工業抓取,但依然屬于傳統視覺,結合模型做抓取的公司在展會上并不多見,要么只專注于模型端,要么只專注于硬件端,與會者中似乎只有我們有同時結合軟硬件的苗頭。」

*Aloha 是2023年由斯坦福大學等機構推出的一個用于雙機械手遠程操作的低成本開源硬件系統,可以遠程操作并完成組裝鏈條、托舉乒乓球等多種任務。

LLM 在機器人蹤跡難尋的原因之一,便是當前負責軟件與硬件研發的團隊并未實現融合。

相反,兩組人員分別在兩個領域進行研發。大模型團隊專注于模型開發,從軟件層面著手,待軟件完善后再著手硬件的開發。

而另一些人則先從硬件開始,再整合大模型。兩個方向分別涵蓋的決策領域太多,因此尚未有團隊能夠同時兼顧兩者。

「不過現在專注于硬件并向大模型過渡的團隊,以及僅專注于軟件開發的團隊,都在逐步推進融合的過程。在這一背景下,與大模型最緊密相關的機器人領域就是具身智能。」張鑫亮解釋道。

機器人產業本身尚未形成一個穩定且盈利的商業模式,同樣是 LLM 尚未在機器人領域廣泛展開的原因之一。

胡春旭向 AI 科技評論講道,「從商業層面來講,大模型公司肯定會評估機器人企業的商業模式落地,但機器人行業距離大規模批量化的落地,還有很長的路要走。」

不過,在 ICRA 2024上,也有觀點認為:機器人當前的研究重點更多集中在解決基礎層面的功能性問題(low level issues),而非高層次的認知或決策問題(high level issues),后者在某種程度上已經通過大模型得到了解決。

例如,即使大模型能夠規劃出做飯的步驟,但如果機器人連冰箱門都無法打開,那么這些高級規劃便無法實施。

許華哲告訴 AI 科技評論,「大模型并非當前機器人技術發展的瓶頸,其當務之急是解決物理交互和操作的基本問題,為未來更高級的集成和應用打下基礎。隨著這些基礎問題的逐步解決,大模型在機器人領域的集成和應用將變得更加可行和有效。」

ICRA 2024 展現出機器人領域正在經歷一場通向具身智能的范式轉變,其核心正是學習(Learning)方法和操縱(manipulation)能力的提升。

ICRA 2024:「具身智能」熱度飆升,「學習」成機器人行業共識

ICRA 2024抓取與操縱比賽

眾多研究人員和公司正在從傳統的機器人方法轉向具身智能以及基于學習的方法。同時,集中于機器人操縱能力的工作也越來越多。

與后空翻等酷炫動作不同,如開瓶、拾取、觸摸等操縱能力可以直接滿足人們生活實際需求,因此也越來越受機器人業內人士的重視。

例如,波士頓動力近期推出兩款新型機器人,一款是碼垛機器人 Stretch,帶有吸盤能分揀物體;一款是人形機器人 Atlas。他們發現,傳統的機器控制無法解決操縱問題,「學習」才是新的可行方向。

最后,隨著電機的快速發展,本屆 ICRA 上的電驅機器人以代替傳統的液壓機器人成為主力軍,業內普遍認為,換上電機后,機器人的爆發力與驅動力會更強。

寫在最后

不少參會者向 AI 科技評論表示,本屆 ICRA 并沒有帶來太多超出預期的驚喜。

具體而言,盡管具身智能的熱度飆升,但代表「智能」與「大腦」的大模型并未在行業中得到廣泛應用。

通往 AGI 的路何時能從數字世界逐步擴展到物理世界?大模型的出現能否讓機器人真的擁有「智能」?

ICRA 2024 尚未見分曉,那便讓我們拭目以待。

本文作者 anna042023 將持續關注AI大模型領域的人事、企業、商業應用以及行業發展趨勢,歡迎作者添加交流,互通有無。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章