“眼里有活”的斯坦福機器人!數十種家務全包:成本僅約3萬美元
大秀了一把廚藝后,斯坦福華人團隊開發的機器人又在北京時間今日凌晨發布了新視頻《Mobile ALOHA的一天》,展示了澆花、打掃房間、煮咖啡、給主人刮胡子、洗碗、逗貓、扔垃圾、洗衣服、換被套、收納衣物等數十種家務技能,堪稱“全能家政員”。
網友熱評,“最難得的是眼里有活。”
長期以來,人們深受“莫拉維克悖論”(Moravec's paradox)的困擾,這是一種和人們直覺相悖的現象,即“人類覺得容易的任務對人工智能來說卻極其困難,反之亦然”。
換言之,一個會做家務的機器人,非常難得。
但別高興得太早,Mobile ALOHA雖然“眼里有活”了,但它的動作依然由人操控(見下圖),并非完全智能的自主操作。
團隊負責人之一對此表示,人類操控是暫時的,他們已經在研究如何彌合人為控制和機器人自控之間的差距。團隊的另一位負責人Tony Z. Zhao樂觀表示,“2024年將是機器人年,這(家政機器人)僅僅是開始!”
Mobile ALOHA更大的意義在于,其運動控制能力比成本高出5-10倍的同類系統更強大,展示了通用機器人的可行性,一個便宜、好用的家用機器人或許很快將會到來。
ALOHA即A Low-cost Open-source Hardware System for Bimanual Teleoperation,是一個低成本的開源雙手遙控操作硬件系統,即開源機械臂。
其算法Action Chunking with Transformers (ACT)采用了神經網絡模型Transformers,因此具備模仿學習能力。只需要15分鐘的演示,機械臂就可以學會一個動作——直接從真實演示中執行端到端模仿學習,并通過自定義遠程操作界面收集。
據上述華人團隊介紹,僅用50個演示,就能讓Mobile ALOHA完成各種復雜任務,其成本僅為32000美元(約22萬元),軟件和硬件全部開源。
該團隊在論文中詳細介紹了Mobile ALOHA的硬件配置——最貴的是機械臂和移動底座,其中移動底座選擇了同類產品中相對便宜的一款;傳感器方面配備了2個腕部攝像頭和1個頂部攝像頭;配有機載電源和計算,即1.26千瓦時重14公斤的電池,在數據收集和推理過程中的所有計算都在一臺消費級筆記本電腦上進行,該筆記本電腦配有英偉達3070ti GPU (8gb VRAM)和英特爾i7-12800H。
物料單中高價值量的部件
英偉達“網紅研究員”、OpenAI第一個實習生Jim Fan此前樂觀預測,2024年將成為人工智能界全面崛起反擊莫拉維克悖論的元年,“我們不會立即獲勝,但我們將走上獲勝之路”。
這并非一時“口嗨”,如今產業面的各種進展層出不窮,Jim列舉了2023年關于未來機器人的基礎模型和平臺的發展:
1、以機械臂作為物理輸入/輸出設備的多模態大模型:VIMA、PerAct、RvT(英偉達)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;
2、彌合 System 1(負責低級控制)和 System 2(負責高級推理)之間差距的算法(使得系統能夠利用高級推理進行決策和理解,并將這些決策轉化為實際的操作和控制):Eureka(英偉達)、Code as Policies(谷歌)等;
3、在強大硬件方面取得的驚人進展:特斯拉擎天柱、Figure、1X、Apptronik、Sanctuary、Agility+Amazon、Unitree等;
4、數據一直是機器人技術的致命弱點,研究界正在共同策劃下一個 ImageNet(人工智能深度學習取得突破的關鍵項目),如開放Open X-Embodiment (RT-X)數據集。雖然數據集還不夠多樣化,但邁出了重要的一步;
5、模擬和合成數據將在解決機器人靈巧性乃至整個計算機視覺問題上發揮關鍵作用;
基礎正一步步被夯實,站在2024年的年頭,我們有理由期待更強大的機器人驚艷亮相。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。