特斯拉機器人真這么絲滑?科技博主在線「打假」:遠程操控的
特斯拉,你說句話呀。
前天,特斯拉開了一場相當科幻的發布會,其中一大看點就是新一代人形機器人 Optimus。
「你能以 2 萬到 3 萬美元的價格購買一臺 Optimus 機器人,它可以當老師、幫你照顧孩子,可以遛狗、修剪草坪、買菜、做你的朋友、端上飲料,你能想到的任何事情,它都能做。」「我認為這將是有史以來最偉大的產品!」身穿皮衣亮相發布會的馬斯克,一臉自豪地夸贊著自家的機器人。與此同時,社交媒體上也冒出一堆視頻,均是展示 Optimus 的強大實力。比如,戴著牛仔帽的 Optimus 化身調酒小哥,平穩地倒著飲料:
視頻來源:https://x.com/ChrisJBakke/status/1844610918552121596唱著生日快樂歌:
視頻來自:https://x.com/ray4tesla/status/1844606188790370611它還到處閑逛,各種跟人搭話聊天:
視頻來源:https://x.com/teslaownersSV/status/1844610376165425658現場如此嘈雜,聲音也是紛亂,Optimus 不僅能精確地鎖定對答,還如此流暢,絲毫察覺不到響應的間隔。語言風格、語氣語調聽起來都與真人無異。如果這些都是 Optimus 的自主回應,那說明特斯拉的技術已經達到了新的 level。除了交流,Optimus 的動作似乎更加「出賣」了它。它的頭部可以在對話過程中四處觀察環境,掃視眾人。手指也比往常更加靈敏,看起來每個動作都精準且生動,不得不讓人懷疑,這真的是 Optimus 自己的水平嗎?果不其然,有科技博主開始在線「打假」。科技博主在線「打假」幾天前,特斯拉在華納兄弟工作室的攝影棚中,舉行了一場備受期待的媒體活動,并推出一款馬斯克稱之為 Cybercab 的無人駕駛出租車。華爾街并不買賬,特斯拉股票應聲跌了約 9%。當然,這并沒有影響 Party 上的氣氛,參加特斯拉活動的人們在社交媒體上發布了幾十個視頻,展示了 Optimus 機器人的絕活 —— 跳舞、說話,甚至調酒。不過,科技博主 Robert Scoble 在 X 上質疑:「這并非完全是人工智能,而是有人在遠程協助」,并附上了一段視頻。
圖源:https://x.com/Scobleizer/status/1844593576040333767Scoble 的質疑并非空穴來風。他在現場專門問了一個機器人:「嘿,Optimus,你的人工智能成分有多少?」Optimus 有些慌亂地回答:「我不能透露具體有多少。這是你以后需要弄清楚的事情。」Scoble 又問:「是有一部分還是完全沒有?」Optimus 開始打太極:「我想說,可能有一部分。我不會確認,但可能有一些。」
視頻來源:https://x.com/Scobleizer/status/1844594008225611858答案似乎呼之欲出。以馬斯克的性格,如果他真的制造了一群能與大量人群實時互動的機器人,早就大肆宣揚這一點了,但現實情況恰恰相反,他們的回應相當含糊其辭。Scoble 還發了一條后續推文,說他與一位特斯拉工程師進行了交談以獲得清晰的答案。「當它走路時,是 AI 在控制 Optimus。Optimus 可以在人群中走來走去,這真的太棒了。」但 Scoble 沒有進行進一步詳細說明。
科技媒體 Gizmodo 也表示,以他們對 Optimus 的了解,馬斯克實際上遠遠落后于競爭對手。今年 1 月份,馬斯克篡改了一個 Optimus 的演示視頻,被網友抓包。視頻中,Optimus 正在疊襯衫,但眼尖的觀眾注意到,有一只手不斷進入攝像機的視野。這意味著,有人在鏡頭外執行折疊任務,而機器人只是在模仿人類。
來自英偉達的研究科學家 Jim Fan 當時發布了推文,提醒大家別因為視頻的驚艷程度就忽略了其中技術真相。他提到,應該將 Mobile ALOHA 看作是一輛制造精良的跑車,而它仍需要人類駕駛才能表現出自己的能力。現在的水平與能夠完全自主的廚師還有較大的差距。
在機器人技術領域,從人類示范中進行的模仿學習已經取得了令人矚目的成績。其實訓練 Mobile ALOHA 的過程就是像是在玩游戲 —— 操作機器人直到動作通關。Mobile ALOHA 之所以能夠讓人發出驚嘆,是因為它所展示的任務不局限于桌面操作。這些復雜且靈活的動作源于研究者開發的一套系統,用于模仿需要全身控制的雙臂移動操作任務。利用 Mobile ALOHA 收集的數據,進行有監督的行為克隆。研究團隊在介紹時表示,對于一些簡單的任務,Mobile ALOHA 可以在 50 次學習之后達到 90% 的行動成功率。對于一些簡單的任務,如炒一只蝦仁(有且只有一只)、拿塊抹布、擺放好椅子,Mobile ALOHA 無需人類指點,還是可以自己 hold 住的。
今年 7 月,MIT 的研究人員竟通過頭戴 Apple Vision 實現了遠程操控 UCSD 實驗室中的機器人。這種基于 VR 頭顯的 Open-Television 遙操作系統,可支持不同 VR 硬件平臺來映射接入任意一種機器人,通過隔空操作來采集數據。操控者能以立體式主動感知機器人周圍的環境。該系統還能將操控者的頭部和手部動作映射到機器人上。
體驗過 Mobile ALOHA 的梁力天表示:Mobile ALOHA 的直接關節映射使用起來非常直觀,這使它成為比 VR 控制器更好的解決方案。這樣的能力,只要 3.2 萬美元的預算真的太值了。Mobile ALOHA 依賴于低成本的全身遠程操作系統來收集數據,然后通過監督行為克隆的方式進行訓練。它更側重于移動和雙臂協調控制,結合全身遠程操作界面,使機器人能完成更復雜的操作任務。而 Open-TeleVision 強調基于視覺反饋的遠程操作,使用強大的視覺模型來實時分析環境信息,并將手部關鍵點動作映射到機器人的關節角度。這種方式依賴高質量的視覺輸入來精確地進行操作,適合用于復雜的、細粒度的任務。這表明 Open-TeleVision 適合那些需要高精度和視覺反饋的任務,其訓練方式更復雜,適合處理細節精度要求較高的場景。而 Mobile ALOHA 則更加適合日常家務等移動和協調操作任務,它通過較少的訓練數據就能取得很高的成功率,是一種更為實用的解決方案。在這次特斯拉的活動中,馬斯克談到了 Optimus 機器人,但并沒有提及這些機器人是否完全自主。他表示這些機器人可以幫你剪草坪、買雜貨,甚至照看孩子。不過,完成這些任務還是要依靠 AI 的自主執行能力。畢竟沒人愿意買個需要遠程操作機器人回家吧。
參考鏈接:
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。