讓網友驚呼“炸裂”的智元靈犀X2究竟強在哪里
智元機器人創始人彭志輝(稚暉君)今天在B站更新了他的作品——一款“三合一”全新機器人靈犀X2。
它是一款支持高自由度運動能力的雙足人形機器人,也是一款搭載情感交互引擎的情感交互機器人,還是一款初步具備通用任務執行能力的具身機器人,“像人一樣靈動”。
萌翻全球的大白機器人。《超能陸戰隊》截圖
豆豆眼、圓腦袋、大腳板……憨態可掬的外形不禁讓人想到10年前那部風靡全球的動畫片《超能陸戰隊》中的治療機器人“大白”。影片中“大白”被人聲喚醒、睜眼,查看房間的擺設,然后試圖將“肥胖”的身子從狹小的空間中挪出的舉動,如今已然成真。截至昨晚7點,視頻的播放量已達90萬,彭志輝也喜提新頭銜——上海“鋼鐵俠”。
運動能力超群,會玩平衡車能縫葡萄皮
靈犀X2與“大白”一樣,使用了親和的柔性材料,摸上去彈力十足。雖然是個身高1.3米的“小學生”,但其全身擁有28個自由度,運動屬性拉滿。視頻中,靈犀X2不僅會騎自行車、滑滑板、玩平衡車,還能絲滑操作縫葡萄皮,讓網友驚呼“炸裂”。值得一提的是,靈犀X2的運動能力是自生成的,而非事先設定。
縫葡萄皮。
在《超能陸戰隊》上映的2015年,主流機器人還需要人為“指路”。卡耐基-梅隆大學曾花費10年時間造一臺名為“漫步者”的機器人,每走一步,它都要更新頭腦中的環境輪廓圖。作為頭腦的中央電腦可管理“漫步者”的激光成像儀、傳感器、氣壓足肢、齒輪箱和電機馬達,接收到不同模塊傳回的信息并計算后,“漫步者”才開始漫步。
靈犀X2的運動算法與大語言模型一樣,源自強化學習,智能體能從每秒數萬次的環境交互和動作數據中找到突破運動瓶頸的方法。換言之,它的運動能力也是一個“黑箱”,能夠根據指令做出相應動作,但人們并不清楚它經歷了怎樣的思考。這一特性也讓靈犀X2個性十足,視頻中有位靈犀X2“家族成員”經常踩測試人員的腳,被貼上性格暴躁的標簽。
毫秒級交互反應,像親人一樣“嘮家常”
“如果我的狗和你一起掉進水里,我先救誰?”“先救狗狗吧,我沒事。”
“如果給你看《銀翼殺手》,你會不會哭到短路?”“不會哭,但我會感慨萬千。”你能想象這是兩段發生在人與機器人之間的實時對話嗎?
彭志輝將靈犀X2定義為第一臺真正具備復雜交互能力的“靈動機器人”。基于“視覺-語言模型”的多模態交互大模型“硅光動語”賦予了它通過視覺理解和認知世界的能力,甚至能通過面部表情和語音語調精準判斷人類的情感狀態,并作出相應回應。
毫秒級的人機交互。
毫秒級的交互反應則源于智元X實驗室團隊通過邊緣側大腦、端到端的模型架構,以及大量工程優化。邊緣側大腦是機器人或智能設備中部署在本地(即邊緣端)的人工智能處理單元,可在不依賴云端的情況下完成實時決策、數據分析和任務執行。
靈犀X2還實現了通過識別環境與人交互。當彭志輝拿著一瓶牛奶和一瓶咖啡,問它想睡覺的人應該喝哪個時,它很肯定地回答:“喝牛奶吧。”
泛化能力強,成為家庭的“吉祥三寶”
彭志輝很懂機器人落地的“痛點”。作為一款主打家用的機器人型號,靈犀的發展目標被定義為“吉祥三寶”——保安、保姆、保潔。事實上,相較于工業和商業場景,家庭場景對機器人的安全性和智能度要求更高。
互相充電。
家庭的工作場景是不固定的,因此需要機器人的泛化能力,也就是機器人對新鮮場景的適應能力。在本體層面,靈犀X2可裝配包括靈巧手在內的各種末端;在模型訓練方面,智元開源了業界最大之一的機器人真機和仿真數據集,并提出了大小腦系統架構。全新構架的通用具身智能基座模型“啟元大模型”也讓其能力更加泛化,一個需要學習數萬條數據才能學會的倒水動作,在新架構下只需學習上千條就會。
盡管業界估計人形機器人進家庭大約還需5年,但此次發布的靈犀X2讓人們相信“一機一戶”的日子已然不遠。“最好的作品永遠是下一個。”彭志輝在視頻中埋了個彩蛋——會是腳踩風火輪的哪吒機器人完整版嗎?
未來的哪吒完全體
(文章來源:上觀新聞)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。