訓練機器人做家務“有一手”智元發布首個通用具身基座大模型
《科創板日報》3月10日訊 最近,華為離職“天才少年”彭志輝的官宣在互聯網刷屏。就在今天,智元啟元大模型如期而至。
智元機器人官微宣布,發布首個通用具身基座大模型Genie Operator-1(GO-1),并配上視頻,展示了GO-1通過學習人類視頻,助力機器人本體完成遞送水杯、制作餐點、迎接外賓等一系列任務。在視頻末端,還附有仿真數據采集及大規模真機數據采集的過程畫面。
從性能來看,GO-1相比已有模型成功率大幅領先,平均成功率提高了32%。經實驗發現,GO-1在“倒水”“清理桌面”“補充飲料”等任務中表現相對突出。
智元機器人表示,為了有效利用高質量的AgiBot World數據集以及互聯網大規模異構視頻數據,增強策略的泛化能力,智元提出了Vision-Language-Latent-Action(ViLLA)架構。
去年底,智元機器人聯合上海人工智能實驗室等單位宣布開源百萬真機數據集項目AgiBot World,該數據集涵蓋超100種真實場景,其中40%為家居場景,20%為工業場景。共收錄80余種人類生活必備技能。
不過,據智元機器人方面表示,諸如AgiBot World的帶動作標簽的真機數據量仍然有限,遠少于互聯網規模的數據集。而基于ViLLA架構,可采用Latent Actions(隱式動作)來建模當前幀和歷史幀之間的隱式變化,從而將外部動作知識轉移到通用操作任務中。
據悉,GO-1大模型借助人類和多種機器人數據,能夠快速適應新任務。同時還支持部署到不同的機器人本體。智元機器人將這一系列特點歸納為4個方面:
人類視頻學習:GO-1大模型可以結合互聯網視頻和真實人類示范進行學習,增強模型對人類行為的理解。
小樣本快速泛化:GO-1大模型具有強大的泛化能力,能夠在極少數據甚至零樣本下泛化到新場景、新任務。
一腦多形:GO-1大模型是通用機器人策略模型,能夠在不同機器人形態之間遷移。
持續進化:GO-1大模型搭配智元一整套數據回流系統,可以從實際執行遇到的問題數據中持續進化學習。
智元機器人表示,GO-1大模型將加速具身智能的普及,機器人將從依賴特定任務的工具,向著具備通用智能的自主體發展。
當下,基礎模型進展迅速。信達證券認為,AI的發展從根本上推進了人形機器人和自動駕駛等端側的發展。Grok3/o3-mini等模型展示了對物理定律逐步深刻的理解,而Deepseek相關模型則反映了推理成本的迅速降低。受此激勵,端側較高級別的智能落地可期,人形機器人或迎來迅速產業化。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。