宇樹機器人可模仿C羅、科比!英偉達新模型賦予更強行動力
繼黃仁勛在英偉達年會上表演熱門舞蹈APT后,機器人也能跳這支舞了,表演者為宇樹科技G1人形機器人。
不僅如此,英偉達團隊還展示了能模仿C羅、詹姆斯和科比的G1人形機器人。
這些動作均為慢動作演示,基于一個名為ASAP(Aligning Simulation and Real Physics,對齊模擬與真實物理)的real2sim2real模型,由卡內基梅隆大學(CMU)和英偉達的研究團隊共同提出,可運用強化學習和真實世界的數據來訓練delta動作模型,有效縮小了仿真與現實之間的差距,讓人形機器人掌握非常流暢且動感的全身控制動作。
該項目的論文和代碼已開源,華人學者依然占據相關論文的大部分作者席位。
新模型如何讓機器人擁有更強的行動能力?
據英偉達高級研究科學家Jim Fan介紹,ASAP采用了“真實→仿真→真實”方法,“在網上看到的多數機器人演示視頻都是經過加速處理的,而我們特意放慢動作速度,讓你能清晰觀賞每個流暢的動作細節?!?/p>
訓練過程主要可拆解成兩步:
1、在仿真環境對機器人進行預訓練
在預訓練階段,研究團隊將真人運動視頻作為數據來源,在仿真環境中訓練動作跟蹤策略。先將這些運動數據重定向到人形機器人上,然后訓練一個基于相位條件的運動跟蹤策略,讓機器人模仿重定向后的動作。隨后,在仿真環境中回放這些數據,動力學差異就會以跟蹤誤差的形式表現出來。
2、后訓練階段進一步校準機器人動作
訓練一個delta動作模型,通過縮小真實世界和仿真狀態的差異,學習如何補償這些偏差,縮小仿真環境和真實世界中的動力學差異。然后,ASAP把這個delta動作模型集成到仿真器中,對預訓練策略進行微調,讓它和現實世界的動力學更匹配。
ASAP框架的意義或在于優化機器人訓練成本,在仿真虛擬環境中訓練出來的機器人也能解鎖真實世界的物理動態。Jim Fan表示,通過額外神經網絡學習差異參數,本質上是對傳統物理引擎進行“動態校準”,使機器人能依托GPU的并行計算能力,在仿真環境中獲得近乎真實的大規模訓練體驗,“未來屬于混合仿真時代?!彼€樂觀表示,2030年的“人形機器人奧運會”會很精彩。
英偉達已經成立GEAR(通用智能體研究實驗室)并入股FigureAI,從軟件平臺到硬件本體,全面切入人形機器人賽道。
在今年1月剛剛結束的2025 CES上,黃仁勛發布開幕演講稱“通用機器人領域的ChatGPT時刻即將到來”,英偉達正在積極推動機器人技術的發展,致力于打造全方位的機器人生態系統。
同月,黃仁勛在北京參加例行年會時,會見了多家國內頭部機器人公司的代表,宇樹科技CEO王興興、銀河通用創始人兼CTO王鶴、深涌智能Emerging AI創始人黃可鋮等創業者皆到場,到場的機器人企業還包括逐際動力、加速進化等。
英偉達機器人技術業務副總裁Deepu Talla一行還在1月份到訪了北京國家地方共建具身智能機器人創新中心。
宇樹H1人形機器人則在2025央視春晚中表演了扭秧歌,展現良好運控性能及AI訓練成果。
東吳證券表示,機器人當前類比2014年電動車,即將量產,開啟10年產業大周期。并且,電動車與機器人均由特斯拉引領,初創公司和人工智能在人形機器人領域布局激進,與特斯拉差距縮小,如華為、英偉達、智元、宇樹等,投資主線從1放大至1+N。
該機構進一步表示,最看好三個方向:
1)綁定龍頭供應鏈:特斯拉人形機器人進展最確定,產品性能軟硬件最優,放量最早,特斯拉供應鏈彈性最大。其次為潛力廠商,如英偉達、華為(或提供整體解決方案授權方式)、智元、宇樹等;
2)壁壘最高的核心環節:零部件來看,壁壘排序滾柱絲杠>傳感器>諧波減速器>空心杯電機;
3)產業趨勢和方向:靈巧手方案變化、傳感器方案變化。
(文章來源:科創板日報)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。