首頁 > AI資訊 > 最新資訊 > 東吳證券:Figure發(fā)布VLA大模型Helix大規(guī)模減少訓練數(shù)據(jù)需求

東吳證券:Figure發(fā)布VLA大模型Helix大規(guī)模減少訓練數(shù)據(jù)需求

新火種    2025-03-27

智通財經(jīng)APP獲悉,東吳證券發(fā)布研究報告稱,在2月中旬宣布與OpenAI結束合作之后,當?shù)貢r間2025年2月20日,F(xiàn)igure宣布推出自主研發(fā)的通用具身智能模型Helix,并展示了兩個機器人協(xié)同工作的能力。該行建議關注Figure鏈條投資機會;此外認為大腦端如果能直接復用VLM大模型,則小腦運控的搭配重要性凸顯。

東吳證券主要觀點如下:

Helix大模型創(chuàng)業(yè)內(nèi)多項第一,性能出眾商業(yè)化前景良好

Helix是一個通用的視覺—語言—動作(VLA)模型,能將感知、語言理解、控制能力相結合。Helix取得的創(chuàng)新性成果包括:①全身控制:是首個能對類人機器人上肢進行高速連續(xù)控制的VLA模型,包括頭部、軀干、手/手指;②多機器人協(xié)作:Helix是首個能同時控制兩臺機器人的VLA模型,使它們能夠協(xié)作解決一項長期的操作任務;③出色的抓取能力:能夠撿起任何小型物品,即使是從未見過/接觸過的小型物品;④單一神經(jīng)網(wǎng)絡:Helix使用單一的神經(jīng)網(wǎng)絡權重集來學習所有行為,無需任何針對特定任務的微調;⑤具備快速商業(yè)化能力:Helix是首個能夠完全在嵌入式低功耗GPU上運行的VLA模型,這賦予了其優(yōu)秀的商業(yè)化落地能力。

首創(chuàng)雙系統(tǒng)協(xié)作架構,實現(xiàn)“快思考”與“慢思考”的協(xié)調配合Figure表示以往機器人大模型面臨的問題是:VLM主干通用性強,但速度不快;而機器人的視覺運動策略速度快,但通用性不足。Helix創(chuàng)新性地采用了“系統(tǒng)1”+“系統(tǒng)2”的解耦架構,兩個系統(tǒng)經(jīng)過端到端的訓練可以互相通信。其中系統(tǒng)1(S1)是一個快速的反應式視覺運動策略,能夠以200赫茲的頻率將S2產(chǎn)生的潛在語義表示轉化為精確的連續(xù)機器人動作,系統(tǒng)2(S2)是經(jīng)過互聯(lián)網(wǎng)數(shù)據(jù)預訓練的VLM,運行頻率為7-9赫茲,用于場景理解和語言理解,能夠在不同的物體和情境中實現(xiàn)泛化。

這種架構為Helix帶來眾多亮點:①高速與泛化能力:速度與單一任務克隆相當,并且可以實現(xiàn)零樣本泛化;②直接輸出對高維動作空間的連續(xù)控制,避免了使用復雜動作標記方案;③S1+S2的架構簡潔;④關注點分離:S1與S2解耦能夠實現(xiàn)系統(tǒng)分別迭代。

Helix僅使用500小時進行訓練,高效實現(xiàn)強大的泛化能力

Figure表示Helix訓練總共使用約500小時的高質量監(jiān)督數(shù)據(jù),僅占先前收集的VLA數(shù)據(jù)集規(guī)模的一小部分,并且不依賴于多機器人實體數(shù)據(jù)收集或多個訓練階段。

此次Figure最核心優(yōu)點在于解決當前人形機器人泛化瓶頸—訓練數(shù)據(jù)不足。過去依賴遙操和虛擬仿真收集的數(shù)據(jù)量嚴重不足,成本高昂,難以解決泛化問題。此次Figure通過模型創(chuàng)新,大幅減少機器人訓練數(shù)據(jù)需求量,有望加速行業(yè)整體發(fā)展。

風險提示:人形機器人量產(chǎn)進展不及預期,人形機器人技術更迭不及預期,宏觀經(jīng)濟風險。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。

熱門文章