中信證券:特斯拉再推新進展,端到端框架已顯成效
中信證券研報指出,特斯拉于9月24日發布官方視頻,更新了其人形機器人方面的進展。視頻顯示TeslaBot通過視覺和位置編碼器實現了肢體的校準,且展示了其人形機器人出眾的姿態控制能力。此次展示再次凸顯端到端算法在人形機器人應用端的不斷成熟,且再次展示出特斯拉在數據量、算法及算力方面的優勢。
此外,其僅靠視覺、編碼器和IMU就完成了任務,展現出超強的硬件控制能力。鑒于人形機器人可用數據集迅速攀升及算法、算力的不斷成熟,中信證券維持人形機器人行業“強于大市”評級,建議持續關注人形機器人板塊及相關廠商投資機會。
▍輸入端:特斯拉端到端模型輸入端為視頻信號,即圖像及音頻信號的混合輸入,但此次展示顯示其識別部分神經網絡算法僅使用視覺信息。
特斯拉于9月24日發布官方視頻,視頻內容展示的算法凸顯出TeslaBot復雜真實條件下的分類分揀能力,且展現出對目標擺放物姿態的精準識別及糾正能力。盡管人形機器人與汽車在輸入視覺信息方面存在一定差異,但基于特斯拉基于V12自動駕駛的算法體系同時應用于人形機器人及汽車是可行的,且有利于加速提升識別算法的泛化能力。此次視頻展示暫未提及所選用相機類別,基于目前圖像識別算法框架原理,我們認為此類識別2D及3D相機都可實現,選配核心為成本控制因素,國內視覺鏡頭及相機等核心零部件廠商已具備此類產品生產能力,產品配套方案及產品性價比值得關注。
▍輸出端:特斯拉人形機器人輸出端為信號及姿態控制。
TeslaBot手指的靈活性在視頻中得到良好展示,其可以以人類速度完成抓取并分類,即使在快速變化的環境下其信號處理及關節控制依然保持良好反應能力及較高輸出穩定性,手指抓取力度同樣表現出較高水平。此外視頻同樣展示了TeslaBot出眾的姿態控制能力,其已可以初步展示部分類瑜伽動作。關節、傳感器、控制系統對輸出端穩定性至關重要,盡管國內廠商此類產品在產品產出一致性及可靠性存在一定短板,但產品升級迭代速度快,且此領域可選方案較多,不同廠商有望在不同價格段占據優勢。
▍算法:特斯拉端到端學習框架不斷成熟,泛化能力持續增強。
端到端框架能夠直接從原始輸入端到最終輸出端進行訓練,無需進行手動特征工程(manual feature engineering)或中間階段的處理,端到端依然利用深度神經網絡能力,優勢在于能極大程度減少手工設計組件,可以直接通過從原始數據中學習,捕獲復雜關系和細微差別,而這些微妙之處可能很難通過手動特征工程來明確指定,這項優勢可以提高性能、縮短開發周期并減少開發者對領域專業知識的依賴;缺點在于所需數據量極大,數據收集成本及模型訓練成本較高。盡管此視頻未展示其具體算法,但基于其輸入輸出信息,建議關注基于強化學習框架的機器人控制算法。
▍硬件:機器人“瑜伽”展現出超強的硬件控制能力, IMU、編碼器等傳感環節的重要性愈發顯現。
特斯拉Optimus機器人在最新視頻中展現出較強的身體平衡能力,包括單腿站立時前后平衡能力和平行與身體方向的平衡能力,表明特斯拉機器人的靜態運動控制穩定性以及用以控制平衡的IMU的較高精度。此外,特斯拉機器人的靈巧手表現更加靈活,身體控制更加順滑,表明了關節模組中的“雙編碼器”并非存在阻滯性較強的缺點,靈巧手中的編碼器也同樣具備較高精度。特斯拉機器人優秀的硬件控制能力表明從硬件、傳輸再到軟件,其均較2023年5月官方團隊中展示的機器人有較多硬件優化。
▍風險因素:
人形機器人政策執行及支持力度低于預期;國內廠商及特斯拉人形機器人任務攻關進度不及預期;人形機器人市場需求低于預期;國產人形機器人產業化低于預期;人形機器人主流技術方案發生重大變化;國產機器人廠商響應程度低于預期。
▍投資策略。
鑒于端到端深度學習框架逐步完善,算法泛化能力持續增強,市場可調取數據集持續增加,機器人識別交互及執行能力有望在數據快速量變的背景下加速實現質變;且隨著控制端硬件規模化生產的擴大及實用性研發的深入有望加速人形機器人本體的落地應用。建議關注視覺/力學/IMU傳感器、位置編碼器、控制系統、關節/靈巧手、芯片及算法上市(擬上市)公司。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。