李飛飛「空間智能」系列新進展,吳佳俊團隊新「BVS」套件評估計算機視覺模型
在不久之前的 2024 TED 演講中,李飛飛詳細解讀了 空間智能(Spatial Intelligence)概念。她對計算機視覺領域在數年間的快速發展感到欣喜并抱有極大熱忱,并為此正在創建初創公司
在此演講中,曾提到斯坦福團隊的一個研究成果 BEHAVIOR,這是他們「創建」的一個用來訓練計算機和機器人如何在三維世界中行動的行為和動作數據集。
如今,吳佳俊帶領團隊發表了后續研究——「BEHAVIOR Vision Suite(BVS)」。論文也獲得 CVPR 2024 Highlight。
在計算機視覺領域,系統評估和理解模型在不同條件下的表現需要?量數據和全?、定制的標簽。然?,現實世界中的視覺數據集往往難以滿?這些需求。盡管?前的合成數據?成器為具? AI 任務提供了有前景的替代?案,但在資產和渲染質量、數據多樣性及物理屬性的真實性??,仍存在諸多不?。
為了解決這些問題,研究團隊推出了 「BEHAVIOR Vision Suite(BVS)」。
BVS 是?套專為系統評估計算機視覺模型?設計的?具和資源集。基于新開發的具? AI 基準BEHAVIOR-1K,BVS ?持?量可調參數,涵蓋場景級別(如光照、物體擺放)、物體級別(如關節配置、屬性)和相機級別(如視野、焦距)。研究?員可以在數據?成過程中?由調整這些參數,以進?精確的控制實驗。
此?作還展?了 BVS 在不同模型評估和訓練應?中的優勢,包括參數可控地評估視覺模型在環境參數連續變化時的魯棒性,系統評估場景理解模型(豐富的視覺標注),以及對新視覺任務的模型訓練。
項目鏈接:https://behavior-vision-suite.github.io/
論文鏈接:https://arxiv.org/pdf/2405.09546
代碼鏈接:https://github.com/behavior-vision-suite/behavior-vision-suite.github.io
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。