民生證券:豆包開源視頻大模型發布有望激活“視覺市場”打開增長空間
智通財經APP獲悉,民生證券發布研報稱,豆包開源視頻大模型“VideoWorld”發布,讓視頻生成成為通用知識學習方法,在現實世界充當“人工大腦”,僅靠“視覺”即可學習知識,“預測”未來,并“理解”因果關系,有望激活“視覺市場”為其打開增長空間,在視頻大模型的能力催化下收益。
事件:2月10日,據豆包大模型團隊官宣發布視頻生成實驗模型“VideoWorld”,不同于Sora、DALL-E、Midjourney等主流多模態模型,VideoWorld在業界首次實現無需依賴語言模型,即可認知世界。
民生證券主要觀點如下:
開源視頻生成模型最新成果,可僅靠視覺認知世界
視頻生成成為通用知識學習方法,在現實世界充當“人工大腦”。作為一種通用視頻生成實驗模型,VideoWorld去掉語言模型,實現了統一執行理解和推理任務。同時基于一種潛在動態模型,可高效壓縮視頻幀間的變化信息,顯著提升知識學習效率和效果。且目前該項目代碼與模型已開源。
在不依賴任何強化學習搜索或獎勵函數機制前提下,VideoWorld達到了專業5段9x9圍棋水平,并能夠在多種環境中,執行機器人任務。團隊認為,視頻生成可以成為一種通用的知識學習方法,并在現實世界充當思考和行動的“人工大腦”。
模型僅靠“視覺”即可學習知識,“預測”未來,并“理解”因果關系
研究團隊構建了兩個實驗環境:視頻圍棋對戰和視頻機器人模擬操控,它在保留豐富視覺信息的同時,壓縮了關鍵決策和動作相關的視覺變化,實現了更有效的視頻學習,且這種純視覺模型可“預測”未來,并能“理解”因果關系。在未來,豆包團隊將著力解決其在真實世界環境中的應用,仍面臨著高質量視頻生成和多環境泛化等挑戰。
視覺認知世界的能力有望激活“視覺市場”為其打開增長空間
以海康威視為代表的“視覺市場”有望在視頻大模型的能力催化下收益,作為全球知名的視頻監控行業龍頭企業,根據2024年度全球安防50強榜單,海康威視以97.22億美元的2023年安防產品銷售收入穩居第一,超過后兩名的總和。2022年,海康威視明確智能物聯(AIOT)戰略,2023年,公司正式推出“觀瀾大模型”助力各行業實現數字化、智能化升級。根據Omdia報告,2022年海康威視在全球視頻監控市場中的占有率達到25.9%,大幅領先于第二名。在龐大的視頻監控部署網絡下,開源視頻大模型的誕生對海康而言無疑是一劑強心針。
螢石網絡公司2023年智能家居攝像頭業務營收占比62.07%,且作為公司的現金牛業務及第一增長曲線,市場占有率處于市場前列,且連續多年在雙11、618等購物節的天貓、抖音等平臺相關類目品牌排行中位列第一。且公司在視覺技術方面擁有硬件、軟件、云平臺高度融合的生態閉環,端云協同,為智能檢測、智能識別、AI分析推理等功能提供了強大支持。視覺大模型的發布有望進一步助推螢石網絡視覺領域業務再上臺階。
建議關注:
海康威視(002415.SZ)、螢石網絡(688475.SH)、大華股份(002236.SZ)、千方科技(002373.SZ)、匯納科技(300609.SZ)、網達軟件(603189.SH)、魅視科技(001229.SZ)等。
風險提示:技術落地不及預期,行業競爭加劇。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。