伊人伊网,亚洲人成在线观看,一色综合

首頁 > AI資訊 > 最新資訊 > 繼續狂飆！豆包“全家桶”迎來重磅更新視覺理解、視頻生成功能都來了

繼續狂飆！豆包“全家桶”迎來重磅更新視覺理解、視頻生成功能都來了

科創板日報 2024-12-19

《科創板日報》12月18日訊字節跳動豆包正一路高歌猛進，今日又迎來重磅更新。

截至目前，豆包大模型日均tokens使用量超過4萬億，發布7個月以來增長超過33倍。

在今日的火山引擎Force原動力大會上，豆包又發布了視覺理解模型，具備更強的內容識別、理解和推理、視覺描述等能力。火山引擎總裁譚待宣布，豆包視覺理解模型價格降至0.003元/千Tokens，比行業平均價格降低85%。

另外，字節豆包新一代視頻生成大模型將明年1月正式發布。此外，抖音旗下圖片和視頻生成工具即夢AI，展示了新一代圖片生成模型和動態海報功能。

從字節今日的種種新動態來看，其仍舊維持著在生成式AI領域的“飽和式”策略。

在今天之前，字節豆包大模型家族已包括了通用大語言、語音合成和識別、圖片及視頻等不同模態的生成式AI模型，但仍缺少具有視覺能力的可交互多模態大模型；并且，字節豆包之前已經以智能體耳機、智能玩偶、臺燈為切入點，在AI硬件端開始布局，但同樣受限于交互多模態模型的缺失，AI硬件產品仍只能實現語音層級交互。

從一定程度上來說，今日豆包發布的視覺理解模型，補上了“豆包全家桶”在視覺交互上的這一短板。

西部證券12月15日報告指出，視覺能力是大模型能力的核心，因為視覺輸入占據人類交互信息的絕大多數，在包括AI玩具或AI眼鏡等的下一代AI硬件終端中，視覺SoC將有望成為標配，這也將新增對NAND存儲芯片的需求。分析師建議關注視覺SoC公司恒玄科技、星宸科技、安凱微；存儲公司東芯股份、普冉股份。

國盛證券也表示，字節跳動目前已具備開放式耳機音頻技術、大模型技術以及豐富的軟件應用生態，有望應用到AI眼鏡產品上，成為該賽道核心玩家。

▌算力需求或進一步擴大

另一方面，從豆包的文字大模型，到視覺理解模型和視頻生成模型，可以看到，“豆包+”生態似乎也已初現雛形。若再加上貓箱、即夢等字節旗下更多AI應用，字節跳動的算力需求，或許又要再上一個臺階。國盛證券近日研報也指出，算力是字節AI產業鏈核心方向。

據媒體援引分析師測算，僅以豆包類似的文字模型來推算，以ChatGPT MAU（月活用戶）為6億來看，推理需求約需35萬個A100顯卡，訓練需求需12萬個A100顯卡。

而相對于文字模型而言，視頻大模型對算力的需求勢必更高，例如在Sora正式上線后不久，OpenAI即出現算力不夠用的問題。

上述分析師以即夢AI為例計算，即夢的視頻生成模型Magic Video v2若MAU達到1億，且每天有生成10分鐘視頻的需求，則需28萬個英偉達H100 GPU，MAU達到2億時，對H100的需求將達到55萬個。

服務器代工廠英業達此前已獲得字節跳動、百度、阿里巴巴、騰訊等公司的訂單，主要出貨形式為L10（機柜組裝與測試）及L11（服務器整合與機架布建），其日前表態中也暗示了字節等公司對算力的需求之強勁——本季度客戶對AI服務器需求較預期強勁，今年AI服務器營收有望同比增長2.5-3倍，明年出貨量將進一步升溫。

民生證券指出，豆包用戶數的快速增長帶來的將是算力中心的擴建，進而帶動AI服務器需求提升；同時，算力中心擴建帶來的不僅是基礎建設需求，更多的是熱管理的需求，字節AI端液冷有望拉動廣闊市場空間。

據《科創板日報》不完全統計，A股中字節跳動算力硬件相關公司有：

Tags:

深度學習豆包重磅

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

繼續狂飆！豆包“全家桶”迎來重磅更新視覺理解、視頻生成功能都來了

【每日收評】短線情緒回暖！抖音豆包、腦機接口概念股批量漲停，兩市成交額卻跌破1.4萬億

主營業務擬變更！30億地產股籌劃重大資產重組明起停牌|盤后公告集錦

民生證券：豆包出圈解析字節的AI終端布局

把人工智能、大模型、媒資庫等有機整合打破信息傳播“孤島”每經AI電視4.0重磅介紹

寒武紀總市值超2500億元江波龍擬發行H股股票并在香港聯交所主板上市

熱門文章