繼續狂飆!豆包“全家桶”迎來重磅更新視覺理解、視頻生成功能都來了
《科創板日報》12月18日訊 字節跳動豆包正一路高歌猛進,今日又迎來重磅更新。
截至目前,豆包大模型日均tokens使用量超過4萬億,發布7個月以來增長超過33倍。
在今日的火山引擎Force原動力大會上,豆包又發布了視覺理解模型,具備更強的內容識別、理解和推理、視覺描述等能力。火山引擎總裁譚待宣布,豆包視覺理解模型價格降至0.003元/千Tokens,比行業平均價格降低85%。
另外,字節豆包新一代視頻生成大模型將明年1月正式發布。此外,抖音旗下圖片和視頻生成工具即夢AI,展示了新一代圖片生成模型和動態海報功能。
從字節今日的種種新動態來看,其仍舊維持著在生成式AI領域的“飽和式”策略。
在今天之前,字節豆包大模型家族已包括了通用大語言、語音合成和識別、圖片及視頻等不同模態的生成式AI模型,但仍缺少具有視覺能力的可交互多模態大模型;并且,字節豆包之前已經以智能體耳機、智能玩偶、臺燈為切入點,在AI硬件端開始布局,但同樣受限于交互多模態模型的缺失,AI硬件產品仍只能實現語音層級交互。
從一定程度上來說,今日豆包發布的視覺理解模型,補上了“豆包全家桶”在視覺交互上的這一短板。
西部證券12月15日報告指出,視覺能力是大模型能力的核心,因為視覺輸入占據人類交互信息的絕大多數,在包括AI玩具或AI眼鏡等的下一代AI硬件終端中,視覺SoC將有望成為標配,這也將新增對NAND存儲芯片的需求。分析師建議關注視覺SoC公司恒玄科技、星宸科技、安凱微;存儲公司東芯股份、普冉股份。
國盛證券也表示,字節跳動目前已具備開放式耳機音頻技術、大模型技術以及豐富的軟件應用生態,有望應用到AI眼鏡產品上,成為該賽道核心玩家。
▌算力需求或進一步擴大
另一方面,從豆包的文字大模型,到視覺理解模型和視頻生成模型,可以看到,“豆包+”生態似乎也已初現雛形。若再加上貓箱、即夢等字節旗下更多AI應用,字節跳動的算力需求,或許又要再上一個臺階。國盛證券近日研報也指出,算力是字節AI產業鏈核心方向。
據媒體援引分析師測算,僅以豆包類似的文字模型來推算,以ChatGPT MAU(月活用戶)為6億來看,推理需求約需35萬個A100顯卡,訓練需求需12萬個A100顯卡。
而相對于文字模型而言,視頻大模型對算力的需求勢必更高,例如在Sora正式上線后不久,OpenAI即出現算力不夠用的問題。
上述分析師以即夢AI為例計算,即夢的視頻生成模型Magic Video v2若MAU達到1億,且每天有生成10分鐘視頻的需求,則需28萬個英偉達H100 GPU,MAU達到2億時,對H100的需求將達到55萬個。
服務器代工廠英業達此前已獲得字節跳動、百度、阿里巴巴、騰訊等公司的訂單,主要出貨形式為L10(機柜組裝與測試)及L11(服務器整合與機架布建),其日前表態中也暗示了字節等公司對算力的需求之強勁——本季度客戶對AI服務器需求較預期強勁,今年AI服務器營收有望同比增長2.5-3倍,明年出貨量將進一步升溫。
民生證券指出,豆包用戶數的快速增長帶來的將是算力中心的擴建,進而帶動AI服務器需求提升;同時,算力中心擴建帶來的不僅是基礎建設需求,更多的是熱管理的需求,字節AI端液冷有望拉動廣闊市場空間。
據《科創板日報》不完全統計,A股中字節跳動算力硬件相關公司有:
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。