英偉達跌倒,AI芯片創企卻吃飽?DeepSeek開啟推理大時代
《科創板日報》2月8日訊 DeepSeek R1模型的橫空出世,在全球范圍內一度引發了對算力長期需求的質疑,甚至重挫英偉達股價。
算力需求真的將要萎縮嗎?
AI芯片初創公司可能不會這么認為。在他們眼中,這不是一個威脅,而是一個能“做大做強”的巨大機會——隨著越來越多的客戶采用和搭建起DeepSeek開源模型,對推理芯片和算力的需求正在攀升。
英偉達競爭對手之一Cerebras Systems主要為客戶提供AI芯片,并可以通過自家計算集群為客戶提供云服務,去年8月曾發布號稱是“全球最快的AI推理解決方案”的Cerebras Inference。
這家公司CEO Andrew Feldman向CNBC透露,DeepSeek R1模型發布之后,公司迎來了“有史以來最大的服務需求高峰之一”。“開發者非常想用DeepSeek R1這樣的開源模型取代OpenAI昂貴且封閉的模型。價格下降能推動全球使用范圍擴張,就像之前的PC和互聯網行業,而現在AI也正走在一條類似的長期增長之路上。”
另一家AI芯片制造商Etched也表示,自從DeepSeek發布推理模型以來,已有數十家公司向Etched伸出了橄欖枝,因此公司正在將支出從訓練集群轉向推理集群。“DeepSeek-R1證明了推理計算已成為每個主要模型供應商的‘最先進’方法,而推理思考并不便宜——為了將這些模型擴展到數百萬用戶,我們將需要越來越多的算力。”
“從DeepSeek的例子就能看到,較小的開放模型可以訓練得與更大的專有模型一樣強大,甚至更強,而且這可以以極低的成本實現。而小型模型的普及,將進一步催化推理時代到來。”AI芯片初創公司 d-Matrix首席執行官Sid Sheth也表示。
在芯片初創公司和業內分析師們看來,DeepSeek有望加速“從訓練到推理”的AI周期,促進新芯片技術采用。
“簡單來說,AI訓練是構建一個工具或算法,而推理則是將這個工具實際應用于現實場景中。”Morningstar半導體分析師Phelix Lee稱,AI訓練非常依賴算力,但推理可以在不那么先進的芯片上進行,這些芯片可以執行較窄范圍的任務。
▌“AI行業的杰文斯悖論”
實際上,DeepSeek日前的表現也反應了算力還是不夠用。
2月6日DeepSeek突然暫停其API服務充值,按鈕顯示灰色不可用狀態。對此官方聲明稱,“當前服務器資源緊張,為避免對您造成業務影響,我們已暫停 API 服務充值。存量充值金額可繼續調用,敬請諒解!”
據國泰君安測算,假設DeepSeek日均訪問量為1億次、每次提問10次,每次提問的回復用到1000個token,1000個token大概對應750個英文字母,則DeepSeek每秒的推理算力需求為1.6*1019TOPs。在這種普通推理情境下, 假設DeepSeek采用的是FP8精度的H100卡做推理,利用率50%,那么推理端H100卡需求為16177張,A100卡需求為51282張。
其進一步表示,在以DeepSeek為首的低成本推理模型的逐漸普及下,推理成本及價格大幅削減勢必會帶來應用側繁榮,由此將拉動成倍數的總算力需求提升。
未來的AI投入不再盲目“大力出奇跡”的Scaling Law,逐漸將重心從預訓練轉向推理,東吳證券認為,訓練+推理的整體需求依然樂觀,參考從2G到4G流量費用不斷降低,但因為用量的指數級提升,導致整體市場規模依然快速增大。
回看19世紀,英國經濟學家杰文斯發現,當通過技術提升,實現煤炭使用效率提高、成本下探,煤炭消費量反而會增加,從而提出了環境經濟學中廣為人知的“杰文斯悖論”。
站在160年后的今天,當DeepSeek通過技術降本,為AI應用打開更多落地場景,“杰文斯悖論”或許也將在AI行業應驗。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。