國泰君安:計算機國產大模型性能領先場景應用加速落地
智通財經APP獲悉,國泰君安發布研報稱,DeepSeek-V3的發布標志著國產AI在規模、效率和成本方面實現重大突破。DeepSeek-V3在多項評測中超越多款頂尖模型,且成本極具競爭力,其強大性能與開源策略顯著提升了其市場競爭力,具備高投資價值。因此AI大模型在各行業落地的技術路徑有望逐步明確,MoE架構的低成本、高性能的大模型在垂類領域中的運用潛力巨大。
國泰君安主要觀點如下:
DeepSeek-V3的強大性能與開源策略顯著提升了其市場競爭力,具備高投資價值。
DeepSeek正式發布了其全新系列模型DeepSeek-V3,并同步開源。該模型為自主研發的MoE架構,擁有6710億參數和37億激活參數,在14.8萬億token上進行了預訓練。DeepSeek-V3在多個評測中超越了Qwen2.5-72B和Llama-3.1-405B等開源模型,其性能與頂尖閉源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知識類任務、長文本處理、代碼編寫和數學競賽等方面表現出色。
DeepSeek-V3的生成速度提升和靈活的API定價策略為用戶帶來更高的使用價值。
通過算法和工程上的創新,DeepSeek-V3的生成吐字速度從每秒20次提升至60次,實現了3倍的性能提升,用戶體驗更加流暢。DeepSeek調整了API服務的價格,新的定價為每百萬輸入tokens0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens8元。高性價比有望為DeepSeek帶來了更大市場份額和收入增長。
DeepSeek-V3的開源權重和本地部署能力增強其社區支持和應用擴展性,推動了技術生態發展。
DeepSeek-V3采用FP8訓練,并開源原生FP8權重,得到開源社區的廣泛支持。DeepSeek提供從FP8到BF16的轉換腳本,方便社區進行適配和拓展應用場景。模型權重可通過HuggingFace平臺下載,進一步促進了本地部署和多樣化應用。這種開放的生態系統為其在AGI普惠化方面奠定了堅實基礎。
風險提示:較低定價壓縮盈利空間,技術競爭加劇的風險。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。