少妇扒开腿让我爽了一夜,人人插人人插,可以直接看的无码av

首頁 > AI資訊 > 最新資訊 > 中信證券：DeepSeekV3發布，加速AI應用落地

中信證券：DeepSeekV3發布，加速AI應用落地

中信證券楊澤原丁奇等 2024-12-31

中信證券延保支持，近日，DeepSeek-V3的正式發版引起AI業內廣泛高度關注，其在保證了模型能力的前提下，訓練效率和推理速度大幅提升。

中信證券認為，DeepSeek新一代模型的發布意味著AI大模型的應用將逐步走向普惠，助力AI應用廣泛落地；同時訓練效率大幅提升，亦將助力推理算力需求高增。持續看好AI產業鏈的加速落地機遇，建議重點關注AI應用、AI Infra、AI算力三大主線。

▍事項：

12月26日，DeepSeek-V3（深度求索）首個版本正式發布并同步開源，已在網頁端和API全面上線。其在訓練效率和推理速度上相較歷史模型有了大幅提升，同時可保證領先的模型能力表現，引起業內高度關注。

▍模型：數學、代碼等能力優異，API性價比較高。

參考官方論文，DeepSeek v3為6710億參數MoE架構模型，激活37B，在14.8T token上進行了預訓練。能力上，模型暫不支持多模態輸入，但在通識和專業知識測試集上表現優秀，MMLU pro正確率75.9%，GPQA-Diamond正確率59.1%，達到國內第一梯隊，接近Claude 3.5 Sonnet的水平；并且在數學和代碼領域測試表現突出，MATH 500正確率90.2%，SWE-bench正確率42.0%，Codeforces得分51.6，超越所有非o系列模型。模型生成速度達到60TPS，是前代模型的三倍。定價上，API定價為輸入每百萬tokens 0.5元（緩存命中）/2元（緩存未命中），輸出每百萬tokens 8元，與字節Doubao-pro-256k定價輸入每百萬tokens 5元，輸出每百萬tokens 9元的水平相當，在國產模型中性價比較高。

▍應用：國產模型能力提升、價格下降，支撐全領域AI應用加速。

豆包pro、DeepSeek v3等國產模型連續發布。模型能力上，國產模型在文本和知識能力上接近GPT-4、Claude、Llama等海外前沿模型水平，多模態能力逐步完備，邏輯和代碼能力在非o1技術路線下達到可用水平。價格上，國產模型API百萬tokens輸出普遍定價10元以內，是GPT-4o的1/3甚至更低。我們預計模型性價比持續提升下，國內AI應用依托豐富生態和成熟流量加速各領域落地。其中，Agent模式有望以更長的任務流程、更好的場景理解、更高的自主能力，成為所有互聯網用戶的數字助手，在企業管理、教育、辦公、金融等領域展現應用價值。

▍算力：DeepSeek訓練效率大幅提升，助力推理算力需求高增。

1）訓練效率大幅提升，GPT4的訓練成本約為DeepSeek V3的6.2倍。根據DeepSeek V3的官方技術文檔，本次DeepSeek的訓練僅使用了2048個H800 GPU，總訓練GPU卡時為2788千小時（其中預訓練為2664千小時），平均到每個GPU上，僅為1361小時，約合56.7天。與之相對比，根據英偉達CEO黃仁勛在GTC2024上的演講內容，GPT-4 MoE使用8000個H100訓練了90天，合計約為17280千卡時，相當于DeepSeek V3的6.2倍。

2）訓練效率提升歸因：我們認為DeepSeek V3訓練提效的原因主要包括低精度計算、小參數量、高質量數據等方面。精度方面，根據英偉達官方文檔，其GPU的8位精度算力通常是16位精度算力的2倍，因此數據精度從FP16降低到FP8可以貢獻一倍效率提升。參數方面，GPT-4 MoE模型總參數量達到1800B，而按照DeepSeek V3官方文檔，其總參數量只有671B，約為GPT-4 MoE的1/3，同時，DeepSeek的激活參數大約為37B，而GPT4-MoE每次推理激活的參數量約為280B，二者約為7.57倍關系；數據方面，GPT-4 MoE使用了13萬億（1300B）token，而DeepSeek V3使用的token數量約為14.8萬億（1480B），數據量相差不大，但DeepSeek V3技術文檔提及了使用模型生成訓練數據等，因此我們認為數據質量或有較大幅度提升。此外，采用負載均衡、更好的流水線策略亦是其官方提及的提升訓練效率的重要原因。

3）從推理側助推AI普惠，帶動推理算力需求倍增，打開更廣闊算力市場空間。我們認為，DeepSeek模型相比GPT4模型更小的參數量也意味著更低的推理成本，推理成本的降低，將是AI應用普及的前奏，正如4G提速降費給我國移動互聯網產業提供了助力。當前AI應用滲透率仍然較低，產業仍在早期，根據我們在2024年12月13日外發的報告《計算機行業“智能網聯”系列報告54—算力需求測算：Agent+Sora》，隨著Agent成為流量入口，滲透率達到30%左右，全球Agent的推理token數量將增長3個數量級以上，且視頻生成與實時視頻理解等形態的AI同樣有望帶來巨量需求增長，并且根據我們對視頻生成模型的測算，視頻推理算力需求將有望達到訓練算力需求的2-3個數量級以上。算力需求的指數級提升與模型訓練推理成本的下降將構成產業飛輪，帶動全產業鏈擴張，隨著AI進一步普及到日常生活與產業當中，我們認為推理算力需求將仍然驅動AI算力產業鏈持續增長。

▍風險因素：

AI核心技術發展不及預期，AI被不當使用造成嚴重社會影響，企業數據安全風險，信息安全風險，行業競爭加劇。

▍投資策略：建議關注AI全產業相關投資機會，綜合梳理以下投資主線：

1）AI 應用：伴隨模型能力升級，Agent等應用形式有望加速落地，帶動辦公、教育、管理、端側、具身智能等應用領域公司加速兌現業績彈性。

2）AI Infra：模型場景化與行業化發展催生數據服務和模型平臺需求，產業發展確定性高。

3）AI算力：AI應用加速落地帶動推理端算力新需求。

Tags:

神經網絡證券

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

中信證券：DeepSeekV3發布，加速AI應用落地

震蕩結構下熱點或將維持快速輪動，留意算力等科技股方向的低吸機會

科創板晚報|利揚芯片擬收購國芯微100%股權燕東微擬定增募資不超40.2億元

【明日主題前瞻】英偉達發布通用機器人模型RVT-2，訓練效率提升6倍

AI驅動生產力，美圖公司跑出“加速度”

中信證券：DeepSeekV3發布，加速AI應用落地

熱門文章