首頁 > AI資訊 > 最新資訊 > DeepSeekApp滿月聯想AI服務器單機可部署滿血大模型

DeepSeekApp滿月聯想AI服務器單機可部署滿血大模型

新火種    2025-03-28

在DeepSeek App上線一個月之際,聯想正式宣布,旗下大模型訓推一體AI算力平臺聯想問天 WA7780 G3、大模型推理AI算力平臺聯想問天 WA7785a G3全新升級,單機即可部署DeepSeek-R1滿血版大模型(具備671B參數)。此次升級將大幅降低客戶部署難度和成本,同時提升模型訓練和推理性能,為DeepSeek等最新AI應用的落地和規模化發展提供強有力的支持。

據悉,聯想正與DeepSeek在個人智能與企業智能兩大領域,開展更全面、深入的合作。其中,聚焦企業智能,聯想中國基礎設施業務與DeepSeek的深度融合,正快速實現從訓練到推理的全鏈條產品適配。

據了解,DeepSeek大模型憑借高性能、低成本和開源三大特點,助力各行業加速應用大模型技術推動業務升級轉型。DeepSeek-R1滿血版大模型基于6710億參數,具備卓越的復雜推理和深度交互能力,眾多企業積極探索并部署DeepSeek-R1滿血版大模型以期提升業務效能與競爭力。然而,在實際應用中,用戶在本地接入時不可避免遇到算力基礎設施匱乏、訓練推理服務性能難以達標等一系列難題。

面對用戶實際應用問題,聯想問天 WA7780 G3、聯想問天 WA7785a G3與DeepSeek-R1滿血版大模型特點進行了深度適配調優,單機即可部署DeepSeek-R1滿血版大模型,助力企業高效完成本地化部署,一站式構建AI生產力,加速智能化升級。

值得一提的是,聯想問天 WA7780 G3大模型訓推一體服務器是為打破AI算力供給困境而來,能夠為訓練推理提供強勁的算力支撐。

作為領先的AI算力平臺,這款服務器內嵌Transfomer Engine, 支持FP8優化,可以幫助DeepSeek-R1滿血版大模型獲得更好的模型訓練和推理性能。

在顯存方面,提供超1T HBM3e,充分滿足DeepSeek-R1滿血版大模型FP8精度下不低于800GB顯存容量的需求。顯存帶寬高達4.9TB/s,可以在推理解碼階段實現極致加速。

在高速互聯方面,GPU P2P通信帶寬達900GB/s,同時單機提供3.2TB/s的高帶寬低延遲網絡擴展,能夠為DeepSeek-R1滿血版大模型提供極低的通信延遲。

聯想問天 WA7780 G3大模型訓推一體服務器

聯想問天 WA7785a G3服務器則聚焦于AI算力優化,該大模型推理AI算力平臺原生支持FP8,提供超1.5T HBM3e,為DeepSeek-R1滿血版大模型插上性能騰飛的翅膀。

此外,顯存帶寬達5.3TB/s的高速顯存可以減少數據傳輸的瓶頸,從而加速訓練過程,提高模型訓練效率。GPU聚合帶寬達896GB/s,同時單機提供3.2TB/s的高帶寬低延遲網絡擴展,充分滿足了DeepSeek-R1滿血版大模型并行計算時跨節點的通信需求,使其成為用戶首選大模型推理服務器。

聯想問天 WA7785a G3服務器

此外,聯想正在加速推進DeepSeek 671B-R1和V3模型及一系列蒸餾模型與其AI服務器的適配。未來,聯想將持續創新為企業提供全面、高效、可靠的IT基礎設施,加速推動AI創新與應用落地,為千行萬業積極擁抱AI注入強大動力。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章