首頁 > AI資訊 > 最新資訊 > 重估大模型發展成本曲線,異構智算如何破解AI落地新挑戰?

重估大模型發展成本曲線,異構智算如何破解AI落地新挑戰?

新火種    2025-05-23

近兩年,AI大模型的加速發展,加快了對算力的需求。相關數據顯示,大模型的發展將人工智能從1.0時代進化到2.0時代,每年對算力的需求增速是10倍。當前,以大模型為基礎特征的AI 2.0時代已經到來,“大模型+大算力+大數據”成為新一代人工智能發展的基本范式。

AI應用場景不斷豐富,AI大模型加速更迭,AI算力需求也迎來持續擴張,《算力基礎設施高質量發展行動計劃》提出,到2025年中國的智能算力占比將達到35%。不過,從算力基礎設施的角度來看,仍不能非常好地滿足行業對算力的需求的。

過去算力還是以通用算力為基礎,在大模型爆發之前,通用算力每年算力的增長是符合摩爾時代的摩爾定律的。到了2008年以后開始有了人工智能的需求,以深度學習作為發展,每年的增速已經出現了一定的高速增長,從每18個月翻一番,變成每6個月翻一番。

1

今年春節期間,DeepSeek的火爆,對中美AI之間的競爭以及算力的格局都造成了巨大的改變。中科院計算所研究員張云泉指出,DeepSeek的誕生標志著在AI領域出現了新的技術突破,尤其是在低算力訓練和高效率模型優化方面,這將推動AI技術向更高效和普惠的方向發展。

“人工智能正在不斷涌現,正在重塑我們的生產方式、生活方式,還有數據治理方式,深刻影響了傳統的生產方式和生產關系,DeepSeek就是這個里面的代表,它前所未有拉低了大模型部署的成本,把它的覆蓋面極大的拓展,用較低水平達到國際領先水平,打破了美國在最近一段時間對我們算力的圍剿。這一突破,促使全球市場重新評估大模型發展的成本曲線,推動國內芯片、云計算等基礎設施加速升級。”

與此同時,談及這一輪DeepSeek帶來的沖擊和影響,燧弘華創執行總裁唐鋒認為,要打破AI迷信,過去談到AI大家想到的都是美國領先,中國緊隨,實際上我們現在正以不可阻擋之勢,不管是從芯片、從應用,在重塑全球人工智能領域的話語權。

針對最近一段時間行業內關于算力過剩的話題,他也給出了自己的看法,稱DeepSeek出來之后其實讓推理的算力需求大量增長。做這個行業大家要樹立AI信仰,算力是源源不斷的,是不夠的,未來它的增長不是線性的,是指數的。

“原來我們智算中心在去年的時候大部分都是一些續建,還有一部分是大模型試用的推理,DeepSeek出來之后整個推理就爆發了,各行各業都有算力應用,比如在醫療、政務、教育、智能制造。”

值得一提的是,DeepSeek掀起的AI應用革命與算力瓶頸突破,讓作為“中國算谷”的慶陽,受到了前所未有的關注。據介紹,慶陽作為全國一體化算力網絡國家樞紐節點和國家數據中心集群,是“東數西算”工程的重要樞紐。唐鋒介紹道,也在跟慶陽市政府做一個投資建設規劃,未來在慶陽可能會投資超過128個億,來建設整個算力基礎建設。

2

可以確定的一點是,人工智能是新質生產力重要的驅動力,智算中心是新時代人工智能重要的基礎設施之一。只是,在算力層面,國內的智算中心依然面臨一些問題。雖然總的性能達到了世界第二,但在高端智算上仍然是緊缺、存在結構性的問題的,跟國際領先水平還有很多差距。

AI 2.0時代的到來,所謂算力好用,是通過提供從芯片到應用的端到端整體算力優化,實現算力效率和算力性能的大幅提升,滿足多樣化復雜應用的升級需求。應對算力方面的挑戰,張云泉認為,一是要加強人才培養,建立我們自己的標準體系。二是在平臺化建設上要加力,通過平臺進行賦能,給更多創業者賦能,通過這個平臺建設可以建設它的創新生態,讓大家在一個生態上、平臺上共同發展,來借力,來降低成本和開銷。

據了解,作為AI基礎設施提供商,聯想已經構建了“一橫五縱”的戰略,旨在通過聯想萬全異構智算平臺,打造服務器、存儲、數據網絡、軟件及超融合、邊緣計算“五縱”產品能力。其中,“一橫”是對“五縱”能力的全面升級,萬全異構智算平臺是AI 2.0時代大模型訓練和推理的基礎設施底座,對于今天整體布局的基礎設施進行重新的改造和升級,實現真正的AI導向。

聯想中國基礎設施業務群戰略總監黃山介紹稱,萬全異構智算平臺能夠統一納管異構算力,實現對異構計算集群的高效管理調度和可用性保障,讓客戶獲取融合、穩定的通用、智能和科學算力。

去年4月,異構智算產業生態聯盟成立。在DeepSeek大模型引領AI浪潮的當下,聯想與異構智算產業生態聯盟持續推動技術創新與產業落地。2025年,聯想與燧弘華創共同攜手推動在慶陽綠色智算中心突破性部署多元異構算力調度平臺,標志著異構算力在超大規模智算場景中完成從技術攻堅到產業化應用的跨越。

聯想中國基礎設施業務群戰略總監黃山

聯想中國基礎設施業務群戰略總監黃山

“我們跟燧弘在第一時間,在慶陽這邊做DeepSeek部署,第一天我們在用2臺機器,先布了一個滿血的671B。在春節結束之后,今天我們可以在1臺機器上去支撐千人企業對DeepSeek滿血版的應用。”黃山說道,“目前為止DeepSeek已開源的方法在推理上聯想都已經用了,并且進行了二次開發,會比開源的方法更加優化。在DeepSeek沒開源的,在傳輸層優化里面的一些通信言語優化等,還有一些專家調度上面聯想會做出自己有差異化的調優能力。”

據悉,聯想及其生態伙伴在慶陽搭建的聯想萬全異構智算平臺,在管理142節點千卡進行DeepSeek后訓練時,以調優技術使得訓練MFU達60%以上,在訓練期間人為加入多類故障后進行故障斷點續訓的時間小于1分鐘。聯想AI服務器可以全速運轉滿血版DeepSeek R1大模型,極限吞吐量可超8000 tokens/s。

此外,在算力的發展過程中,經營模式也發生了一些變化,原來2B端可能更多向2C端來變化。面對當下千行百業的新需求,黃山進一步指出,算力的需求其實并未減少,在近期來說從預訓練算力的需求轉向了后訓練和推理。今年會和智算中心一起要服務千行百業,各個行業都會要推理服務、要智能體開發平臺,所以今年會在生態中進一步擴大,并且從低到高做好行業標準。作者|杜志強,編輯|鐘毅)

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章