浪潮信息加碼布局高性能分布式存儲助推AI產業化變革
在日前舉行的2023全球閃存峰會上,浪潮信息發布高性能分布式存儲平臺AS15000G7,在性能、管理、融合和效率方面進一步突破,助力千行百業釋放數據價值,推進AI產業化數智變革。
國家互聯網信息辦公室今年5月發布的《數字中國發展報告(2022年)》顯示,2022年我國數據產量達8.1ZB,同比增長22.7%,全球占比達10.5%,位居世界第二。截至2022年底,我國數據存儲量達724.5EB,同比增長21.1%,全球占比達14.4%。
在專家看來,數據資源規模快速增長對數據存儲提出了新的要求。算力、存力、運力缺一不可,只有三者平衡配置、均衡發展,才能充分發揮算力的作用。
特別是,今年以來,隨著通用人工智能的升溫,各地紛紛投入建設AI算力中心,但對數據存儲的重視程度略顯不足。浪潮信息存儲產品線副總經理劉希猛表示,數據是AIGC大模型應用的核心,決定了機器學習算法的性能、泛化能力、應用效果,隨著參數量和數據量的極速膨脹,數據的“存、管、用、傳”正在關乎著AIGC產業發展。
具體而言,劉希猛表示,數據存儲與管理一是要支撐基于海量多元異構數據的歸集、標注、訓練、推理和歸檔全生命周期管理;二是要承載AIGC數據訓練推理時的高性能、低延時、大容量、易擴展、自由流動的嚴苛需求。“數據來源廣,數據量大,數據訪問不僅要大帶寬,同時需要更高的IOPS和低時延,數據全生命周期高性價比保存也同樣重要。”他說。
從存儲產品看,存力能力體現為主存儲、分布式存儲、備份三類。從存力核心技術看,國外廠商在非易失性存儲、QLC SSD等先進介質的研發,混合云、多云存儲生態,AIGC專用存儲系統等方面都發展較早,目前像浪潮信息等國內不少廠商也在加快布局發展。
浪潮分布式存儲產品線總經理姜樂果介紹,AS15000G7平臺基于其融合架構,面向AI大模型海量多源異構非結構化數據,支持文本、圖片、音頻、視頻等多種類型數據存儲,以文件、對象、大數據以及視頻的存儲方式進行并行訪問,多協議實時互訪互通和系統扁平擴展。而且數據訪問過程中保持語義一致、性能無損,從而實現高效共享。
“基于業界對大模型訓練的數據存儲在性能、管理、融合和效率方面更極致的需求,AS15000G7平臺,助力AIGC在金融、教育、醫療等領域突破海量多源數據存力瓶頸,加速釋放數據價值。”姜樂果說。
“AI大模型的發展和應用,在給IT基礎設施帶來機遇的同時,也為數據存儲帶來了巨大的挑戰。如何滿足大模型對數據存儲性能和容量的需求,需要存儲系統以創新性的架構來迎接未來的挑戰。”劉希猛表示,目前國內已發布的生成式AI模型超過了100個,在建設布局時應考慮到AI大模型對高性能AI服務器、高吞吐并行存儲系統等需求,將數據中心的算力、全閃存儲、混閃存儲按照1:1:1比例建設,這樣可實現整體投入最小化。
(文章來源:經濟參考網)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。