首頁 > AI資訊 > 最新資訊 > 奇異摩爾??|:破局AI算力之困“互聯(lián)”將成關鍵|連線創(chuàng)始人

奇異摩爾??|:破局AI算力之困“互聯(lián)”將成關鍵|連線創(chuàng)始人

科創(chuàng)板日報記者郭輝    2025-01-18

《科創(chuàng)板日報》1月17日訊(記者 郭輝) Chiplet被認為是應對摩爾定律放緩、解決芯片高性能運算需求的一大技術方向。近兩年的產(chǎn)業(yè)成熟,使得Chiplet的技術愿景變得更加清晰。

在位于上海張江的中科創(chuàng)星張江硬科技孵化器園區(qū),奇異摩爾2024年正式入駐于此。這是一家成立于2021年3月的芯片公司,起初,Chiplet技術是他們身上最鮮明的標簽。經(jīng)過近四年的成長,奇異摩爾如今構建了一套涵蓋Scale Out(網(wǎng)間互聯(lián))、Scale Up(片間互聯(lián))、Scale Inside(片內(nèi)互聯(lián))的AI網(wǎng)絡互聯(lián)全棧式產(chǎn)品體系。

image

面對生成式AIGC爆發(fā)這一契機,奇異摩爾在Chiplet技術基礎上對企業(yè)自身的定位和發(fā)展上做了哪些戰(zhàn)略升級與規(guī)劃?AI算力需求發(fā)展為這家企業(yè)帶來了哪些機遇?

近期,奇異摩爾聯(lián)合創(chuàng)始人、產(chǎn)品及解決方案副總裁祝俊東接受了《科創(chuàng)板日報》記者的專訪,并對以上問題進行了深入解讀。

??|表示,Chiplet依然是奇異摩爾的技術基礎,該公司也由片內(nèi)互聯(lián)業(yè)務為切入,布局了以“互聯(lián)”為核心關鍵詞的產(chǎn)品體系。

隨著算力集群的發(fā)展,奇異摩爾始于幾年前的布局,構建了一整套平替國際領先廠商的Scale Inside芯片內(nèi)互聯(lián)、Scale Up超節(jié)點GPU片間互聯(lián)及Scale out超大規(guī)模服務器集群間互聯(lián)的產(chǎn)品解決方案,未來可能將迎來遠超市場想象的成長速度。

從片內(nèi)到多維度互聯(lián)解決算力難題

面向北向Scale Out網(wǎng)絡的AI原生智能網(wǎng)卡、面向南向Scale Up網(wǎng)絡的GPU片間互聯(lián)芯粒,以及面向芯片內(nèi)算力擴展的2.5D/3D IO Die和UCIe Die2Die IP等,這些產(chǎn)品共同構成了奇異摩爾全鏈路互聯(lián)解決方案。

奇異摩爾聯(lián)合創(chuàng)始人、產(chǎn)品及解決方案副總裁??|接受《科創(chuàng)板日報》記者專訪表示,早在公司創(chuàng)立初期,就已對現(xiàn)有的產(chǎn)品體系進行了完整規(guī)劃。然而,在Chatgpt帶來了AI產(chǎn)業(yè)變革后,計算集群的算力問題,要在比他們幾年前預想的要更早到來。

“‘互聯(lián)’,是要實現(xiàn)計算單元和存儲單元的連接,需要從微觀到宏觀的一整套架構和產(chǎn)品。這項工作是一個復雜且長期的工程?!弊?|表示,因此,奇異摩爾最初從Chiplet的片內(nèi)互聯(lián)為切入口,想要首先解決芯片本身的算力問題。

于是,奇異摩爾在完成片內(nèi)互聯(lián)產(chǎn)品開發(fā)后,開始布局片間互聯(lián)跟網(wǎng)間互聯(lián)類產(chǎn)品,用以解決更大規(guī)模的算力問題,目前該公司的發(fā)展也正沿著這一方向行進。

??|表示,Chiplet作為產(chǎn)品系列的技術基礎,具有較強的延展性及靈活性,可集成或應用于其他類型的芯片產(chǎn)品開發(fā)中,比如萬卡乃至十萬卡之間的集群互聯(lián)解決方案。

image

提到計算集群的算力調(diào)度功能,不免讓人想到傳統(tǒng)網(wǎng)卡以及近年同樣火熱的DPU產(chǎn)品。

關于奇異摩爾現(xiàn)有的網(wǎng)間互聯(lián)產(chǎn)品與其他類似產(chǎn)品功能的區(qū)別,??|表示,公司會把正在做的產(chǎn)品歸為AI原生的智能網(wǎng)卡產(chǎn)品?!耙獙崿F(xiàn)幾百G、上Tb級別數(shù)據(jù)帶寬的服務器卡間數(shù)據(jù)交互,這是計算在不同階段、針對不同類型任務的產(chǎn)物,也是公司產(chǎn)品功能的差異化特點”。

祝俊東表示,在云計算階段,傳統(tǒng)網(wǎng)卡或DPU需要把全部網(wǎng)絡連接在一起,并將計算集群面向千萬用戶進行分配和管理。其中,DPU同時還兼具為CPU卸負載的功能。而在智算階段,尤其是面向大模型訓練需求時,通常需要萬卡共同針對一個任務進行處理,對應的網(wǎng)間數(shù)據(jù)交互量較大,因此對智能網(wǎng)卡實現(xiàn)高效、高性能的數(shù)據(jù)交互形成需求。

隨著AI應用需求增多、算力集群設計變得更加復雜。??|認為,智算中心硬件設計未來會有三大明顯的發(fā)展趨勢。

一是基于現(xiàn)有標準,將會出現(xiàn)諸如智能網(wǎng)卡的功能產(chǎn)品,去適應在數(shù)十萬甚至百萬卡的集群之間實現(xiàn)高速互聯(lián)和數(shù)據(jù)交互。新一代的智能網(wǎng)卡主要面向AI網(wǎng)絡,尤其是在分布式訓練、大規(guī)模推理的應用場景中,較DPU能夠具備更少的計算能力及更低成本。

二是龐大算力集群需要設置“超節(jié)點”GPU片間互聯(lián)超高帶寬域,實現(xiàn)高規(guī)模的更高帶寬集群,以近似1個GPU的形式工作?,F(xiàn)在英偉達NVL576就是通過NVLink和NVSwitch實現(xiàn)超高速連接,讓576張卡像一張卡運行,且英偉達也在行業(yè)內(nèi)走得靠前。

據(jù)介紹,Scale Up是近幾年很火的技術方向,目前業(yè)內(nèi)正探索Scale Up加速器網(wǎng)絡的速度能夠?qū)崿F(xiàn)Scale Out網(wǎng)絡10倍以上的數(shù)據(jù)連接,提升訓練和大規(guī)模推理方面的效能。

三是通過將CPU、GPU合封,形成異構計算芯片。目前英偉達GB200已實現(xiàn)不同類型計算單元的異構連接。

網(wǎng)間互聯(lián)與片內(nèi)互聯(lián)產(chǎn)業(yè)應用率先突圍

以奇異摩爾現(xiàn)有的幾大業(yè)務板塊來看,行業(yè)內(nèi)Scale Out、Scale Up、Scale Inside的三方面需求都在不同程度快速增長當中。??|表示,其中奇異摩爾Scale Out與片內(nèi)互聯(lián)類業(yè)務“跑得最快”。

其原因不難理解。首先,目前智算中心處于高速建設期,需要構建高性能的Scale Out網(wǎng)絡。祝俊東表示,其對應的市場容量和規(guī)模以及產(chǎn)品方案的單價都非常可觀,且預計每一個集群構建Scale Out網(wǎng)絡的成本占比,都要從過去的10%以上提升到至少兩成。

其次在片內(nèi)互聯(lián)產(chǎn)品方面,祝俊東觀察到,從2023年開始越來越多的算力芯片幾乎都開始基于Chiplet技術進行開發(fā)。據(jù)透露,奇異摩爾目前的片內(nèi)互聯(lián)產(chǎn)品已實現(xiàn)應用落地并持續(xù)進行開發(fā)升級。

而Scale Up片間互聯(lián)市場目前仍在發(fā)展期。祝俊東表示,現(xiàn)在業(yè)內(nèi)已經(jīng)關注到了超節(jié)點對大模型訓練的重要性,因此都在加大對相關開發(fā)的投入,并且也開始有行業(yè)聯(lián)盟與行業(yè)標準出臺,進一步推動超節(jié)點的應用。另外,多元化的GPU廠商發(fā)展使得異構式訓練明顯增長,也催生了對于通用Scale Up的需求。??|表示,預計未來三年內(nèi)應該會有比較快速的增長和發(fā)展。

“在Chiplet生態(tài)中,我們一共做三件事情,其一是與行業(yè)標準組織構建Chiplet芯粒庫,這可以幫助行業(yè)在未來降低芯粒選擇的難度;二是與產(chǎn)業(yè)鏈中的‘大廠’合作,研究不同廠商之間的互聯(lián)互通,并把項目變成一個可以實際落地的系統(tǒng)級的芯片項目?!弊?|表示,其中奇異摩爾主要提供部分芯粒以及基礎技術,從而實現(xiàn)與其他芯粒資源和客戶資源形成鏈接,為市場提供定制化的芯片解決方案。

以Chiplet為基礎的Scale Inside片內(nèi)互聯(lián)技術,在近兩年封裝技術突破以及產(chǎn)業(yè)化分工合作中快速發(fā)展,產(chǎn)品也在高端算力場景中得到深入應用,同時,該技術為半導體產(chǎn)業(yè)帶來的變革也立竿見影。

祝俊東表示,芯片產(chǎn)業(yè)從過去的單向直線形流程,隨著Chiplet技術的應用,已經(jīng)變?yōu)橐粋€個環(huán)路,從設計到制造環(huán)節(jié)都需要前后觀照。其次,Chiplet本身是系統(tǒng)功能的再分,在供應方與需求方之間能夠產(chǎn)生比較好的協(xié)同,將需求過程理順并完成產(chǎn)品定義;再者,不同廠商之間的芯粒互聯(lián)互通已進入產(chǎn)業(yè)化實踐階段,已然改變過去分工合作的模式。

Chiplet技術進展與產(chǎn)業(yè)變革之間相互影響,誕生于上海這片國內(nèi)半導體產(chǎn)業(yè)最集中的區(qū)域。

??|表示,Chiplet技術生態(tài)涉及半導體全產(chǎn)業(yè)鏈合作,從最早的EDA、IP到系統(tǒng)級的芯片設計,再到芯粒、封裝,需要完整的、閉環(huán)的產(chǎn)業(yè)融合,上海張江是全國范圍內(nèi)半導體產(chǎn)業(yè)鏈最為完整的地方?!霸趶埥漠a(chǎn)業(yè)環(huán)境中,我們可能在5公里范圍內(nèi)就把這個事情組合起來,這對產(chǎn)業(yè)新興技術的開發(fā)是一個很重要的事情?!?/p>

上海的大型SoC廠商尤為多,這意味著下游有大量的產(chǎn)業(yè)可形成牽引,包括數(shù)據(jù)中心、汽車等,而Chiplet技術的應用落地也離不開豐富的應用場景。在??|看來,基于此,目前來看,張江在這方面也有著得天獨厚的環(huán)境。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關的任何行動之前,請務必進行充分的盡職調(diào)查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。

熱門文章