中信證券:今后三年是國產GPU發展關鍵窗口期,生態建設至關重要
我們認為今后三年是國產GPU發展關鍵窗口期,生態建設至關重要。以ROCm為代表的生態實現了并行計算軟件庫的廣覆蓋,對主流AI框架如Pytorch等的完善支持都是生態建設的核心。優先推薦性能優良、軟件庫覆蓋率高且能夠持續迭代、已獲得客戶認可的公司如海光信息。昇騰NPU率先獲得Pytorch原生支持,且研發資源強大,未來有望持續領先。建議關注華為昇騰整機合作伙伴。
▍國產GPU發展窗口期已至,生態構筑核心優勢。
AI發展帶動算力硬件需求,我們認為未來三年可能是國產GPU發展關鍵窗口期。目前國產算力硬件理論性能可接近國際主流,但軟件生態是限制理論性能和開發者使用的重要因素。
▍CUDA:GPU生態先驅,AI時代基礎設施。
CUDA是GPU生態的先驅,實現了GPU從圖形硬件向算力硬件的轉變。2006年CUDA推出后,開發者無需再通過圖形API來調用GPU,而是可以直接操控GPU。CUDA在長期發展中逐步滲透了HPC與AI生態,2023年已經迭代到第12代API,具備了巨量軟件組件,塑造了用戶習慣,如今要將其取代需要巨量的時間和資源投入。以CUDA為模板,我們可以發現,其他算力芯片的生態要接近CUDA的地位,應當盡可能在(并行計算相關)軟件庫覆蓋率以及AI框架支持度方面進行投入。
▍并行計算軟件庫覆蓋度:以ROCm為例。
CUDA為用戶提供便利的同時,也帶來了代價,一是需要承受英偉達硬件不低的成本,二是閉源的CUDA導致部分使用者面臨供應不確定性。因此需要CUDA的低成本替代方案,目前AMD推出的ROCm軟件平臺未來有望替代CUDA。
ROCm出現前為何CUDA長期沒有挑戰者?OpenCL與硬件均有不足。OpenCL在2015年才添加C++支持,長期對高層軟件庫支持不足,而CUDA早在2013年就已經支持C/C++/Fortran/Python。硬件方面,AMD在2017年首次推出MI系列數據中心GPU,但與同期的NVIDIA V100相比存在一定差距,也不利于生態的形成。
ROCm為何能夠成為生態轉折點?2015年Boltzman計劃推出以來,全新的軟硬件平臺解決了此前短板。硬件方面,全新CDNA架構與NVIDIA的架構各有優勢;軟件方面,重構的HIP平臺也全面優于OpenCL。ROCm通過Hipify工具利用現有CUDA代碼;軟件庫方面,經過5年建設,到2020年的ROCm4.0時代,已經初步實現AI與HPC領域基礎庫的全面支持;基礎軟硬件支持方面,現有的CDNA與RDNA系列架構得到較全面的支持,虛擬化支持也為數據中心云化部署創造了條件;性能方面,ROCm在良好優化下與CUDA并無性能差距。
ROCm的未來?用開源占據大生態。ROCm作為后發者,采用開源方式,聚集開發者力量是合理選擇。目前ROCm生態中,除專為AMD硬件優化的AOCC編譯器外,均為開源組件。我們認為未來ROCm與CUDA可能類似Python和MATLAB的發展路線,ROCm可能在部分大型統一生態領域獲得認可,而CUDA在大量細分場景的優勢有望持續。
▍AI框架支持:以昇騰為例,算法庫+配套軟件基建。
對AI芯片而言,通用并行運算庫未必都能支持,對于AI框架的完善支持相對較為關鍵。其主要工作包括算子庫與輔助軟件庫的適配,我們認為對于大型公司其適配耗時大致需3-5年。華為昇騰在國內AI框架適配進度較為領先,率先實現Pytorch NPU原生支持。我們認為較高的適配時間需求可能導致先發優勢持續。
▍風險因素:
信創不及預期的風險;國產GPU廠商競爭加劇的風險;供應鏈可持續性的風險;軟件生態適配不及預期的風險;國產芯片客戶接受度不及預期的風險。
▍投資建議:
參考國際行業發展情況,長期市場份額可能逐步走向集中,因此并行計算生態建設進度領先的廠商有望擴大優勢。
1)優先推薦性能優良、生態完備(軟件庫覆蓋率高且能夠快速迭代)且已獲得客戶認可的公司。
2)針對AI框架的軟件生態適配也有望形成先發優勢,有利于更快占據市場份額。目前國內AI芯片賽道,昇騰率先獲得Pytorch原生支持,且研發資源強大,未來有望持續領先。
3)其他上市公司方面,建議關注具備算力芯片或圖形GPU等相關芯片業務的公司。
4)非上市的算力芯片相關企業。
5)其他AI服務器零部件供應商也有望受益。
本文源自:券商研報精選
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。