機構:英偉達持續狂奔,看好AI趨勢的能見度至2024年
報告導讀
英偉達推出 H200 的 GPU 顯卡,更新了更快更大的 HBM3e 的存儲,將性能提升了60%-90%。我們看好 AI 進入快速發展的成長期,能見度持續至 2024 年。
摘要
事件:英偉達推出H200的GPU顯卡。與前一代H100相比,H200的性能直接提升了60%到90%。目前,H200預計于2024年第二季度出貨。
相較于H100,此次最大的更新在于H200搭載了更快、更大的HBM3e的存儲。H200的容量接近翻倍,帶寬增加2.4倍,加速生成式AI和大語言模型的同時,推進HPC工作負載的科學計算。H200 在700億參數的Llama2大模型上的推理速度比H100快了一倍,而且在推理能耗上H200相比H100直接降低了一半。
H200的提前發布再次證明持續奔跑這種能力本身才是英偉達的護城河。在黃氏定律時代,GPU將推動AI性能實現逐年翻倍,GPU的進化速度可能遠超投資者的預期。當H100橫空出世時,這幾乎成為大模型時代最稀缺的資源。但是市場終究不會只讓英偉達獨自享受新時代的算力紅利。隨即,二號玩家AMD的MI300顯卡推出,芯粒堆疊技術使得晶體管的數量達到瘋狂的1460億個。同時,這款顯卡芯片集成了Zen4架構的24個CPU核心、大容量的Infinity Cache無限緩存,還有8192-bit位寬、128GB容量的HBM3高帶寬內存。Intel、IBM等科技巨頭以及新晉企業正陸續推出新的AI芯片,試圖與英偉達AI芯片抗衡;谷歌、微軟、亞馬遜、阿里、百度等公司也紛紛布局自研芯片,以減少對外部供應商的依賴。所以,在芯片行業內,一款產品很難形成一個超過兩年的護城河。此次更大內存,更大帶寬的H200發布再次證明英偉達持續奔跑,持續領先的能力或是英偉達真正的護城河。
看好AI進入快速發展的成長期,能見度持續至2024年。對于AI上升趨勢的判斷,我們認為有三重催化:1. 算力是一切變革的基礎設施。此次H200的發布,將過去數據中心芯片兩年一更新的速率直接翻倍。2. 更強勁,更低價的大模型GPT 4 Turbo發布降低進入門檻,自定義GPT+GPT應用商店預計將打造一個充滿活力的軟件與應用生態。3. 性能無邊的B100與GPT5預計在2024年發布,重磅升級或釋放前所未有的生產力。
風險提示:AI商業化不及預期;地緣政治風險;毛利率、凈利率不及預期。
(文章來源:國泰君安)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。