產業調研:AI芯片行業真實現狀
近期國君TMT團隊邀請了AI算力專家做分享,現將交流內容總結如下:
國外使用 GPT 通用模型,國內現在開發各種各樣的專屬模型,模型下邊會有一個底座,使用異構GPU 算力。把 GPU 放到 AI 里面,就叫它 AI 芯片。
AI 芯片大概分四類:GPU,FPGA,ASIC和類腦,類腦目前還是在實驗室研究階段。市場銷售比較多是前三類,大模型背景下面我們能看到 GPU 和 ASIC 出貨量最多。國內在大模型出來之前, AI 芯片公司更多關注 ASIC ,因為GPU的研發難度是比較高的,ASIC相對來說是算力小,然后成本低,總結就是便宜、好用、專用。
AI應用海外內差異較大,特別是大模型出來以后,GPU算力落地的行業不太一樣。海外和國內的區別在于海外在商業市場落地是比較快的,國內雖然說互聯網廠商們一直在囤英偉達的芯片,但是能看到真正在B端能夠產生實際應用場景反而是在政府側。
特殊國情導致很多數字化、信息化的應用,政府會沖在前面。其他國家的政府好像也沒有中國在這方面效率高,直觀上現在公共安全政務部門對 GPU 的這個算力開始格外關注。另外,考慮到信息安全的問題,政府部門也在關注中國人自己到底能不能做真正的GPU,或者說GPU出來之后能不能好用?能不能低成本使用,能不能用出中國特色,因此國內是政府端的大需求是和互聯網廠商同步的。
海外更多的是商業化的應用。德國那邊已經研發在用英偉達GPU的算力集群,加上通用模型、加化工行業的專屬模型,去做化學材料的加速創新研發,這意味著將來大家的汽車發生事故以后沒必要再糾結是否去 4S 店補漆,以后小汽修店把漆補的又亮又硬又漂亮,跟原來的車的顏色一樣的。這就是算力落地能夠在生活中的一些應用。
國內的芯片公司產品做得再好也需要市場營銷。目前國內產品做得再好,哪怕是像華為海思這樣,在客戶側的號召力依舊趕不上老大哥Intel、英偉達。所以,產品再優秀,依舊需要市場銷售去在客戶側做大量基礎工作。芯片這個圈子僅僅靠國內是難以自主循環的,芯片產業是一個全球的產業鏈,國內最擅長的是芯片設計,我們設計確實是很厲害的,如果沒有制裁或者限制,海思會把芯片做得很漂亮,國內也會孵化出很多不錯的芯片設計公司。但是在上游 EDA 軟件的問題到下游工廠光刻機以及光刻膠的生產等等,目前這些材料一旦到了生產28納米以下的芯片,就有很多問題存在,國內目前能做到的就是中低端產品,在中低端勉強可以做一些產業鏈的自給自足,但是一旦制程比較先進的,受限制就會比較大。
國產芯片是特別是 AI 芯片,除了 CPU 之外,更多是生產 ASIC 的這種小芯片。現在來看,這些邊緣芯片起家的公司依舊是小而美的公司,有自己專注的行業,然后芯片一代一代再往下迭代,然后量產,整體來說做得也還不錯。但是大模型背景下,真正到了 GPU或GPGPU的時候,真正能做出來的廠家就沒幾個了。
衡量一個優秀的AI芯片企業有四個方面的核心因素。做GPU芯片難度比 ASIC 要高出很多。
團隊經驗是第一要素。不是說拉一幫人,拉一些風投就能把GPGPU或者GPU做出來的,而是說團隊一定要有做過 GPU 的經驗,要有設計、量產及迭代的經驗才行。再者,不管上市公司或者初創企業,技術路線絕對不能犯錯,這種錯誤基本上是致命性的,所以內部要團結,技術路線也必須要穩定。
長久的時間成本是第二要素。 GPGPU 芯片的團隊大概需要1000 人左右,中間不踩坑,至少也要做兩年才能做出一顆芯片,還不是訓練推理一體的大芯片,只是推理而已。如果要做大模型訓推一體的大芯片,那么至少 3 年才能把一顆芯片做出來。如果是渲染、訓練、推理都放在一起的話,至少 3 年才能出一個芯片,有可能還不是那么好用,軟件還需要花很長的時間去迭代。
人才是第三要素。原來看 1000 人好像挺多,現在看 1000 人只是一個低配,連標配都算不上,特別是現在大模型一出來,既需要做訓練,也需要做大量的推理,然后還需要堆人去幫客戶去調優你的產品,進一步做迭代等等。另一方面,芯片本身這個硬件不需要太多人,芯片定型了之后就按照迭代往下走就可以了。最難的是軟件和生態,非常需要堆人,需要不斷的抄作業,需要花時間,需要燒更多錢。
成本是第四要素。目前看國內一些主流的AI芯片設計公司的產品大部分是集中在7納米,相對來說性價比會高一些,就功耗,計算的速度相對來說還可以。即便這樣,一個 1000 人的團隊,一顆 7 納米的芯片,整個團隊兩年打底不踩坑也要 10- 20 億人民幣成本。所以各位在判斷一些初創的 AI 芯片公司的時候,可以參考這幾條核心要素。
以下是總結的國內 AI 芯片的初創企業,因為前面三家是上市企業就沒有披露名字。重點關注最左側 GPU 這一欄,其實真正在芯片的硬件架構上是 GPU 的企業并不多,大部分都是做ASIC或者NPU、XPU架構,這種架構沒有辦法做通用大模型。國內目前使用通用模型的基礎是不具備的。首先,中文語料數量少,質量欠佳。再次,中文的邏輯跟英文是不一樣的,這也是一個比較大的問題。
另外,微軟擁有open AI和聯邦學習平臺,國內目前還缺乏這樣一個平臺來去打通各個巨頭們的數據。因此,國內芯片廠商們能夠做的是應對中小模型和專用模型AI算力。
當下面臨英偉達芯片的限制風險。原來英偉達 A100 是可以買,現在只能買A800,本質上是把片間互聯的速度限到了400,進一步限制我們做大模型的能力。那最近又聽說 A800也要限購,但是還沒有落實。同時,有可能將來把片間互聯這個接口全部給封死,雖然單卡能力很強,但是沒有辦法做集群,更沒有辦法做大模型。這也是國產芯片的一個機會。
中國市場容量巨大,政府需求強烈。雖然說先進芯片上下游會有一些限制,但是中國市場太大了,我們的市場占到英偉達營收的1/ 3,中國整個市場在it、數字化這幾個行業基本上都能占到全球的1/3,除美國以外中國是最大的單一市場,而且中國政府對數字化、信息化的這種訴求渴望是非常強烈的,而且政府愿意買單。我們的市場跟海外完全不一樣,有政府需求跑在前面,不管是中小模型還是專用模型,匹配國產算力將來大有可為。我們不求和一線的美國廠商們相抗衡,就做好本國的區域市場就已經很不錯了。
我們預測到2027年全球 GPU市場,能到 2000 億美金。有點稍微夸張,但我覺得各種模型對算力的需求很恐怖,所以這個2000億美金還是值得期待的。
國內在 GPT 出來之前市場預測是 300 億,GPT問世后數字就翻了好幾倍,國內市場預測有1000 億人民幣,其中訓練和推理四六開。其實,1000 億還是一個相對比較保守的數字,我認為國內未來兩到三年就會涌現一批做 GPU 芯片的新秀廠商們。
GPT 4 的硬件成本在下降,現在的價格比以前低了不少。只需要H100 服務器 1000 臺,成本算下來大概不到 20 億人民幣了。但是這對于國內想做大模型的企業來說是高昂的成本,很多客戶難以自建,那么就會租賃。
目前三大運營商已經在尋找可靠的國產GPU 算力,將其放到自己的數據中心。同時國內建了一些政府主導的數據中心,但是利用率不高,基本只有30%的利用率,其中大多還是用于天氣預測。現在運營商也好,金融行業也好,政府側包括智能交通、智慧政務的這種大數據中心已經在迫切考察國產 AI 芯片廠商們的產品能不能用。接下來對于國內廠商來說,能否有可靠可用的算力產品是搶占市場的關鍵。
GPU 的算力和大模型結合能落地行業中,交通行業值得關注。前兩天一個朋友和我說北京和上海吵了 10 年的紅綠燈智能化實現了。以前一到節假日或者城市開展會,周邊的交通就一塌糊涂,趕上天氣糟糕就更差。為什么?大模型給我們提了個醒。原來交管部門能夠拿到的數據只是交通部門的數據,比如說文旅行業的數據他拿不到。大模型之所以能夠做出很多應用,是因為他把各個行業的數據全部打通了,他把其他行業的數據拿過來,去做賦能。比如它把各個維度的數據都拿過來,然后在路口的紅綠燈上去做真正 AI 優化。真正能做到車多的時候紅燈亮,車少的時候綠燈亮,行人想過的時候可能手都不用去摁那個紅綠燈的按鈕,人多了之后綠燈自動放行。
GPT 給國內各個行業真正提了一個醒,就是數據要打通各個行業,然后再去做專用模型才是真AI。既然說有專屬模型,那下面匹配的算力就不是原來 CPU 而是變成 GPU 的異構算力。比如說省交通廳或者公安廳或者省政府的大數據中心,它會建訓推一體的大芯片算力平臺,到下面各個地級市或者縣城會用邊緣側推理應用,用到更多的就是這種小芯片,比如說ASIC或者 NPU 架構的推理芯片。所以將來國產 GPU 的市場在5-6 年以后,會是訓練占20%,推理占80%的市場比例。
以英偉達作為參考,海外GPU+大模型的落地行業更多的是工業 4.0 的高端制造業。英偉達已經幫臺積電把原來兩納米芯片特別高的成本通過異構算力大大降低,降低到了原來的十分之一。現在主流芯片是4納米,三年以后輕輕松松可以做到2納米,比我們領先了不止一代,這可能也是他們期望的一個差距;實體制造業里面也是這樣,比亞迪投了國內自動駕駛的芯片廠商,幫助其在海外建工廠,將來海外跟國內會布局不同的GPU算力,海外會用英偉達,國內就用國產GPU 算力,主要用來做電池材料的創新研發。無獨有偶,豐田已經借助英偉達的GPU算力+算法,優化兩個方向的創新研發,一個是電池,一個是氫燃料,極大地提升研發效率。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。