首頁 > AI資訊 > 最新資訊 > 玉淵譚天:如何看待英偉達RTX50系新顯卡?

玉淵譚天:如何看待英偉達RTX50系新顯卡?

玉淵譚天    2025-01-09

1月7日上午,英偉達總裁黃仁勛在全球最大的消費電子展上作了演講。

此前就有海外科技博主預測,英偉達即將發布的新版顯卡,其GPU性能,又要提升一大截。而在演講中,黃仁勛發布了英偉達RTX 50系列顯卡。按英偉達的說法,RTX 5090整體性能是上一代RTX 4090的兩倍。

由此,也有些聲音擔憂,在美國對華斷供高端芯片的背景下,無法獲得最高性能GPU用于訓練的中國人工智能行業,與美國的差距是否會被進一步拉大。

人工智能領域,“算力焦慮”一直是種流行的敘事。作為主導全球的GPU企業,英偉達H100 GPU數量一度成為了衡量大模型公司算力的指標,黃仁勛曾言:“英偉達是AI世界的引擎”,在他的敘事下,英偉達的硬件是發展人工智能大模型的決定性產品。

不過,譚主跟在現場的朋友聊了聊,他表示:

算力和人工智能大模型已經不再是現場多數企業最關心的問題。相比之下,如何將人工智能落地應用是2024年很明顯的一個重點,在這方面,很多時候并不需要最高性能的GPU芯片。

相比之下,黃仁勛卻顯得沒有那么“淡定”,在演講中渲染英偉達“Blackwell架構芯片是人類歷史上最大的單芯片”“前所未有的規模”的同時,卻也對其消費級的產品采取了性能不變,但降價至三分之一的策略。

這跟此前輿論場認為英偉達產品將繼續漲價的預期,形成了反差。顯然,在主導地位遭遇越來越多挑戰的情況下,英偉達也開始考慮多找“幾條腿”走路。

實際上,全球幾家還在全力投入人工智能大模型研發的頭部企業,也正在掀起一股“去英偉達”的趨勢。

諸如Open AI、蘋果公司等都開始自研芯片和生態系統,支撐自身的大模型訓練。

而這股趨勢更重要的意義在于,英偉達營銷人工智能“算力為王”的認知,已經被人工智能行業的新動向打破了。

除了自研AI芯片,Open AI等全球頭部的人工智能公司,都在更多地聚焦大模型本身的設計優化。

模型訓練層面,Mistral AI公司公開將混合專家模型引入大模型訓練,用許多個特定領域的“小專家”配合幾個“通用專家”,先決定問題類型,再用少數適合的專家處理不同類型的問題。 以DPO、LoRA為代表的高效微調方法,將原本需要高算力和復雜調優算法的模型對齊過程進行了化簡,大幅度降低了模型對齊復雜度。

在這樣的趨勢下,國產大模型也逐漸明確了自己的發展方向。

2024年,國產大模型突飛猛進,不乏通過底層優化,實現用2048塊GPU,接近頭部公司數萬塊GPU訓練才具備的大模型性能的案例。

在全球最大的大模型和數據集社區Hugging Face推出的開源大模型排行榜單上,從去年6月開始,中國國產開源大模型曾一度第一名,到年末,這個紀錄又被新的國產開源大模型刷新,身位已經穩定在領先行列。

業內人士跟譚主分析:

之所以能做到這一點,是因為國產大模型主要進行了三個方面的創新:底層大模型數據結構的創新,訓練過程的創新,以及數據準備有創新。

中國工業互聯網研究院的最新數據顯示,DeepSeek-V3通過采用混合精度方法,有效平衡訓練精度和效率,結合混合專家模型架構,大模型訓練成本降低至500萬美元,僅為同性能模型的5%~10%,其性能上卻跟GPT-4o以及Claude 3.5 Sonnet相差無幾。而目前,國內類似的大模型成本、訓練時長都已經大幅下降。

這種新的模型訓練方法,不僅大幅度降低了大模型行業的門檻,還推動了全球大模型的降價潮。而大模型的降價,對于人工智能技術的應用和轉化有著革命性的意義。

行業人士告訴譚主:

在當前全球人工智能大模型的競爭中,算力雖然重要,但從來不是決定性因素。只有跟軟件、應用場景結合起來,才能真正成為賦能行業轉型、提高經濟效率的引擎。

相比之下,目前部分人工智能項目存在“假智能”的問題——靠大量數據疊加出來答案,缺乏真正的創造力和想象力。

這與當前發展道路的“唯算力論”有關。現在市場上的許多AI,說白了就是用戶告訴它怎么改,它一步步按要求調整,最終生成一個看上去“對”的答案,但它本身缺少主動思考或提出創新解決方案的能力。

雖然一些前沿大模型探索了“思維鏈”,試圖讓大模型長時間思考模擬人類的思維推導,在一些問題上已經有一定效果,但如何實現“通用人工智能”仍然有較大障礙。

更大的問題是,這種只靠算力的方式,遲早會碰到天花板。

行業人士跟譚主分析:

拿美國當前的大模型來說,他們的模型已經讀完了幾乎所有的英文書籍。可是,接下來怎么辦?這就是人工智能大模型的發展瓶頸。由于世界上沒有更多的新書可以喂進去,那AI只能讓自己寫書,但這種“自己生成自己喂”的方式,其實并沒有真正突破。這就好比餓了沒東西吃,只能“自給自足”,顯然不長久。

要突破這個瓶頸,就不能再光盯著算力和數據,而是要回到大模型的技術本質,去解決更關鍵的方向性問題。就像一個不算聰明但記性好的同學,讀了一萬本書以后,問到的問題只要書里有答案,他就能直接告訴你怎么解決。可如果書里沒有,他就無從回答了。這正是現有大模型的局限。

也就是說,真正要把大模型做好,不只是加算力,而是讓它“活”起來,這就需要操作系統、應用場景的發展協同,幫助它從歸納走向創新。

中國的國產大模型,顯然正在運用這種高效、靈活的路徑,找到更加“聰明”的人工智能發展方向。

人工智能,不是一場跑道和圈數劃定的跑步比賽,而是一場向著未知的探險。中國企業選定的方向,不會輕易被各式的“焦慮”裹挾。

能者非他,能自樹立不因循者是也。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章