首頁 > AI資訊 > 最新資訊 > 源頭創新突破算力瓶頸,國產大模型進入成長關鍵期

源頭創新突破算力瓶頸,國產大模型進入成長關鍵期

新火種    2023-10-27
北京日報客戶端 | 記者 袁璐國產大模型“百模大戰”激戰正酣之際,美國升級對華芯片出口管制帶來新的不確定性。全球供應鏈震蕩之下,國產大模型進入成長關鍵期。“要堅持源頭創新,提高生成式人工智能的核心競爭力。”業內專家表示,只有制定高端算力芯片、大模型算法等基礎性、原創性技術攻關的中長期專項規劃,實現更多從“0”到“1”的突破,大模型才有望突破瓶頸。算力需求將是未來十年挑戰近日,美國升級對華芯片出口管制。根據英偉達10月17日在一份文件中披露的受限芯片詳情,包括高性能GPU(圖形處理器)芯片A800和H800。這兩款是該公司專為中國市場設計的AI(人工智能)芯片。隨著大模型浪潮掀起,英偉達成了AI淘金時代的“賣鏟人”,其開發的GPU芯片需求井噴。GPU即圖形處理器,被設計用來處理并行計算,更適合同時處理相同類型的大量數據。它最早設計用于處理圖像、視頻和3D圖形渲染,后被引入AI計算,成為大模型訓練與推理不可或缺的算力基礎設備。“一顆A800芯片的售價已經高達15萬元,半年前,這一價格不過八九萬元。”有芯片經銷商對記者透露,相關存量芯片價格一路看漲。“盡管中國開發的AI算法非常強大,但國內硬件的計算能力仍有差距。”科大訊飛創始人、董事長劉慶峰表示,中國企業在訓練AI大模型上面臨的挑戰之一,就是訓練主要是在英偉達的硬件上完成的,企業內部只能做出微小的調優和訓練。“我相信對計算能力的需求,將會是未來十年對所有人的挑戰。”半導體公司AMD全球副總裁唐曉蕾表示,這不僅涉及對能源、算力的需求,還關系到整個環境改變的需求,“這是一種大勢,跟以前不一樣。”行業呼喚自主可控算力底座科大訊飛日前宣布聯合華為推出基于昇騰生態的“飛星一號”大模型算力平臺,國內的大模型廠商信心得以提振。此外,當天發布的星火認知大模型V3.0,據稱已全面對標ChatGPT(GPT-3.5),在中文能力上實現超越。“星火3.0可以說是除了華為內部應用之外,當前第一個真正在國產算力平臺上訓練出來的大模型。”雖然沒有透露新一代昇騰芯片性能參數,但劉慶峰提到,“飛星一號”半年內就實現了星火大模型訓練和推理效率均翻番。“國產算力平臺要有從不好用到好用、再到生態繁榮的過程。如果誰都不往前走一步,那始終無法自立自強。”自主可控的算力底座也有望解決大模型訓練成本過于高昂的問題。近日,畢馬威中國與聯想集團聯合發布《普慧算力開啟新計算時代》報告顯示,以構建GPT-3為例,OpenAI數據顯示,滿足GPT-3算力需求至少要上萬顆英偉達GPU A100,一次模型訓練成本超過1200萬美元,這還不包括模型推理成本和后續升級所需的訓練成本。此前,科大訊飛在三季報業績說明會上表示,公司已于2023年初與華為昇騰啟動專項攻關,讓國產大模型架構在自主創新的軟硬件基礎之上,當前華為昇騰910B能力已經基本可對標英偉達A100,后者是當下AI大模型訓練市場上應用最廣泛的GPU芯片。做好源頭創新突破多而不強截至今年7月底,我國累計有130個人工智能大模型問世。首批通過《生成式人工智能服務管理暫行辦法》備案的11個大模型產品也獲批向全社會開放服務。“對國產大模型而言,亟待解決的問題是多而不強。”北京工業大學經濟與管理學院教授何喜軍表示,因底層技術突破難,很多公司選擇調用較為成熟的大模型,直接應用到原有產品和服務上,技術同質化嚴重,且缺乏源頭創新,高質量落地應用較少。“要建設一批國家級開源平臺、代碼托管及大模型開發測試平臺,確保核心算法自主可控。”劉慶峰也坦言,國產大模型必須正視與GPT-4的差距。“國產大模型在復雜知識推理、小樣本快速學習、超長文本處理、跨模態統一理解上距GPT-4還有差距。”他表示,唯有實事求是,才能實現超越。著重培育源頭創新的步伐正在加快。近日,工信部運行監測協調局局長陶青表示,要夯實人工智能技術底座,通過科技創新重大項目,著力推動大模型算法、框架等基礎性原創性的技術突破,提升智能芯片算力水平,釋放數據價值,強化“根”技術研發。各大廠商也在扎牢底層的算法和算力。騰訊集團副總裁蔣杰表示,混元大模型掌握了從模型算法、機器學習框架、人工智能基礎設施的全鏈路自研技術。螞蟻集團首席技術官何征宇也表示,螞蟻大模型走純自研的技術路線,底層算力集群可達萬卡規模。
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章