北京,大模型第一城
作者 | 李水青
編輯 | 心緣
2024年,細數中國在大模型領域的種種突破,頗為令人振奮:
百度文心一言、智譜GLM-4等國產模型在全球權威測試中打敗GPT-4;月之暗面等三家國產大模型獨角獸沖破200億元估值“大關”;“國產Sora”黑馬愛詩科技、生數科技等將AI視頻生成時長刷新到6秒、14秒、30秒;萬卡集群沖出摩爾線程等國產GPU黑馬,支持訓練萬億參數AI大模型……
這些,都與我國的“AI第一城”北京有關。
今年7月,相關負責人在2024全球數字經濟大會人工智能專題論壇上提到,截至當時全國已通過備案的大模型產品166個,其中北京有71個,接近占全國一半。從公開信息可知,北京大模型獨角獸數量占全國八成,同時,這些大模型已加速落地到了互聯網、教育、醫療、金融、政府等多個領域。
▲2024全球數字經濟大會人工智能專題論壇
7月底,智東西曾統計了2024年上半年及7月我國大模型產業相關企業超千萬元融資情況,結果顯示,北京企業獲得了43筆融資,上海和深圳則分別為11筆、9筆,展現出明顯的差距。(《大模型熱錢洶涌:半年百個億級融資,最高超500億元》)
種種跡象表明,北京正在成為中國“大模型第一都”。
從起跑到領跑,北京大模型產業的突圍僅花了一年多時間。2023年5月,北京發布《北京市促進通用人工智能創新發展的若干措施》,公布了“開展大模型創新算法及關鍵技術研究”等21項措施,在全國城市中率先打響大模型第一槍。
一年多之后,北京已形成全面覆蓋大模型、AI算力、數據、應用、方案全產業鏈及產學研融合的大模型“路線圖”。在北京,不僅看中國,也看世界。
每一次“首個”、“最強”、“重磅”北京進展的背后,中國大模型產業已經從追趕走向引領。為什么是北京?北京又是如何占據“百模大戰”的C位的?讓我們來一起探究。
一、備案大模型接近全國一半,頂尖大模型“北京造”
進入2024年,北京“盛產”大模型的實力不斷得到印證。
在3月的第二屆北京人工智能產業創新發展大會上,北京市相關負責人提到,北京AI相關企業數量約2200家,約占全國4成;
在7月的2024全球數字經濟大會上,北京宣布已通過備案上線的大模型數量達71個,接近占全國總數166個的一半。
此前在2023年10月,《北京市人工智能行業大模型創新應用白皮書(2023年)》顯示,我國10億參數規模以上的大模型廠商約一半在北京,數量高達122家。
明星大模型產品和公司“北京造”,在中國科技圈接連發生。
科技大廠掀起「百模大戰」,北京成為最前沿的創新根據地。阿里、騰訊、百度、字節、華為、三六零、京東、小米、網易等科技大廠都公布了最新大模研發及應用進展,大模型電商、大模型上車、AI手機發新等成熱門趨勢。
比如,百度在2023年10月推出了對標GPT-4的文心大模型4.0版本,10多款AI原生應用及大模型硬件隨之推出,到年底用戶規模已破億,今年又升級了AI編程助手、數字人平臺、智能客服平臺、知識管理平臺等多款應用。
國產大模型“創業五虎”涌現,成為估值直逼200億元的獨角獸。其中智譜AI、百川智能、月之暗面和零一萬物四家都注冊于北京,MiniMax一家位于上海。
創立于2019年的智譜AI于2024年1月推出新一代基座大模型GLM-4,整體評測結果逼近GPT-4;2024年7月推出“中國版Sora”清影,支持生成6秒視頻。該公司今年獲得了超4億美元融資,最新估值突破200億元。
由前搜狗公司CEO王小川創立于2023年的百川智能,目前已推出了Baichuan-7B/13B,Baichuan2-7B/13B、Baichuan2-192K、Baichuan 4、“鵬城-百川·腦海33B”等12款大模型。該公司于今年7月剛剛完成了50億元A輪融資,估值也突破200億元“大關”。
創立于2023年的月之暗面以其獨特的“To C”戰略,將Kimi打造為月訪問超2000萬人次的AI爆款產品,公司在2024年2月獲得超10億美元融資,刷新國內AI領域最大單筆融資紀錄,最新估值高達30億美元,也超200億人民幣了。
由李開復博士親自帶隊孵化的AI2.0公司零一萬物,于2024年3月開源了Yi-9B模型,并發布了Yi大模型API開放平臺,近期也已傳出完成了數億美元的新一輪融資。
一些大模型“新苗子”還未躋身獨角獸陣營,但僅成立1年左右已成為細分賽道“王者”。
在熱門的AI視頻生成領域,由前字節視覺技術負責人王長虎領銜的愛詩科技早在2024年1月就推出了類Sora視頻生成產品PixVerse海外版,由清華大學教授朱軍等坐鎮的生數科技于2024年4月推出中國首個原創全自研長時長、高一致性、高動態性的視頻大模型Vidu,都領先于OpenAI的“期貨”產品Sora。
在備受關注的AI基礎設施(AI Infra)領域,前OneFlow創始人及CEO袁進輝創辦的硅基流動,在6月剛剛推出一站式大模型API云服務平臺SiliconCloud,據悉其自研的SiliconLLM大模型推理引擎生成速度較同類開源產品快10倍以上。
產學研聯合創新成為趨勢。比如在通用大模型領域,北京智源人工智能研究院與中國電信于2024年7月聯合發布了全球首個低碳、高性能開源多語言大模型Tele-FLM,并預告接下來將發布千億、6000億、萬億參數大語言模型。
大模型行業應用落地初見成效。2023年6月,北京發布首批10個行業大模型典型應用案例,百度、智譜華章、中科院自動化所、科大訊飛、云知聲、科學智能研究院、第四范式、毫末智行、銜遠、面壁智能等10家技術供給方的應用案例入選,覆蓋能源、醫療、金融、消費、智駕、政府、地產等多個行業領域。
▲北京首批10個行業大模型典型應用案例
2024年7月,北京市行業大模型創新應用大賽頒獎,最終有6家企業獲得一等獎,分別是瑞萊科技(政務)、中科聞歌(金融)、瑞泊(產業升級)、數坤科技(醫療)、中科大腦(文化教育)、中科睿鑒(智慧城市)。
短短一年時間,北京主力大模型的數量從2023年7月的40個,生長到現在2024年7月的71個,科技大廠布局大模型算力、算法和應用全產業鏈,數十家獨角獸和細分賽道頭部創企趕超國際同行,產學研融合推動應用落地成果井噴,并在全國率先形成了AI大模型集聚區。
北京跑出了大模型產業發展的中國速度,也賽出了中國強度。
二、四大E級智算中心啟動,3.6萬P智能算力激活數據要素
打開北京“模”力,離不開算力這把“鑰匙”。
截至2023年12月,北京已形成1.2萬P(PFlops,千萬億次浮點運算/秒)的算力供給規模——其中通用算力8672P,智能算力3402P,超算算力340P。首都云服務商在津冀、晉蒙區域部署的智能算力約4082P,更是為大模型產業發展提供了堅實基礎。
這是什么概念?1P是指每秒1000萬億次計算速度,100P就相當于5萬臺高性能計算機的算力,比如要在20萬顆天體的星空圖中要定位某種特征星體,僅100秒。1.2萬P將為北京帶來什么樣的“模”力,可想而知。
進入2024年,北京的智能算力基礎設施建設依然強勁,為大模型產業發展持續供能。
2024年1月,位于海淀區的北京人工智能公共算力平臺(上莊)發布,一期500P算力已正式上線,為大模型產業發展提供普惠算力服務。
2024年3月,作為北京規模最大的公共算力平臺,北京亦莊人工智能公共算力平臺正式啟用,可提供算力3000P,相當于超過百萬臺高性能電腦的算力。
該區每年將發布“1億算力券+1億模型券”服務企業;面向未來,該平臺所處的經開區規劃了超10000P的算力規模。
2024年5月,位于朝陽區的北京數字經濟算力中心項目基礎設施建設已于啟動施工,預計2024年年底完成,投產后將累計實現2000PFlops智能算力供給。
▲北京數字經濟算力中心效果圖
根據最新發布的《北京市算力基礎設施建設實施方案(2024—2027年)》,北京計劃打造的4個E(EFlops,浮點運算次數百億億次/秒)級智能算力高地,到2027年新增智能算力將達3.6萬P。
北京不僅從算力層面為大模型產業發展提供了動力,還從數據要素方面提供充足“燃料”。
北京市經信局數據顯示,北京國際大數據交易所實現牌照落地后,截至2023年11月,該所發放27張數據資產登記憑證,數據交易規模超過20億元。
背后,北京率先創建了全國首個數據基礎制度先行區,發布數據基礎制度先行區創建方案和政策清單;出臺數據資產首登記、首交易、首入表和首開放等創新的獎勵措施,持續釋放政策紅利。
2024年3月,北京啟用國內第一個AI數據訓練基地,同時以“監管沙盒”制度保障大模型訓練。AI數據訓練基地與北京算力基礎設施聯合起來,大大助力了大模型領域企業練就“最強大腦”。
可以看到,抓住模型、算力和數據三大要素,北京抓住了大模型技術產業發展的“牛鼻子”。
三、30年AI進化,北京成中國“大模型第一都”
北京是如何一步步成為AI之都的?這還要從30多年前說起。
北京AI產業的崛起具備悠久的歷史源頭。中科院的人工智能研究始于1987年,微軟亞洲研究院成立于1998年,著名的清華姚班創立于2005年……它們為北京AI發展創造了一批又一批人才,伴隨著2010年代初商湯、曠視、智源研究院等掀起的第一波AI浪潮,也在2020年代成為當下大模型產業發展的中流砥柱。
厚積薄發,隨著以計算機視覺為代表的AI技術產業落地成熟,2020年中國AI落地的爆發年,也是北京AI的第一次大爆發。
根據北京智源人工智能研究院發布的《2020北京人工智能發展報告》,2019年北京人工智能相關產值規模已達1700億元規模;AI創企截至2020年6月底融資總額超3000億元,并催生了商湯、曠視等32家人工智能獨角獸企業;AI相關論文發布、專利申請量均居全國第一,并產出了一批具有國際影響力的重大原創性成果,均居于全國第一。
這離不開北京能在AI綱領性政策上踩準節點。
2017年9月,中關村科技園區管理委員會率先發布了北京首個AI政策《中關村國家自主創新示范區人工智能產業培育行動計劃(2017—2020年)》,12月北京市印發了《北京市加快科技創新培育人工智能產業的指導意見》,為北京AI產業的發展提供了政策基礎和支持。2019年,北京獲批成立首個國家新一代人工智能創新發展試驗區,也為其AI爆發提供了條件。
因勢利導,伴隨著以ChatGPT為代表的大模型應用爆火全球,2023年是北京AI產業的進化年。
1、打響全國AI大模型政策第一槍,1000億元支持投融資環境
在AI大模型綱領性政策方面,北京起得早、不猶豫、不觀望。
2023年5月30日,北京率先打響地方大模型政策第一槍。北京市政府發布《加快建設具有全球影響力的人工智能創新策源地實施方案》、《北京市促進通用人工智能創新發展的若干措施》兩大政策,提出加強大模型訓練數據采集及治理工具研發等21條措施,為北京大模型產業發展定調。
2023年9月,北京市海淀區首先出手打樣。該區發布《中關村科學城通用人工智能創新引領發展實施方案》(簡稱“方案”),該方案提出要打造2300億元核心產業規模,從人才落戶、資金補貼,公租房等多方面給予人才補貼。
2024年4月,北京市再放政策大招。發展改革委等部門進一步聯合發布《北京市關于加快通用人工智能產業引領發展的若干措施》(簡稱“措施”),措施聚焦提升智能算力供給、加快大模型創新應用等提出10條措施,并從算力、模型、數據、應用及環境全方位給大模型企業發放真槍實彈的“大禮包”。
這些“大禮包”包括但不限于:對于納入國家重大戰略任務的AI技術攻關項目最高重獎1億元,對打造人工智能標桿應用的項目最高支持5000萬元,未來5年投資超1000億元優化投融資環境,通過資金補貼、發放算力券、模型券等方式降低大模型企業運營成本等。
2、打造45EFLOPS智算供給,國產算力支撐萬億級參數大模型訓練
在大模型基礎設施建設方面,北京保持著此前的強大投入力度。
2024年4月,北京市經濟和信息化局、北京市通信管理局印發《北京市算力基礎設施建設實施方案(2024—2027年)》(簡稱“方案”)。方案提出,到2025年,北京市智算供給規模達到45EFLOPS;到2027年,實現智算基礎設施軟硬件產品全棧自主可控,整體性能達到國內領先水平,具備100%自主可控智算中心建設能力。
北京市還宣布打造超過200個智能算力驅動的行業標桿案例,重點建設海淀、朝陽、亦莊、京西(石景山、門頭溝)等E級智能算力高地,優先加快兩個10EFLOPS大規模智算集群建設進度。
但北京的算力版圖不止于此,打造京津冀蒙算力供給走廊,規劃建設支撐萬億級參數大模型訓練需求的超大規模智算集群,使其加快人工智能大模型商業化落地的更宏大布局。
值得一提的是,加快推動核心軟硬件產品自主可控將是重點任務。
北京在方案中提出,對采購自主可控GPU芯片開展智能算力服務的企業,實施方案提出的保障措施是按照投資額的一定比例給予支持,加速實現智算資源供給自主可控。
而在5月的《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025年)》,北京也明確提出推動國產人工智能芯片實現突破。積極引導大模型研發企業應用國產人工智能芯片,加快提升人工智能算力供給的國產化率。
北京對國產算力的真刀實槍投入也是“大手筆”。
比如在2023年10月,北京市經濟和信息化局昨晚發布《2023年北京市高精尖產業發展資金實施指南(第二批)》,就提出重點支持集成電路設計產品首輪流片獎勵等方向,單個企業年度獎勵金額不超過3000萬元。
3、筑巢引鳳,發動全國科技力量“組局”,做活政產學研資生態
政產學研資生態融合,是北京大模型產業發展的活力源泉。
筑巢引鳳,北京在寸土寸金的首都撥出了多塊地來發展AI產業。
2023年9月,“中關村人工智能大模型產業集聚區”揭牌,打造五道口人工智能產業園、北大西門人工智能產業園、中關村西區人工智能產業園、以及清華科技園四大產業園區,覆蓋面積達67萬平方米,這為北京大模型產業的宏偉藍圖提供了寬闊的物理空間。
2024年7月,人工智能創新街區概念發布。北京計劃在海淀南部的53平方公里范圍打造人工智能創新街區,串聯起52個全國重點實驗室、10個新型研發機構、106個國家級科研機構、37所頂尖高校、89位AI2000全球頂尖學者、1.23萬位人工智能學者、1300家人工智能企業、90余家大模型相關單位、37家備案大模型單位。
通過一系列伙伴計劃、聯盟,北京讓一片片AI創業空間“活起來”。
2023年5月,北京發布通用人工智能產業創新伙伴計劃,當月公布首批39家成員名單,7月公布了第二批63家企業,包括阿里云、北京超級云計算中心等算力伙伴,北京市大數據中心、北京市科學技術研究院、北京智源人工智能研究院等數據伙伴,百度、智譜AI、阿里達摩院、昆侖萬維等模型伙伴,北京市政務服務管理局、北京銀行、金山辦公等應用伙伴,IDG資本、鼎暉創新、奇績創壇等投資伙伴。
2024年7月,中關村人工智能產業聯盟發起成立,啟動通用人工智能產業創新生態計劃。聯盟成員包括北京通用人工智能研究院、中國信通院、北京大學、清華大學、中國人民大學、中國科學院自動化研究所、智源研究院、海天瑞聲、智譜AI、騰訊、中國中車、百度、百川智能、中關村科學城公司等上百家高校、機構。
可以看到,為體現市場化開放合作對接機制,北京發動了大半個中國的投資界、產業界、學術界力量,共同助力大模型產業的發展。
而這些行動促成的成果,最終也不只是“秀肌肉”,而是為全國打樣,用成果?反哺全國大模型產業和數字經濟發展。
結語:打造數字經濟標桿,北京占據“百模大戰”C位
從數字化到智能化,北京再次走在了時代跨越的前列。
1994年中國首次接入互聯網,北京于1997年就率先成立了市信息辦,并在1999年制定了長遠的“數字北京”三步走目標:2000—2010年,形成“數字北京”基本框架。2011—2020年,提高首都的數字化水平。2021—2050年,將北京建設成為現代化國際數字城市。
引領互聯網寬帶、高清數字電視等風潮,踩準電商、數字物流、數字政府等風口,打造了載入史冊的“首都之窗”網站開通、市政交通一卡通普及、2008年數字奧運、3G網絡服務通網……根據官方數據,北京數字經濟增加值在2015年達到8719億元,到2022年已經增長至1.7萬億元,成為經濟增長的主要引擎之一。
AI作為數字化的重要子題,作為新質生產力的代表,不僅在北京數字化的沃土中生根,更在積極的AI專項政策澆灌下萌芽。政策、產業、學研、資本、應用多管齊下,北京已成為國內甚至全球首屈一指的人工智能產業人才中心,中國大模型第一城背后,北京的護城河,儼然越來越深。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。