首頁 > AI資訊 > 最新資訊 > 中國大模型發展指數(第1期)

中國大模型發展指數(第1期)

新火種    2024-10-16

【編者按】為了及時跟蹤中國大模型動態,深入研究大模型產業發展的廣度、深度、銳度,零壹智庫聯合多家學界和業界的機構和專家,編制“中國大模型發展指數”。大模型的發展日新月異,指數以月為單位更新數據。第1期指數數據更新到2024年4月,因第一期指數在數據挖掘、處理、建模、調研等用時較長,今日才得以發布。第2期指數將更新到2024年9月,將于近期發布。我們期待各界人士為指數提供建議、觀點和優秀案例,我們將不斷改進指數,為中國大模型的發展制作精準的風向標和參照系。——《中國大模型發展指數》編寫組

摘要

本報告構建了中國大模型發展指數,旨在量化評估中國大模型發展現狀和趨勢。指數涵蓋大模型研發、大模型實踐和大模型支撐三個維度,共20個四級指標,以2023年5月至2024年4月的數據為基礎進行分析。

中國大模型發展指數顯示,國內大模型在技術和應用方面均取得了顯著進展。大模型技術作為推動科技創新和產業變革的核心技術,正逐步成為經濟發展的新引擎。

大模型研發方面:研發指數反映出學術研究和專利授權的穩步增長,表明中國在大模型領域的技術創新和學術探索持續活躍。盡管增速有所放緩,但大模型研發的總體趨勢依舊向上,顯示出國內在該領域的深厚積累和創新潛力。

大模型實踐方面:實踐指數揭示了大模型在實際應用中的增長態勢,盡管短期內增速有所放緩,但大模型在各行業的應用水平仍在提升。特別是大模型創業指數的快速增長,表明市場對大模型應用的高度認可和積極響應。

大模型支撐方面:支撐指數的顯著增長凸顯了中國在算力、人才、政策和創新環境等方面的堅實基礎。算力中心數量的增加、高校專業人才的培養、國家及地方政府的政策支持,以及開源社區的活躍度提升,均為大模型的快速發展提供了有力支撐。

典型案例:KAN網絡提出了一種創新的神經網絡架構,在理論基礎、結構設計、參數效率和可解釋性方面具有優勢。智譜清言是一款新一代基座大模型,具備多模態能力。在高級自然語言處理能力、多語言交流、深度文本分析、智能寫作、信息搜索、個性化服務、文檔理解等眾多方面得到應用。

東方財富妙想金融大模型憑借其自研技術、金融數據挖掘、專業詞表、高效訓練算法、算力集群、金融場景應用、數據積淀和專業生態,已成為金融科技領域的領先者,服務于百萬專業投資者和金融機構。

百融云創結合行業專知,引入檢索增強生成技術(RAG),融合多模態,為金融行業提供了精準、高效和個性化的服務,成為AI產業應用的典范。

結論與展望:中國大模型發展迅速,已成為全球重要力量。未來需要加強技術研發,拓展應用場景,完善政策環境,營造良好創新生態。中國大模型有望在多個領域發揮重要作用,推動經濟和社會發展。

人工智能技術正引領新一輪科技革命,其中AI大模型作為核心技術,在推動科技創新和產業變革方面發揮著重要作用。

中國密集出臺政策支持大模型發展,并在技術研發和應用方面取得了顯著成效。然而,目前缺乏對中國大模型發展現狀的量化評估工具。

為此,本報告構建了中國大模型發展指數,旨在從大模型支撐、大模型研發和大模型實踐三個維度,對中國大模型發展情況進行全面評估,為相關決策提供參考依據。

01

指數背景

(一)國家政策背景

伴隨人工智能技術的加速演進,AI大模型已成為全球科技競爭的新高地、未來產業的新賽道、經濟發展的新引擎,發展潛力大、應用前景廣。特別是自2022年以來,以ChatGPT為代表的通用人工智能大模型在全球掀起了新一輪的人工智能發展浪潮。

作為新質生產力的重要組成部分,大模型有望揭示重大科學規律、催生重要科技成果,激發新一輪的技術和產業變革,賦能千行百業,推動經濟和社會跨越式發展。當前,全球主要國家已經著手制定大模型相關的發展戰略和政策文件。

1. 美、歐等人工智能戰略動向

2021年,白宮科學技術政策辦公室(OSTP)宣布啟動國家人工智能倡議辦公室,負責協調和監督美國政府的國家人工智能政策計劃。

2023年 5月,美國政府發布了新版《國家人工智能研發戰略計劃》,同年6月宣布投資1.4億美元成立7 家新的國家人工智能研究所,7月在白宮召集亞馬遜、谷歌、Anthropic、Meta、微軟等七家AI頭部公司簽署人工智能的自愿承諾協議,9月再次與英偉達、IBM、Adobe、Salesforce、Scale、Cohere等八家企業簽署該協議。

2023年6月,歐洲議會通過了《人工智能法案》的一系列修正案,預計于2024年正式通過《人工智能法案》。

歐盟主要針對人工智能的定義、禁止的人工智能應用清單、高風險人工智能的義務及基礎模型、執法機制幾個爭議性的領域加以討論和修正。還將成立 “人工智能委員會”,在歐洲議會的建議下建立一個新的人工智能辦公室,該機構將擁有行政、咨詢、解釋和執法相關的一系列權力,并負責協調跨境調查。

當下,圍繞《人工智能法案》的爭議集中在它是否會過度約束大模型的發展,由此可以看出,歐盟內部對以大模型為代表的新一代人工智能整體還是持審慎態度。

日本對人工智能技術采取的戰略性舉措包括整體規劃“社會5.0”《新機器人戰略》《下一代人工智能促進戰略》《人工智能技術戰略》《人工智能技術戰略實施計劃》《以人為中心的人工智能社會原則》以及《人工智能戰略》等加強對人工智能技術和專利發展的戰略性引導。

近年來,新加坡瞄準人工智能在當今國際局勢中的戰略性地位,大力發展人工智能以賦能智慧國家建設并發揮國際戰略優勢,在戰略、軍事、治理等方面展現數字革命時代下新加坡的文化 特色。

新加坡致力于用數字信息科技改變新加坡,在2006年、2014年分別啟動“智慧國家2015計劃”與“智慧國家2025計劃”,并發布《國家人工智能戰略》,計劃于2030年成為人工智能廣泛應用的智慧國家,實現經濟與產業轉型并成為全球人工智能創新的領跑者。

2. 我國大模型政策布局動向

我國對大模型產業持包容審慎態度,自2022年下半年以來,密集出臺了一系列大模型相關政策。

表1-1:中國AI大模型行業最新政策匯總一覽表

資料來源:公開渠道,零壹智庫

在技術創新方面顯著提升,加快形成大模型產業。在國家政策的指導下,國內各地密集出臺人工智能政策,圍繞算力、算法、數據等大模型應用基本點發力,加快形成大模型產業。

各地人工智能政策發布呈密集態勢,且主要聚焦通用人工智能大模型,多省市在2023年上半年密集出臺人工智能相關利好政策,都在努力搶抓發展風口。

據不完全統計,2023年上半年,重點省市共出臺人工智能發展相關政策19項,而2022 年同期僅有5項,增長率近400%。北京、上海、深圳、成都、杭州、武漢等大城市均高度重視大模型產業發展。

國內多地大模型政策主要以“三算”(算力、算法、算據)、應用和企業布局為同質化著力點。

從算力上看,杭州、上海等地加快建設算力基礎設施、統籌調度平臺及算力協調體系,集聚算力資源、夯實發展“底座”,如妙想金融大模型致力于以底座能力賦能金融場景。

從算法上看,南京、深圳等地聚焦基礎軟硬件體系、大模型算法核心技術,做好底層支撐以突破算法瓶頸。

其中,成都、杭州、廊坊實施首試首用、支持首版次等措施來支持算法研發;北京則強調通用人工智能算法發展,如百融云創金融大模型結合了算力、行業專知對模型進行算法精調;蘇州和無錫提出探索元宇宙相關算法。

從數據上看,北京、成都等6地提出歸集高質量數據開放共享資源集、支持數據交易、探索公共數據開放使用途徑,打通數據資源壁壘,其中,北京謀劃建設數據訓練基地、建設數據基礎制度先行示范區,成都和杭州都考慮構建行業級數據集或數據平臺。

表1-2:主要城市大模型政策

資料來源:公開渠道,零壹智庫

(二)技術發展背景

數字技術創新成效顯著。我國大模型爆發式增長,緊跟國際前沿步伐,特別是在技術創新領域,成效顯著。

人工智能、區塊鏈、云計算、大數據和物聯網等數字技術(統稱ABCDI)是發展大模型的關鍵技術。

為了更好地獲得ABCDI數據,我們選擇從企業預警通、智慧芽等渠道獲取數據并分析得出,ABCDI專利申請數量自2008年的10018件至2021年達到峰值415982件,但在2023年回落至214478件。

專利申請的增長率也從2021年的27.04%顯著下降至2023年的-40.16%。

這一趨勢反映出近三年專利申請數量的明顯減少,主要是區塊鏈的專利申請數量下降明顯;專利申請數量逐漸減少導致后期專利授權數量逐年減少,授權數量從2008年的1872件,到2022年最高峰為161988件,2023年略有下降為131125件,專利授權增長率從2009年的46.31%上升到2020年78.59的峰會,之后下降到2023年的-19.05%。

圖1-1:數字技術創新增長率

數據來源:智慧芽,零壹智庫

大模型專利累計數量逐年增長,以2023年05月-2024年04月共達到384506件,月平均增長32042件,具體如圖1-2所示,從圖中可以看出大模型專利增長強勁。

這也說明自2022年以來,以ChatGPT為代表的通用人工智能大模型在全球掀起了新一輪的人工智能發展浪潮。大模型作為新質生產力的重要組成部分,有望揭示重大科學規律、催生重要科技成果,激發新一輪的技術和產業變革,賦能千行百業,推動經濟和社會跨越式發展。

圖1-2:2023年5月-2024年4月每月大模型專利數量

數據來源:智慧芽,零壹智庫

(三)產業發展背景

近年來,人工智能得到快速發展,激發了新一輪的技術和產業變革,賦能千行百業,推動經濟和社會跨越式發展。當前我國人工智能技術被廣泛運用在無人駕駛、移動網絡、智能家居等產業中,逐步形成了依賴基礎技術支持并融合人工智能技術和人工智能應用鏈接的產業框架。

通過人工智能技術應用于實體經濟,促進技術進步,帶動產業升級和經濟轉型,進一步推動經濟的持續增長,2022年中國核心產業規模達到5080億元,同比增長18%。

在技術創新領域,中國在人工智能芯片、深度學習軟件架構和中文自然語言處理等領域取得了顯著進展,同時AI技術正在醫療健康金融科技和新消費等領域廣泛應用,賦能到各行各業。

截至2023年,人工智能顯示出強勁的發展勢頭并通過創新推動實體經濟的發展,涵蓋人工智能產業鏈相關行業的創新、工業機器人和服務機器人產業的創新,以及物聯網和智能商業模式的創新。

人工智能產業作為一個充滿巨大機遇和潛力的新興產業,對于國家經濟發展和社會進步具有重要意義。人工智能產業的發展也面臨著一系列挑戰和問題,需要政府、企業和社會各界共同努力解決。

總體來看,在市場機遇和技術挑戰的雙重驅動下,人工智能產業迎來了前所未有的發展機遇。但是,政策環境和國際競爭的不確定性仍然給人工智能產業帶來一定的挑戰。因此,只有進一步加強政策引導,加強國際合作,才能夠促進人工智能產業健康、可持續發展。

02

評價體系

自2022年11月底發布ChatGPT以來,以其為代表的通用人工智能大模型在全球掀起了新一輪的人工智能發展浪潮。作為新質生產力的重要組成部分,大模型有望揭示重大科學規律、催生重要科技成果,激發新一輪的技術和產業變革,賦能千行百業,推動經濟和社會跨越式發展。

目前,尚未有指標對我國大模型發展情況進行衡量。因此,鑒于大模型的快速發展,本報告以月度數據作為基礎數據,擬選取2023年5月至2024年4月十二個月,從大模型支撐、大模型研發和大模型實踐3個維度,構建中國大模型發展指數指標體系,對我國大模型發展情況進行量化研究。

(一)構建原則

本報告基于我國大模型研究和發展實際,堅持科學性、系統性、可操作性、可比性原則,構建中國大模型發展水平的評價指標體系。

1. 科學性原則

指標體系的設置考慮指標的內在因果邏輯,嚴謹、準確地反映大模型發展水平和發展潛力。其中,指標權重的確定采用CRITIC客觀賦權法,指標的構建以定量指標為主,最大限度排除主觀干擾?;诖擞嬎愕玫降闹袊竽P透骷壷笖的軌蚍从持袊竽P桶l展的現實發展水平、變化程度、未來趨勢等。

2. 系統性原則

選取指標盡可能地全面反映大模型發展的各方面,又能突出重點,確保指標體系完整、客觀、合理。系統性原則使得單個指標能反映大模型發展的某個側面,綜合指標又能反映大模型的整體情況。

本報告從大模型支撐、大模型研發和大模型實踐3個維度對我國大模型發展情況進行測量。其中,大模型支撐是大模型發展的基礎條件,本報告從算力、人才、政策以及創新環境等維度測量我國對大模型發展的支持情況。

對大模型的學術研究和技術研發是大模型創新發展的重要源泉,而良好的開源生態有利于大模型技術持續創新。大模型實踐是大模型在企業和產業的實踐和落地情況。三個維度較好地囊括了我國大模型發展基礎、學術和技術研發及實踐應用情況。

3. 可操作性原則

本報告立足現行統計制度和方法,聚焦大模型相關實物量和價值量指標需求,充分考慮大模型學術和行業數據的可獲得性、可操作性,力求全面、準確反映大模型發展狀況。數據以定量數據為主,主要通過查閱國家統計局、教育部、中國知網和網絡搜索等途徑獲得數據。

其中,大模型技術研發活躍度數據來源于全球最大的開源社區之一—github,基于該平臺檢索我國開源大模型數量、參與者數量及項目參與者活躍度。這一做法,很大程度上減少了數據遺漏,使得數據可以持續獲得。

4. 可比性原則

通過對各月基礎數據進行歸一化和去量綱等方法進行處理,消除不同特征之間的量綱差異,使不同特征數據之間具有可比性,從而使計算結果具有綜合可比性。同時,針對計算結果進行基期指數化,更直觀地反映我國大模型發展指數變動情況和趨勢。

(二)指標體系

向上聯結學術、向下扎根行業,實現技術創新與社會價值的接軌是大模型發展的第一性原理(注1)。而這一切也都需要人力、算力和創新環境等的支撐。由此可以看出,對大模型發展而言,大模型支撐是基礎,大模型研究是創新的源泉,大模型實踐是落腳點。

基于此,本報告從大模型支撐、大模型研究和大模型實踐3個一級指標(見表2-1)、8個二級指標、13個三級指標和18個四級指標構建大模型發展指數指標體系,衡量我國大模型發展水平。

表2-1:中國大模型發展指數一級指標

1.大模型支撐

算力、人才、政策的支持,以及良好的創新環境,是大模型發展的重要支撐。算力和人才指大模型發展最重要的資源投入之一。大模型發展離不開訓練和推理,大模型訓練包含海量高質量數據獲取、大規模訓練集群穩定訓練、模型算法調優等多個環節,每個環節都需要大量人才、算力等資源的投入。

本報告分別用算力中心數量和高等院校相關專業數量來衡量我國算力和人才支持情況(表2-2所示)。

同時,政府政策是保障大模型健康發展的重要規范。大模型的使用可能會出現各種各樣的錯誤,也會帶來一些倫理、安全和隱私等方面的問題。這就需要政府從大模型治理、隱私保護等各方面出臺各項政策支持,保障大模型安全、健康、持續發展。

如,2023年7月,國家網信辦聯合國家發展改革委、教育部等7部門聯合公布《生成式人工智能服務管理暫行辦法》。從數據和基礎模型的合法性、知識產權保護、個人信息保護等方面提出了相關要求,對促進生成式人工智能健康發展和規范應用,維護國家安全和社會公共利益意義重大。

本報告以大模型、內容平臺、生成式人工智能等關鍵詞(見附錄二)在知領政策庫檢索大模型相關政策數量作為基礎數據。

此外,技術創新是大模型發展的首要驅動力。大模型發展面臨諸多挑戰,如魯棒性、安全性及效率問題,這些挑戰的解決依賴于技術進步和原始創新。

大模型的實踐,除了技術層面的突破,也需要商業模式的創新。因此,良好的創新環境是大模型研發和應用的動力源泉。基于此,本報告以大模型、內容平臺、生成式人工智能等關鍵詞(見附錄二)在中國日報網等進行檢索,以表征創新熱情。

表2-2:大模型支撐指標

2.大模型研發

大模型研發主要集中于兩類,分別是學術研究和技術研發(表2-3所示)。其中,學術研究層面,近年來,高校與科研院所積極布局大模型,大模型學術研究雨后春筍般涌現。

本報告以中國知網作為檢索平臺,以大模型、預訓練、生成式預訓練、GPT、涌現能力、語言大模型、NLP、大語言模型、LLM、ChatGPT等作為關鍵詞(見附錄一),檢索我國關于大模型研究的學術論文數量。

在技術研發方面,專利是衡量創新產出的重要指標。本指標從智慧芽等平臺檢索我國專利授權數量,以此衡量我國技術創新成效。

此外,良好的開源生態不僅有利于大模型技術持續創新、拓展大模型應用路徑,還能在多方攜手共建的基礎上更好地解決大模型的可解釋性、安全性、穩定性等問題。

因此,本指標基于github社區,檢索我國開源大模型規模,及各開源模型貢獻者(contributors)表征開源大模型參與者數量,各位貢獻者存在多次提交(commits),以各參與者提交次數累計值表征開源大模型參與者活躍度。

表 2-3:大模型研發指標

3.大模型實踐

大模型作為新物種,一直在快速進化,目前已經初步形成包括各參數規模、各種技術架構、各種模態和各種應用場景的大模型家族。本報告從大模型創業和大模型應用兩個維度分別測量我國大模型創業情況和大型企業在大模型應用上的實踐(表2-4)。

目前,投創界積極入局大模型競賽,本報告借助企業預警通平臺,通過關鍵詞檢索(見附錄1),據此統計大模型創業企業規模,初始資本等,衡量我國大模型創業情況。同時,通過爬取AIGC企業投融資數據,作為創業企業資本補給基礎數據。

大模型的實踐應用上,行業大模型是大模型在產業中的應用拓展與典型,是大模型專業化、場景化和垂直化的體現。另一方面,大模型輸入模態從文本向語音和圖像等多模態的擴充的趨勢。

多模態應用進一步提升了產業應用的適應性,讓大模型解鎖了更多的可能性。因此,本報告從大模型垂直應用、單模態應用和多模態應用三個維度測量大模型應用水平。該部分數據來源主要是網絡搜索。

表2-4:大模型實踐指標

(三)指標權重

指標權重的確定有客觀賦權和主觀賦權兩類方法??陀^賦權法可排除主觀干擾,應用相對廣泛。

熵權法、標準離差法和CRITIC法是主要的客觀賦權法,三種方法均用變量的變異確定權重。其中,CRITIC法考慮了變量之間的沖突,確定的權重更為精準(Chen et al.,2021;Chen et al.,2022;許滌龍和陳雙蓮,2015)。本報告首先對各指標數據進行離差標準化處理,以避免量綱的差異對測算結果的影響。

本報告選擇CRITIC法確定各指標的權重。第i個指標的權重:

根據上述計算公式,計算各一級指標權重如下。

表2-5:中國大模型發展指數一級指標權重

(四)數據來源

本指數測量時間為2023年05月至2024年04月,所涉數據來源于國家統計局、教育部、中國知網、中國日報網、智慧芽、企業預警通、知領政策庫、零壹財經、github平臺等。

03

中國大模型總體情況

大模型作為人工智能領域的重要突破,對于推動科技進步和產業升級具有至關重要的意義,它們在揭示科學規律、促進技術創新方面發揮著核心作用,為各行各業的轉型與發展提供了強大的動力。

通過上述的指標體系,計算得出了中國大模型指數。為了更深入地理解這些指標背后的含義,并從中提煉出有價值的信息,接下來將進行中國大模型指數分析,揭示中國大模型發展的特點。

(一)中國大模型總體指數快速上升

從2023年5月至2024年4月,中國大模型指數從100點基數增長至257.40。

圖3-1:中國大模型總體指數

數據來源:零壹智庫

我國大模型總體指數快速上升的原因是:

其一,國家政策驅動大模型發展。我國高度重視人工智能的發展,將其上升為國家戰略,并出臺了一系列的扶持政策和規劃,為AI大模型產業發展創造了良好的環境。

如2024年,多重利好因素推動大模型快速發展,首先是“人工智能+”行動等來自政府層面的有力支持,其次用戶提升生活、工作效率的需求激增,再加上科技公司加大對 AI 領域投入資金、人力、技術研發,各環節協同支撐大模型發展。

積極發展 AI、促進 AI 與實體經濟深度融合,成為中國實現經濟可持續高質量發展的必然選擇。

其二,基礎設施支持大模型發展。我國具備發展人工智能較好的基礎,算力中心、5G網絡等基礎設施發展迅速,企業創新能力和動力強勁,快速跟上全球大模型發展前沿,涌現出一批具有行業影響力的大模型。

其三,資本賦能大模型發展。大模型能夠有效的解決人工智能方面的很多問題,不斷降低資源需求、提高性能、創造良好的效益,不斷激發了業界和資本的動力,推動了大模型的發展。

(二)我國大模型研發指數增長4倍

大模型研發指數是由學術研究和技術研發兩個二級指標構成,從計算得出大模型研發指數從2023年05月63.57增長到2024年04月258.54,增長4倍;大模型研發指數增長率從26.20%下降到9.33%。

圖3-2:大模型研發指數及增長率

數據來源:零壹智庫

我國大模型研發指數增長強勁,其原因如下:

其一,學術成果豐碩,從計算結果得出,大模型學術研究指數從2023年5月44.35增長到2024年04月的253.37,增長5倍,原因是圍繞大模型的學術論文從2024年05月216篇增長到了1018篇,大模型專利數量從2023年05月13001項增長到了2024年04月39412項。

大家都明白,自2022年以來,以ChatGPT為代表的大模型在全球掀起了新一輪的人工智能發展浪潮,能揭示重大科學規律、催生重要科技成果,激發新一輪的技術和產業變革,賦能千行百業,推動經濟和社會跨越式發展。

其二,技術研發水平不斷提升,從計算的結果得出,大模型技術研發指數從2023年05月82.24增長到2024年04月258.54,增長3倍。原因是技術創新成效、開源大模型研發水平、開源項目開發進展三個指標增長較快,分別從64.13增長到258.54、從96.86增長到、258.54;從95.14增長到258.54。這會加大大模型技術快速發展,使我國大模型產業發展將邁入快車道。

1. 大模型學術研究指數增長率有所放緩

大模型研發二級指數學術研究指數從2023年05月45.25增長到2024年04月的285.54,學術研究指數增長率從2023年6月28.70%下降2023年12月12.14%,一直到2024年12 月穩定在12%左右;技術研發指數從2023年05月79.07增長到2024年04月的253.37,技術研發指數增長率從25.86%下降到6.37% 。

圖3-3:大模型學術研究指數和大模型技術研究指數及增長率

數據來源:零壹智庫

其增速放緩的原因如下:

其一,創新邊際遞減效應。創新的邊際遞減效應是一個經濟學原理,它描述了隨著技術發展,每增加等量的投入,所帶來的產出增長會逐漸減少的現象。

這一效應在學術發展過程中同樣存在,尤其是在學術研究成熟期,創新的難度和成本增加,而獲得的額外效益卻逐漸減少。

從大模型學術研究數據來看,2023年5月到2023年6月大模型論文由216篇增長到278篇,只增長了62篇;而增長率卻為28.70%。2024年3月到2024年4月大模型論文由1098篇增至1234篇,增長了136篇,而增長率僅為12.39%。大模型論文的增長率呈現出邊際遞減效應。

其二,論文選題方向邊際遞減效應?,F有的大模型研究主要方向是深度神經網絡、Transformer架構、自監督學習、預訓練與微調策略,以及高效的優化算法,之后研究轉向了大模型處理復雜任務時的適應能力和泛化能力。

然而,隨著時間的推移,大模型處理復雜任務研究逐漸遇到了性能瓶頸,即在現有理論框架和技術手段下,進一步的性能提升變得越來越困難,導致研究產出的增長速度開始減緩,呈現出論文選題方向邊際遞減效應。

2. 大模型技術研發指數增長率逐漸降低

大模型技術研發指數增長率從2023年5月24.7%下降到2024年4月6.13%(圖3-3),增速逐漸放緩。其具體原因主要是:

其一,市場競爭日益激烈。大模型領域的競爭愈演愈烈,各類企業紛紛投入研發和推廣,為了爭奪市場份額,各大企業不斷推陳出新,使得技術更新速度越來越快,在這種情況下,大模型研發的高增長率難以持續;

其二,當前大模型的應用場景有限。盡管大模型在很多領域都表現出了出色的能力,但實際上,它們的應用場景仍然相對有限。許多企業在嘗試將大模型應用到自己的業務中時,發現實際效果并不如預期;

其三,大模型的高成本和技術難題也是制約其增速的重要因素。開發和維護大模型需要大量的資金和技術投入,這使得一般的中小企業難以承受,同時大模型的技術難題也使得很多企業在實際應用中面臨諸多挑戰。這些問題的存在,導致大模型的熱度逐漸降低。

(三)我國大模型實踐應用復合增長率16%

大模型實踐指數從2023年5月44.68增長至2024年4月234.37,復合增長率16%。大模型實踐指數在短期內經歷了一段“降溫”期,但從中期視角來看,指數仍然呈現出“穩步加溫”的態勢。

特別是在2023年的6月、11月,以及2024年的2月,可以觀察到了顯著的增長率高峰(參見圖3-4)??傮w而言,大模型實踐指數保持著上升的發展軌跡,盡管增長率在不同時間段表現出一定的波動性。

這些數據點揭示了一個模式:盡管大模型實踐可能會遇到暫時的冷卻期,但經過一段時間的沉淀和調整,研究和應用的熱情往往會被重新點燃。

這種周期性的波動可能與技術突破、市場需求變化或政策導向等因素有關。因此,盡管面臨暫時的挑戰,大模型的發展前景依然樂觀。

其“降溫”原因如下:

其一,大模型認知鴻溝被逐步填平。大模型神秘面紗正在不斷被揭開,同時開源社區也獲得了蓬勃起步,學術界也積極參與和支持開源化,這進一步降低了大模型在應用側的門檻。

隨著認知差逐步平衡,上手試驗成本降低,在初期結構性紅利誘導下的沖動臆想正在快速消退,產業界逐步回歸理性。

其二,國家出臺政策進一步約束大模型安全合規問題。國內對大模型安全高度重視,國家網信辦等七部門于2023年7月10日聯合公布了《生成式人工智能服務管理暫行辦法》,自2023年8月15日起施行。

該辦法就生成式人工智能可能面臨的安全問題提出了一系列明確的約束規范,比如要求提供和使用生成式人工智能服務,應當遵守法律、行政法規,尊重社會公德和倫理道德;要求采取有效措施防范未成年人用戶過度依賴或者沉迷生成式人工智能服務。

規定提供者應當按照《互聯網信息服務深度合成管理規定》對圖片、視頻等生成內容進行標識(注2)。

大模型的安全和倫理約束是確保技術負責任發展的關鍵。

雖然這些約束在一定程度上抑制了技術的迅猛發展,但它們對于防止技術濫用和潛在風險至關重要,不僅避免了技術的過熱,也為行業的可持續發展提供了寶貴的思考和調整空間。

通過這種適度的制約,我們可以確保大模型技術的發展方向與社會的整體利益相一致,促進行業的健康和有序發展。

圖3-4:大模型實踐指數及增長率

數據來源:零壹智庫

1.大模型創業指數總體增速較快,月均復合增長率26%

大模型創業指數初期發展水平較低,總體增速較快。從2023年5月19.21增長至2024年4月253.36,月均復合增長率為26%(圖3-5),增速較快。

其中,2023年6月增長率激增,高達124.40%,隨后增長率下降至2024年1月11.62%。隨后2月,增長率增長至42.43%。整體增長情況與大模型實踐指數保持一致。

圖3-5:大模型創業指數及增長率

數據來源:零壹智庫

溯其根源,大模型相關企業數量、初創企業資本金和大模型企業融資金額基礎指標總體呈現遞增,2023年5月初創企業數量從28449家增長至2024年4月303779家,初創企業資本金2223.5億元增長至106427.80億元,大模型企業融資金額從15.16億元增長至176.37億元。

三個下屬指標均在2023年6月呈現快速增長,這也導致大模型創業指數在6月份激增。

圖3-6:大模型相關企業數量、初創企業資本金和大模型企業融資金額

數據來源:企業預警通,零壹智庫

其一,2023年開始,創投界青睞對大模型投資青睞有加。據統計,2020年至2022年,各年投融資事件數量未超過5起,而2023年共有20起(注3)。

從已知金額來看,2023年,國內LLM領域投融資金額已高達64.27億元(圖3-6)。其中,騰訊和阿里是國內最“慷慨”的投資方,國內5家大模型獨角獸公司中(月之暗面、智譜AI、Minmax、零一萬物和百川智能),阿里參投率高達100%,騰訊參與了其中3家的投資,參投率為60%(圖3-7)。

2024年4月,中國人工智能(CAAI)和螞蟻集團聯合發起設立“CAAI-螞蟻科研基金(大模型專項)”,用于支持大模型領域的產學研合作和共同發展,該基金課題涵蓋行業應用大模型、 通用大模型、大模型數據、大模型安全、大模型 infra 等五個方向。

表3-1:2022年至今國內大模型獨角獸融資情況

數據來源:公開渠道,零壹智庫

其二,大型語言模型投融資地區、覆蓋的行業不均衡。從大型語言模型投融資事件發生的地點來看,主要集中在北京、上海、廣東等經濟發達地區,這些地區經濟發展水平居前,科研技術水平較高、科研氛圍良好,三地投融資事件數量共計占全國的半數。

其中,北京占比27.4%,廣東占比13.7%,上海占比8.2%。從被投公司的行業分布來看,截至2023年,我國LLM領域投融資項目以企業服務細分為主,具體來看,主要是各類AI內容平臺商。企業服務領域占比高達58.3%,其次是元宇宙,占比為25.0%。工具軟件、文娛傳媒占比均小于10%(注4)。

其三,從外部環境來看,政策出臺助力為科技型企業提供全生命周期的多元化接力式金融服務。

2023年6月,國務院總理李強主持召開國務院常務會議,審議通過《加大力度支持科技型企業融資行動方案》(以下簡稱《行動方案》)。

會議強調,要引導金融機構根據不同發展階段的科技型企業的不同需求,進一步優化產品、市場和服務體系,為科技型企業提供全生命周期的多元化接力式金融服務?!缎袆臃桨浮返某雠_為大模型初創企業解決融資難、融資貴問題具有重要意義,也有效提升了大模型創業指數。

此外,僅2023年4月28日,OpenAI單次完成3億美元融資;截止當日,OpenAI已獲得約103億美元融資(據美國科技媒體TechCrunch數據)。由此催生的創業浪潮點燃了風投公司投資熱情,帶來了一定時期內的投資熱潮。

2.大模型應用指數復合增長率8%

大模型應用指數發展水平整體較高,增長速度逐步放緩,增長趨勢與大模型創業指數基本一致。由2023年5月89.05增長至2024年4月201.28,復合增長率8%,且增速明顯放緩。

圖3-7:大模型應用指數及增長率

數據來源:零壹智庫

從下級指標來看,大模型應用水平上,應用大模型數量從34個增長至100個,其行業覆蓋率從25%增長至85%,現大模型已覆蓋大部分行業。大模型未涉及的行業范圍越來越少,導致覆蓋率增速放緩。就離散度而言,大模型所覆蓋行業的增速慢于大模型數量增長率,因此離散度有減緩的趨勢。

圖3-8:應用大模型數量、大模型覆蓋率和離散度

數據來源:零壹智庫

在大模型單模態應用上,單模態大模型數量呈現先遞增后減少的趨勢。而在大模型多模態應用上,多模態大模型數量呈現遞增的趨勢。

究其原因,不難發現,相比傳統的單模態大模型,多模態大模型更加符合人類的多渠道認知方式,從而導致單模態大模型與多模態大模型的此消彼長。多模態大模型能將不同模態信息相互補充,提高信息的完整性和準確性,從而更好地應對復雜環境、場景和任務。

落實到應用層面,多模態能使機器更好地理解人類的意圖和需求,提供精準、個性化服務。

圖3-9:單模態和多模態大模型應用

數據來源:公開渠道,零壹智庫

其次,垂直大模型致力于解決特定場景問題,因此其發展節奏與大模型創業企業發展節奏基本一致。此外,中國大模型產業發展源于多領域的廣泛需求,例如辦公、金融、醫療、政務等場景和訴求。隨著大模型應用場景和領域增長,大模型未涉及的行業領域越來越少,導致覆蓋率增速放緩。

綜上所述,我們可以從以下方面分析大模型應用指數呈現整體較高,增長速度逐步放緩特征的原因。

其一,隨著基礎模型的不斷強大,開發應用的難度逐漸降低,導致其發展水平整體較高。如李彥宏預測,在未來,各個行業領域都可能依據自身獨特的場景和豐富的經驗,催生出大量的智能體,從而構建起一個龐大的智能體生態(注5)。

其二,隨著大模型行業應用將更加廣泛,涵蓋越來越多的行業和場景,大模型未涉及的行業范圍越來越少,導致覆蓋率增速放緩。

其三,垂直大模型致力于解決特定場景問題,因此其發展節奏與大模型創業企業發展節奏基本一致。

大模型本身的特性與金融、醫療等行業有著天然的契合,導致大模型應用在某些行業應用較多(表3-2)。以金融領域為例,該領域數據種類具有廣泛性和深度,要滿足不同用戶的需求,妙想大模型結合相關技術提高性能,滿足不同顧客需求;金融數據多且雜,導致大模型可能產生的“幻覺”問題,百融云創金融大模型運用創新增強生成技術解決此問題。

以醫療領域為例,該領域存在大量模態種類豐富且跨學科的數據,大模型與醫療行業有著天然的契合性,醫療AI大模型不僅能深刻理解臨床數據,還能生成富有洞見的醫療知識(圖3-10)。

從影像診斷到藥物研發,這些模型正逐步改寫醫療服務的未來(注6)。

表3-2:國內應用大模型所屬行業top10

數據來源:GitHub - wgwang/awesome-LLMs-In-China: 中國大模型

圖3-10醫療健康AI大模型應用場景

圖片來源:介入醫學工程國創平臺

(四)我國大模型支撐指數累計增長68%

大模型支撐指數總體持續平穩增長。從2023年5月至2024年4月,大模型支撐指數從150.89增至253.37,累計增長了67.92%(圖3-14)。大模型支撐指數總體增速有兩個月較快,分別是2023年7月和2024年4月。

2023年7月增速最大,達28.86%;2024年4月增速為6.02%。除此外,其他月份大模型增長速度保持相對平穩,每月平均增速為2.32%。這兩個月指數增長較快的原因:

其一,我國算力數據有很大提升。2023年6月增幅達80%,中國算力大會公布數據顯示,全國在用數據中心機架總規模超過760萬標準機架,算力總規模達到197百億億次/秒(EFLOPS),存力總規模超過1080艾字節(EB)。

算力樞紐節點建設了130條干線光纜,數據傳輸性能大幅改善。這些數據體現在2023年7月的大模型支撐指數和增幅上,導致指數增長較快。

其二,人才支撐有了大幅度提升。因2020年開設與大模型相關專業(如:大數據技術、數據科學、計算機科學與技術、信息技術等專業)數量增長明顯,導致2024年1月的畢業生人數有較大幅度增加。2019年大模型相關專業數量為304個,到2020年增加至335個,增幅達10.2%。

圖3-11:大模型支撐指數及增長率

數據來源:零壹智庫

1.大模型政策指數增長4.23倍

大模型政策指數從2023年5月59.94,增長至2024年4月253.37,增長了4.23倍,增速較快(圖3-15)。

其中,2023年6月和9月增長率激增,分別是55.45%和23.67%,隨后增長率下降至2024年2月的2.14%。

隨后至4月,增長率略有增長至10%左右。大模型政策指數總體增長增速在放緩。

主要原因是,我國大模型政策集中在2023年出臺發布,如2023年7月發布《人工智能氣象應用工作方案(2023-2030)》《生成式人工智能服務管理暫行辦法》,8月發布《電子信息制造業2023—2024年穩增長行動方案》,10發布《人形機器人創新發展指導意見》,12月發布《關于加快推進視聽電子產業高質量發展的指導意見》《“數據要素+”三年行動計劃(2024-2026)(征求意見稿)》;2024 年《政府工作報告》中提出開展“人工智能+”行動。

我國各地方政府也在2023年出臺相關支持政策,加快大模型產業的持續發展。如北京、深圳、杭州、成都、福建、安徽、上海、廣東等地在2023年均發布了關于 AI 大模型的相關政策。

圖3-12:大模型政策支撐指數及增長率

數據來源:零壹智庫

2.大模型創新環境指數增長14.16倍

大模型創新環境指數從2023年5月17.89,增長至2024年4月253.37,增長了14.16倍,并且一直保持高速增長(圖3-16)。其中,2023年6月增長最快,最高達111.07%;其次是2023年9月,增速為35.01%。主要原因如下:

其一,受大模型實踐成功的刺激。受到ChatGPT4以及SORA等大模型的成功案例影響,激起中國大模型業內人士興趣,開始國產化大模型的研究與應用,國內的研究院所、高校、企業等單位成為大模型創新的主要推動者。根據不完全統計,僅在開源大模型項目commits參與者人數達32萬余人。

其二,受到中國大模型政策的鼓舞。中國大模型政策鼓舞了大模型企業,促進大模型行業應用。致使中國大模型從業者不斷地將大模型技術運用垂直領域,從而在應用領域等相關方面快速地創新。

其三,受益于中國創新環境的改善。“中國科技創新能力迅速提升”已成為國際廣泛共識。中國科學技術發展戰略研究院2023年11月21日發布的《國家創新指數報告2022—2023》顯示,中國創新能力綜合排名上升至第10位,較上期報告提升3位,是唯一進入榜單前15位的發展中國家,向創新型國家前列進一步邁進。

在世界知識產權組織的《全球創新指數》評價結果中,中國創新能力綜合排名由2012年的第34位提升至2023年的第12位。在歐盟委員會的《歐洲創新記分牌》評價體系中,中國創新能力2014年總體水平僅相當于歐盟的44%,2023年總體水平已達歐盟的95%。創新環境的不斷提升,致使我國大模型領域受益,并且取得巨大進步。

圖3-13:大模型創新環境支撐指數及增長率

數據來源:零壹智庫

04

國內外典型案例分析

國外大模型展現出強大的創新驅動力,通過跨學科合作和全球視野,不斷推動技術邊界,引領行業發展,同時在數據隱私和安全方面展現出高度適應性,保障了全球化合規運營。

國內大模型則緊密貼合本土市場和國家政策,通過深入實踐和技術創新,優化算法和數據處理能力,推動了金融、醫療、教育等行業的數字化轉型,同時積極探索與新興技術的結合,成為推動中國科技創新的關鍵力量。

(一)國外大模型創新典型案例:KAN

2024年5月,MIT劉子鳴的論文《KAN:科爾莫戈洛夫-阿諾爾德網絡》,引起了業內人士的高度關注。KAN網絡(Kolmogorov-Arnold Networks)是一種創新的神經網絡架構,其核心創新點主要體現在以下四個方面:

1.理論基礎由MLP轉為Kolmogorov-Arnold表示定理

該論文顛覆了 MLP 的數學地基——通用近似定理,采用的是Kolmogorov-Arnold表示定理。

KAN網絡的設計靈感來源于Kolmogorov-Arnold表示定理,該定理指出,任何多變量連續函數都可以表示為單變量連續函數和加法運算的組合。這一理論啟示KAN網絡的構建,使之能夠以全新的方式處理多元函數的學習問題。如圖4-1所示。

2.結構設計由多層感知器轉向可學習的B樣條激活函數

與傳統的多層感知器(MLP)不同,KAN網絡在權重上放置了可學習的激活函數,這些激活函數被參數化為B樣條函數。

在MLP中,激活函數是固定的,并位于神經元上,而權重則以多維度的參數矩陣形式存在于邊上。KAN的這種設計允許每個權重參數不再是一個單一的數值,而是一個函數,從而增強了網絡的表達能力。

3.參數更少精度更高

KAN網絡聲稱能夠以更少的參數量實現更高的精度。這是因為它使用B樣條函數作為激活函數,這些函數能夠以更少的參數表征復雜的函數關系。這種參數效率的提升是KAN網絡的一個重要優勢。

KAN能用更少的參數在數學、物理問題上取得更高精度。在各種任務中,包括回歸、解偏微分方程和持續學習,KAN的表現都優于MLP。

4.可解釋性實現零的突破

KAN網絡在模型的可解釋性方面表現出色。由于其結構的特點,KAN網絡能夠提供對模型決策過程的更深入理解。這種可解釋性對于需要高度透明度和可靠性的應用場景尤為重要。

KAN通過揭示組成結構和拓撲關系提供了可解釋性,為科學發現帶來了希望??赡茉跀祵W和物理研究中的輔助模型更受歡迎,幫助發現和尋找更基礎的數值規律。

圖4-1:MLP與KAN對比

資料來源:《KAN:科爾莫戈洛夫-阿諾爾德網絡》

(二)國內大模型應用典型案例:智譜清言

2024年1月16日,智譜 AI 團隊全面展示了其投身于大模型事業三年多來所積累的技術成果,并發布了新一代基座大模型 GLM-4。在自然語言處理領域展現出卓越的性能和豐富的功能,如圖4-2所示,體現了其在專業領域的特色:

圖4-2:智譜清言大模型界面

資料來源:智譜清言

1.強大的自然語言處理能力

一是先進的預訓練模型。智譜清言大模型基于海量文本數據進行預訓練,學習到了豐富的語言知識和語言規律,使其能夠理解和生成自然語言,并進行邏輯推理和連貫性表達。

二是多模態融合。智譜清言大模型融合了文本、圖像、語音等多種模態信息,能夠進行跨模態理解和生成,例如根據圖片生成描述性文字,或根據語音生成文本內容,提升了模型的表達能力和泛化能力。

三是可解釋性。智譜清言大模型內部包含多個注意力機制,這些機制能夠識別文本中與當前任務相關的關鍵信息,并將注意力集中在這些信息上。

通過可視化注意力機制,可以觀察模型在處理文本時關注哪些信息,從而理解模型的推理過程。注意力機制只能提供對模型決策過程的有限洞察,難以揭示模型內部的深層機制。

2.豐富的功能和應用場景

一是自然語言理解。智譜清言大模型能夠理解用戶輸入的自然語言指令,并執行相應的任務,例如信息搜索、問答、對話等,為用戶提供便捷的交互體驗。

二是自然語言生成。智譜清言大模型能夠根據用戶需求生成各種類型的文本內容,例如文章、報告、郵件、詩歌等,滿足用戶多樣化的內容創作需求。

三是智能對話系統。智譜清言大模型能夠與用戶進行流暢自然的對話,并根據用戶情感和意圖進行理解和回應,例如進行閑聊、咨詢、建議等,為用戶提供個性化的交互體驗。

四是文本摘要。智譜清言大模型能夠對長文本進行摘要,提取關鍵信息,幫助用戶快速了解文本內容。

五是機器翻譯。智譜清言大模型能夠進行多種語言的機器翻譯,幫助用戶跨越語言障礙,進行跨語言交流。

3.開放的生態系統

一是開源社區。智譜清言大模型開源了其代碼和數據,吸引了大量開發者參與模型開發和改進,促進了模型的迭代更新和性能提升。

二是API接口。智譜清言大模型提供了豐富的API接口,方便開發者將模型集成到自己的應用程序中,拓展模型的應用場景。

三是開發者工具。智譜清言大模型提供了開發者工具,例如模型訓練工具、模型評估工具等,方便開發者進行模型訓練、評估和優化。

智譜清言大模型在自然語言處理領域展現出卓越的性能和豐富的功能,體現了其在專業領域的特色。其強大的自然語言處理能力、豐富的功能和應用場景、開放的生態系統,使其成為推動自然語言處理技術發展和應用的重要力量。

(三)大模型應用典型案例:東方財富妙想大模型

東方財富妙想金融大模型是由東方財富自主研發的金融行業大語言模型,于2024年1月正式上線,在專業投資顧問服務、深度財經要聞分析、定制化財富管理、內容機會挖掘等金融場景上達到世界先進水平,如圖4-3所示,體現了其在專業領域的優勢與特色:

圖4-3:妙想金融大模型領先優勢

資料來源:東方財富

1.自研妙想大模型底座行業領先

一是金融數據特色挖掘:為了讓自研大模型充分學習金融知識,特別是細分深入的業務邏輯維度,自研大模型充分挖掘東方財富既有的結構化數據,將金融的業務、財務、基本面等數據構造成表格數據,在增加模型結構化數據解讀能力的同時強化金融能力。

二是金融詞表讓模型從源頭懂金融:研發團隊為自研大模型準備了高達12萬的金融詞表,覆蓋中英文金融詞匯、各類金融標的、常見指標等金融專業術語,以確保使大模型從根源上理解金融語義,生成內容更貼合金融場景邏輯。

三是創新模型訓練算法:在訓練過程中,自研大模型通過采用FlashAttention2異步優化、虛擬流水線等方法,顯著提高了超千卡集群的訓練速度,在模型訓練中達到了高效的顯卡利用率,高于業內平均水平,較高的訓練效率有效地支撐了模型的快速迭代。

團隊通過Scaling Law技術、模型架構優化、金融數據和通用數據的配比優化等多種創新算法提升模型訓練效率,極致提升模型的金融能力。

四是超千卡算力集群支撐快速迭代:自研大模型構建了超千卡級別的算力集群,可支撐千億級別的模型訓練規模。集群配套可伸縮分布式調度系統,配合高速大存儲,實現了自動故障檢測與應對,報警和訓練機器高速切換功能,能夠支撐起模型的快速迭代優化。

五是高性能推理支撐場景需求:自研大模型通過量化、模型算子優化等措施極大提高了速度,結合Paged Attention、Continuous Batching、張量并行推理等技術優化推理框架的性能,在金融場景下算力的利用率提高了數倍。

考慮到高性能推理算力的持續供給,更新優化了推理框架,能夠靈活適配多種異構算力。

2. 金融應用場景立體閉環

自研大模型致力于以底座能力賦能金融場景,為用戶創造更多價值。自研大模型發力投研、投顧、投教、投資等金融核心場景,基于資訊、數據、研究、交易、交流等用戶場景痛點,對智能問答和智能投研場景進行了個性化的功能設計,提供數據查詢、信息搜索、事件解讀、知識問答、智能選股、投資建議等數百種場景解決方案。

致力于成為用戶隨時隨地的金融百科全書和專業投資者的投研提效利器,貼心服務金融場景用戶。以下介紹3個主要場景模塊:

一是股票分析模塊。該模塊通過自研大模型提供個股的全面分析。基本面診股深入分析股票的盈利、成長、營運、現金獲取和償債能力,關注公司長期發展趨勢。

技術面診股側重短期行情、資金流向和技術信號,追蹤市場趨勢。消息面診股則關注公司相關新聞和公告,為投資決策提供信息支持。

綜合分析整合各維度,幫助投資者全面了解股票優缺點,做出更準確的投資預判。

二是特色分析模塊。該模塊深入挖掘投資者關注點,提供多角度智能分析。股票對比模塊通過多維度分析幫助投資者發現高成長性股票。估值分析模塊深入個股估值,提供多角度比較。

機構觀點模塊通過機構專業分析,減少信息不對稱風險,提供權威投資建議。漲跌分析模塊解析個股行情趨勢原因,幫助投資者理解市場規律。自選分析模塊對用戶自選股進行綜合分析,輔助規避風險,加深了解,優化投資決策。

三是內容資訊模型。妙想大模型融合多維度智能信息,提供實時股票報價、行業動態、板塊走勢等全面資訊。

大模型注重信息真實性,提供可追溯的來源,增加用戶信任。同時,妙想深入分析市場趨勢和歷史數據,預測影響,輔助決策。豐富的行情信息及時更新,幫助用戶把握投資機會。妙想旨在提供全面、真實、深入的信息服務,助力用戶快速了解市場并做出明智決策。

3. 專業數據積淀與應用生態

妙想大模型的數據庫是一個全面而專業的金融數據集合,覆蓋了多種市場和金融品種。

它包括滬深上市公司的詳盡數據,為投資者提供了上市公司的全面信息和關鍵指標;新三板數據,為關注中小企業的投資者提供了重要的市場信息;科創板數據,專注于科技創新型企業的動態和表現;公募基金數據,涵蓋了基金的凈值、持倉、業績等關鍵信息;投資理財數據,為用戶提供了理財產品的收益、風險評估等數據;綜合資訊數據,包括市場新聞、政策變動等,幫助用戶及時了解市場動態;債券數據,提供了債券市場的深度分析和估值信息;宏觀行業數據,涵蓋了宏觀經濟指標和行業發展情況,為宏觀經濟分析提供了數據支持;期權期貨數據,為衍生品市場的參與者提供了實時的交易數據和市場分析。

這些數據種類的廣泛性和深度,使得妙想大模型能夠為用戶提供一個全面、多維度的金融信息視角,滿足不同用戶的需求。

自主可控、數據安全、數據資產等數據優勢,確保了模型的獨立性、安全性和數據的豐富性。

自主可控意味著模型從數據生產到算法開發再到模型訓練均由東方財富自主完成,這不僅保障了技術的創新性,也確保了模型的適應性和靈活性。

數據安全方面,通過全量數據審核和用戶數據脫敏等措施,保護了用戶隱私和數據安全。而數據資產的豐富性,為模型的訓練和優化提供了堅實的基礎。這些優勢共同構成了東方財富妙想大模型在金融科技領域的核心競爭力。

目前東方財富妙想金融大模型已經為Choice金融終端的PC版和APP實現智能化賦能,服務了超過100萬位專業投資者,賦能20000余家金融機構,并獲得各類用戶的高度認可。

不僅能為專業投資者提升用戶體驗,也為金融機構提供了強大的技術支持,后續也會為更多金融工具實現賦能,進而推動金融行業的創新和發展。

(四)大模型應用典型案例:百融云創大模型

百融云創自2014年起專注于決策式人工智能(AI)技術的研發,奠定了其在AI領域的基礎。2017年底,公司拓展至生成式AI領域,專注于智能語音和多輪文本與語音對話技術的研發。

憑借對金融行業的深刻理解和前瞻洞察,于2018年3月在業內率先成立了人工智能實驗室。不久,實驗室升級為X-Dynamics(以下簡稱X動力),實驗室匯集了國內外眾多頂尖人工智能專家。X動力在決策式AI、生成式AI、隱私計算、計算語音、自然語言處理、知識圖譜等多個技術領域進行了深入的研究與實踐,積累了豐富的實戰經驗。

2018年,百融云創成功將這些技術應用于智能運營業務,推出了第一代AI Chatbot產品,標志著其技術在實際業務中的首次應用。隨著技術的不斷成熟,百融云創在2021年實現了這些技術的規?;虡I變現,進一步鞏固了其在AI領域的市場地位。

2023年,公司推出了具有里程碑意義的大模型BR-LLM,并以其為技術基礎框架,陸續開發了包括對話大模型VoiceGPT、自動編程模型BR-Coder、建模工具ORCA-GPT以及一站式大模型應用開發平臺——賽博坦。

圖4-4:賽博坦技術框架圖

資料來源:百融云創

1.行業專知與多模態融合

百融云創大模型的核心競爭力在于其深厚的行業專知(know-how)。公司不僅擁有龐大和復雜的網絡結構、眾多參數和深層數,更重要的是結合了算力、行業專知和模型精調的綜合能力。

行業專知決定了對行業洞察的深度和廣度,使得百融云創能夠在CRM等關鍵領域形成專有部署,并不斷優化模型。此外,百融云創的大模型與多模態技術有效融合,如數字員工和數字人產品,支持多國語言,提供接近真人的交互體驗,勝任多區域的營銷和接待任務。

2.檢索增強生成技術(RAG)

為了解決大模型可能產生的“幻覺”問題,百融云創引入了檢索增強生成技術(RAG)。RAG通過整合外部知識庫,使得大模型在生成答案前能夠檢索并參考外部信息,從而生成更準確和相關的內容。這一技術不僅提升了大模型的輸出質量,還避免了重新訓練的復雜性。

百融云創在Q&A場景中對模型能力進行了特別強化,使得大模型能夠學習到個性化、專業化的知識,顯著提高了答案的精準度和專業性。在第三方測評中,百融云創大模型的準確性和精準性在行業中處于領先地位,多項指標超越了ChatGPT 3.5。

3.綠色金融領域的精準識別服務

百融云創在綠色金融領域提供了一項創新服務,通過其強大的大模型技術,幫助金融機構精準識別和分類綠色項目。公司利用大模型處理和分析大量政策文件和金融標準,構建了一個全面且獨一無二的綠色金融知識庫。

這一知識庫不僅能夠實時更新以反映最新的政策調整,還能通過檢索增強生成(RAG)技術實現精準檢索和內容生成。這種服務大幅提升了識別效率,同時確保了業務流程的準確性和合規性,滿足了監管機構和金融機構的多維度管理需求。

4.證券市場的知識管理和智能決策支持

在證券市場,百融云創的大模型技術為證券公司提供了一站式的智能解決方案。通過本地化部署和微調,公司快速搭建了企業級知識庫,利用RAG技術對海量非結構化數據進行挖掘和分析,提煉關鍵信息,轉化為結構化數據。

這一服務不僅提高了信息處理的效率,還增強了決策的準確性和合規性。此外,百融云創的智能版面識別模型確保了從復雜文檔中提取信息的準確性,為證券公司提供了強有力的決策支持。

5.財富管理領域的個性化服務和客戶體驗提升

在財富管理領域,百融云創的大模型技術為金融機構提供了個性化的客戶服務和資產配置建議。通過生成式AI,公司能夠幫助從業人員自動化完成大量工作,同時根據客戶的具體情況量身定制投資組合方案。

這種服務不僅提升了客戶經營的效率,還通過提供專業且隨時可用的“私人顧問”服務,增強了客戶的體驗和信任。經過一段時間的運行,營銷響應率顯著提升,資產管理規模(AUM)也實現了大幅增長。

百融云創的大模型技術是人工智能在產業應用中的典范,通過技術創新和行業深度融合,公司不僅推動了金融服務的智能化,也為其他行業的數字化轉型提供了強有力的支持。

公司通過成立人工智能實驗室并升級為X-Dynamics,匯集了全球頂尖專家,深耕決策式AI、生成式AI等前沿技術,并在隱私計算、自然語言處理等領域積累了豐富經驗。

百融云創不僅在技術棧構建、大模型開發和RAG技術應用上展現了卓越創新能力,還在綠色金融精準識別、證券市場智能決策支持以及財富管理個性化服務等方面提供了創新解決方案,顯著提升了金融服務的效率、準確性和客戶體驗,推動了金融科技的實質性進步。

05

結論與展望

(一)結論

本報告構建了中國大模型發展指數,對我國大模型發展情況進行了量化研究。研究結果顯示,盡管面臨市場競爭、技術挑戰和政策約束等因素的影響,中國大模型整體上仍保持著積極的增長態勢,并呈現以下特點:

1.中國大模型的研發進展顯示出強勁的創新動力和市場適應性

盡管遭遇了市場競爭加劇、技術瓶頸和成本挑戰等問題,研發指數的持續增長反映了國內在大模型技術上的不斷突破和優化。特別是在算法創新、模型微調和多模態學習等方面,國內研究者和企業正積極探索適合本土需求的解決方案,以期在全球人工智能領域占據一席之地。

2.大模型的實踐應用在中國正逐漸拓展至更深層次和更廣泛的領域

從金融風控到醫療診斷,從智能客服到教育輔助,大模型正成為推動各行各業數字化轉型的關鍵力量。實踐指數的增長,盡管增速有所放緩,但反映了大模型應用正從初期探索轉向更加成熟和系統化的階段,其中,對垂直化和場景化應用的深入挖掘,成為推動大模型實踐應用穩步增長的重要因素。

3.國家層面對大模型的政策支持和創新生態的培育,為大模型的快速發展提供了堅實的基礎

政策指數的顯著增長和創新環境指數的突飛猛進,表明了政府在推動大模型發展方面的積極作用,包括算力基礎設施建設、人才培養計劃、數據開放政策以及鼓勵創新的法規框架等。此外,開源社區的活躍、產學研合作的加強以及風險投資的增加,共同構建了一個有利于大模型技術創新和產業應用的生態系統。

4.大模型創新涌現,應用場景不斷拓展

大模型應用場景不斷拓展,涵蓋辦公、制造、金融、醫療、政務等領域,并逐步深入到各個行業的核心環節,……。東方財富妙想金融大模型通過自研技術和專業金融數據的深度融合,實現了金融場景的智能化應用,提升了金融服務的效率和質量,成為金融科技領域的創新先鋒。金融大模型百融云創結合行業專知,引入檢索增強生成技術(RAG),融合多模態,為金融行業提供了精準、高效和個性化的服務。

(二)展望

1.中國大模型體指數持續增長

中國大模型指數,包括創新指數、應用指數、支持指數,將繼續保持較快增長。隨著AI技術的快速發展,中國在大模型領域的研究和應用正不斷加深。

中國的AI模型不僅數量還將增加,而且模型的質量也將不斷提升,這表明中國在AI大模型領域的創新能力正在迅速提升。社會公眾對大模型的熱情將持續高漲,活躍人數不斷增加,開源項目層出不窮。

2.市場規模與應用場景相互促進

中國市場規模的增長將繼續加速。中國AI大模型的市場需求源于多個領域,如辦公自動化、智能制造、金融科技、智慧醫療和電子政務等,這些領域的智能化轉型為大模型提供了豐富的應用場景。不同應用場景大模型的應用,提高我國大模型的總體應用規模。

我國大模型市場潛力巨大,預計到2028年,中國大模型產業市場規模將達到1179億元人民幣,顯示出巨大的市場潛力和增長空間,巨大的市場規模將為我國大模型應用提供廣泛應用場景。

3.中國在大模型的技術創新上不斷取得突破

特別是在自然語言處理、計算機視覺和語音識別等領域。

同時,隨著對模型可解釋性的重視,中國正加強對可解釋性AI技術的研究,以提高模型的透明度和可信度,這將有助于大模型在金融、醫療等敏感領域的廣泛應用將更加緊密地結合,可解釋性技術得到發展。

4.中國算力資源和人才隊伍建設將得到進一步加強

為了支撐大模型的發展,中國正在加速構建高性能計算中心,提升算力水平。例如,中國的AI模型評測結果顯示,模型在不同能力維度上的表現優異,這背后離不開強大的算力支持。同時,中國正通過教育體系和實訓基地的建設,培養更多高素質的AI專業人才,為大模型的發展提供堅實的智力支持。

注釋:

原文標題:中國大模型發展指數(第1期)

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章