大模型·大未來丨垂直大模型創新應用答辯順利在蘇州舉行
如果說ChatGPT讓全球人民直接感受到了人工智能的過人之處,那中國目前一百多個陸續公開發布的人工智能大模型,即“百模大戰”,也許會以難以想象的方式,在未來改變你我生活的方方面面。
這一百多個人工智能大模型中,既包括通用大模型,又包括垂直大模型,分別作用于未來生活的地基與專業賽道。無論通用還是垂直,這些大模型的智能程度如何測評,修正改進該往何處去,是行業內重要而緊急的問題。
2023人工智能大模型基準測試科創發展大會暨中西部數字經濟大會分別從兩個賽道對行業展開了評測。截至12月20日,垂類大模型報名企業近20家,它們分布金融、教育、電商、醫療等各個領域,經過評委專家的初篩,最終選出13家優秀大模型企業參加了評委線下答辯環節。
12月23日,在蘇州工業園區東沙湖基金小鎮元禾辰坤,評委與13家企業分別開展了深度的交流,當前創新應用優秀案例的評選名單已經產生,將于12月28日在2023人工智能大模型基準測試科創發展大會暨中西部數字經濟大會上揭曉。
多維度評估
綜合考量企業的創新能力和發展潛力
相比通用大模型的普適性,垂直大模型更專精于一個領域,對其測評既需要專業的行業知識,也需要市場化的豐富經驗。
10月22日,大模型基準評測專家委員會第一次評測預備會在成都成功召開。會上,專家委員會圍繞評測方法、評測維度、評測的主體范圍等細節問題展開了激烈討論,并結合各方意見形成了大會測試標準,也是國內首次對垂直大模型進行評測。
此次評測維度包括:項目團隊背景、市場潛力、技術水平評估、商業模式可行性和融資安排評估等多個方面,綜合考量參與評測的項目團隊的行業經驗、專業背景、團隊分工;項目目標市場需求空間及潛力;產品技術水平、相比競爭對手的優勢及創新性、產業化可行性;以及盈利模式可行性、可持續性;項目投資計劃和進度安排合理性等方面。
線下答辯采取評委現場評估打分的形式,由一名主席以及多名技術專家、企業專家、投資人組成決賽評委各自對參評企業進行打分,計算截尾平均分數,最終決出此次垂直大模型創新應用優秀案例的名單。
參與此次垂直大模型創新應用優秀案例的評選專家,既有來自人工智能行業的資深工程師與專家學者,又有來自創投和咨詢行業的專業人士。他們分別從各自行業出發,多維度評選出更符合行業需求的垂直大模型應用優秀案例。
以下是此次垂直大模型創新應用評測評委(排名不分先后):
【天津大學“語言智能與技術”中外聯合研究中心主任、智能與計算學部教授 熊德意】
【中國軟件評測中心(工業和信息化部軟件與集成電路促進中心) 梁斌】
【上海交通大學約翰·霍普克羅夫特計算機科學中心 林洲漢】
【鄭州大學計算機與人工智能學院 昝紅英】
【馳星創投董事總經理 李一心】
【德勤中國資本市場服務部上市業務華西區主管合伙人 劉洋】
各領域垂直大模型齊聚一堂
多維度評測交流助推行業進步
中國軟件評測中心(工業和信息化部軟件與集成電路促進中心)梁斌告訴紅星新聞:“參與此次垂直大模型答辯評審會,我最大的感受是各行各業垂直領域大模型都在蓬勃發展。這些企業對于大模型的行業應用探索都很深入,但是針對自身大模型的檢驗檢測技術的重視程度還需加強。在參與答辯的13家企業中,上海財經大學金融大模型實驗室團隊不僅開發了FinEval金融大模型,還同步構建了評估金融大模型的‘評測數據集’。這是一個讓我覺得特別亮眼的地方。我認為無論是垂直還是通用的大模型,在發展大模型行業應用的同時,還應關注到相應大模型的檢驗檢測技術。這兩者要如同矛與盾,相克相生,才能共同成長。”
馳星創投董事總經理李一心向紅星新聞表示:“這次參與的垂直大模型應用方向涵蓋了包括金融、工業、法律、醫療、營銷和零售等在內的各個場景。基礎大模型在知識復刻的商業生態中,占據了核心位置,短期來看還有Scale-Up的可能性。而對垂直大模型公司來說,重要是找準差異化的生態位置,抓住AI創造的增量價值,即便是GPT4這種水平的多模態模型離直接應用都還有比較遠的距離。數據壁壘、模型finetune水平和工程能力都會是創業公司的機會?!?/p>
截至發稿,此次垂直大模型創新應用優秀案例名單已經產生,該名單將為市場提供多元、客觀的垂直大模型性能評估,促進行業創新,共同推動人工智能技術進步。讓我們共同期待12月28日,該名單在2023人工智能大模型基準測試科創發展大會暨中西部數字經濟大會上揭曉。
以下是此次參與答辯的企業及大模型產品(排名不分先后):
1 摸象科技:金磐大模型 (零售金融行業)
2 達觀數據:達觀曹植大語言模型 (金融行業)
3 微盟集團:微盟WAI (電商行業)
4 賽靈力:實時數字互動人
5 左手醫生:GPT診前服務(智能云客服行業)、專家數字分身(醫療行業)
6 得理科技:得理法律大模型(法律行業)
7 極睿科技:ECGPT+FashionCLIP(電商行業)
8 中科聞歌:雅意2.0(媒體、輿情、金融等行業)
9 北京交通大學交通大模型團隊:多模態交通大模型(交通領域)
10 曉多科技:曉模型XPT(電商行業)
11 上海財經大學金融大模型實驗室團隊:FinEval (金融行業)
12 考拉悠然:悠然產業通用大模型(企業服務)
13 盛世君聯:干濕試驗結合的大分子AI藥物研發平臺BioAI(生物醫藥行業)
紅星新聞記者 程璐洋 彭運
編輯 余冬梅
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。