首頁 > AI資訊 > 最新資訊 > 覆蓋97.6%泌尿就醫人群,螞蟻集團開源首個醫療專科推理數據集

覆蓋97.6%泌尿就醫人群,螞蟻集團開源首個醫療專科推理數據集

新火種    2024-01-04

12月28日,由信通院主辦的“虹橋之源”大模型驅動數字經濟新生態峰會在上海召開。會上,螞蟻集團商業機器智能部總經理顧進杰介紹螞蟻正式開源國內首個醫療專科推理數據集,這將提升大模型在醫療領域的專業性。

圖說:螞蟻集團商業機器智能部總經理顧進杰介紹國內首個醫療專科推理數據集

在醫療行業,通用型語言模型在應對醫療問診時,會直接給出答案,而醫生則會根據專業知識進行反復的癥狀探討,才能給出答案。另外,大模型的幻覺問題和推理能力不足,當前高質量的中文醫學專科數據集又較為稀缺,這對訓練出色的醫療領域大模型提出了挑戰。

為克服這些難題,螞蟻集團與上海仁濟醫院泌尿科專家團隊聯合研發,基于醫生團隊臨床經驗,通過構造模擬病例數據的方式,推出了首個中文醫療專科問答推理數據集RJUA-QA,這也是業內首個臨床專科數據集。

數據集由訓練、驗證、測試三部分組成,包含2132個問答對,每個問答對由醫生根據臨床經驗編寫的問題、專家提供的回答以及用于幫助推理的上下文構成,病種覆蓋了97.6%以上的泌尿科就醫人群,能真實復刻診療場景。數據集能提高大模型在醫療診斷推理方面的能力,并作為在嚴肅可控場景下應用的評測基準。

顧進杰進一步介紹了螞蟻百靈大模型在醫療領域的技術進展。“專業性、可控性、輕量化是大模型技術在醫療行業落地的三個重要挑戰和機會。”顧進杰說。

專業性上,由于醫療行業有超百個科室,每個專科和疾病,都需要專業的調試。螞蟻集團聯合醫療專家共同研發了多模態醫療知識引擎,進一步推動中國專業醫療數據集的構建與開放。

在可控性方面,百靈大模型結合知識圖譜技術,讓大模型的每一個回答都有據可依。“生成內容可以滿足不同醫院、不同科目的定制需求,包括風格與調性等”,顧進杰說。螞蟻集團在超大規模圖學習和知識圖譜技術長期積累,今年聯合OpenKG發布的OpenSPG開源項目,重新定義了工業界的知識圖譜語義架構,知識檢索增強技術也是大幅提升大模型正確性與可控性的重要課題。

醫療行業有數據隱私、專業知識和系統自主性的需求,考慮到機構的算力成本與便捷部署,百靈大模型還攻堅了輕量化技術。在12月份開源的模型輕量化框架(PIA)中,集成了模型剪枝、壓縮、量化、推理加速等全鏈路環節的優化,具備開箱即用、功能無損、低代碼接入等優點,可在天級別完成10倍以上壓縮比。

目前,螞蟻百靈大模型在中英文的醫療考試以及基準測試達到或超過了GPT4水準,例如,在中文醫療LLM評測榜單promptCBLUE上,取得A榜第一,B榜第二的成績;在國際醫療問答榜單PubMedQA中,以80.6%的準確率取得了前五的成績,而且是前十中參數量最小的模型,更適合被機構部署和使用。

本次峰會也是2024中國信通院ICT+深度觀察報告會上海分會場,以“智能涌現,創新生態”為主題,共同探索大模型的前沿技術創新和落地應用實踐,為行業發展提供新思路、新方法、新路徑。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章