首頁 > AI資訊 > 最新資訊 > 自然語言處理領(lǐng)域新突破,理光在ACL2024SMM4H競(jìng)賽中榮獲第一

自然語言處理領(lǐng)域新突破,理光在ACL2024SMM4H競(jìng)賽中榮獲第一

新火種    2024-11-15

近日,計(jì)算語言學(xué)和自然語言處理領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議The 62nd Annual Meeting of the Association for Computational Linguistics(以下簡(jiǎn)稱ACL)落下帷幕,在其主辦的官方比賽Social Media Mining for Health Research and Applications Workshop and Shared Tasks 2024(以下簡(jiǎn)稱SMM4H)中,理光中國(guó)研究院自然語言處理(NLP)團(tuán)隊(duì)以其卓越的研究成果,獲得共享競(jìng)賽任務(wù)提取和規(guī)范化英文推文中的藥物不良事件(ADEs)賽道的第一名,并受邀分享了技術(shù)方案。

理光中國(guó)研究院團(tuán)隊(duì)在本屆SMM4H 2024共享競(jìng)賽任務(wù)中選擇的競(jìng)賽課題是“提取和規(guī)范化英文推文中的藥物不良事件(ADEs)”。這項(xiàng)任務(wù)的核心挑戰(zhàn)在于從充滿噪音的社交媒體推文中,精準(zhǔn)地提取出由藥物引起的不良反應(yīng),并將這些信息準(zhǔn)確映射到MedDRA詞典中的標(biāo)準(zhǔn)化醫(yī)學(xué)術(shù)語。

*競(jìng)賽任務(wù)描述

競(jìng)賽中,參賽團(tuán)隊(duì)在充分考慮了非結(jié)構(gòu)化數(shù)據(jù)的復(fù)雜性、噪音和背景信息的干擾、多義性問題以及數(shù)據(jù)稀疏性等客觀問題后,通過一系列創(chuàng)新技術(shù)的應(yīng)用顯著提高了不良事件信息提取和術(shù)語規(guī)范化的性能:

1.提出了一個(gè)包含ADEs抽取、MedDRA術(shù)語檢索和MedDRA術(shù)語過濾模塊的體系架構(gòu),有效地緩解了傳統(tǒng)方法使用的流程所帶來的誤差傳播,提升了術(shù)語規(guī)范化的準(zhǔn)確性。

2.創(chuàng)新性地提出了四種基于大語言模型的數(shù)據(jù)增強(qiáng)方法,充分發(fā)揮了大語言模型生成高質(zhì)量文本內(nèi)容的能力。

3.通過使用醫(yī)學(xué)領(lǐng)域訓(xùn)練樣本對(duì)文本嵌入模型進(jìn)行微調(diào),顯著提高了MedDRA術(shù)語的召回率。

在技術(shù)層面實(shí)現(xiàn)突破的同時(shí),理光團(tuán)隊(duì)本次競(jìng)賽的研究成果在公共健康領(lǐng)域具備一定的現(xiàn)實(shí)意義與應(yīng)用潛力。豐富藥物評(píng)估視角,該系統(tǒng)通過分析社交媒體反饋,補(bǔ)充了臨床試驗(yàn)中未報(bào)告的藥物副作用信息,為藥物安全性評(píng)估提供了新的視角;實(shí)時(shí)監(jiān)測(cè)與數(shù)據(jù)支持,系統(tǒng)能夠?qū)崟r(shí)監(jiān)測(cè)公共健康趨勢(shì),并通過社交媒體數(shù)據(jù)分析,快速反映藥物使用情況和風(fēng)險(xiǎn),為公共衛(wèi)生決策提供數(shù)據(jù)支持;公共健康風(fēng)險(xiǎn)管理,對(duì)于制藥公司和監(jiān)管機(jī)構(gòu)系統(tǒng)提供了實(shí)時(shí)監(jiān)控社交媒體上的ADEs信息的能力,有助于及早發(fā)現(xiàn)并管理潛在的公共健康風(fēng)險(xiǎn)。

*理光中國(guó)研究院NLP團(tuán)隊(duì)成員在ACL 2024現(xiàn)場(chǎng)分享技術(shù)方案

理光以遠(yuǎn)見卓識(shí)引領(lǐng)技術(shù)革新,致力探索科技創(chuàng)新最前沿。本次獲獎(jiǎng)不僅彰顯了理光在自然語言處理領(lǐng)域不斷銳意進(jìn)取和深厚技術(shù)積累,也展現(xiàn)了人工智能技術(shù)在解決現(xiàn)實(shí)世界問題中的潛力和價(jià)值。展望未來,理光將持續(xù)引領(lǐng)技術(shù)進(jìn)步與應(yīng)用拓展,攜手全球合作伙伴積極探索、不懈挑戰(zhàn),在數(shù)字化浪潮中高揚(yáng)人工智能之帆,賦能各行各業(yè)共赴可持續(xù)未來。

背景:

一年一度的ACL大會(huì)是自然語言處理領(lǐng)域的頂級(jí)會(huì)議,其主辦的SMM4H是一個(gè)關(guān)注社交媒體數(shù)據(jù)挖掘在健康研究和應(yīng)用中的年會(huì)和競(jìng)賽活動(dòng)。今年第9屆SMM4H以"Large Language Models (LLMs) and Generalizability for Social Media NLP"為主題,專注于深入探討大型語言模型(LLMs)在社交媒體自然語言處理(NLP)任務(wù)中的應(yīng)用及泛化能力,旨在推動(dòng)社交媒體數(shù)據(jù)分析在健康科學(xué)領(lǐng)域的創(chuàng)新與發(fā)展。

MedDRA詞典(Medical Dictionary for Regulatory Activities)是一個(gè)國(guó)際權(quán)威的標(biāo)準(zhǔn)化醫(yī)學(xué)術(shù)語集。它的存在極大地促進(jìn)了全球不同國(guó)家和地區(qū)的藥品監(jiān)管機(jī)構(gòu)、制藥企業(yè)、臨床研究者以及醫(yī)療保健專業(yè)人員之間的有效溝通和數(shù)據(jù)交換。通過使用MedDRA詞典,可以確保醫(yī)學(xué)信息的準(zhǔn)確性和一致性,從而在全球范圍內(nèi)實(shí)現(xiàn)醫(yī)學(xué)數(shù)據(jù)的無縫對(duì)接和交流。

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章