首頁 > AI資訊 > 最新資訊 > 《科學》:AI有望幫助消化海量論文?仍面臨技術和法律障礙

《科學》:AI有望幫助消化海量論文?仍面臨技術和法律障礙

新火種    2023-11-27

·“LLM(大型語言模型)肯定會變得更好。但現在,它們有很多局限性。它們提供了錯誤的信息。科學家們應該非常清楚這一點,并仔細檢查它們的輸出。”

當地時間2023年11月21日,據《科學》(Science)雜志報道,人工智能(AI)有望幫助科研人員消化大量論文,但面臨技術和法律障礙。

約瑟夫·吉迪奧蒂斯(Iosif Gidiotis)今年開始攻讀瑞典皇家理工學院(KTH Royal Institute of Technology)教育技術博士學位,獲悉AI驅動的新工具可以幫助“消化”文獻,很感興趣。

在全球科學領域,去年共發表了近300萬篇論文。在論文數量激增的情況下,AI研究助理“聽起來很棒”。

吉迪奧蒂斯希望AI能夠找到與其研究問題更相關的論文,并總結出亮點。然而事情并不如他想象中順利。當他嘗試使用一種名為Elicit的AI工具時,他發現只有部分相關,而且Elicit的摘要不夠準確,無法滿足他的需求。“獲得Elicit的結果后,你的直覺是要自己閱讀原文來驗證摘要是否正確,所以它并不能節省時間。”

Elicit“表示”,它正在繼續為25萬普通用戶改進算法。在一項調查中,該工具平均每周為人們節省90分鐘的閱讀和搜索時間。據悉,Elicit由一家非營利性研究組織創建于2021年,旨在幫助科學家瀏覽文獻。

“這些平臺呈爆炸式增長。”安德里亞·基亞雷利(Andrea Chiarelli)說,她在研究咨詢公司(Research Consulting)的出版工作中關注AI工具,然而,這些工具的生成系統容易產生虛假內容,并且許多搜索到的論文都需要付費。

基亞雷利表示:“很難預測哪些AI工具會占上風,而且有一定程度的炒作,但它們顯示出巨大的前景。”

與引發全球關注的 ChatGPT(OpenAI研發的一款聊天機器人程序)和其他大語言模型 (LLM) 一樣,一些新工具在大量文本樣本上進行“訓練”,學習識別單詞關系,這些關聯使算法能夠對搜索結果求和。它們還根據論文中的上下文識別相關內容,相較于僅使用關鍵字查詢,會產生更廣泛的結果。

從頭開始培訓大語言模型對大部分組織來說太過昂貴,因此Elicit和其他AI工具使用開源的大語言模型,而在其用于“訓練”的文本中,許多是非科學的。

有些AI工具走得更遠。例如,Elicit 按概念組織論文,查詢“過多咖啡因”,可以出現關于“減少嗜睡”和“損害運動表現”的單獨論文集。高級版本每月收費10美元,還可使用額外的內部編程來提高準確性。

另一個名為 Scim 的工具有助于將讀者的目光吸引到論文最相關的部分。該工具是非營利性組織——艾倫AI研究所(Allen Institute for AI)創建的語義閱讀器(Semantic Reader)工具的一項功能,它像一個自動墨跡熒光筆,用戶可以對其進行自定義,應用于有關新穎性、目標和其他主題的陳述。

“它提供了一篇論文是否值得閱讀的快速診斷和分類,這非常有價值。”美國密歇根大學(University of Michigan)的信息科學家艾達(Eytan Adar)說,他試用過早期版本。還有一些工具可以注釋摘要,允許用戶自己判斷準確性。

為了盡量避免產生錯誤的響應,艾倫研究所(Allen Institute)使用受過科學論文“訓練”的大語言模型來操作語義閱讀器,但這種方法的有效性很難衡量。美國麻省理工學院(Massachusetts Institute of Technology)的計算機科學家邁克爾·卡賓(Michael Carbin)說:“這些都是邊緣的技術難題。”

艾倫研究所語義學者(Semantic Scholar)論文庫的首席科學家韋爾德(Dan Weld)的說:“目前,我們擁有的最佳標準是讓受過良好教育的人來觀察AI輸出并仔細分析它。”

該研究所已經收集了300多名付費研究生和數千名志愿測試人員的反饋。質量檢驗顯示,將Scim應用于非計算機科學論文會產生故障,因此該研究所目前僅為大約55萬篇計算機科學論文提供Scim。

其他研究人員強調,只有當開發人員和用戶能夠訪問論文全文,為搜索結果和內容分析提供信息時,AI工具才能發揮潛力。澳大利亞皇家墨爾本理工大學(Royal Melbourne Institute of Technology,RMIT)計算語言學家卡琳·弗斯普爾(Karin Verspoor)說:“如果我們不能訪問文本,那么我們對這些文本中所捕獲的知識的看法就很有限。”

全球最大的科學出版商愛思唯爾(Elsevier)也將其AI工具限制在論文摘要上。今年8月,這家商業公司在其Scopus數據庫中首次推出了AI輔助搜索功能,該數據庫列出了9300萬篇研究出版物,成為最大的研究出版庫之一。為了響應查詢,其算法會識別最相關的摘要,并使用 ChatGPT來提供整體摘要。

Scopus AI還按概念對摘要進行分組。目前,用戶的反饋是:這種方法足以“幫助跨學科領域的研究人員快速了解特定主題” 。

艾倫研究所采取了不同的方法:它與50多家出版商談判達成協議,允許其開發人員對付費論文的全文進行數據挖掘。韋爾德說,幾乎所有的出版商都免費提供訪問權限,因為AI為他們帶來流量。即便如此,根據許可限制,Semantic Reader用戶只能訪問Semantic Scholar的6000萬篇全文論文中的800萬篇全文。

實現大規模的數據挖掘還需要讓更多的作者和出版商采用非PDF格式,以幫助機器有效地消化論文的內容。美國白宮2022年的一項指令要求,由聯邦資金制作的文件必須是機器可讀的,但各機構尚未提出細節。

盡管面臨挑戰,計算機科學家已經在尋求開發更復雜的AI,以從文獻中收集更豐富的信息。他們希望收集線索以加強藥物發現并不斷更新系統評價。例如,由美國國防高級研究計劃局(Defense Advanced Research Projects Agency)支持的研究探索了一種能夠自動生成科學假設的系統。

目前,使用AI工具的科學家需要保持合理的懷疑態度,美國馬薩諸塞大學阿默斯特分校(University of Massachusetts Amherst)交互式信息訪問系統研究者哈米德·扎馬尼(Hamed Zamani)說:“LLM肯定會變得更好。但現在,它們有很多局限性。它們提供了錯誤的信息。科學家們應該非常清楚這一點,并仔細檢查它們的輸出。”

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章