人工智能:人類智慧的倍增器

伴隨著技術平等化的步伐,曾經局限在專業范圍內的人工智能正飛速步入人們的日常生活。如今,人們不僅在經濟、教育和醫療等領域中可以看到人工智能的作用,而且在科學研究的最前沿,人工智能也發揮著不可替代的重要作用。近日,英國《經濟學家》刊發專題《科學中的人工智能:更快、更好、更高效》(AI in Science: Faster, Better, and More Productive),介紹并展望了人工智能在科研中的作用和潛力。
2019年,麻省理工學院的科學家們在現代醫學領域做了一件非同尋常的事情,他們發現了一種新的抗生素鹽酸鹽。今年5月,另一個研究小組發現了另一種抗生素苦杏仁素。這兩種化合物可用于對抗兩種已知最危險的抗生素耐藥細菌,而且都是使用人工智能模型搜索數百萬種備選化合物后確定的對“超級細菌”最有效的化合物。藥物發現并不是唯一受到人工智能影響的領域。研究人員正在解決許多世界上最復雜和最重要的問題:從預測天氣到尋找電池新材料太陽能板新材料,再到控制核聚變反應,這些領域都在求助于人工智能,以增強或加速進步。
●人工智能應用廣泛
人工智能助力研發的潛力是巨大的。總部位于倫敦的人工智能實驗室谷歌深度大腦的聯合創始人戴密斯·哈薩比斯(Demis Hassabis)表示:“人工智能可能迎來一場新的發現復興,充當人類智慧的倍增器。”他把人工智能比作望遠鏡,可以讓科學家比用肉眼看得更遠,了解更多。
盡管自1960年代以來,人工智能一直是科學工具包的一部分,但在大部分時間里一直停留在科學家熟知的計算機代碼學科范圍內,例如粒子物理學或數學。但根據澳大利亞科學機構CSIRO的數據,到2023年,隨著深度學習的興起,99%以上的研究領域都在產生與人工智能相關的結果。倫敦阿蘭·圖靈研究所首席科學家馬克·吉羅拉米(Mark Girolami)表示:“技術的平等化是導致這一現象的原因。”過去需要攻讀計算機科學學位和掌握一系列晦澀編程語言才能完成的工作,現在可以通過用戶友好的人工智能工具來完成,比如向ChatGPT進行查詢。科學家們可以很容易地接觸到這個超人般的研究助手,它可以解方程,并不知疲倦地篩選大量數據,尋找其中的規律或相關性。
利物浦大學的研究人員使用了一種被稱為“自動編碼器”的人工智能模型,在世界上最大的無機晶體結構數據庫(ICSD)中搜索所有20萬種已知的穩定晶體化合物,成功地將科學家在實驗室測試的候選材料從數千種減少到只有5種,節省了大量時間和金錢。
人工智能也可以用于預測。科學家一直不知道蛋白質是如何折疊的,但在2021年,谷歌深度大腦開發了AlphaFold,這是一個自我學習的、僅從氨基酸序列就能預測蛋白質結構的模型,它已經建立了一個包含超過2億個預測蛋白質結構的數據庫。牛津大學生物化學家馬修·希金斯(Matthew Higgins)使用它預測出了蚊子體內一種蛋白質的形狀,這種蛋白質對蚊子經常攜帶的瘧疾寄生蟲具有重要作用。然后,他又結合AlphaFold的預測,找出了蛋白質的哪些部分最容易被靶向藥物攻克。另一個團隊使用AlphaFold在短短30天內發現了一種影響肝癌增殖方式的蛋白質結構,從而為設計一種新的靶向治療方法打開了大門。
人工智能在復雜的計算機模擬提速方面也被證明行之有效。預測天氣的超級計算機價格昂貴,消耗大量電力,并且耗時長。如今,氣候科學家和私營公司開始使用機器學習來加快模型計算的速度。由中國華為公司開發的人工智能“盤古氣象大模型”(Pangu-Weather)可以提前預測一周天氣,速度快,成本低。美國芯片制造商英偉達(Nvidia)開發的FourCastNet模型能提供預測山洪暴發等自然災害的重要信息。英偉達還宣布計劃建造一個地球的數字孿生體,名為“地球—2”,希望能夠提前預測未來幾十年氣候變化。
與此同時,試圖利用核聚變力量的物理學家一直在使用人工智能來控制復雜設備,由谷歌深度大腦和瑞士洛桑聯邦理工學院的科學家建立的人工智能控制系統可以在計算機模擬中嘗試不同形狀的等離子體,并計算出如何最好地加以實現。實驗室工作還可以實現自動化和加速化。“自動駕駛實驗室”可以使用機械臂執行實驗,然后分析結果。自動化可以加快發現新化合物或用新方法制造舊化合物的速度,提速可達一千倍。
●生成式AI受年輕人歡迎
隨著2022年ChatGPT的到來,生成式人工智能迅速進入公眾視野,ChatGPT有兩個主要的科學用途。首先,它可以用來生成數據。就像大型語言模型(LLM)通過預測序列中下一個最佳單詞可以生成流暢的句子,生成分子模型能夠一個原子一個原子地構建分子。大型語言模型將自學的統計數據和從互聯網上精選的數萬億字的培訓文本結合起來,寫作方式幾乎近于人類。在已知藥物及其特性的龐大數據庫的訓練下,“從頭開始的分子設計”模型可以找出哪種分子結構最有可能起什么作用。總部位于加州的Verseon制藥公司已經用這種方法研制出了一些候選藥物,其中一些正在動物身上進行試驗,還有一種精確抗凝血劑正處于臨床試驗的第一階段。
ChatGPT的第二種科學用途是滑鐵盧大學心理學家伊戈爾·格羅斯曼(Igor Grossmann)提出的大型語言模型更具未來主義色彩的用途。如果大型語言模型能夠被真實或虛構的背景故事所激勵,從而準確反映人類參與者可能會表達出的言語,那么從理論上講,大型語言模型可以取代焦點小組,或者被用作經濟學研究的代理人。大型語言模型可以接受各種不同角色的訓練,然后其行為可以用來模擬實驗,如果有意義,實驗結果可以在人類實驗對象身上得到證實。
大型語言模型讓科學家的研究變得更高效了。根據代碼托管平臺GitHub的數據,程序員如果使用類似Copilot的工具可以將編寫軟件的速度提高55%。在開始一個項目之前閱讀一個領域的背景研究可能是一項艱巨的任務,因為現代科學文獻的規模太大,很難駕馭。美國非營利研究實驗室Ought開發的免費在線人工智能工具Elicit可以幫助研究者利用大型語言模型梳理堆積如山的研究文獻,并比人類更快地總結出重要的內容。這已經被學生和年輕科學家使用,這些人發現,在面對汗牛充棟的文本時,大型語言模型可以幫助他們找到可以引用的論文,或者確定研究方向。大型語言模型甚至可以幫助研究人員從數以百萬計的文檔中提取結構化信息,例如使用特定藥物完成的每個實驗。
人工智能還可以擴大學科內知識的獲取。位于日內瓦的歐洲核子研究中心(CERN)的大型強子對撞機(Large Hadron Collider)的每個探測器都需要有自己的專業操作和分析團隊。這就需要來自每個探測器的物理學家聚在一起分享專業知識,對數據進行組合和比較。加州大學物理學家米格爾·阿拉蒂亞(Miguel Arratia)建議使用人工智能來整合來自多個基礎物理實驗(甚至宇宙學觀測)的測量結果,以便理論物理學家可以在自己的工作中快速探索、組合和再利用這些數據。(社會科學報社融媒體“思想工坊”出品 全文見社會科學報及官方網站)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。