AIforScience開源新項目「PolymathicAI」,YannLeCun擔任顧問
編輯 | 紫羅
過去幾年,通過在大量不同的數據集上訓練通用模型,視覺和自然語言處理 (NLP) 機器學習領域取得了重大進展。這導致了「基礎模型」的出現。
例如,「大型語言模型」引發了 NLP 的復興:微調或提示通才模型現在已成為標準做法,而不是從頭開始訓練專業模型。
然而,機器學習在科學數據集上的應用尚未發生類似的范式轉變。
這就是「Polymathic AI」(博學人工智能)研究計劃尋求解決的一個未實現的機會。
圖靈獎得主、Meta 首席科學家 Yann LeCun 表示:「很高興成為 AI for Science 新計劃(Polymathic AI)的顧問」。
劍橋大學 AI+天文/物理助理教授 Miles Cranmer 在 twitter 也分享了其參與的一項新計劃:Polymathic AI!
「我們正在開發科學[數據]的基礎模型,以便它們可以利用跨學科的共享概念。」
網友紛紛表示:「這太酷了!這看起來很有趣!驚人的研究......」
Polymathic AI 計劃的目標是加速開發針對數值數據集和科學機器學習任務定制的多功能基礎模型。
面臨的挑戰是建立人工智能模型,利用來自異構數據集和不同科學領域的信息,與自然語言處理等領域相反,這些模型不共享統一的表示(即文本)。
然后,這些模型可以用作強大的基線,或者由科學家針對特定應用進行進一步微調。這種方法有可能通過提供現成的模型來實現科學中人工智能的民主化,這些模型對于共享的一般概念(如因果關系、測量、信號處理,甚至更專業的共享概念(如波))具有更強的先驗(即背景知識)。否則這些概念需要從頭開始學習。
為了實現這一目標,該研究計劃匯集了一支由純機器學習研究人員和領域科學家組成的團隊,涵蓋各個學科。此外,還接受由世界領先專家組成的科學咨詢小組的指導。
研究團隊。
科學咨詢小組。
參與機構。
建立真正的科學基礎模型需要大量的初步研究。研究計劃正集中精力研究這個領域的基礎知識,迄今為止已經發表了關于關鍵架構組件的研究,從適應數值數據的語言模型到展示在不同物理系統上訓練的代理模型的可轉移性,再到學習多模態科學數據的共享嵌入。
該研究計劃對這個研究方向重新定義科學機器學習前景的潛力感到興奮,而 Polymathic AI 代表了實現這一目標的雄心勃勃的一步。
項目開源地址:https://github.com/PolymathicAI/
參考內容:https://polymathic-ai.org/blog/announcement/
https://polymathic-ai.org/
https://twitter.com/MilesCranmer/status/1711429121220465037
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。