發(fā)現(xiàn)38萬種新材料、17天自主合成41種新化合物,DeepMind一日兩篇論文登上Nature
編輯 | 蘿卜皮
從計算機(jī)芯片、電池到太陽能電池板等現(xiàn)代技術(shù)都依賴于無機(jī)晶體。開發(fā)這些新技術(shù),所需的晶體必須穩(wěn)定,否則材料就會分解,而每個新的、穩(wěn)定的晶體背后可能需要研究人員數(shù)月或者更久的艱苦實驗。
Google DeepMind 材料團(tuán)隊分享了 220 萬顆新晶體的發(fā)現(xiàn),相當(dāng)于近 800 年的知識。該團(tuán)隊推出了新的深度學(xué)習(xí)工具,用于材料探索的圖網(wǎng)絡(luò) (GNoME),可通過預(yù)測新材料的穩(wěn)定性來顯著提高發(fā)現(xiàn)的速度和效率。
使用 GNoME,科學(xué)家可以使人類已知的技術(shù)上可行的材料數(shù)量成倍增加。在其 220 萬個預(yù)測中,有 38 萬個是最穩(wěn)定的。這些候選材料中有潛力開發(fā)未來變革性技術(shù),包括超導(dǎo)體、超級計算機(jī)供電和下一代電池等等。
GNoME 展示了利用人工智能大規(guī)模發(fā)現(xiàn)和開發(fā)新材料的潛力。世界各地實驗室的外部研究人員在并行工作中獨立實驗創(chuàng)建了 736 個此類新結(jié)構(gòu)。
勞倫斯伯克利國家實驗室的研究團(tuán)隊與 Google DeepMind 合作,開發(fā)了一個將機(jī)器人技術(shù)與人工智能 (AI) 相結(jié)合的自主新材料發(fā)現(xiàn)合成系統(tǒng),被稱為 A-Lab,可用于設(shè)計材料配方,其中包括一些可能用于汽車電池或太陽能電池的材料。它進(jìn)行合成并分析產(chǎn)品的所有過程都無需人工干預(yù)。
這些進(jìn)步有望大大加速清潔能源技術(shù)、下一代電子產(chǎn)品和許多其他應(yīng)用材料的發(fā)展。「我們身邊的許多技術(shù),包括電池和太陽能電池,都可以通過更好的材料來真正改進(jìn)。」 倫敦 Google DeepMind 材料發(fā)現(xiàn)團(tuán)隊的領(lǐng)導(dǎo)者 Ekin Dogus Cubuk 說。
「科學(xué)發(fā)現(xiàn)是人工智能的下一個前沿領(lǐng)域。」紐約伊薩卡康奈爾大學(xué)人工智能科學(xué)研究所聯(lián)席主任 Carla Gomes 評論道,「這就是為什么我覺得這如此令人興奮。」
相關(guān)研究分別以「Scaling deep learning for materials discovery」和「An autonomous laboratory for the accelerated synthesis of novel materials」為題,于 2023 年 11 月 29 日發(fā)布在《Nature》。
超大尺寸材料發(fā)現(xiàn)
經(jīng)過幾個世紀(jì)的艱苦實驗室工作,化學(xué)家已經(jīng)合成了數(shù)十萬種無機(jī)化合物——一般來說,這些材料不是基于碳原子鏈,而碳原子鏈?zhǔn)怯袡C(jī)化學(xué)的特征。然而研究表明,數(shù)十億種相對簡單的無機(jī)材料仍有待發(fā)現(xiàn)。那么從哪里開始尋找呢?
Google DeepMind 材料發(fā)現(xiàn)團(tuán)隊展示了大規(guī)模訓(xùn)練的圖網(wǎng)絡(luò)可以達(dá)到前所未有的泛化水平,從而將材料發(fā)現(xiàn)的效率提高一個數(shù)量級。他們開發(fā)的GNoME,在對從材料項目和類似數(shù)據(jù)庫中抓取的數(shù)據(jù)進(jìn)行訓(xùn)練后(其中包括 48,000 個穩(wěn)定晶體)調(diào)整了已知材料的成分,得出了 220 萬種潛在化合物,其中許多結(jié)構(gòu)并不在人類之前的化學(xué)直覺之內(nèi)。在計算這些材料是否穩(wěn)定并預(yù)測其晶體結(jié)構(gòu)后,系統(tǒng)最終統(tǒng)計出 381,000 種新無機(jī)化合物,將其添加到材料項目數(shù)據(jù)庫中。
該工作代表了人類已知的穩(wěn)定材料的數(shù)量級擴(kuò)展。在穩(wěn)定結(jié)構(gòu)中,有 736 個已通過獨立實驗實現(xiàn)。數(shù)億次第一原理計算的規(guī)模和多樣性也釋放了下游應(yīng)用程序的建模能力,特別是導(dǎo)致高度準(zhǔn)確和強(qiáng)大的學(xué)習(xí)原子間勢,可用于凝聚相分子動力學(xué)模擬和離子電導(dǎo)率的高保真零樣本預(yù)測。
圖:GNoME 預(yù)測的材料之一 Ba6Nb7O21 的晶體結(jié)構(gòu)。(來源:論文)
至關(guān)重要的是,GNoME 使用多種策略來預(yù)測比以前的 AI 系統(tǒng)更多的材料。例如,與其將材料中的所有鈣離子都改為鎂離子,不如只替換其中的一半,或者嘗試更廣泛的不尋常原子交換。如果這些調(diào)整不起作用也沒有問題,因為系統(tǒng)會清除所有不穩(wěn)定的因素,并從錯誤中吸取教訓(xùn)。「這就像用于材料發(fā)現(xiàn)的 ChatGPT。」Gomes 說。
高效準(zhǔn)確的機(jī)器人
預(yù)測某種材料的存在是一回事,但在實驗室中實際制造它又是另一回事。這就是 A-Lab 的用武之地。「我們現(xiàn)在有能力快速制造我們通過計算得出的這些新材料。」A-Lab 團(tuán)隊的領(lǐng)導(dǎo)者、勞倫斯伯克利國家實驗室和加州大學(xué)伯克利分校的材料科學(xué)家 Gerbrand Ceder 說道。
位于勞倫斯伯克利國家實驗室的 A-Lab 使用最先進(jìn)的機(jī)器人技術(shù)來混合和加熱粉末狀固體成分,然后分析產(chǎn)品從而檢查該過程是否有效。該項目耗資 200 萬美元,歷時 18 個月建成。該項目但最大的挑戰(zhàn)在于使用人工智能使系統(tǒng)真正自主,以便使 A-Lab 可以計劃實驗、解釋數(shù)據(jù)并就如何改進(jìn)綜合做出決策。「這些機(jī)器人看起來非常有趣,但創(chuàng)新實際上是在幕后進(jìn)行的。」Ceder 說。
Ceder 的團(tuán)隊從 Materials Project 數(shù)據(jù)庫中識別出 58 種預(yù)計穩(wěn)定的目標(biāo)化合物,將它們與 GNoME 數(shù)據(jù)庫進(jìn)行交叉檢查,并將目標(biāo)移交給 A-Lab 的機(jī)器學(xué)習(xí)模型。通過梳理 30,000 多個已發(fā)布的合成程序,A-Lab 可以評估每個目標(biāo)與現(xiàn)有材料的相似性,并提出制造所需的成分和反應(yīng)溫度。
總之,A-Lab 花了 17 天的時間,從 58 個目標(biāo)中分離出了 41 種新型化合物,其中包括各種氧化物和磷酸鹽。它的合成配方是由根據(jù)文獻(xiàn)訓(xùn)練的自然語言模型提出的,并使用基于熱力學(xué)的主動學(xué)習(xí)方法進(jìn)行優(yōu)化。同時,對合成失敗的分析提供了直接且可行的建議,從而進(jìn)一步改進(jìn)當(dāng)前的材料篩選和合成設(shè)計技術(shù)。高成功率證明了人工智能驅(qū)動平臺在自主材料發(fā)現(xiàn)方面的有效性,并推動了計算、歷史知識和機(jī)器人技術(shù)的進(jìn)一步整合。
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。