首頁(yè) > AI資訊 > 行業(yè)動(dòng)態(tài) > AI顛覆材料學(xué)!DeepMind重磅研究登Nature,預(yù)測(cè)220萬(wàn)晶體結(jié)構(gòu)

AI顛覆材料學(xué)!DeepMind重磅研究登Nature,預(yù)測(cè)220萬(wàn)晶體結(jié)構(gòu)

新火種    2023-12-01
編輯:編輯部【新智元導(dǎo)讀】繼AlphaFold系列改變了生物學(xué)領(lǐng)域之后,谷歌DeepMind今日再發(fā)Nature,全新AI工具GNoME,成功預(yù)測(cè)220萬(wàn)種晶體結(jié)構(gòu),顛覆了材料學(xué)領(lǐng)域。

陶哲軒一直看好,ChatGPT將顛覆數(shù)學(xué)證明,而如今,AI在化學(xué)領(lǐng)域的潛力同樣深不可測(cè)。

今天,220萬(wàn)種晶體結(jié)構(gòu)完全被AI預(yù)測(cè)出來(lái)了。

這是什么概念?相當(dāng)于近800年的知識(shí)價(jià)值。

谷歌DeepMind開發(fā)全新AI工具GNoME,能夠預(yù)測(cè)新材料的穩(wěn)定性,大大提高了發(fā)現(xiàn)的速度和效率,論文今天刊發(fā)在了Nature上。

在220萬(wàn)個(gè)晶體預(yù)測(cè)中,有38萬(wàn)種特性是最穩(wěn)定的,有潛力成為未來(lái)變革性技術(shù)的材料,為超導(dǎo)體、電動(dòng)汽車電池研發(fā),以及超算供電等領(lǐng)域提供動(dòng)力。

更進(jìn)一步的是,全世界各地的科學(xué)家已經(jīng)在GNoME的輔助之下,著手將AI發(fā)現(xiàn)的新材料進(jìn)行了合成。

美國(guó)勞倫斯國(guó)家實(shí)驗(yàn)室和DeepMind合作,在Nature上刊發(fā)了另一篇論文,展示了如何利用GNoME的預(yù)測(cè)進(jìn)行自主材料合成。

17天自主合成了41種新材料。


AI對(duì)于基礎(chǔ)科學(xué)的推動(dòng)作用,可能會(huì)讓人類文明從此駛上快車道!

如果說(shuō),OpenAI是人類在奔向AGI道路上的領(lǐng)航員,DeepMind就是一把人類在科學(xué)領(lǐng)域不斷突破自身極限的利劍。

利用 AI 加速材料發(fā)現(xiàn)

過去,科學(xué)家們通過調(diào)整已知晶體或試驗(yàn)新的元素組合來(lái)尋找新的晶體結(jié)構(gòu)。

這是一個(gè)昂貴且耗時(shí)的試錯(cuò)過程。通常需要幾個(gè)月的時(shí)間才能得到有限的結(jié)果。

在過去的十年中,全世界各國(guó)的科學(xué)家通計(jì)算機(jī)模擬的方法發(fā)現(xiàn)了28000種新材料。

加上人類利用傳統(tǒng)實(shí)驗(yàn)的方法發(fā)現(xiàn)的大約20000種穩(wěn)定性材料,在使用AI輔助材料發(fā)現(xiàn)之前,人類發(fā)現(xiàn)的穩(wěn)定晶體數(shù)量總共達(dá)到了48000個(gè)。

而DeepMind使用AI材料發(fā)現(xiàn)工具GNoME,預(yù)測(cè)出了220萬(wàn)種新的晶體,其中38萬(wàn)種具有穩(wěn)定的結(jié)構(gòu)。

而在GNoME預(yù)測(cè)的新的穩(wěn)定結(jié)構(gòu)中,有736種是和其他科學(xué)家獨(dú)立發(fā)現(xiàn)的穩(wěn)定材料是一致的,說(shuō)明新發(fā)現(xiàn)的材料是客觀真實(shí)的。

自此,人類發(fā)現(xiàn)的穩(wěn)定晶體數(shù)量一下子被提升了接近9倍!

而這些材料中,有52000種類似于石墨烯的新型層狀化合物,其中1000種是已經(jīng)被之前的研究所發(fā)現(xiàn)的。

如果在這些材料中能發(fā)現(xiàn)有更強(qiáng)超導(dǎo)特性的材料,有可能徹底顛覆電子學(xué)。

利用GNoME,科學(xué)家還發(fā)現(xiàn)了528種潛在的鋰離子導(dǎo)體,是之前研究成果的25倍。

這些材料都有可能用來(lái)提高電池的性能,從而改變?nèi)祟惖哪茉唇Y(jié)構(gòu)。

DeepMind將會(huì)在未來(lái)發(fā)布這38萬(wàn)種穩(wěn)定材料的預(yù)測(cè)結(jié)構(gòu)。

利用GNN進(jìn)行材料探索

GNoME采用兩條工作流(管道)來(lái)發(fā)現(xiàn)穩(wěn)定材料:

「結(jié)構(gòu)管道」創(chuàng)建具有與已知晶體結(jié)構(gòu)相似的候選物,而「成分管道」則采用遵循基于化學(xué)式的更隨機(jī)的方法。

之后,使用密度泛函理論計(jì)算來(lái)評(píng)估兩條工作流的輸出,并將這些結(jié)果添加到GNoME數(shù)據(jù)庫(kù)中,為下一輪主動(dòng)學(xué)習(xí)提供信息。

GNoME是一種最先進(jìn)的圖神經(jīng)網(wǎng)絡(luò)(GNN)模型,可以預(yù)測(cè)晶體總能量。

GNN的輸入數(shù)據(jù)采用圖的形式,跟原子之間的連接很像,這使得GNN特別適合發(fā)現(xiàn)新的晶體材料。

模型的輸入通過元素的單次嵌入轉(zhuǎn)換成圖。采用消息傳遞公式,其中聚合投影是具有非線性特性的淺層多層感知器(MLP)。

對(duì)于結(jié)構(gòu)模型,重要的是通過整個(gè)數(shù)據(jù)集原子的平均鄰接關(guān)系,對(duì)從邊到節(jié)點(diǎn)的信息進(jìn)行歸一化。

GNoME的初始模型是在2018年Materials Project(約69000種材料)上訓(xùn)練的,研究人員改進(jìn)了之前工作中,對(duì)這項(xiàng)任務(wù)設(shè)置的平均絕對(duì)誤差(MAE)。

GNoME使用晶體結(jié)構(gòu)及其穩(wěn)定性的數(shù)據(jù)進(jìn)行訓(xùn)練,這些數(shù)據(jù)可通過Materials Project公開獲得。

研究人員使用GNoME來(lái)生成新的候選晶體,并預(yù)測(cè)它們的穩(wěn)定性。

為了評(píng)估模型在訓(xùn)練周期中的預(yù)測(cè)能力,研究人員使用被稱為密度泛函理論 (DFT) 的成熟計(jì)算技術(shù),反復(fù)檢查模型輸出的結(jié)果。

DFT被廣泛用于物理、化學(xué)和材料科學(xué)中,幫助人們理解原子的結(jié)構(gòu),對(duì)于評(píng)估晶體的穩(wěn)定性有重要的作用。

研究人員使用了一種稱為「主動(dòng)學(xué)習(xí)」的訓(xùn)練過程,極大地提高了GNoME的性能。

「主動(dòng)學(xué)習(xí)」是一種擴(kuò)展模型的技術(shù),模型首先在小型專用數(shù)據(jù)集上訓(xùn)練,然后,開發(fā)人員可以引入新的目標(biāo),允許模型在人工協(xié)助下標(biāo)記新數(shù)據(jù)。

GNoME會(huì)對(duì)新型的、穩(wěn)定的晶體結(jié)構(gòu)進(jìn)行預(yù)測(cè),然后使用DFT進(jìn)行測(cè)試,并將生成的高質(zhì)量訓(xùn)練數(shù)據(jù)反饋到模型訓(xùn)練中。

GNoME的出現(xiàn),將材料穩(wěn)定性預(yù)測(cè)的發(fā)現(xiàn)率從50%左右提高到80%(50%是之前的SOTA)。

另外,GNoME的效率也有很大提升,將發(fā)現(xiàn)率從低于10%提高到了80%以上,——效率的提高會(huì)大大節(jié)約每次發(fā)現(xiàn)所需的計(jì)算量。

「AI配方」新材料

GNoME的目的是降低發(fā)現(xiàn)新材料的成本。

研究人員在完成了這項(xiàng)工作后,檢索了科學(xué)文獻(xiàn),發(fā)現(xiàn)了由世界各地的實(shí)驗(yàn)室獨(dú)立創(chuàng)造的736種新材料,與GNoME預(yù)測(cè)的結(jié)果一致。

這證明GNoME對(duì)穩(wěn)定晶體的預(yù)測(cè)與客觀現(xiàn)實(shí)相符。

上圖給出了其中六個(gè)例子,從堿土類金剛石光學(xué)材料(一排中間)到潛在的超導(dǎo)體(一排右邊)。

DeepMind已經(jīng)向研究界發(fā)布了新發(fā)現(xiàn)的晶體數(shù)據(jù)庫(kù)——通過向科學(xué)家提供新材料的「AI配方」,DeepMind希望幫助科學(xué)家們進(jìn)行測(cè)試,并制造出最好的配方。

而利用晶體數(shù)據(jù)庫(kù)中的「AI配方」,科學(xué)家可以快速開發(fā)新材料。

在美國(guó)勞倫斯國(guó)家實(shí)驗(yàn)室發(fā)表的一篇論文中,研究人員展示了,機(jī)器人實(shí)驗(yàn)室可以通過自動(dòng)合成技術(shù)快速制造新材料。

利用Materials Project(MP)中的材料,和GNoME對(duì)穩(wěn)定性的見解,實(shí)驗(yàn)室創(chuàng)造了晶體結(jié)構(gòu)的新配方,并成功合成了超過41種新材料,為人工智能驅(qū)動(dòng)的材料合成開辟了新的可能性。

上圖是以58種新化合物為目標(biāo)進(jìn)行合成的結(jié)果。箭頭表示接近零的數(shù)值。

我們可以看到共有41個(gè)目標(biāo)成功合成(藍(lán)色條),而其余17個(gè)目標(biāo)失?。t色條)。

帶有斜杠的目標(biāo)表示使用了主動(dòng)學(xué)習(xí)。每個(gè)條形圖上方的散點(diǎn)表示針對(duì)每個(gè)目標(biāo)嘗試配方的結(jié)果,按執(zhí)行順序從上到下排列。

插入的餅圖分別展示了成功目標(biāo)(左)和配方(右)的比例。

上圖分析了實(shí)驗(yàn)室無(wú)法合成的17種目標(biāo)材料,每種材料都按使其合成復(fù)雜化的特征進(jìn)行了分類。

除去亞穩(wěn)態(tài)的,其余16個(gè)穩(wěn)定目標(biāo)所面臨的挑戰(zhàn)可分為兩類:實(shí)驗(yàn)障礙(藍(lán)色,13個(gè))和計(jì)算障礙(綠色,3個(gè))。

這些障礙又可分為四種不同的失敗模式:反應(yīng)動(dòng)力學(xué)緩慢、前體易揮發(fā)、產(chǎn)物非晶化以及在0 K條件下進(jìn)行的DFT計(jì)算的局限性。

論文細(xì)節(jié)

發(fā)現(xiàn)能量上有利的無(wú)機(jī)晶體是固態(tài)化學(xué)的基本科學(xué)和技術(shù)興趣所在。

幾十年來(lái),實(shí)驗(yàn)方法已在無(wú)機(jī)晶體結(jié)構(gòu)數(shù)據(jù)庫(kù)(ICSD)中收錄了 20,000 個(gè)計(jì)算穩(wěn)定結(jié)構(gòu)(總條目數(shù)為 200,000 個(gè))。然而,由于成本、吞吐量和合成復(fù)雜性等原因,這種策略無(wú)法推廣。

而材料計(jì)劃(MP)、開放量子材料數(shù)據(jù)庫(kù)(OQMD)、AFLOWLIB20 和 NOMAD21 所倡導(dǎo)的計(jì)算方法采用基于密度泛函理論(DFT)的第一性原理計(jì)算作為物理能量的近似值。

根據(jù)我們自己的重新計(jì)算(見方法),將 ab initio 計(jì)算與簡(jiǎn)單的替換相結(jié)合,研究人員已將計(jì)算穩(wěn)定的材料提高到 48000 種。盡管人們一直在尋求有助于進(jìn)一步發(fā)現(xiàn)材料的數(shù)據(jù)驅(qū)動(dòng)方法,但迄今為止,機(jī)器學(xué)習(xí)技術(shù)在估算相對(duì)于競(jìng)爭(zhēng)相能量凸殼(convex hull of energies)的穩(wěn)定性(分解能)方面表現(xiàn)一直不好。

研究人員通過大規(guī)模主動(dòng)學(xué)習(xí)擴(kuò)大了機(jī)器學(xué)習(xí)在材料探索中的應(yīng)用,首次建立了可準(zhǔn)確預(yù)測(cè)穩(wěn)定性的模型,從而為材料探索提供指導(dǎo)。

研究人員的方法依賴于兩大支柱:

首先,他們建立了生成多種候選結(jié)構(gòu)的方法,包括新的對(duì)稱感知部分置換(SAPS)和隨機(jī)結(jié)構(gòu)搜索。

其次,研究人員采用了最先進(jìn)的圖神經(jīng)網(wǎng)絡(luò)(GNN),該網(wǎng)絡(luò)可根據(jù)結(jié)構(gòu)或成分改進(jìn)材料特性建模。

在一系列回合中,這些用于材料探索的圖神經(jīng)網(wǎng)絡(luò)(GNoME)根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行訓(xùn)練,并用于過濾候選結(jié)構(gòu)。

通過DFT計(jì)算篩選出的候選結(jié)構(gòu)的能量,既可驗(yàn)證模型預(yù)測(cè),又可作為數(shù)據(jù)飛輪,在下一輪主動(dòng)學(xué)習(xí)中在更大的數(shù)據(jù)集上訓(xùn)練更穩(wěn)健的模型。

通過這種迭代程序,GNoME模型已經(jīng)發(fā)現(xiàn)了220多萬(wàn)種與以前的工作相比穩(wěn)定的結(jié)構(gòu),特別是包含計(jì)算和實(shí)驗(yàn)結(jié)構(gòu)的聚合數(shù)據(jù)集。

鑒于已發(fā)現(xiàn)的材料在穩(wěn)定性方面存在競(jìng)爭(zhēng),更新后的凸殼包含381000個(gè)新條目,總計(jì)421000個(gè)穩(wěn)定晶體,與之前發(fā)現(xiàn)的所有晶體相比有了數(shù)量級(jí)的擴(kuò)展。

與其他機(jī)器學(xué)習(xí)領(lǐng)域的觀察結(jié)果一致,研究人員發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果與數(shù)據(jù)量成冪律關(guān)系。

最終的GNoME模型可以準(zhǔn)確預(yù)測(cè),并將穩(wěn)定預(yù)測(cè)的精確度(命中率)提高到80%以上(結(jié)構(gòu)預(yù)測(cè))和33%以上(僅成分預(yù)測(cè)),而之前的工作只有1%。

此外,這些網(wǎng)絡(luò)還發(fā)展了分布外泛化。

例如,GNoME能夠準(zhǔn)確預(yù)測(cè)含有5個(gè)以上獨(dú)特元素的結(jié)構(gòu)(盡管在訓(xùn)練中省略了這些元素),為有效探索這一化學(xué)空間提供了首批策略之一。

研究人員將預(yù)測(cè)結(jié)果與實(shí)驗(yàn)和更高保真的 r2SCAN計(jì)算結(jié)果進(jìn)行了比較,從而驗(yàn)證了研究結(jié)果。

最后,研究人員證明了在GNoME發(fā)現(xiàn)過程中產(chǎn)生的數(shù)據(jù)集為下游應(yīng)用釋放了新的建模能力。

這些結(jié)構(gòu)提供了一個(gè)龐大而多樣的數(shù)據(jù)集,可用于訓(xùn)練學(xué)習(xí)的等變?cè)娱g位勢(shì),具有前所未有的準(zhǔn)確性和零樣本泛化能力。

通過分子動(dòng)力學(xué)模擬估算離子電導(dǎo)率,研究人員展示了這些電位在材料性質(zhì)預(yù)測(cè)方面的前景。

候選材料的生成和過濾

可能的材料空間太大,無(wú)法以無(wú)偏見的方式進(jìn)行采樣。

由于沒有可靠的模型來(lái)低成本地估算候選材料的能量,研究人員只能通過化學(xué)直覺來(lái)限制候選材料的生成,具體做法是替換相似的離子或列舉原型。

這種策略雖然提高了搜索效率,但從根本上限制了候選物質(zhì)的多樣性。

通過使用神經(jīng)網(wǎng)絡(luò)引導(dǎo)搜索,研究人員能夠使用多樣化的方法生成候選體,并在不影響效率的前提下對(duì)晶體空間進(jìn)行更廣泛的探索。

為了生成和篩選候選晶體,研究人員使用了兩個(gè)框架,如下圖所示。

首先,通過修改現(xiàn)有晶體生成結(jié)構(gòu)候選體。不過,研究人員通過調(diào)整離子取代概率來(lái)優(yōu)先發(fā)現(xiàn)候選結(jié)構(gòu),并使用新提出的對(duì)稱性感知部分取代(SAPS)來(lái)有效實(shí)現(xiàn)不完全取代,從而有力地?cái)U(kuò)展了取代集。

在主動(dòng)學(xué)習(xí)過程中,這種擴(kuò)展會(huì)產(chǎn)生超過109個(gè)候選結(jié)構(gòu);產(chǎn)生的結(jié)構(gòu)會(huì)通過GNoME進(jìn)行過濾,使用基于體積的測(cè)試時(shí)間擴(kuò)展,并通過深度集合進(jìn)行不確定性量化。

最后,對(duì)結(jié)構(gòu)進(jìn)行聚類,并對(duì)多形態(tài)進(jìn)行排序,以便用DFT進(jìn)行評(píng)估。

在第二個(gè)框架中,成分模型在沒有結(jié)構(gòu)信息的情況下預(yù)測(cè)穩(wěn)定性。輸入是還原化學(xué)式。通過氧化態(tài)平衡生成的模型往往過于嚴(yán)格。利用寬松的約束條件,研究人員使用GNoME篩選成分,并初始化100個(gè)隨機(jī)結(jié)構(gòu),通過ab initio隨機(jī)結(jié)構(gòu)搜索(AIRSS)進(jìn)行評(píng)估。

在這兩個(gè)框架中,模型提供能量預(yù)測(cè),并根據(jù)相對(duì)于競(jìng)爭(zhēng)相的相對(duì)穩(wěn)定性(分解能)選擇閾值。

評(píng)估是通過在維也納Ab initio仿真軟件包(VASP)中進(jìn)行的DFT計(jì)算來(lái)完成的,與Materials Project(MP)相比,研究人員同時(shí)測(cè)量了發(fā)現(xiàn)的穩(wěn)定材料的數(shù)量和預(yù)測(cè)的穩(wěn)定材料的精確度(命中率)。

GNoME已經(jīng)發(fā)現(xiàn)了380000種穩(wěn)定的晶體,這些晶體具有開發(fā)更環(huán)保技術(shù)的潛力——從用于電動(dòng)汽車的電池到用于更高效計(jì)算的超導(dǎo)體。

DeepMind的GNoME,以及伯克利實(shí)驗(yàn)室、谷歌研究院和世界各地團(tuán)隊(duì)的合作者的研究,顯示了使用人工智能來(lái)指導(dǎo)材料發(fā)現(xiàn)、實(shí)驗(yàn)和合成的潛力。

希望GNoME與其他AI工具,能夠影響和改變這個(gè)領(lǐng)域,指引我們的未來(lái)。

網(wǎng)友熱議

有網(wǎng)友根據(jù)GNoME預(yù)測(cè)新材料的能力生成了下面這張圖:

不得不說(shuō),還挺形象的。

也有網(wǎng)友把LK-99拿出來(lái)鞭尸了:

「還記得LK-99嗎?Google DeepMind最新的AI工具GNoME剛剛通過識(shí)別220萬(wàn)種新材料樹立了新的標(biāo)桿,重新定義了我們對(duì)材料科學(xué)的理解。這一發(fā)現(xiàn)超越了以前的努力,提供了具有多種應(yīng)用的新晶體目錄?!?/p>

當(dāng)我們期盼看到Google的產(chǎn)品可以正面剛ChatGPT的時(shí)候,卻發(fā)現(xiàn)Google把技能點(diǎn)用到了別的地方。

對(duì)此有網(wǎng)友表示:

「當(dāng)人們對(duì)聊天機(jī)器人失去理智時(shí),真正的人工智能在DeepMind」。

當(dāng)然,也有陰謀論玩家表示:

「想象一下,科學(xué)家們已經(jīng)根據(jù)這樣的研究秘密合成了什么。我敢打賭,DeepMind并不是唯一一家進(jìn)行此類模擬的實(shí)驗(yàn)室。」

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章