首頁 > AI資訊 > 最新資訊 > AI驅動化學空間探索,大語言模型精準導航,直達目標分子

AI驅動化學空間探索,大語言模型精準導航,直達目標分子

新火種    2024-11-15
圖片

作者 |「深度原理」陸婕妤

編輯|ScienceAI

現代科學研究中,化學空間的探索是化學發現和材料科學的核心挑戰之一。過渡金屬配合物(TMCs)的設計中,由金屬和配體組成的龐大化學空間為多目標優化的搜索帶來了難度。

為了解決這一問題,來自「深度原理」 (Deep Principle) 和康奈爾大學的研究者們開發了一種名為 LLM-EO(Large Language Model for Evolutionary Optimization)的新型工作流程算法,釋放大型語言模型(LLM)的生成和預測潛能,顯著提高了化學空間探索的效率。

相關研究以「Generative Design of Functional Metal Complexes Utilizing the Internal Knowledge of Large Language Models」為題,發布在預印平臺 arXiv 上。

圖片

論文鏈接:https://arxiv.org/abs/2410.18136

LLM-EO 的工作原理

LLM-EO 是一種創新的優化框架,結合了大型語言模型的生成能力與進化優化算法,專為在化學空間中進行高效的優化設計。

其工作原理依賴于 LLM 在預訓練過程中積累的豐富化學知識和生成能力。在每次迭代中,LLM 根據用自然語言描述的設計目標和約束條件生成新的過渡金屬配合物(TMCs)。這些生成的 TMCs 被整合到提示中,作為下一次迭代的知識基礎,從而完成進化優化。

圖片

與傳統的進化優化算法(如遺傳算法)相比,LLM-EO 具有三個關鍵優勢:

1.靈活的目標控制:LLM-EO 允許使用自然語言來表達更靈活和細致的優化目標,而不需要復雜的數學公式。這種靈活性使得研究人員能夠快速調整優化策略,以適應不同的研究需求。

2.優化效率的提升:LLM 中嵌入的豐富化學知識和其從少量樣本中學習的能力顯著提高了優化效率。通過利用LLM的強大推理能力,LLM-EO 能夠在較少的實驗次數下獲得更優的結果。

3.新化學結構的生成設計:LLM 的生成能力使 LLM-EO 不僅能高效地搜索預定義的化學空間,還能創造性地生成新的 TMCs。LLM-EO 能夠提出具有創新性的化學結構,突破傳統設計的限制。

實驗結果與性能分析

LLM-EO 在化學空間中進行高效探索

LLM 本身具有豐富的化學知識。Claude-3.5-sonnet 和 o1-preview 模型成功識別出具有大 HOMO-LUMO 能隙的化合物,其表現優于傳統基準算法。同時,它們在有效性和獨特性指標上也顯示出良好的表現。

值得注意的是,這種優勢在提供少量初始 TMCs 的情況下便能顯現,展示了這兩個模型在復雜化學空間中識別高潛力化合物的能力。相比之下,o1-mini 和 GPT-4o 在所有評估指標上表現較差,這可能是由于基礎模型規模較小或其推理能力不足。這些觀察結果強調了 LLM-EO 在不同模型中的表現差異性,并表明其在模型改進方面的潛力。

圖片

LLM-EO 在優化 HOMO-LUMO 能隙這一關鍵屬性時,憑借其高效的迭代搜索能力,與傳統基因算法對比,不僅能更快速地識別關鍵化合物,還能充分利用歷史數據。在僅評估較少化合物(200 個 TMCs)的情況下,成功識別出了前 20 個 HOMO-LUMO 能隙最大 TMCs 中的 8 個,占 1.37M 設計空間的 0.015%。這充分展示了 LLM-EO 在大規模化學空間中的探索能力。

圖片

LLM-EO 提供了靈活的多目標優化能力

通過自然語言提示工程,研究人員可以在不依賴復雜數學公式的情況下,靈活地調整優化目標。例如,在優化 HOMO-LUMO 能隙和極化率時,LLM-EO 能夠同時考慮這兩個性質,根據提示詞的不同,進行不同目標的雙性質優化。這種靈活性使得 LLM-EO 在實驗室環境中實現閉環優化成為可能。

圖片

LLM-EO 能夠生成新的配體結構

利用 LLM 的生成能力,LLM-EO 可以提出具有獨特化學性質的新配體和 TMCs,大大加速了優化過程。我們將這種生成能力分別在單性質優化和多性質優化的場景下進行了測試。結果表明 LLM-EO 有能力生成原化學空間之外的配體化合物結構,這種能力突破了傳統化學直覺定義的化學空間,開啟了創新化合物設計的無限可能。

圖片

未來展望

隨著 LLM 逐步發展,LLM-EO 的能力將持續提升。「深度原理」的創始人兼CTO 段辰儒表示,「在化學方面,LLM 初步展示出人類平均的智能水平。但平均水平在前沿科學探索是完全不夠的。我們旨在使用外接的工作流程激發 LLM 的潛能,助使它們完成一系列頂尖科學家才有可能做到的事情。」

「深度原理」的機器學習帶頭人陸婕妤說,「我們相信,LLM-EO 不僅為化學空間的探索提供了一種全新的視角,還將在未來的藥物設計和材料發現中發揮重要作用。通過不斷優化和擴展 LLM-EO 的應用,我們期待在科學研究的多個領域實現更高效、更智能的化學設計。」

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章