首頁 > AI資訊 > 最新資訊 > Nature|從1.07億個(gè)分子中發(fā)現(xiàn)新抗菌化合物,MIT團(tuán)隊(duì)開發(fā)用于抗生素發(fā)現(xiàn)的DL方法

Nature|從1.07億個(gè)分子中發(fā)現(xiàn)新抗菌化合物,MIT團(tuán)隊(duì)開發(fā)用于抗生素發(fā)現(xiàn)的DL方法

新火種    2023-12-26

圖片

編輯 | 蘿卜皮

當(dāng)前,迫切需要發(fā)現(xiàn)新結(jié)構(gòu)類別的抗生素來解決持續(xù)存在的抗生素耐藥性危機(jī)。深度學(xué)習(xí)方法有助于探索化學(xué)空間;這些通常使用黑盒模型并且不提供化學(xué)見解。

麻省理工學(xué)院(MIT)的研究人員開發(fā)了一種用于抗生素發(fā)現(xiàn)的深度學(xué)習(xí)方法,并表明它可以從大型化學(xué)庫中識(shí)別出潛在的抗生素。研究人員用該方法從藥物再利用中心(包含約 6,000 個(gè)分子)中發(fā)現(xiàn)了 halicin 和 abaucin,并從 ZINC15 庫中的約 1.07 億個(gè)分子中發(fā)現(xiàn)了新的抗菌化合物。

圖片

圖示:Yann LeCun 轉(zhuǎn)發(fā)了這項(xiàng)研究的 Twitter 報(bào)道。(來源:網(wǎng)絡(luò))

這種方法依賴于 Chemprop,這是一個(gè)圖神經(jīng)網(wǎng)絡(luò)平臺(tái),通常是黑盒模型,或者不容易解釋或解釋的模型。根據(jù)定義,解釋此類模型揭示了模型為得出預(yù)測而執(zhí)行的決策步驟的模式(interpretability),或使此類預(yù)測可供人類理解(explainability)。

「這里的見解是,我們可以看到模型正在學(xué)習(xí)什么,以做出某些分子將成為良好抗生素的預(yù)測。從化學(xué)結(jié)構(gòu)的角度來看,我們的工作提供了一個(gè)具有時(shí)間效率、資源效率和機(jī)械洞察力的框架,這是我們迄今為止所沒有的。」麻省理工學(xué)院醫(yī)學(xué)工程與科學(xué)研究所(IMES)和生物工程系醫(yī)學(xué)工程與科學(xué) Termeer 教授 James Collins 說道。

IMES、哈佛大學(xué)博德研究所的博士后 Felix Wong 和 Collins 指導(dǎo)下的前哈佛醫(yī)學(xué)院研究生 Erica Cheng 是該研究的主要作者,該研究是 MIT Antibiotics-AI 項(xiàng)目的一部分。

該研究以「Discovery of a structural class of antibiotics with explainable deep learning」為題,于 2023 年 12 月 20 日 發(fā)布在《Nature》。

圖片

迫切需要發(fā)現(xiàn)新的抗生素

持續(xù)的抗生素耐藥性危機(jī)可能導(dǎo)致現(xiàn)有抗生素失效,并增加細(xì)菌感染的發(fā)病率。由于缺乏新的抗生素,這場危機(jī)變得更加嚴(yán)重,如果沒有新的抗生素,預(yù)計(jì)到 2050 年全球每年因耐藥感染而死亡的人數(shù)將達(dá)到 1000 萬人。

與這種急需的狀態(tài)相反,抗生素的開發(fā)一直緩慢且漫長;從 1962 年推出氟喹諾酮類抗生素到 2000 年推出下一個(gè)新結(jié)構(gòu)類別惡唑烷酮,中間間隔了 38 年。

在過去的十年中,通過基于天然產(chǎn)物挖掘、高通量篩選、進(jìn)化和系統(tǒng)發(fā)育分析、結(jié)構(gòu)引導(dǎo)和合理設(shè)計(jì)以及使用機(jī)器學(xué)習(xí)的計(jì)算機(jī)篩選的各種方法發(fā)現(xiàn)了候選抗生素。然而,開發(fā)有效的抗生素發(fā)現(xiàn)方法,更好地利用化學(xué)空間的巨大結(jié)構(gòu)多樣性仍然是一個(gè)挑戰(zhàn),迫切需要新的抗生素發(fā)現(xiàn)方法。

高效的DL模型發(fā)現(xiàn)新抗生素

麻省理工學(xué)院的研究人員通過開發(fā)了一種可解釋的、基于化學(xué)子結(jié)構(gòu)的方法用于高效、深度學(xué)習(xí)引導(dǎo)的化學(xué)空間探索,從而預(yù)測和發(fā)現(xiàn)新的抗生素。

該團(tuán)隊(duì)確定了 39,312 種化合物的抗生素活性和人體細(xì)胞毒性特征,并應(yīng)用圖神經(jīng)網(wǎng)絡(luò)集成來預(yù)測 12,076,365 種化合物的抗生素活性和細(xì)胞毒性。使用可解釋的圖形算法,該團(tuán)隊(duì)確定了預(yù)測具有高抗生素活性和低細(xì)胞毒性化合物的基于子結(jié)構(gòu)的基本原理。

「你基本上可以將任何分子表示為化學(xué)結(jié)構(gòu),并且你還可以告訴模型該化學(xué)結(jié)構(gòu)是否抗菌。」Wong 說,「該模型接受了許多這樣的例子的訓(xùn)練。如果你給它任何新的分子、原子和鍵的新排列,它可以告訴你該化合物被預(yù)測具有抗菌性的概率。」

圖片

圖示:用于預(yù)測抗生素活性和人體細(xì)胞毒性的深度學(xué)習(xí)模型集合。(來源:論文)

研究人員憑經(jīng)驗(yàn)測試了 283 種化合物,發(fā)現(xiàn)對金黃色葡萄球菌表現(xiàn)出抗生素活性的化合物在基于基本原理的推定結(jié)構(gòu)類別中得到了豐富。在這些結(jié)構(gòu)類別的化合物中,其中一種對耐甲氧西林金黃色葡萄球菌(MRSA)和耐萬古霉素腸球菌具有選擇性,可避免實(shí)質(zhì)性耐藥性,并降低 MRSA 皮膚和全身大腿感染小鼠模型中的細(xì)菌滴度。

「我們有相當(dāng)有力的證據(jù)表明,這種新的結(jié)構(gòu)類別通過選擇性地消散細(xì)菌中的質(zhì)子動(dòng)力,對革蘭氏陽性病原體具有活性。」Wong 說,「這些分子選擇性地攻擊細(xì)菌細(xì)胞膜,不會(huì)對人體細(xì)胞膜造成實(shí)質(zhì)性損害。我們大幅增強(qiáng)的深度學(xué)習(xí)方法,使我們能夠預(yù)測這種新的抗生素結(jié)構(gòu)類別,并發(fā)現(xiàn)它對人體細(xì)胞沒有毒性。」

對于機(jī)理和構(gòu)效關(guān)系的分析表明,該結(jié)構(gòu)類別還可以進(jìn)一步優(yōu)化,從而提高對革蘭氏陽性病原體的選擇性,并增加對革蘭氏陰性病原體的滲透性。

圖片

圖示:過濾和可視化化學(xué)空間。(來源:論文)

作為一種發(fā)現(xiàn)抗生素結(jié)構(gòu)類別的深度學(xué)習(xí)方法,該方法系統(tǒng)地建立在對單獨(dú)化合物命中預(yù)測的基礎(chǔ)上,并能夠?qū)V闊的化學(xué)空間進(jìn)行有效的、基于子結(jié)構(gòu)的探索。

除了對化學(xué)空間進(jìn)行下采樣之外,該方法的一個(gè)重要特征是能夠自動(dòng)識(shí)別前所未有的結(jié)構(gòu)圖案,特別是在深度學(xué)習(xí)模型的背景下。這種能力提供了化學(xué)新穎性的來源,可以建議化學(xué)空間來探索和有效地增強(qiáng)當(dāng)前的發(fā)現(xiàn)管線,例如,通過為從頭設(shè)計(jì)工作生成感興趣的化學(xué)片段。

重要的是,這種能力無法使用替代方法來實(shí)現(xiàn),例如傳統(tǒng)的 QSAR 分析,這些方法建立在已知的支架上,并且不能基于概括化學(xué)結(jié)構(gòu)中分子原子和鍵的模式來識(shí)別新的支架。

研究人員估計(jì),更好地理解基于圖表的基本原理預(yù)測可以幫助發(fā)現(xiàn)和設(shè)計(jì)其他急需的抗生素類別(例如,那些對革蘭氏陰性細(xì)菌有活性的)以及針對其他生物過程和疾病的藥物類別,包括抗病毒和抗癌藥物。

藥物發(fā)現(xiàn)DL模型變得可解釋

該研究的另一個(gè)重要意義是藥物發(fā)現(xiàn)中的深度學(xué)習(xí)模型可以得到解釋。事實(shí)上,機(jī)器學(xué)習(xí)中常用的黑盒模型的一個(gè)基本限制是,此類模型通常不向底層決策過程提供信息。然而,模型的可解釋性可能會(huì)帶來普遍的見解,從而更好地為探索化學(xué)空間的下一代方法的使用和開發(fā)提供信息。

該研究表明,使用基于圖的搜索來概括模型預(yù)測的化學(xué)子結(jié)構(gòu)基本原理,可以更好地理解和解釋圖神經(jīng)網(wǎng)絡(luò)。這為特定模型或模型集合所學(xué)到的內(nèi)容提供了有意義的化學(xué)見解。

研究人員表示,他們未來的工作將基于這種方法和類似的方法來進(jìn)一步分析和理解深度學(xué)習(xí)模型生成的預(yù)測,例如,通過使用以擾動(dòng)模型輸入為中心的方法來進(jìn)行額外的可解釋性測試,以及擾動(dòng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以實(shí)現(xiàn)可解釋性。

「我們已經(jīng)在利用基于化學(xué)子結(jié)構(gòu)的類似方法來從頭設(shè)計(jì)化合物,當(dāng)然,我們可以很容易地采用這種開箱即用的方法來發(fā)現(xiàn)針對不同病原體的新型抗生素。」Wong 說。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章