首頁 > AI資訊 > 最新資訊 > 計算效率領(lǐng)先10倍,中國科大、哈佛功能蛋白質(zhì)設(shè)計深度生成模型登Nature子刊

計算效率領(lǐng)先10倍,中國科大、哈佛功能蛋白質(zhì)設(shè)計深度生成模型登Nature子刊

新火種    2024-11-21

圖片

編輯 |ScienceAI

蛋白質(zhì)作為生命活動的物質(zhì)基礎(chǔ),就像一塊塊精巧的「樂高積木」,支撐著生物體內(nèi)幾乎所有的化學反應和生命過程。

從肌肉的收縮到大腦的思維,從病毒的侵染到免疫系統(tǒng)的防護,幾乎都依賴這些功能多樣的分子。

然而,自然界中的天然蛋白質(zhì)并不能完全滿足人類日益多樣化的需求,因此科學家們致力于通過設(shè)計與定制蛋白質(zhì),賦予其更多復雜的功能。

隨著生成式人工智能和生物技術(shù)的快速發(fā)展,科學家們在蛋白設(shè)計領(lǐng)域取得了顯著突破。華盛頓大學的 David Baker 教授因其在這一領(lǐng)域的開創(chuàng)性貢獻,榮獲2024年諾貝爾化學獎。

在此背景下,中國科學技術(shù)大學認知智能全國重點實驗室劉淇教授指導的博士生張載熙,與哈佛大學醫(yī)學院 Marinka Zitnik 教授課題組合作,開發(fā)了深度生成算法 PocketGen。

這一算法在蛋白質(zhì)生成效率和成功率上全面超越了新晉諾貝爾化學獎得主 David Baker 教授實驗室的生成模型 RFDiffusion 和 RFDiffusionAA,成為當前性能最快、成功率最高的蛋白質(zhì)口袋設(shè)計算法之一。

相關(guān)研究成果《Efficient generation of protein pockets with PocketGen》于 2024 年 11 月 15 日正式發(fā)表在《Nature Machine Intelligence》[1]。

圖片

論文鏈接:https://www.nature.com/articles/s42256-024-00920-9

圖片

圖 1:PocketGen 生成示意圖。(來源:論文)

研究團隊基于前期蛋白質(zhì)口袋生成工作 FAIR(NeurIPS 2023 Spotlight)[2]和 PocketFlow(NeurIPS 2024 Spotlight)[3]的成果,進一步研發(fā)了 PocketGen(見圖 2)。

PocketGen 能夠基于蛋白質(zhì)框架和結(jié)合小分子,生成蛋白質(zhì)口袋的序列和結(jié)構(gòu)(圖 2a)。該模型的核心架構(gòu)由兩部分組成:

1、雙層圖 Transformer 編碼器(圖 2b)

受到蛋白質(zhì)固有的層級結(jié)構(gòu)啟發(fā),PocketGen 的編碼器設(shè)計為氨基酸層級和原子層級的雙層圖 Transformer。

氨基酸層級編碼器:學習蛋白質(zhì)中氨基酸之間的宏觀相互作用信息。

原子層級編碼器:捕捉更細粒度的原子級相互作用,并動態(tài)更新氨基酸和原子表示及其空間坐標。這一層級設(shè)計有效整合了蛋白質(zhì)多尺度的結(jié)構(gòu)特性,為生成高質(zhì)量的口袋設(shè)計奠定了基礎(chǔ)。

2、蛋白質(zhì)預訓練語言模型(圖 2c)

PocketGen 在蛋白質(zhì)語言模型 ESM2 的基礎(chǔ)上進行高效微調(diào),通過固定大部分模型層,僅微調(diào)部分適應層參數(shù),結(jié)合序列-結(jié)構(gòu)交叉注意力機制,進一步增強序列與結(jié)構(gòu)的協(xié)調(diào)一致性。這種策略不僅降低了訓練開銷,還顯著提升了預測精度。

PocketGen 的優(yōu)勢

PocketGen 的獨特優(yōu)勢在于結(jié)合了多層次信息和預訓練模型的能力,實現(xiàn)了序列與結(jié)構(gòu)設(shè)計的一體化。

在實驗中,PocketGen 不僅在親和力和結(jié)構(gòu)合理性等關(guān)鍵指標上優(yōu)于傳統(tǒng)方法,還在計算效率上取得了革命性進步,相較傳統(tǒng)方法效率提升超過 10 倍。

這使得 PocketGen 成為當前蛋白質(zhì)口袋設(shè)計領(lǐng)域的前沿工具,為藥物研發(fā)和分子設(shè)計提供了新技術(shù)方案。

圖片

圖 2:(a)用 PocketGen 進行蛋白質(zhì)序列-結(jié)構(gòu)共同設(shè)計。(b) 雙層圖 Transformer 編碼器;(c)蛋白質(zhì)預訓練語言模型用于序列預測及高效微調(diào)技術(shù)。(來源:論文)

PocketGen 在計算效率和成功率方面均表現(xiàn)優(yōu)異,成為目前全球最頂尖的蛋白質(zhì)口袋設(shè)計算法之一。

在計算效率上,PocketGen 表現(xiàn)尤為亮眼。相比傳統(tǒng)方法,計算效率提升超過 10 倍,顯著縮短了蛋白質(zhì)口袋設(shè)計的時間(圖 3)。

團隊還將其與新晉諾貝爾化學獎得主 David Baker 實驗室的生成模型 RFDiffusion 和 RFDiffusionAA 進行了對比,發(fā)現(xiàn) PocketGen 在計算效率上也領(lǐng)先約 10 倍,大幅優(yōu)化了生成效率。

在蛋白質(zhì)口袋設(shè)計的成功率方面,PocketGen 同樣取得了突出成績。蛋白質(zhì)口袋的親和力是評估蛋白質(zhì)與小分子結(jié)合成功率的重要指標。親和力越高,意味著蛋白質(zhì)與小分子結(jié)合得越緊密、穩(wěn)定,就像兩塊吸鐵石間的吸引力。

PocketGen 在親和力指標上的表現(xiàn)超越了傳統(tǒng)方法 5 個百分點,顯著提升了蛋白質(zhì)與小分子結(jié)合的可能性。

PocketGen 的綜合表現(xiàn)使其在蛋白質(zhì)口袋設(shè)計領(lǐng)域樹立了新標桿,為藥物研發(fā)和分子設(shè)計等領(lǐng)域提供了更加高效、精準的工具。

圖片

圖 3:(a)生成效率比較。(b)生成多樣性比較。(c)PocketGen可以靈活生成不同大小的蛋白質(zhì)口袋。(來源:論文)

PocketGen 推進了深度生成模型用于功能蛋白質(zhì)設(shè)計,為進一步理解蛋白質(zhì)設(shè)計規(guī)律并開展生物實驗驗證奠定了基礎(chǔ)。

未來,在藥物開發(fā)、生物傳感器、酶催化等領(lǐng)域具有廣泛的應用前景。這種跨領(lǐng)域、跨技術(shù)的協(xié)同創(chuàng)新,不僅為生物工程和藥物研發(fā)提供了全新思路,也展現(xiàn)了人工智能與自然科學融合的無限可能。

參考文獻

[1] Zhang Z, Shen W X, Liu Q, et al. Efficient generation of protein pockets with PocketGen. Nature Machine Intelligence, 2024: 1-14.

[2] Zhang Z, Lu Z, Zhongkai H, et al. Full-atom protein pocket design via iterative refinement. Advances in Neural Information Processing Systems, 2023, 36: 16816-16836.

[3] Zhang Z, Zitnik M, Liu Q. Generalized Protein Pocket Generation with Prior-Informed Flow Matching. Advances in Neural Information Processing Systems, 2024.

相關(guān)推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務必進行充分的盡職調(diào)查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。

熱門文章