首頁 > AI資訊 > 最新資訊 > 首個強化生成模型AbNovo實現(xiàn)多目標、多約束抗體從頭設(shè)計,發(fā)表于ICLR2025

首個強化生成模型AbNovo實現(xiàn)多目標、多約束抗體從頭設(shè)計,發(fā)表于ICLR2025

新火種    2025-03-05

圖片

編輯 | ScienceAI

近期,上海交通大學(xué)醫(yī)學(xué)院張海倉課題組聯(lián)合中原人工智能產(chǎn)業(yè)技術(shù)研究院與中國科學(xué)院計算技術(shù)研究所,提出了一項名為AbNovo的抗體設(shè)計新方法。該方法基于強化學(xué)習(xí)與深度擴散模型,能夠在多目標、多約束條件下實現(xiàn)抗體從頭設(shè)計。

該研究以「Multi-objective antibody design with constrained preference optimization」為題發(fā)表在國際機器學(xué)習(xí)頂會ICLR2025上。

圖片

論文鏈接:https://openreview.net/forum?id=4ktJJBvvUd

背景介紹

抗體是免疫系統(tǒng)中的關(guān)鍵蛋白,能與特定靶抗原結(jié)合并觸發(fā)適應(yīng)性免疫反應(yīng),在癌癥、自身免疫缺陷及病毒感染等疾病治療中具有重要地位。目前,全球范圍內(nèi)已批準應(yīng)用了百余種抗體藥物。近年來,借助深度生成模型,計算抗體設(shè)計取得了長足進展,尤其在增強抗體-抗原結(jié)合親和力方面成效顯著。然而,除了高親和力之外,抗體還需具備多種理想的生物物理特性,例如穩(wěn)定性、高靶標特異性以及低自聚合性等,才能實現(xiàn)更優(yōu)的可開發(fā)性與臨床安全性。在濕實驗中,傳統(tǒng)的「后篩選」方法通常先生成一批抗體候選,再根據(jù)目標特性進行篩選和淘汰,但這樣的策略效率低下,且難以保證設(shè)計到的抗體可同時滿足所有指定約束。

AbNovo-利用約束偏好優(yōu)化進行多目標抗體設(shè)計

為應(yīng)對上述挑戰(zhàn),并進一步縮小計算設(shè)計與實際應(yīng)用之間的差距,研究團隊提出了 AbNovo 框架,率先將「帶有約束的偏好優(yōu)化」思想融入到多目標和多約束的抗體設(shè)計中,為研發(fā)多特性兼優(yōu)的抗體提供了新思路。

圖片

圖1:AbNovo的流程圖

主要創(chuàng)新點

應(yīng)用層面:AbNovo 通過強化學(xué)習(xí)和深度生成模型引入多目標、多約束的抗體設(shè)計思路,直接刻畫實際藥物研發(fā)過程中的生物物理約束。

算法層面:首次將「帶約束偏好優(yōu)化」從語言模型推廣至基于擴散的生成模型,設(shè)計了相應(yīng)訓(xùn)練算法,并給出了嚴謹?shù)睦碚摲治觥?/p>

性能方面:為緩解抗體-抗原訓(xùn)練數(shù)據(jù)稀缺問題,AbNovo還訓(xùn)練了大規(guī)模結(jié)構(gòu)感知的蛋白質(zhì)語言模型,從豐富的非抗體結(jié)構(gòu)數(shù)據(jù)中學(xué)到通用規(guī)律,進一步降低過擬合風(fēng)險。

多目標抗體設(shè)計的兩階段約束偏好優(yōu)化框架

如圖1 所示,AbNovo 在訓(xùn)練過程中包含兩個主要階段:

階段1 (基礎(chǔ)模型):使用多模態(tài)擴散模型來進行抗體序列和結(jié)構(gòu)的聯(lián)合設(shè)計,得到初步的抗體-抗原條件生成模型。具體地,對離散序列使用基于連續(xù)時間馬爾可夫鏈(CTMC) 的擴散模型,對結(jié)構(gòu)使用基于SE(3) 空間的擴散模型。

階段2(約束偏好優(yōu)化):使用約束偏好優(yōu)化對階段一中的基礎(chǔ)模型進行微調(diào)。為了設(shè)計與目標抗原結(jié)合且同時滿足其他生物物理特性的抗體,訓(xùn)練目標如下:

圖片

網(wǎng)絡(luò)不僅需要優(yōu)化親和力等相關(guān)指標,還需要滿足物理化學(xué)性質(zhì)的約束。與普通的多目標優(yōu)化不同,帶約束多目標優(yōu)化在訓(xùn)練的過程中可以自動調(diào)節(jié)目標和約束之間的權(quán)重。在滿足約束的同時,去最大化獎勵函數(shù),其擁有更好的約束滿足性和更優(yōu)的目標性能。

此外,該階段以迭代方式進行,不斷更新參考模型和策略模型,提高收斂效率和約束滿足率。完整的訓(xùn)練過程如圖 2所示。

圖片

圖2: 抗體設(shè)計的約束偏好優(yōu)化算法

AbNovo的性能評測

圖片

圖 3:測試集中獨立于參考的指標的評估

圖片

圖 4: 測試集中基于參考的指標的評估

為全面評估AbNovo的設(shè)計效果,論文從兩大維度考察結(jié)果:

1.物理化學(xué)性質(zhì)相關(guān)的指標:物理化學(xué)性質(zhì)相關(guān)的指標主要包含Rosetta 結(jié)合能評估所設(shè)計抗體與靶抗原的結(jié)合親和力。使用獨立抗體語言模型下的概率似然來評估進化合理性。此外,論文考慮滿足與自聚合、穩(wěn)定性和非特異性結(jié)合相關(guān)的約束的生成抗體的比例(圖 3);

2.基于天然抗原抗-體復(fù)合物參考的指標:基于參考的指標評估設(shè)計抗體和天然抗體結(jié)構(gòu)和序列之間的相似性。氨基酸恢復(fù)率(AAR)通過將生成的序列與天然序列進行比較來測量序列恢復(fù)的準確性;均方根偏差(RMSD)計算生成的結(jié)構(gòu)和天然結(jié)構(gòu)之間的偏差(圖 4)。

AbNovo 和當前主流的抗體設(shè)計模型做了比較,例如DiffAb、dyMEAN、GeoAb 和 AbX。在所有獨立于參考的指標上的表現(xiàn)均優(yōu)于所有基線方法。

此外,與論文中第一階段的基礎(chǔ)模型相比,AbNovo 在所有指標上都表現(xiàn)出顯著的改進,凸顯了約束偏好優(yōu)化的有效性。

Case study:設(shè)計抗體的可視化和統(tǒng)計分布

論文還進行了詳盡的Case Study分析(圖 5),比較了使用不同方法設(shè)計的抗體:dyMEAN、DiffAb 和 AbNovo。該案例說明,AbNovo 設(shè)計的抗體不僅對靶抗原表現(xiàn)出更高的結(jié)合親和力,而且完全滿足所有約束條件。

圖片

圖 5: 設(shè)計抗體的可視化

結(jié)語

研究團隊指出,雖然 AbNovo 專注于抗體設(shè)計,但其基于「帶約束偏好優(yōu)化」的多目標、多約束設(shè)計框架,可推廣至多肽設(shè)計、小蛋白配體以及小分子藥物設(shè)計等領(lǐng)域。論文提出的框架具有很好的可擴展性,可以將其他物理化學(xué)性質(zhì)作為獎勵和約束,以縮小計算設(shè)計與實際應(yīng)用之間的差距。

上海交通大學(xué)醫(yī)學(xué)院人工智能蛋白質(zhì)設(shè)計課題組長期致力于AI 蛋白質(zhì)設(shè)計和AI 藥物設(shè)計,積極推動 AI 模型在生物醫(yī)藥領(lǐng)域的實際應(yīng)用。課題組先后開發(fā)了CarbonDesign、CarbonNovo等蛋白質(zhì)從頭設(shè)計算法,gMVP、MVP等蛋白質(zhì)定向進化算法,以及AbX、AbNovo、DiffAffinity等抗體設(shè)計專用算法,成果多次發(fā)表于ICML、NeurIPS、ICLR等機器學(xué)習(xí)會議及Nature Machine Intelligence、Nature Communications等學(xué)術(shù)期刊。

團隊也在誠聘助理研究員、博士后和客座學(xué)生等優(yōu)秀人才,歡迎有志于AI 蛋白質(zhì)與藥物設(shè)計的研究人員通過郵箱聯(lián)系。

聯(lián)系郵箱:zhanghaicang@sjtu.edu.cn

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責(zé)任。

熱門文章