將合成生物學與AI相結合,以無細胞方式尋找新抗生素
編輯 | 蘿卜皮
生物活性肽是健康和醫學的關鍵分子。深度學習為生物活性肽的發現和設計帶來了巨大的希望。然而,需要合適的實驗方法來以高通量和低成本驗證候選物。
馬克斯·普朗克陸地微生物研究所(Max Planck Institute for Terrestrial Microbiology)的研究團隊建立了無細胞蛋白質合成(CFPS)管線,用于直接從 DNA 模板快速、廉價地生產抗菌肽 (AMP)。為了驗證該平臺,研究人員使用深度學習從頭設計了數千個 AMP。
使用計算方法,研究人員對使用 CFPS 管線生成和篩選的 500 個候選物進行了優先排序。該團隊鑒定了 30 種功能性 AMP,并通過分子動力學模擬、抗菌活性和毒性對其進行了進一步表征。
值得注意的是,六種 de novo-AMP 具有針對多重耐藥病原體的廣譜活性,并且不會產生細菌耐藥性。該工作證明了 CFPS 在 24 小時內高通量、低成本生產和測試生物活性肽的潛力。
該研究以「Cell-free biosynthesis combined with deep learning accelerates de novo-development of antimicrobial peptides」為題,于 2023 年 11 月 8 日發布在《Nature Communications》。
據世界衛生組織稱,抗菌素耐藥性(AMR)是全球十大健康威脅之一。僅2019年,致病性大腸桿菌、ESKAPE病原體(屎腸球菌、金黃色葡萄球菌、肺炎克雷伯菌、鮑曼不動桿菌、銅綠假單胞菌、腸桿菌)、肺炎鏈球菌、結核桿菌等多重耐藥菌就造成 127 萬人死亡。
預計到 2050 年,這一數字每年將達到 1000 萬。盡管威脅迫在眉睫,但新型抗菌藥物的開發仍然落后。2021 年,雖然有超過 4000 種免疫腫瘤化合物進入臨床試驗,但只有 40 種抗菌藥物接受了臨床研究(其中沒有一種對多重耐藥革蘭氏陰性菌有活性),這表明迫切需要增加新型抗菌化合物的開發。
一類有前景的抗菌化合物是抗菌肽(AMP)。一大類 AMP 含有 12-50 個典型氨基酸 (AA) 的線性肽,它們已成為自然界細菌抗菌庫以及多細胞生物先天免疫系統的一部分。
與經典抗生素相比,AMP 的耐藥性發展減少,主要是因為(i)大多數 AMP 直接作用于細胞膜,(ii)顯示相對較高的殺傷率,(iii),對 AMP 的抗性是由相當非特異性的機制賦予的,這減少了突變或水平基因轉移事件的機會。總體而言,這使得 AMP 成為下一代抗菌藥物的重要候選者。
迄今為止,科學家已對約 5000 種 AMP 進行了表征,其中大部分是天然來源的。然而,這 5000 個 AMP 僅涵蓋了大自然可能探索的可能解決方案空間的一小部分(30 個 AA AMP 約為 2030 個)。此外,從基因組和宏基因組中進行 AMP 挖掘受到有限的天然(尚未發現)AMP 以及可用的計算和實驗 AMP 挖掘工具的阻礙。因此,科學家從這片未知領域發現新的 AMP 的能力是有限的。
由于隨機生成的肽不太可能表現出抗菌特性,因此無限開發 AMP 的一種方法是使用深度學習模型,該模型越來越多地用于從頭蛋白質和肽設計。在這種稱為生成深度學習的方法中,模型使用未標記的數據來學習訓練集中的自然蛋白質序列景觀,以提出新的自然蛋白質序列。
這些模型與使用標記數據從蛋白質序列預測蛋白質特定屬性(標簽)的預測模型不同。生成和預測深度學習最近已用于發現新的 AMP 序列,隨后通過單個候選物的化學合成來創建和驗證這些序列。雖然這一原理驗證展示了深度學習在 AMP 發現中的潛力,但由于缺乏中高通量生產和篩選更多 AMP 候選物的便捷方法,該方法的更廣泛應用受到限制。
提高 AMP 生產通量的一種可能性是從化學合成轉向基于 DNA 的生物生產方法。然而,在大腸桿菌等微生物中異源表達 AMP 有幾個缺點:(i) 它是時間和勞動力密集型的;(ii) 它需要從細胞培養物中克隆、生產和純化 AMP,最重要的是;(iii) 許多(有效的)AMP 候選物可能不可用,因為它們可能在誘導后殺死生產菌株。
無細胞蛋白質合成(CFPS)為這些挑戰提供了一個有前途的解決方案。CFPS 系統是體外轉錄翻譯 (TX-TL) 系統,直接使用 DNA 模板進行蛋白質生物合成,從而可以在活細胞外生產肽。因此,這些系統可以幫助克服潛在的細胞毒性效應,并為從線性 DNA 中快速、小規模平行生產數百種肽開辟道路。
「在深度學習中,神經網絡——受人腦啟發的算法——從大量數據中學習。這種類型的機器學習對于肽發現和從頭設計具有巨大的前景。然而,通常隨后會進行肽的化學合成以進行實驗驗證,這相當困難且耗時,并且嚴重限制了可以化學合成的肽的數量。」馬克斯·普朗克陸地微生物研究所的 Amir Pandi 解釋道。
在這里,馬克斯·普朗克陸地微生物研究所 Amir Pandi 所在的團隊將深度學習和 CFPS 結合起來,進行從頭設計,在 24 小時內快速生產和小規模篩選 AMP,每個單獨的 AMP 生產檢測成本低于 10 美元(不包括 DNA 片段的成本)。
在探索了約 500,000 個理論序列后,研究人員篩選了 500 個 AMP 候選物,鑒定出 30 個功能性 AMP,它們與任何天然序列完全無關。值得注意的是,其中六種 AMP 對多重耐藥病原體表現出高抗菌活性,沒有出現耐藥性,對人體細胞只有極小的毒性。
雖然在該研究中,研究人員使用 CFPS 管線來合成含有天然氨基酸的線性肽,但未來可以利用的 CFPS 的獨特優勢是可以合成含有環和非規范氨基酸的肽。不過,目前的 CFPS 在表達具有難以合成基序的肽時可能面臨困難。
此外,肽的表達性和結構以及與 PURE 成分可能的相互作用可能會導致假陰性結果。幸運的是,CFPS 的吞吐量通過篩選大量候選人來彌補這種情況。請注意,肽序列越長(抗菌特異性越高),化學合成就越困難,CFPS 工作就越困難。此外,該 CFPS 管線可應用于大分子蛋白質。
與其他方法相比,研究人員在尋找功能性 AMP 方面的成功率處于相同范圍內,所有測試候選物的成功率為 6%(該團隊的最佳生成器-回歸器組合為 12.6%),而 Das 團隊報告的成功率為 10%。然而,發現的功能性 AMP 總數要高出一個數量級(30 個 AMP 對 2 個),并且速度大幅增加(24 小時對 28 天)且成本相當低(生產一種 AMP 用于并行篩選兩種菌株的成本<10 美元,不包括不斷降低的 DNA 合成或使用 PCR 引物的成本)。雖然深度學習模型可以提高未來工作的命中率,但像該團隊這樣的高吞吐量方法可以實現更高的命中率。此外,CFPS 系統的內部制備可以將肽生產成本降低至約 1 美元。
該團隊的 de novo AMP 雖然獨特且多樣化,但與已知的 AMP 具有共同的特性。預計它們主要是富含陽離子和疏水性氨基酸的 α-螺旋肽,并且優選作用于帶負電的 IM,這表明該管線能夠設計遵循 AMP 一般構建原則的新穎序列。由此產生的 AMP 具有幾個特征(經過體內驗證)可能有助于其成功轉化為治療應用,包括廣譜活性、細菌耐藥性發展傾向低、局部或全身使用的潛力以及與現有療法的協同潛力。
盡管該團隊的主要重點是尋找具有廣譜活性的 AMP,但該管線與各種機器學習技術相結合,也非常適合具有更具體特征的 AMP 的開發和迭代優化。這些特征可能包括選擇性和特異性、穩定性、體內生物利用度、免疫調節特性、與現有藥物的協同作用以及耐藥性。通過完善這些功能,該管線有潛力推進各種臨床應用的 AMP 設計。
總的來說,該團隊的工作提供了原理驗證,說明如何使用 CFPS 來充分發揮未來機器學習方法的潛力。特別是考慮到 DNA 合成成本不斷降低,深度學習和 CFPS 相結合的方法為肽生產和篩選提供了一種時間、成本和勞動力有效的方法。因此,該工作有可能以更高的速度和深度探索 AMP 的設計功能空間。這有望在未來促進基于肽的候選藥物的發現和開發。
「我們從無細胞合成生物學、人工智能和高通量方法的結合中獲益匪淺。通過增加可在 24 小時內進行實驗測試的候選物數量,發現活性抗菌肽的機會增加了。」Pandi 說,「因此,我們的無細胞蛋白質合成管道不僅補充了計算設計的最新進展。它還有潛力更快、更經濟地探索生物活性肽的設計和功能之間的關系。」
該團隊的負責人之一 Tobias Erb 補充道:「這種合成生物學和機器學習相結合的新方法將會引起生物醫學和生物活性肽領域科學家的興趣。」
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。