分子表征從「圖」到「視頻」,1.2億幀、200萬分子,湖大分子視頻基礎模型登Nature子刊
編輯 | KX
分子表征已經從「圖」擴展到「視頻」了。
兩年前,湖南大學的研究團隊,開發了具有化學意識的深度學習框架 ImageMol,用于從大規模分子圖像中學習分子結構,可準確預測分子特性和藥物靶點。
現在,該研究團隊將 ImageMol 進行了重大升級,提出一個基于分子視頻的基礎模型,稱為 VideoMol,該模型在 1.2 億幀的 200 萬個未標記的類藥物分子和生物活性分子上進行了預訓練。
VideoMol 是一個新穎的分子表征學習框架,與以往基于序列、圖和圖像的分子表征學習方法有顯著不同。VideoMol 將分子視為動態視頻,以視頻處理的方式學習分子表征,這意味著大量視頻表征學習技術可用于分子表征學習。
與之前的 ImageMol 相比,VideoMol 有幾個實質性的升級:
(1)分子視覺表征的內容由二維像素信息升級為三維像素信息;
(2)分子預訓練由基于圖的學習升級為基于視頻的學習;
(3)包含的指紋信息由之前的 1 個指紋(MACCS 鍵)升級為 21 個指紋。
由于 VideoMol 涉及圖像表征學習、視頻表征學習、多視角表征學習等研究領域,因此具有更大的研究潛力,可以激勵更多研究人員進行更大的性能改進。
相關研究以「A molecular video-derived foundation model for scientific drug discovery」為題,于 11 月 8 日發布在《Nature Communications》上。
藥物發現是一個復雜且耗時的過程,包括潛在藥物靶點的識別、化合物設計和合成、化合物的功效和安全性測試。
計算藥物發現使用計算和人工智能技術來協助藥物開發,可以大大減少傳統藥物發現和開發的時間和成本。
對數億種化合物進行精確的分子表征是計算藥物發現界面臨的一項重要挑戰。隨著深度學習和自監督學習的興起,自動化分子表征學習方法可以通過對大規模分子數據集進行預訓練,從分子序列、圖和圖像中提取表征。這些方法在藥物發現的各種任務中表現出顯著的性能提升。
基于視頻表征學習和計算機視覺自監督學習的最新進展,基于自監督視頻的預訓練模型為進一步提高藥物發現的性能提供了機會。
VideoMol 框架:1.2 億幀的 200 萬個分子分子存在于自然界中,不斷進行構象動態變化,視頻是最直接的表示方法。無需人工提取特征,即可從視頻中直接觀察到分子的三維信息,例如原子對之間的距離、多個原子之間形成的夾角等。
具體來說,VideoMol 利用動態感知(dynamic awareness)和物理化學感知,以無監督的方式從大量分子 3D 動態視頻中學習分子表征。VideoMol 從 200 萬個具有人類蛋白質組多種生物活性的分子視頻的 1.2 億幀中捕獲化合物的物理化學信息。
研究人員評估了不同表示在特征提取能力上的優勢,發現所提出的視頻表示比現有表示具有明顯的優勢,在 8 個基本屬性上的提升率為 39.8%。因此,這些顯著的差異促使研究人員開發了 VideoMol,以分子衍生視頻的形式準確預測分子的靶點和性質。
首先,為 200 萬個類藥和生物活性分子生成構象,并為每個 3D 分子渲染 60 幀的動態視頻(共 1.2 億幀)。然后,將分子 3D 視頻輸入視頻編碼器以提取潛在特征,并實施三種預訓練策略,通過考慮視頻的變化和分子的物理化學信息來優化潛在表示。最后,在下游任務(分子靶標和屬性的預測)上對預訓練的視頻編碼器進行微調,以進一步提高模型性能。
VideoMol 通過使用梯度加權類激活映射(Grad-CAM)實現了良好的可解釋性,通過熱圖可視化分子視頻對預測結果的貢獻。
為了全面評估 VideoMol 的性能,研究人員選擇了四類任務:(1)化合物激酶結合活性預測,(2)配體-GPCR(G 蛋白偶聯受體)結合活性預測,(3)抗 SARS-CoV-2 活性預測,(4)分子特性預測。
研究表明,VideoMol 是一種有效的基于分子視頻的表征學習方法,在多種藥物發現任務中表現優于最先進的方法。
發現配體-受體相互作用接下來,研究人員通過 VideoMol 識別 4 個眾所周知的人類靶標的新型配體-受體相互作用:β-分泌酶 1 (BACE1)、環氧合酶 1 (COX-1)、COX-2 和前列腺素 E 受體 4 (EP4),從而評估該模型的通用性。
此外,還驗證了 VideoMol 在 4 個靶標(BACE1、COX-1、COX-2 和 EP4)的虛擬篩選中的高精度,這與正在進行的臨床和實驗數據一致。
與 ImageMol 相比,VideoMol 在這 4 個靶標上實現了 38.1% 的平均精度提升,這表明 VideoMol 能夠推廣到外部驗證集。特別是在 COX-1、COX-2 和 EP4 抑制劑的虛擬篩選中,VideoMol 取得了明顯的優勢,證明了 VideoMol 可以克服數據不平衡(ChEMBL 的 COX-1 和 COX-2 的不平衡率為 0.043 和 0.253)和數據稀缺(ChEMBL 的 EP4 僅有 350 個樣本)的情況。
視頻可視化和模型可解釋性由于分子視頻中的每一幀都代表同一個分子,因此它們在特征空間中的投影應該相似。
為了評估 VideoMol 對分子視頻的判別能力,研究人員隨機選擇了 100 個分子視頻并提取視頻中每一幀的特征。隨后,使用 t-SNE 將每個特征投影到二維空間中。來自同一視頻的幀很好地聚類在一起,而來自不同視頻的幀則明顯分開。通過定量評估這些聚類的 DB(Davies Bouldin)指數。VideoMol 實現了較低的 DB 指數(值為 0.197),表明 VideoMol 具有識別同一分子的不同幀的能力。
研究人員分別從相同和不同的分子視頻中隨機抽取 10,000 對分子幀,并計算這些配對樣本之間的余弦相似度。正如預期的那樣,視頻內的平均相似度很高(88.3%),而視頻間的平均相似度幾乎為零(0.5%),這表明 VideoMol 對同一分子的不同 3D 視圖具有穩健性。
在 VideoMol 的可解釋性方面,研究發現,VideoMol 對同一視頻不同幀的注意力不同,這是由于視角遮擋問題導致有用信息經常分散在不同的視圖中。這顯示了分子視頻的優勢,使 VideoMol 能夠通過掃描每一幀來了解更多的分子信息。此外,值得注意的是,VideoMol 可以感知遮擋場景中的子結構。
研究人員相信,隨著分子成像技術的不斷進步,通過視頻來表示分子并進行推理很有前途。總而言之,VideoMol 的推出,一方面豐富了計算藥物發現領域的分子表征形式,另一方面啟發人們從不同角度學習和理解分子。
注:封面來自網絡
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。