首頁 > AI資訊 > 最新資訊 > Science子刊,斯坦福AI方法表示蛋白互作節點,增強功能識別與PPI推理

Science子刊,斯坦福AI方法表示蛋白互作節點,增強功能識別與PPI推理

新火種    2025-01-01

圖片

編輯 | 白菜葉

生物網絡通過詳細描繪基因、蛋白質及其他細胞成分之間的復雜相互作用,為建模生物系統提供了重要工具。

這些網絡將實體表示為節點,將其相互作用(從物理連接到功能關聯)表示為邊,從而為解析生物系統和過程的復雜性奠定了基礎。

例如,在蛋白質-蛋白質相互作用(PPI)網絡中,復雜的連接關系包含了理解細胞過程和疾病機制的關鍵信息。然而,解讀這些網絡以獲取生物學洞察仍面臨巨大挑戰。

在最新的研究中,斯坦福大學(Stanford University)的研究人員提出了一種自監督網絡嵌入框架,稱為判別網絡嵌入 (DNE,discriminative network embedding)。

與主要關注直接或有限階節點鄰近度的傳統方法不同,DNE 通過利用鄰近節點和遠距離節點的表示之間的對比來在本地和全局上表征節點。

測試顯示 DNE 在各種關鍵網絡分析(包括 PPI 推理和蛋白質功能模塊的識別)中均比現有技術表現優異。

該研究以「Deep representation learning of protein-protein interaction networks for enhanced pattern discovery」為題,于 2024 年 12 月 18 日發布在《Science Advance》。

圖片

蛋白質-蛋白質相互作用 (PPI) 網絡是理解生物系統動態的基礎,其中節點代表蛋白質,邊代表蛋白質之間的無數相互作用。

雖然它們在現代生物學中發揮著關鍵作用,但從這些相互交織的網絡中可靠地辨別模式仍然是一項艱巨的挑戰。

挑戰的本質在于全面描述網絡中每個節點與其他節點的關系,并有效地利用這些信息進行準確的模式發現。

新方法 DNE

最新的研究中,斯坦福大學的研究人員介紹了一個通用的圖表示學習框架,該框架使用深度學習在低維空間中保留網絡的非線性和多面結構,以便對生物網絡進行高性能分析。該方法稱為判別網絡嵌入 (DNE),通過其直接相鄰和網絡中較遠節點的表示之間的非線性對比來表征每個節點。

圖片

圖示:DNE 概述。(來源:論文)

DNE 方法允許從整體上看待網絡中每個節點的作用:它突出顯示節點的直接連接,例如 PPI 網絡中蛋白質之間的相互作用,以及網絡內的社區關系,例如蛋白質功能模塊。

圖片

圖示:四個 PPI 基準中不同鏈接預測方法的表現。(來源:論文)

與主要關注節點間有限階接近度的傳統方法不同,DNE 根據其近鄰和較遠節點的表示之間的對比來表征每個節點。通過同時考慮局部連接模式和與更廣泛網絡的交互,DNE 可以更全面地了解網絡內的節點關系。

研究人員在多個 PPI 數據集上對 DNE 的評估表明,它在準確預測 PPI 和識別功能模塊方面的能力優于現有方法。DNE 還表現出對網絡擾動的穩健性,并且在不同的擾動率下始終優于其他方法。

圖片

圖示:穩健性評估顯示,DNE 的 ROC-AUC 分數與其他九種網絡嵌入方法相比,可抵抗鏈接擾動,其中鏈接以不同的比率隨機刪除。(來源:論文)

同時,DNE 通過其嵌入反映蛋白質在 PPI n 跳距離和基因本體功能相似性方面的接近度,有效地捕獲了具有生物學意義的信號。

圖片

圖示:DNE 蛋白質嵌入的可視化。(來源:論文)

雖然 DNE 能夠僅從網絡的結構信息中得出節點嵌入,但當這些特征可用時,它還可以靈活地將節點特征合并到嵌入過程中。

在像 PPI 這樣的生物網絡中,每個節點代表一種蛋白質,節點(或蛋白質)特征可以來自多種來源,例如氨基酸序列、蛋白質的三維(3D)結構和蛋白質定位,從而提供網絡內蛋白質拓撲功能之外的附加信息。

DNE 方法通過整合來自預訓練蛋白質語言模型的蛋白質序列特征來增強網絡嵌入,為預測 PPI 提供了一種卓越的方法。與僅依賴序列數據的現有方法相比,這種整合大大提高了 PPI 預測準確性。

圖片

圖示:評估預測復合物與標準 Retromer 復合物之間的重疊。(來源:論文)

DNE 的優勢

總體而言,DNE 為網絡分析提供了幾個優勢。

第一,它生成更具判別性的嵌入,不僅可以捕獲每個節點的局部連接模式,還可以將這些模式與網絡其他部分的模式區分開來。這可以更準確地表示每個節點的結構角色和社區成員身份,從而降低過度擬合局部網絡噪聲的可能性。

第二,通過整合來自近鄰以及其他網絡段的數據,DNE 提供了整個網絡的更全面的視圖。

第三,DNE 可以利用網絡結構和節點特征來生成更豐富的嵌入。

研究中,這些嵌入用于推斷蛋白質相互作用并識別功能模塊。進一步的應用可能包括疾病基因預測,其中嵌入有助于識別與疾病機制相關的蛋白質,以及蛋白質功能預測,以促進對新測序基因組中的蛋白質進行注釋。

圖片

圖示:結合蛋白質特征的鏈接預測中各種方法的性能比較。(來源:論文)

值得注意的是,DNE 的適用范圍不僅限于 PPI 網絡,還適用于各種領域。對引文網絡、電網和互聯網服務提供商網絡等各種網絡類型的初步研究結果表明,DNE 具有更廣泛的適用性。

研究人員在論文里表示,他們所提出的方法標志著網絡嵌入的顯著進步,并為高性能網絡分析提供了迫切需要的解決方案。

改進空間

雖然所提出的方法在網絡分析方面前景光明,但未來仍有改進空間。

首先,該方法目前優先考慮結構信息而不是節點特征。雖然 DNE 可以整合節點特征,但它們主要用于初始化嵌入,以便最終嵌入可以反映這些節點屬性。通過在上下文節點采樣期間考慮節點特征之間的相似性以及節點連接,可以改進此過程。

其次,所提出的方法使用多層感知器 (MLP) 作為編碼器。研究其他網絡類型以用作編碼器也可能很有趣,例如圖神經網絡。諸如 PPI 之類的生物網絡是推進科學家對復雜生物系統理解的支柱。然而,它們固有的復雜性往往會給分析帶來挑戰,并阻礙下游應用。

結語

總而言之,該團隊提出了一種自監督網絡嵌入技術,旨在為高維網絡數據提供更具辨別力的低維嵌入。所提出的技術通過利用每個節點的本地環境和更廣泛的網絡環境的見解,以獨特的方式捕捉每個節點的內在特征。

針對各種生物網絡的大量實驗研究表明,這種雙重視角提供了全面而穩健的網絡表示,從而實現了可靠的模式發現和準確的下游網絡分析。

因此,DNE 有望成為生物信息學和系統生物學領域的寶貴工具。

論文鏈接:https://www.science.org/doi/10.1126/sciadv.adq4324

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章