ScienceAl2024「AI+蛋白&核酸&分子互作」專題年度回顧
編輯 | 蘿卜皮
2024年,科學(xué)界迎來了重要的突破與創(chuàng)新,尤其是在人工智能與結(jié)構(gòu)生物學(xué)的結(jié)合領(lǐng)域。正如今年諾貝爾獎頒發(fā)所體現(xiàn)的那樣,人工智能(AI)技術(shù)的迅猛發(fā)展正在推動各學(xué)科的深度融合,揭示了生命科學(xué)研究的新機(jī)遇與前景。
在這一年里,AI 與生物學(xué)的交匯點愈發(fā)引人注目,成為推動現(xiàn)代生物醫(yī)藥、醫(yī)學(xué)研究、生命科學(xué)等領(lǐng)域變革的重要力量。
具體而言,蛋白質(zhì)結(jié)構(gòu)預(yù)測、蛋白-蛋白互作、蛋白-核酸互作等基礎(chǔ)生命科學(xué)的關(guān)鍵問題,依托 AI 的計算能力,取得了令人矚目的進(jìn)展。
AI 技術(shù)已經(jīng)打破了傳統(tǒng)方法的局限,不僅加深了我們對生命本質(zhì)的理解,也為藥物研發(fā)和疾病診斷提供了全新的思路。這些領(lǐng)域的突破不僅推動了基礎(chǔ)生物學(xué)的深入探索,也使酶工程、制藥、醫(yī)療診斷等實際應(yīng)用場景中誕生了新機(jī)遇。
接下來,ScienceAI 將回顧 2024 年 AI 在結(jié)構(gòu)生物學(xué)、生物大分子互作領(lǐng)域的一些重要研究進(jìn)展。
溫馨提示:點擊文章標(biāo)題可直達(dá)文章。
新SOTA,浙大、中科院深度學(xué)習(xí)模型可靠、準(zhǔn)確預(yù)測蛋白-配體,助力藥物開發(fā)AI for Science 是科學(xué)的未來,NVIDIA 正加速它的到來性能遠(yuǎn)超當(dāng)前SOTA,首個可解釋RNA的AI植物基礎(chǔ)模型來了,整合1124種植物RNA信息量化617,462種人類微蛋白必需性,北大LLM蛋白質(zhì)綜合預(yù)測與分析,登Nature子刊精確屬性控制,湖大、西電從頭藥物設(shè)計AI方法,登Nature子刊準(zhǔn)確、快速地從頭預(yù)測RNA 3D結(jié)構(gòu),港中大、復(fù)旦等深度學(xué)習(xí)方法RhoFold+登Nature子刊準(zhǔn)確率84.09%,騰訊AI Lab發(fā)布Interformer,用于蛋白質(zhì)-配體對接及親和力預(yù)測,登Nature子刊壓縮率達(dá)10的48次方,實現(xiàn)蛋白序列空間極端壓縮,清華EvoAI登Nature子刊高精度預(yù)測蛋白構(gòu)象變化,中國科大、上科大通用深度學(xué)習(xí)模型探索蛋白質(zhì)動態(tài)變化,新AI方法JAMUN比標(biāo)準(zhǔn)MD模擬更快、更準(zhǔn)確無需預(yù)訓(xùn)練,親和力與天然蛋白相當(dāng),中國科大的蛋白質(zhì)從頭設(shè)計方法登Nature子刊計算效率領(lǐng)先10倍,中國科大、哈佛功能蛋白質(zhì)設(shè)計深度生成模型登Nature子刊AlphaFold3級性能、開源、可商用,MIT團(tuán)隊推出生物分子預(yù)測模型Boltz-1蛋白預(yù)測從數(shù)月縮短至數(shù)小時,MassiveFold出于AlphaFold而勝于AlphaFold3生成超10萬bp的DNA序列,北理工邵斌團(tuán)隊生成式DNA大語言模型,登Nature子刊登Science封面!基因組基礎(chǔ)模型Evo重磅發(fā)布,AI解碼分子、DNA、RNA和蛋白質(zhì)AI面臨的五個蛋白質(zhì)設(shè)計問題,Nature找了一群專家來討論AlphaFold3開源了,諾獎AI工具人人可用,開啟生物分子設(shè)計新時代ByteDance Research登Nature子刊:AI技術(shù)助力冷凍電鏡揭示蛋白質(zhì)動態(tài)改進(jìn)蛋白突變穩(wěn)定性預(yù)測,清華龔海鵬團(tuán)隊AI蛋白工程模型登Nature子刊AI預(yù)測序列與催化性能的潛在關(guān)系,中國科學(xué)院、北師大設(shè)計合理酶變體,登Nature子刊量子級精度,靜態(tài)到動態(tài),微軟蛋白MD模擬系統(tǒng)登Nature普林斯頓王夢迪團(tuán)隊提出蛋白水印方法,助力AI蛋白生成的版權(quán)保護(hù)與安全精準(zhǔn)預(yù)測RNA可變剪接,浙大多模態(tài)深度學(xué)習(xí)模型SpTransformer登Nature子刊登Nature,AI設(shè)計DNA開關(guān),MIT團(tuán)隊實現(xiàn)精確的細(xì)胞控制準(zhǔn)確、高效、物理有效,中科大、北大提出「兩段式」分子對接統(tǒng)一框架DeltaDock不懂AI、不會編碼?如何輕松拿捏AlphaFold準(zhǔn)確預(yù)測蛋白結(jié)構(gòu)Nature 子刊,化學(xué)語言模型自動設(shè)計多靶點配體從結(jié)構(gòu)準(zhǔn)確預(yù)測蛋白質(zhì)功能,東北大學(xué)「CNN+GCN」統(tǒng)一框架,優(yōu)于現(xiàn)有方法準(zhǔn)確預(yù)測蛋白質(zhì)功能,中山大學(xué)基于幾何圖學(xué)習(xí)的酶工程新方法AI發(fā)現(xiàn)超16萬種新RNA病毒?阿里云、中山大學(xué)合作研究登Cell化學(xué)諾獎為何頒給「AI+生物」,憑什么Baker獨占一半?AI再奪諾獎!2024諾貝爾化學(xué)獎授予蛋白質(zhì)計算領(lǐng)域三位科學(xué)家更簡單、更清晰,解析核酸、蛋白、細(xì)胞等結(jié)構(gòu),AI實現(xiàn)快速分子模式挖掘Science 發(fā)文,高通量蛋白質(zhì)組學(xué)和人工智能的革命同時生成蛋白序列和結(jié)構(gòu),David Baker團(tuán)隊序列空間擴(kuò)散新模型登Nature子刊Nature子刊,川大團(tuán)隊機(jī)器學(xué)習(xí)結(jié)合MD,預(yù)測蛋白質(zhì)變構(gòu),助力藥物研發(fā)借助谷歌AI工具,科學(xué)家揭示「生物蛋白如何應(yīng)對惡劣條件」病毒從何而來?AlphaFold等AI正在尋找答案新型蛋白質(zhì)大語言模型即將登陸Google Cloud加速蛋白質(zhì)工程,微軟開發(fā)蛋白突變效應(yīng)預(yù)測AI框架μFormer抗體親和力增強(qiáng)17倍,百奧幾何、復(fù)旦團(tuán)隊AI方法模擬細(xì)微蛋白質(zhì)互作,登Nature子刊AI蛋白大模型推動生物產(chǎn)業(yè)變革,分子之心完成A輪融資超越AlphaFold3,OpenAI投資的AI生物初創(chuàng)發(fā)布Chai-1,分子結(jié)構(gòu)預(yù)測新SOTADeepMind蛋白質(zhì)設(shè)計新工具AlphaProteo,從頭設(shè)計高親和力蛋白結(jié)合劑,成功率最高88%從頭設(shè)計「超難」癌癥抗體,大衛(wèi)貝克團(tuán)隊AI生物計算方法的新應(yīng)用提速1400倍,準(zhǔn)確標(biāo)注酶活性位點,浙大、澳門理工多模態(tài)深度學(xué)習(xí)方法,登Nature子刊準(zhǔn)確預(yù)測蛋白質(zhì)「運(yùn)動」?AlphaFold融合物理知識,南京大學(xué)團(tuán)隊蛋白構(gòu)象運(yùn)動新策略命中率達(dá)60%,AlphaFold預(yù)測受體的三維結(jié)構(gòu),加速藥物開發(fā)蛋白質(zhì)功能預(yù)測新SOTA,上海理工、牛津等基于統(tǒng)計的AI方法,登Nature子刊中科院計算所團(tuán)隊提出CarbonNovo,基于AI進(jìn)行蛋白質(zhì)結(jié)構(gòu)和序列的端到端從頭設(shè)計AI從頭設(shè)計蛋白質(zhì)「開關(guān)」,蛋白質(zhì)設(shè)計的驚人突破,David Baker研究登Nature預(yù)測蛋白質(zhì)-DNA結(jié)合特異性,南加州大學(xué)團(tuán)隊開發(fā)幾何深度學(xué)習(xí)新方法從頭設(shè)計抗體,騰訊、北大團(tuán)隊預(yù)訓(xùn)練大語言模型登Nature子刊SOTA性能,華盛頓大學(xué)開發(fā)Transformer模型將質(zhì)譜轉(zhuǎn)化為肽序列,登Nature子刊Nature子刊,北大團(tuán)隊通用AI框架對蛋白-蛋白對接進(jìn)行綜合結(jié)構(gòu)預(yù)測,彌合實驗與計算的差距Nature子刊,快10倍,基于Transformer的逆向蛋白質(zhì)序列設(shè)計方法生成394,760種蛋白質(zhì)表征,哈佛團(tuán)隊開發(fā)AI模型,全面理解蛋白質(zhì)上下文萬字長文,騰訊、清華等多位生物大模型作者專訪,暢談AI生物學(xué),解析大型細(xì)胞模型技術(shù)Nature子刊,諾華團(tuán)隊評測ML模型在靶向蛋白質(zhì)降解劑中的特性預(yù)測SOTA性能,廈大多模態(tài)蛋白質(zhì)-配體親和力預(yù)測AI方法,首次結(jié)合分子表面信息登Science,藥物親和力增加37倍,AI對蛋白、抗體復(fù)合物進(jìn)行無監(jiān)督優(yōu)化Nature子刊,使用3D transformer和HMM對冷凍電鏡密度圖進(jìn)行從頭原子蛋白結(jié)構(gòu)建模精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質(zhì)互作AlphaFold 3 向解碼分子行為和生物計算邁出重要一步,Nature 子刊銳評Nature子刊,優(yōu)于AlphaFold,全原子采樣,一種預(yù)測肽結(jié)構(gòu)的AI方法上交大洪亮課題組&上海AI實驗室團(tuán)隊發(fā)布FSFP,基于語言模型的蛋白質(zhì)功能小樣本預(yù)測方法,登Nature子刊僅幾秒,準(zhǔn)確推斷蛋白動力學(xué)信息,山大、北理工等AI模型RMSF-net登Nature子刊分子100%有效,從頭設(shè)計配體,湖南大學(xué)提出基于片段的分子表征框架登Nature子刊,拓?fù)銽ransformer模型進(jìn)行多尺度蛋白質(zhì)-配體互作預(yù)測,助力藥物研發(fā)人工智能如何徹底改變蛋白質(zhì)科學(xué),AlphaFold是起點,終點會在哪里?清華AIR等提出ESM-AA,首個從氨基酸到原子尺度的蛋白質(zhì)語言模型準(zhǔn)確率達(dá)0.96,從序列中預(yù)測蛋白-配體互作的物理化學(xué)約束圖神經(jīng)網(wǎng)絡(luò)高效且準(zhǔn)確,鄭州大學(xué)團(tuán)隊開發(fā)新AI工具識別藥物-靶標(biāo)相互作用模擬5億年的進(jìn)化信息,首個同時推理蛋白質(zhì)序列、結(jié)構(gòu)和功能的生物學(xué)大模型比傳統(tǒng)方法高30倍,中國科學(xué)院團(tuán)隊Transformer深度學(xué)習(xí)模型預(yù)測糖-蛋白質(zhì)作用位點成功率超越RoseTTAFold系列,用序列信息直接預(yù)測蛋白質(zhì)-配體復(fù)合物結(jié)構(gòu)「AI+物理先驗知識」,浙大、中國科學(xué)院通用蛋白質(zhì)-配體相互作用評分方法登Nature子刊取代昂貴量子方法,南科大AI方法實現(xiàn)蛋白質(zhì)-藥物系統(tǒng)多尺度量子「精煉」助力藥物發(fā)現(xiàn),北京蛋白質(zhì)組學(xué)研究中心提出基于蛋白質(zhì)序列的深度遷移學(xué)習(xí)框架1.8B參數(shù),阿里云首個聯(lián)合DNA、RNA、蛋白質(zhì)的生物大模型,涵蓋16.9W物種SOTA性能,多尺度學(xué)習(xí),中山大學(xué)提出蛋白質(zhì)-藥物相互作用AI框架效果超AlphaFold系列,量子計算方法用于蛋白質(zhì)結(jié)構(gòu)預(yù)測填補(bǔ)AlphaFold3空白,字節(jié)跳動提出物理引導(dǎo)的方法讓蛋白質(zhì)動起來登Nature子刊,中科院計算所團(tuán)隊開發(fā)CarbonDesign,進(jìn)行準(zhǔn)確且穩(wěn)健的蛋白質(zhì)序列設(shè)計結(jié)合量子特征、2萬個分子動力學(xué)模擬,新蛋白-配體復(fù)合物ML數(shù)據(jù)集,登Nature子刊準(zhǔn)確預(yù)測藥物-靶點相互作用,江南大學(xué)提出深度學(xué)習(xí)融合GNN新方法MINDGNature回應(yīng):為什么在沒有代碼的情況下發(fā)布AlphaFold3?多功能RNA分析,百度團(tuán)隊基于Transformer的RNA語言模型登Nature子刊AlphaFold 3輕松應(yīng)對核酸、脂類分子?科學(xué)家迫不及待地更新了評測預(yù)測配體-靶標(biāo)對的結(jié)合親和力,哈工大開發(fā)新SOTA藥物表示模型AlphaFold 3 重磅問世,全面預(yù)測蛋白質(zhì)與所有生命分子相互作用及結(jié)構(gòu),準(zhǔn)確性遠(yuǎn)超以往水平首次,西湖大學(xué)用蛋白質(zhì)語言模型定向改造堿基編輯器,登Cell子刊輝瑞 AI 方法登 Science,揭示數(shù)以萬計的配體-蛋白質(zhì)相互作用4000萬蛋白結(jié)構(gòu)訓(xùn)練,西湖大學(xué)開發(fā)基于結(jié)構(gòu)詞表的蛋白質(zhì)通用大模型,已開源預(yù)測蛋白質(zhì)共調(diào)控和功能,哈佛&MIT訓(xùn)練含19層transformer的基因組語言模型登Science,藥物親和力<5納摩爾,加州大學(xué)開發(fā)特異性藥物結(jié)合蛋白的從頭計算方法3倍靈敏度,搜索百萬蛋白對只需幾秒,復(fù)旦、山大、上海交大開發(fā)新的蛋白質(zhì)語言模型預(yù)測完整糖肽的片段光譜,浙大開發(fā)深度學(xué)習(xí)方法DeepGlyco少量數(shù)據(jù)實現(xiàn)高通用性,KAIST開發(fā)藥物設(shè)計3D分子生成新框架優(yōu)于SOTA,騰訊AI Lab開發(fā)雙重擴(kuò)散模型,實現(xiàn)靶標(biāo)配體3D分子生成和先導(dǎo)化合物優(yōu)化精確預(yù)測相分離蛋白質(zhì),同濟(jì)大學(xué)&中國科學(xué)院開發(fā)機(jī)器學(xué)習(xí)預(yù)測器PSPire騰訊AI Lab 3篇蛋白質(zhì)組論文入選國際頂級期刊,為闡釋生命提供重要技術(shù)參考里程碑時刻!David Baker 團(tuán)隊利用 AI 從頭設(shè)計抗體準(zhǔn)確性比AlphaFold2高6倍,Basecamp推出AI模型BaseFold,蛋白結(jié)構(gòu)預(yù)測新突破預(yù)測所有生物分子,David Baker 團(tuán)隊蛋白質(zhì)設(shè)計新工具 RoseTTAFold All-Atom 登 Science用基于結(jié)構(gòu)的突變偏好進(jìn)行蛋白質(zhì)設(shè)計,加州大學(xué)、MIT、哈佛醫(yī)學(xué)院團(tuán)隊開發(fā)了一種無監(jiān)督方法計算蛋白質(zhì)工程最新SOTA方法,牛津團(tuán)隊用密碼子訓(xùn)練大語言模型70 億參數(shù)訓(xùn)練,從DNA、RNA、蛋白質(zhì)到全基因組,生物學(xué)通用大模型新標(biāo)桿AlphaFold 預(yù)測細(xì)菌生存所需的 1402 種蛋白互作,最完整的細(xì)菌必需相互作用圖譜進(jìn)行藥物靶標(biāo)親和力預(yù)測,浙大&華科大團(tuán)隊開發(fā)擴(kuò)展圖學(xué)習(xí)卷積網(wǎng)絡(luò)方法超越AF2?Iambic、英偉達(dá)、加州理工學(xué)院開發(fā)多尺度深度生成模型,進(jìn)行狀態(tài)特異性蛋白質(zhì)-配體復(fù)合物結(jié)構(gòu)預(yù)測Nat. Commun.|人類水平的準(zhǔn)確性,哈佛醫(yī)學(xué)院團(tuán)隊使用機(jī)器學(xué)習(xí),從空間蛋白質(zhì)組數(shù)據(jù)中快速、精確地識別細(xì)胞類型科學(xué)家用分子動力學(xué)和AlphaFold,揭示了轉(zhuǎn)運(yùn)蛋白的未解結(jié)構(gòu)生成高質(zhì)量、生物學(xué)上合理且多樣化的蛋白質(zhì)結(jié)構(gòu),微軟和斯坦福提出基于擴(kuò)散的生成模型預(yù)測蛋白質(zhì)動態(tài)對接?上海交大&星藥科技&中山大學(xué)等團(tuán)隊開發(fā)新的深度等變生成模型David Baker在Science發(fā)文:AI驅(qū)動的蛋白質(zhì)設(shè)計應(yīng)當(dāng)符合生物安全未來五年AI如何改變各學(xué)科?從LLM到AI蛋白設(shè)計、醫(yī)療保健......藥物-靶標(biāo)親和力預(yù)測,上科大團(tuán)隊開發(fā)了一種Transformer編碼器和指紋圖譜相結(jié)合的方法如何利用革命性的蛋白質(zhì)結(jié)構(gòu)工具來發(fā)現(xiàn)藥物?AlphaFold 發(fā)現(xiàn)了數(shù)千種可能的致幻劑國家蛋白質(zhì)科學(xué)中心&北工大團(tuán)隊開發(fā)了一種深度學(xué)習(xí)工具,用于大型隊列 LC-MS 數(shù)據(jù)分析靈敏度超40%、精度達(dá)90%的從頭肽測序,一種深度學(xué)習(xí)驅(qū)動的串聯(lián)質(zhì)譜分析方法降低預(yù)測誤差,中國科學(xué)院團(tuán)隊開發(fā)用于預(yù)測酶動力學(xué)參數(shù)的統(tǒng)一框架上海交大&中山大學(xué)團(tuán)隊使用ESMFold、預(yù)訓(xùn)練語言模型以及Graph Transformer,進(jìn)行蛋白質(zhì)結(jié)合位點預(yù)測
Tags:
相關(guān)推薦
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。