首頁 > AI資訊 > 最新資訊 > 比AlphaFold2還強,AI生物醫藥創企獲6000萬融資,打造「生物學GPT」

比AlphaFold2還強,AI生物醫藥創企獲6000萬融資,打造「生物學GPT」

新火種    2024-11-20

專攻蛋白質結構預測,AI創企與谷歌DeepMind同臺競爭。

今天,AI生物醫藥創企Basecamp Research 宣布獲6000萬美元B輪融資 ,由Singular領投,其他投資者包括S32、redalpine、True Ventures和Hummingbird Ventures等以及其他多位知名投資人。

與剛剛拿下諾貝爾化學獎的谷歌DeepMind相似,Basecamp Research同樣借助AI大模型發現新型蛋白質結構,并幫助創造新藥。據Basecamp Research稱,在準確預測大型復雜蛋白質結構和小分子相互作用方面, 其基礎模型 BaseFold 的表現優于AlphaFold 2 。

同時,Basecamp Research還在打造最大的天然生物多樣性圖譜數據庫,其中包含超過60億個基因、基因組以及其他生物學相關數據之間的關系。

Basecamp Research還打造了企業級AI代理,它不僅可以回答與生物學和自然界生物多樣性相關的任何問題,還可以產生人類無法獨自獲得的新見解。

Basecamp Research 官網

該公司計劃利用這筆資金推動更多與其他生物醫學和研究組織的合作,也收集更多數據來擴展其模型。前谷歌 Verily Life Sciences首席執行官Andy Conrad認為,Basecamp Research 的平臺可以“解決生物制藥行業甚至不知道要問的問題”。

Basecamp Research成立于2019年,總部位于倫敦,聯合創始人兼首席執行官Glen Gowers和Oliver Vince都是生物學博士,在牛津大學讀本科時相識。公司名Basecamp Research為了紀念兩人共同在冰蓋上生活過的時光。“我們率先建立了第一個移動 DNA 測序實驗室。”Vince說道。

Basecamp Research聯合創始人

01

比AlphaFold2高六倍

專為生物AI構建數據庫

盡管AlphaFold2展現了AI 在生物技術領域的應用強大潛力,但Basecamp Research認為AlphaFold2大量借鑒公共MGnify數據庫,該數據庫以序列不完整而聞名,這可能會影響較大蛋白質結構預測的質量。

“Basecamp Research的BaseFold解決了下一個重大計算挑戰,即為更大、更復雜的蛋白質實現晶體學級別的精度,尤其是那些在現有蛋白質序列數據庫中代表性不足的蛋白質。”Gowers提到。

BaseFold是通過用BaseGraph增強AlphaFold2模型而創建的,該模型可以根據蛋白質的氨基酸序列預測其3D結構。BaseGraph是專門為生物 AI 構建的基礎數據集,通過與25多個國家建立訪問和利益共享伙伴關系收集相關數據。

從0構造的深度學習模型BaseFold利用Basecamp Research專門構建的基礎數據集,顯著提高大型復雜蛋白質結構和小分子相互作用的預測準確性—— 其準確度比AlphaFold2高出六倍,小分子對接準確度提高了三倍。

此外,Basecamp Research將與英偉達合作,為英偉達旗下的AI醫藥平臺BioNeMo平臺提供優化。

Gowers博士補充道:“我們知道,在人工智能領域,最好的數據會產生最好的結果,我們構建的全新專用基礎數據集已經對藥物開發和人類健康產生了廣泛的影響。”

02

打造"生物學GPT"

讓AI理解所有生物語言

如今,人們在訓練生物學模型方向存在巨大的數據缺口。世界上一些頂級制藥公司正在訓練的模型對自然界了解不夠多。

盡管人類在生物學上的探究從未停止,擁有大量的書籍、研究以及相當規模的數據庫,但這些數據大多已經過時、結構不合理且前后不一致。“人類可能只獲取了1%左右的世界生物多樣性信息,這也意味著我們人類目前甚至沒有能力提出正確的問題。”Gowers說。

因此,Basecamp Research選擇從零開始收集第一手原始數據,并構建相應的模型,期待能夠打造一種能夠比人類更好地洞察生物學的AI。

Basecamp Research官網展現數據庫的成長

Basecamp Research的研究人員走遍世界各地收集數據,并將其與AI程序相結合, 更高效地為生物界構建“ChatGPT” 。它不僅可以回答與生物學和自然界有關生物多樣性的任何問題,還可以產生人類無法看到的新見解。

相較于ChatGPT理解程序語言或自然語言,Basecamp Research則是希望“生物界GPT”能夠理解DNA語言、生物語言。Gowers認為如果給予AI足夠的數據,語言模型能夠發揮出超乎尋常的作用。

03

寶潔、Colorifix是客戶

主攻企業服務

Basecamp Research迄今已與25個國家的100多家組織達成合作,以擴大其數據庫,提供一手資料,約有15家正在使用其AI幫助開發新產品。

寶潔公司正在利用這些模型設計洗滌劑中的酶,以便在低溫下清除污漬。英國生物基染料制造商Colorifix正借助該模型研究更具可持續性的新型織物染料配方。

該公司還與大型生物醫學研究中心Broad Institute的合作。目前,Broad Institute實驗室正在研究用于制造基因藥物的“新型融合蛋白和其他大分子”,他們正在使用Basecamp Research的數據集來開發這些藥物。

Gowers表示,Basecamp Research在B2B基礎上開展業務的機會更多,而不會將像OpenAI將資源投入到開發一款與公眾互動的產品上。

Basecamp還將與Howard Hughes醫學研究所研究員David R. Liu博士以及Liu實驗室合作,創造“可編程基因藥物”的新方法,通過開發新方法來發現融合蛋白和其他大分子物質,以生產下一代藥物,從而進一步研究疾病治療方法。

??作者:Xuushan,編輯:蔓蔓周,36氪經授權發布。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章