首頁 > AI資訊 > 最新資訊 > 2023中國高新技術論壇主旨演講——深圳華大生命科學研究院副院長金鑫

2023中國高新技術論壇主旨演講——深圳華大生命科學研究院副院長金鑫

新火種    2023-11-22

謝謝主持人的介紹,也特別感謝大會組委的邀請,讓我有這個機會和各位老師、各位朋友們來分享近期我們做的一些工作。

我今天分享的題目叫做BIT與IBT,實際上就是生命科學和信息科學相互的支撐和互相的促進。這個背景圖就是華大剛剛落成的全球總部,在深圳美麗的大梅沙灣畔,希望大家有興趣可以造訪我們的新總部。

image什么是生命?我們早上聽了各位老師從腦機接口、合成生物學很多方面闡釋了生命,但是從生命的本原和信息傳遞角度講,實際上傳遞生物信息的最基本的材料就是我們的DNA,如果我們看細胞的結構,它中間的DNA就是一代一代傳承,承載生命的核心信息的這么一個編碼。人類基因組上面一共有30億的堿基,在90年代到2000年代初,全世界科學家花了13年的時間,30多億美金才完成了第一個人的基因組圖譜的繪制,前排左二的中國科學家就是我的老師楊煥明院士,他參與了圖譜繪制工作。

DNA是承載生命信息和傳遞生命信息的基本載體,生命科學不同于物理科學和數學的科學底座和基座,生命科學領域里面今天能夠稱得上法則和公式的東西非常少,大家普遍認同的法則就是這一條,叫做中心法則,這個中心法則就是講生命的信息主要是承載和傳遞通過DNA,DNA把它轉錄變成一個實時的信息,變成RNA,RNA通過翻譯形成了蛋白。之前的很多工作實際上都集中在DNA層面,就像人類基因組計劃,剛剛分享的老師介紹到的RNA技術的突破和新興的應用給我們帶來了mRNA疫苗和新的治療技術。蛋白現在也是非常重要的研究領域,它是很多生命過程的重要承載者。

但是之前一直有一個問題很難回答清楚,就是我們全身這么多細胞,每一個細胞都是同一套基因組、同一套基因序列,為什么有的變成了神經細胞,有的變成皮膚細胞,有的變成肌肉細胞,這些生命信息是怎么在不同的時間和空間維度之下展開的?在這個問題之下,我們一直努力的方向就是把IT技術領域建立的方法和技術支撐到我們的生命應用當中,我們希望從生老病死的各個維度把生命盡可能的做全景、全周期、多模態的數字化,在不同的模態數字化基礎之上應用到IT技術更好理解生命。而要去做數字化的解析,有一個非常重要的底層工具和核心支撐就是基因測序儀,大家知道基因測序儀不僅可以測DNA,也可以測定RNA,像基因測序儀是做多為組學數字化的工具,它是一個非常核心和關鍵的工具。

在20多年前,所有的基因測序儀都是有少數幾個美國頂尖的公司生產和制造的,我們一直不掌握這個底層工具,直到2013年初,我們才有機會開啟了基因測序儀國產化和自主制造。隨著2015年推出第一款自主知識產權和自主技術平臺的全國產的基因測序儀,我們把這個數字化,生命數字化的工具能力不斷地在推向極致。大家如果看到我們國產的基因測序儀,它的代號和命名是非常簡單的,它的后面編號就是代表了它每一天能夠產生多少數據,比如最早測序儀叫做G500,后來有2000,2000個G,后面有了T1、T5、T10。我們去年有一個測序儀是T20,每天可升產出20T的數據。有了這樣的平臺的支撐,我們可以從一個人的基因組到百萬人、千萬人,未來人人基因組。我們現在擁有自己基因組數據的人還屈指可數,我們在過完完整的一生,從打開生命圖譜到最后謝幕,實際上我們都沒有看過生命的說明書和使用手冊,未來它會變成人人具備的數據,為我們的精準醫學和應用轉化助力。同時基因和生命科學的承載就是大國重器,政產學研資,大家在團隊里面共同促進,尤其需要國家大力支撐。我們非常有幸從2011年起承載了由四部委批復的國家基因庫的建設工作,我們現在建成了生物樣本庫和生物信息庫和基因測序平臺。

我們的生命中有很多未解之謎,我昨天去我女兒的幼兒園給幼兒園小朋友講什么是生命,什么是細胞。小朋友非常好奇,問到很多問題,幾個問題把我問住了。第一個問題是細胞在哪里,為什么我看不見。我給他們講我們每個人是由受精卵發展而來的。他問受精卵是怎么來的。我們要去解釋這個問題,需要用到新的工具,需要新的法則。我們之前研究生命都是研究一套基因組,一套基因組在全身幾十萬億個細胞是一樣的,我們每個人的人體細胞數量,成年人大概是30萬億-50萬億,這個數量相當于目前可觀測宇宙所有橫行的數量,你的身體就是一個宇宙。我們以前是拿一個組織集,希望把這個RNA、DNA都給解碼出來,希望用這樣的方式研究腫瘤怎么發展的。我們研究一個汽車怎么運行,不可能把它打成泥漿,看里面有多少的鐵、銅,多少塑料,就可以理解汽車。實際上我們要知道它里面有哪些零部件,這些零部件在空間位置上怎么組織、怎么作用,這就是我們帶來新的工具支撐,叫做時空組學技術。我們最早研究生命科學用顯微鏡,后來做DNA研究用到測序儀,我們就是在DNA測序技術的研究上發展這個技術,我們把納米球承載到微孔的芯片上,每個納米球與納米球之間有幾百個納米,這是亞細胞的尺寸,我們一個空間尺寸里有幾百個納米求獲得亞細胞的信息。我們再結合整個一套樣本處理的過程,將生物的組織切片和基因測序芯片進行貼合,讓它們進行結合,把基因轉錄的信息捕獲到這個芯片上去,我們經過兩輪檢測把基因位置的信息捕獲過來,通過檢測和還原,得到了空間的圖譜,這個空間圖譜的技術在分辨率和視場方面都是在全球技術方面有一定的領先優勢。簡單來講,做一個不太形象的比喻,這個生命的照相機又是一個超廣角,又是一個超長焦,就是又能拍得很精細,又能拍得很大范圍,這對我們解密生命信息很關鍵,都是一個利器。

我們在技術發展過程中間就解析了斑馬魚從卵生長為完整的生命個體,我們解析了小鼠的胚胎怎么從受精卵發展成一個完整的小老鼠。同時在大腦方面的研究,腦科學方面的研究,我們也可以提供助力。右邊是一個獼猴腦的工作。左邊是一個蠑螈,它的再生能力比較強,它的端腦和端肢可以再生,我們通過這個技術解析了非常有意思的機理和機制。還有一些生命的終極問題,我們都可以用新的生命組織解析技術來去支撐。我們作為生命組學工具的開發者和生產者,我們希望為各個領域,不管是科學研究和臨床應用方面的專家、老師、團隊提供這樣一個生命組學技術的底層支撐,讓整個領域都能有更快的進展,能夠把我們的生命法則最終和時空法則結合起來,形成對生命整個過程完整的理解。

接下來我再快速講一講BIT方面怎么用生命科學的信息、技術去幫助解決今天一些IT的問題。我們做個簡單的比喻它有相似之處,生命的基因的編碼是ATCG,我們用DNA編碼和存儲大量的信息,我們的信息增長速度遠遠超過去建設這個數據存儲中心的速度,我們用到生命中心法則的過程是DNA可以很快速、很低成本的復制。有人做過一個測算,我們用同樣的物質單位來計算,它可以存儲多少數據量,我們用硅的介質,它大約是兆B級別。石墨烯材料是TB級別,用DNA是EB級別,是多個數量級存儲密度提升。我們把讀和寫再進一步延伸到存,我們可以把圖譜的知識通過一定的方式進行編碼寫入到DNA里面,讓這個DNA長期存儲,我們有很多技術可以快速解析DNA,還原成我們所知的信息,尤其是這樣的存儲方式是使用于長期的冷備存儲的。我們自有人類文明史以來,現在傳承的最久的信息就是在石頭上畫畫,其他的語言、文字刻在書本上、存在電腦里,硬盤的壽命是否超過百年,都是一個問題,但是刻在石頭上的字和畫在巖壁上的畫傳承萬年以上。另外一個可以傳承萬年以上的就是DNA,現在已經有多個幾萬年之前的古人類的DNA骸骨的化石,我們可以從中間提取到來自古人類的DNA,幫著我們解析人類究竟是如何起源和遷徙的,和以前滅絕的古人類祖先的親戚們發生怎樣的聯系,進行交流和互動。現在最古的是來自70萬年前的西伯利亞凍土古代馬的化石DNA,它就是一個干燥的環境,它的存儲成本是比較低,未來會成為非常重要的人類存儲的介質。

(現場播放視頻)

這就是我們用DNA存儲的技術對于開國大典的一段珍貴的影像視頻進行了轉碼和存儲,在這樣一個小小的試管里面,你看不到的物質可以存儲復雜的影像數據。

BIT和IBT,生命科學和信息科學是近年來人類領域里面發展最快的兩個方向,我們從信息技術里面得到了很多的滋養,很大程度上助力了我們對生命周期的過程和解析,同時我們利用新興的生命和科學技術反過來支撐到信息科學的發展。隨著人工智能快速的發展,到了2035年、2050年,90%的工作可能會消失了,人類在這個地球上做什么呢?至少到那個時候,大家肯定會更加關注自己和自己身邊的人會不會活得健康,活得開心,這就是我們即將迎來的生命時代,希望跟大家一起攜手,在華大生命科技底層技術支撐之下,更好的走進新的生命經濟時代。

謝謝大家。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章