DeepMind用深度強化學習研究“人造太陽”!據說這是秘密進行了3年的工作

作者 | 王曄
編輯 | 陳彩嫻
北京時間凌晨四點,DeepMind在官方推特上發布消息,稱其與瑞士洛桑聯邦理工學院(EPFL)合作研究出第一個可以在托卡馬克(Tokamak)裝置內保持核聚變等離子體穩定的深度強化學習系統,為推進核聚變研究開辟了新途徑,工作已發表在Nature!
消息一出,立刻引起圍觀,收獲一千多點贊、數百轉發:
據該工作的其中一位成員@317070披露,該工作已經秘密進行了三年,并興沖沖地表示:“它真的成功了!深度強化學習真的很擅長搞定這些人類迫切想實現的科幻想法。”
我們都知道,DeepMind是全球最早將人工智能應用于科學研究(即“AI for Science”)的研究機構之一,在過去的幾年也取得了許多令人矚目的成就,成功地在生物、化學、數學與物理模擬等等領域扎下了AI的影子,并吸引一大批學者投身“AI for Science”方向的研究工作。
此前,在DeepMind兼職擔任高級研究科學家的華人學者王夢迪便曾對AI科技評論談到,DeepMind有強大的信心將人工智能用于推動人類文明的進步,這種自信也感染了許多年輕的科學家:
DeepMind的價值觀就是要推動人類文明的進步。我感覺研究人工智能的學者都非常自信,覺得自己有能力解決世界上最難的問題。這種自信非常棒,會給予自己主觀能動性,也會感染其他學者,幫助不同學科的人更快、更好地聯合在一起,去解決原先以為難于登天的問題。而近日DeepMind在難度更高的核物理發布突破成果,無疑更加證明、鞏固了其在“AI for Science”方向的領頭羊地位!
更有意思的是,AI科技評論編輯組還發現,早在五年前(2017年),就有中國網友在知乎上提出將深度強化學習系統用于學習可控核聚變裝置建造技術的設想。莫非 DeepMind 的科研是跟著知乎走的……(手動狗頭)
言歸正傳,我們來看看DeepMind這次又搞出了什么花樣!
什么是托卡馬克裝置?
首先,為了更好地了解DeepMind此次的突破,以及“AI+核聚變”的奧妙,我們需要知道:什么是托卡馬克(Tokamak)裝置?
此前,知乎上還有一個關于托卡馬克的討論:“劉慈欣在《三體》中為什么不待見托卡馬克裝置?(托卡馬克裝置有什么弊端)”:
鏈接:https://www.zhihu.com/question/31056640/answer/56816872
當時就有網友@Shigen Chin回答:
首先,超導托卡馬克的材料成本相對較高,相比之下激光核聚變只是設備一次性投資高,而超導托卡馬克對于裝備本身損耗比較嚴重,對于后續投入是不利因素(尤其是三體成為現實威脅 亟需技術突破的情況下)。其次,理論瓶頸,智子已經為物理理論研究建立壁壘,而超導托卡馬克作為一種相對而言在可控核聚變研究中出現較早的思路,一直到現在沒有大進展,很大程度上也是受理論研究所累,在沒有取得理論突破的情況下,托卡馬克裝置投入實用的可能性不大再次,托卡馬克本身的小型化十分困難,因為托卡馬克的實用功率和約束時間和裝備體積正相關,超低溫制冷,磁約束需要較為龐大的設備,而實現設備小型化也需要材料等基礎科學的進步,這些方面的進步又依賴于物理理論的進步(比如建立于原子尺度研究和量子力學基礎上的電子計算機的發明和量子計算機概念的提出 帶動了對于晶體管和光量子材料的工藝研究)。可能是基于以上的原因,大劉認為托卡馬克不適于承擔帶領人類走入聚變時代的重任(笑)。言歸正傳:
托卡馬克,又稱“環磁機”,俄語原文“Токамак”,是一種利用磁約束來實現磁約束聚變的環形容器,最早由位于蘇聯莫斯科庫爾恰托夫研究所(NRC KI)的物理學家伊戈爾·塔姆、安德烈·薩哈羅夫和列夫·阿齊莫維齊等人在1950年代發明。
根據百度百科的描述,托卡馬克的中央是一個環形的真空室,外面纏繞著線圈(如下面動圖)。通電時,托卡馬克的內部會產生巨大的螺旋型磁場,將其中的等離子體加熱到很高的溫度,以達到核聚變的目的:


AI+可控核聚變的前世事實上,早在AlphaGo擊敗人類世界的圍棋冠軍李世石后,就有網友在知乎上提問:據說AlphaGo是從零開始自學,運用了深度神經網絡與蒙特卡洛樹狀搜索相結合的技術,那么是否能讓AlphaGo從零開始學習可控核聚變裝置建造技術呢?


DeepMind如何做?2月16日,DeepMind與EPFL合作研究的深度強化學習系統助力可控核聚變的工作在Nature上發布:



寫在最后目前為止,在可控核聚變上取得的最好成績來自歐洲聯合環狀反應堆(JET),今年的2月9日,JET中的聚變反應在5秒內以中子的形式釋放出總共59兆焦耳的能量——這個數值并不高,大概只能燒開幾十壺開水而已。人類早已實現了輸出能量小于輸入能量的可控核聚變,以JET創下的世界紀錄為例,其Q值(聚變能增益系數,輸出能量與輸入能量之比)約為0.33左右。要實現真正可用的核聚變清潔能源,需要通過新的范式的研究,不斷提高核聚變的Q值。DeepMind 團隊堅信:他們的深度強化學習系統為托卡馬克裝置中的等離子體磁約束提供了一個新的范式。更重要的是,他們的控制設計表明了基于機器學習的控制方法的優勢。要實現AI+核聚變,需要科學與工程的雙管齊下,硬件與算法缺一不可。他們相信,深度強化學習框架有可能塑造未來的核聚變研究與托卡馬克裝置的研究發展。大家怎么看?參考鏈接:1.https://www.zhihu.com/question/31056640/answer/568168722.https://scitechdaily.com/science-made-simple-what-is-a-tokamak/3.https://www.zhihu.com/question/41295369/answer/142572075
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。