首頁 > AI資訊 > 行業(yè)動態(tài) > DeepMind大模型再登Nature:8分鐘預(yù)測15日天氣,準確度超頂尖物理模型,已開源

DeepMind大模型再登Nature:8分鐘預(yù)測15日天氣,準確度超頂尖物理模型,已開源

新火種    2024-12-18

DeepMind大模型再登上Nature——

氣象預(yù)測大模型GenCast,8分鐘內(nèi)完成15天的預(yù)測,而且不管常規(guī)還是極端天氣都能分析。

在97.2%的場景中,GenCast的表現(xiàn)都超過了全球頂尖的中期天氣預(yù)報系統(tǒng)ENS。

不同于DeepMind之前推出的GraphCast的確定性預(yù)測,GenCast關(guān)注的是各種天氣情況的概率。

和GraphCast一樣,GenCast也已經(jīng)開源。

它基于擴散模型實現(xiàn),分辨率為0.25度經(jīng)度/緯度(在赤道處約為28×28公里),相當于將地球表面分割成了超過100萬個網(wǎng)格。

每個網(wǎng)格都涵蓋80多個地表和大氣變量,相當于每次預(yù)測都有數(shù)千萬甚至上億條數(shù)據(jù)生成。

測試結(jié)果表明,在1320種實驗條件中,GenCast在97.2%的任務(wù)中,都比ENS更準確。

對于GenCast的表現(xiàn),論文作者、DeepMind研究人員Ilan Price表示:

我們確實取得了巨大的進步,通過機器學習趕上了并超越了基于物理的模型。

準確率超最強傳統(tǒng)方法

傳統(tǒng)天氣預(yù)報基于數(shù)值天氣預(yù)報(NWP)算法實現(xiàn),核心是對模擬大氣動力學的方程求近似解。

不過,相比于單一確定性的預(yù)測,氣象機構(gòu)越來越依賴集合預(yù)報,生成多個基于NWP的結(jié)果,對各種可能的情景進行建模。

GenCast做的也是集合式預(yù)報,當然基于的原理不是NWP而是AI。

開頭提到的ENS,就是目前最先進的集合預(yù)報系統(tǒng),來自歐洲歐洲中期天氣預(yù)報中心(ECMWF),未來將被納入其確定性預(yù)報系統(tǒng)HRES。

但即便是這種最強的傳統(tǒng)方式,也無法戰(zhàn)勝AI系統(tǒng)。

在常規(guī)預(yù)報當中,DeepMind團隊利用訓練數(shù)據(jù)中未涵蓋的真實歷史(2019年)數(shù)據(jù),設(shè)置了1320種實驗條件,涉及不同的物理變量、預(yù)報時長和垂直高度。

結(jié)果在97.2%的場景當中,GenCast的CRPS都顯著優(yōu)于ENS,如果只看對36小時之后的預(yù)測,GenCast在99.6%的條件下都能勝出。

(CRPS衡量了預(yù)報與觀測值之間累積概率分布的差異,數(shù)值越小說明預(yù)報越準確)

對于高溫、大風等極端天氣事件(實驗中按發(fā)生概率分為1%/0.1%/0.01%三檔),除了在個別場景下,GenCast的預(yù)報的相對經(jīng)濟價值(REV)顯著優(yōu)于ENS。

(2t代表距離海平面2米高處溫度,10wind_speed代表10米處風速,msl代表平均海平面氣壓,藍線代表GenCast)

除了基礎(chǔ)的預(yù)測,在下游應(yīng)用上GenCast也表現(xiàn)出了更強的預(yù)測能力。

DeepMind團隊測試了一款區(qū)域風電應(yīng)用,使用全球發(fā)電廠數(shù)據(jù)庫中的5344個風電場位置和裝機容量信息,通過插值獲得各風電場位置的10米風速預(yù)報,并通過功率曲線轉(zhuǎn)換為風電功率。

在120公里、240公里、480公里三個空間聚合尺度上,GenCast的風電功率預(yù)報CRPS和REV在7天內(nèi)都顯著優(yōu)于ENS。

不僅精準性強,GenCast的預(yù)測速度也很快,完成一次15天的預(yù)測僅需約8分鐘,而ENS需要幾個小時。

用擴散模型預(yù)測天氣

不同于DeepMind去年在Science上發(fā)表的GraphCast(基于圖神經(jīng)網(wǎng)絡(luò)GNN),GenCast基于擴散模型實現(xiàn)。

它以最近的X(t)和前一步天氣狀態(tài)X(t-1)的殘差Z(t)為采樣條件,經(jīng)過去噪后得到預(yù)測結(jié)果,然后利用預(yù)測結(jié)果計算新的殘差作為新的輸入依據(jù),將預(yù)測向更長時間延伸。

而具體的去噪過程,DeepMind又選擇了交給Transformer來完成。

Transformer編碼器首先將物理狀態(tài)場從經(jīng)緯度網(wǎng)格表征映射到一個六次細化的二十面體網(wǎng)格上。

然后,在Transformer的自注意力機制中,網(wǎng)格上的每個節(jié)點都會關(guān)注其周圍32跳鄰域內(nèi)的所有節(jié)點,從而有效捕捉局部和中等尺度的天氣特征。

最后,解碼器將結(jié)果映射回原始分辨率,得到去噪后的結(jié)果。

GenCast從公開的ERA5再分析數(shù)據(jù)集中,選取了1979至2018這40年的數(shù)據(jù)(間隔12小時,分辨率0.25°)對GenCast進行了訓練。

為了提高預(yù)訓練效率,數(shù)據(jù)首先被降采樣到1°分辨率,使用5次細化的二十面體網(wǎng)格進行學習。

這個階段需要200萬步,在32個TPUv5實例上運行約3.5天。

完成預(yù)訓練后,再用原始的0.25度分辨率數(shù)據(jù)和6次細化的二十面體網(wǎng)格,對模型進行高精度微調(diào),共計64000步,需要約1.5天完成。

目前,像去年發(fā)布的確定性預(yù)測模型GraphCast一樣,GenCast也已經(jīng)開源,代碼和模型權(quán)重均已發(fā)布。

DeepMind還表示,將會很快發(fā)布GenCast(和以前的模型)生成的實時和歷史預(yù)報結(jié)果,為其他研究者提供更多的研究資源。

相關(guān)推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。

熱門文章