首頁 > AI資訊 > 行業動態 > 臺式PC上可運行,DeepMind天氣AI以0.25°分辨率預測全球10天內數百個天氣變量,僅1分鐘

臺式PC上可運行,DeepMind天氣AI以0.25°分辨率預測全球10天內數百個天氣變量,僅1分鐘

新火種    2023-11-20

編輯 | 蘿卜皮

全球中期天氣預報對于許多社會和經濟領域的決策至關重要。傳統的數值天氣預報使用增加的計算資源來提高預報精度,但無法直接使用歷史天氣數據來改進基礎模型。

Google DeepMind 團隊介紹了「GraphCast」,一種直接從再分析數據訓練的基于機器學習的方法。它可以在一分鐘內以 0.25° 的分辨率預測全球 10 天內的數百個天氣變量。

研究人員用 1380 個驗證目標進行了測試,GraphCast 在 90% 的驗證目標中顯著優于當前最準確的操作確定性系統,其預測支持更好的嚴重事件預測,包括熱帶氣旋跟蹤、大氣河流和極端溫度。

該研究以「Learning skillful medium-range global weather forecasting」為題,于 2023 年 11 月 14 日發布在《Science》。

世界標準時間 2022 年 10 月中旬 05:45,意大利博洛尼亞,歐洲中期天氣預報中心 (ECMWF) 的新高性能計算設施最近投入運行。在過去的幾個小時里,綜合預報系統(IFS)一直在運行復雜的計算,從而預測未來幾天和幾周的地球天氣,并且其第一個預測剛剛開始向用戶傳播。這個過程每天每六個小時重復一次,為世界提供最準確的天氣預報。

IFS 以及更廣泛的現代天氣預報都是科學和工程的勝利。天氣系統的動態是地球上最復雜的物理現象之一,每天,個人、行業和政策制定者做出的無數決定都取決于準確的天氣預報,從決定是否穿夾克到逃離危險的風暴。當今天氣預報的主要方法是「數值天氣預報」(NWP),其中涉及使用超級計算機求解天氣控制方程。

數值天氣預報的成功在于嚴格且持續的研究實踐,這些實踐提供了對天氣現象越來越詳細的描述,以及數值天氣預報如何利用更多的計算資源來提高準確性。結果,天氣預報的準確性逐年提高,甚至可以提前很多天預測颶風的路徑——這在幾十年前還是不可想象的。

雖然傳統的數值天氣預報可以很好地通過計算進行擴展,但利用大量歷史天氣數據來提高準確性并不簡單。相反,數值天氣預報方法是由訓練有素的專家創新更好的模型、算法和近似值來改進的,這可能是一個耗時且昂貴的過程。

MLWP 是 NWP 的重要替代方案

基于機器學習的天氣預報 (MLWP) 提供了傳統 NWP 的替代方案,可以根據歷史數據(包括觀測和分析數據)訓練預測模型。通過捕獲數據中不易用顯式方程表示的模式,有可能提高預測準確性。MLWP 還通過利用現代深度學習硬件而不是超級計算機來提供提高效率的機會,并實現更有利的速度與精度權衡。

在最近的研究中,MLWP 幫助改進了傳統 NWP 相對較弱的區域中基于 NWP 的預報,例如次季節熱浪預測和來自雷達圖像的降水臨近預報,而這些區域無法提供準確的方程和穩健的數值方法。

在中期天氣預報中,即預測未來 10 天的大氣變量,IFS 等基于 NWP 的系統仍然是最準確的。世界上頂級的確定性操作系統是 ECMWF 的高分辨率預報 (HRES),它是 IFS 的配置,可在大約一小時內以 0.1° 緯度/經度分辨率生成全球 10 天預報。

然而,在過去幾年中,在 WeatherBench 等基準的推動下,基于再分析數據訓練的 MLWP 中期預報方法一直在穩步發展。基于卷積神經網絡和 Transformer 的深度學習架構在粗略于 1.0° 的緯度/經度分辨率下顯示出了巨大潛力,最近的研究成果(使用圖神經網絡 (GNN)、傅里葉神經運算符和 Transformer)報告的性能在少數變量的 1.0° 和 0.25° 上開始與 IFS 相媲美,并且交付時間長達 7 天。

全球中期天氣預報的 MLWP 方法

在這里,Google DeepMind 團隊介紹了一種用于全球中期天氣預報的 MLWP 方法,稱為「GraphCast」,它可以在單個 Google Cloud TPU v4 設備上在一分鐘內生成準確的 10 天預報,并支持包括預測熱帶氣旋路徑、大氣河流和極端溫度等應用。

GraphCast 將地球天氣的兩個最新狀態(當前時間和六小時前)作為輸入,并預測未來六小時的下一個天氣狀態。單一天氣狀態由 0.25° 緯度/經度網格 (721 × 1440) 表示,對應于赤道處大約 28 × 28 km 的分辨率,其中每個網格點代表一組地表和大氣變量 。與傳統的 NWP 系統一樣,GraphCast 是自回歸的:它可以通過將自己的預測作為輸入反饋來「推出」,從而生成任意長的天氣狀態軌跡。

圖:模型示意。(來源:論文)

GraphCast 采用神經網絡架構實現,基于「編碼-處理-解碼」配置的 GNN,總共有 3670 萬個參數;按照現代 ML 標準,它是一個相對較小的模型,選擇它是為了保持內存占用易于處理。之前基于 GNN 的學習模擬器在學習由偏微分方程建模的流體和其他系統的復雜動力學方面非常有效,這支持了它們對天氣動力學建模的適用性。

編碼器使用單個 GNN 層將輸入網格上表示為節點屬性的變量(標準化為零均值單位方差)映射到內部「多網格」表示上的學習節點屬性。

多重網格是一個空間均勻的圖,在全球范圍內具有高空間分辨率。它是通過迭代六次細化正二十面體(12 個節點、20 個面、30 個邊)來定義的,其中每次細化將每個三角形劃分為四個較小的三角形(導致面和邊增加四倍),并將節點重新投影到球體上 。多重網格包含來自最高分辨率網格的 40,962 個節點(大約是 0.25° 處緯度/經度網格點數量的 1/25),以及中間圖中創建的所有邊的并集,形成具有不同長度的邊的平坦層次結構。

處理器使用 16 個非共享 GNN 層在多重網格上執行學習消息傳遞,從而以很少的消息傳遞步驟實現高效的本地和遠程信息傳播。解碼器將從多網格表示中學習到的最終處理器層特征映射回經緯度網格。它使用單個 GNN 層,并將輸出預測為最新輸入狀態的殘差更新(通過輸出歸一化來實現目標殘差的單位方差)。

在模型開發過程中,Deepmind 使用了 ECMWF ERA5 再分析檔案中的 39 年(1979-2017)歷史數據。作為訓練目標,研究人員對 GraphCast 在 N 個自回歸步驟上的預測狀態與相應的 ERA5 狀態之間的均方誤差 (MSE) 進行平均,并按垂直水平對誤差進行加權。

在訓練過程中,N 的值從 1 逐漸增加到 12(即 6 小時到 3 天),并且損失的梯度通過時間反向傳播來計算。使用梯度下降對 GraphCast 進行訓練,以最小化訓練目標,這在使用批量并行性的 32 個 Cloud TPU v4 設備上花費了大約四個星期的時間。

更好地預警極端天氣事件

與真實的部署場景一致,未來的信息無法用于模型開發,Deepmind 團隊根據 2018 年以后提供的數據評估了 GraphCast。分析表明,GraphCast 還可以比傳統預測模型更早地識別惡劣天氣事件。

通過將簡單的氣旋跟蹤器直接應用于 GraphCast 預測,他們可以比 HRES 模型更準確地預測氣旋運動。2023 年 9 月份,ECMWF 網站上部署的公開 GraphCast 模型的實時版本,提前約 9 天準確預測了颶風 lee 將在 Nova Scotia 登陸。相比之下,傳統預報對于登陸地點和時間的可變性更大,并且只能提前大約六天鎖定 Nova Scotia。

GraphCast 還可以表征大氣河流——將大部分水蒸氣轉移到熱帶地區之外的狹窄大氣區域。大氣河流的強度可以表明它是否會帶來有益的降雨或引發洪水的洪水。GraphCast 預報可以幫助描述大氣河流的特征,這可以幫助規劃應急響應以及人工智能模型來預測洪水。

最后,在全球變暖的大背景下,預測極端溫度變得越來越重要。GraphCast 可以表征地球上任何給定位置的熱量何時升至歷史最高溫度以上。這對于預測越來越常見的熱浪、破壞性和危險事件特別有用。

圖:嚴重事件預測 - GraphCast 和 HRES 的比較。(來源:Deepmind博客)

天氣人工智能的未來

GraphCast 現在是世界上最準確的 10 天全球天氣預報系統,可以比以前更預測未來的極端天氣事件。隨著天氣模式在氣候變化中的演變,GraphCast 將隨著更高質量的數據的出現而發展和改進。

為了讓人工智能天氣預報變得更容易,Deepmind 開源了模型的代碼。ECMWF 已經在試驗 GraphCast 的 10 天預報,它將為研究人員帶來新的可能性 - 從針對特定天氣現象定制模型到針對世界不同地區進行優化。

GraphCast 與 Google DeepMind 和 Google Research 的其他最先進的天氣預報系統一起,其中包括可提前 90 分鐘提供預報的區域臨近預報模型,以及已在美國和歐洲運行的區域天氣預報模型 MetNet-3,它可提供比任何其他系統更準確的 24 小時預報。

率先在天氣預報中使用人工智能將使數十億人的日常生活受益。除了天氣預報之外,GraphCast 還可以為其他重要的地理時空預測問題開辟新的方向,包括氣候和生態、能源、農業、人類和生物活動以及其他復雜的動力系統。研究人員相信,經過豐富的真實數據訓練的學習模擬器對于推進機器學習在物理科學中的作用至關重要。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章