Nature 子刊收錄!清華李勇團隊用 AI 解碼全球氣候耦合,ENSO 預測提前期延長至 19 個月
重點摘要
UniCM:揭示極端 El Niño 和 La Niña 背後的跨洋盆信號。 作者丨鄭佳美 編輯丨馬曉寧 在全球氣候風險越來越難以用單一事件解釋的今天,氣候預測行業正面臨一個明顯轉向:預測對象不再只是某一次 El Niño 或某一個海溫指數,而是整個海洋和大氣系統中多個氣候模態的聯動變化。過去,很多預測方法更擅長處理 ENSO 這樣的核心模態,卻較難同時理解印度洋、大西洋和太平洋副熱帶區域之間的連鎖反應。現實中的氣候異常也往往不是單點發生的,例如一次太平洋海溫異常,可能會改變遠洋航線沿途的風浪條件,影響跨洋貨運的時間安排;一個印度洋或大西洋信號的變化,也可能影響大型賽事、旅遊旺季、保險定價和公共衛生部門對熱帶疾病傳播風險的預判。也就是說,氣候預測已經不只是科學問題,更關係到交通、商業、保險、旅遊、公共服務等許多普通人能感受到的生活場景。在這種背景下,來自清華大學李勇教授研究團隊提出了題為《Learning the coupled dynamics of global climate modes》的研究,嘗試用統一模型 UniCM 學習全球氣候模態之間的耦合動力學。研究的核心並不是把 ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD 分別預測一遍,而是把它們放進同一個相互牽動的系統中,讓模型同時理解海表溫度、風應力、溫躍層等物理場如何生成氣候模態,也理解這些氣候模態形成後如何反過來影響全球海氣系統的未來變化。這樣一來,預測就不再停留在某個指數會升高還是降低,而是進一步追問,不同海盆之間的信號如何傳遞,極端事件出現前哪些模態正在變得更活躍,以及全球氣候系統是否正在從分散波動走向有組織的異常狀態。論文地址:https://www.nature.com/articles/s42256-026-01245-501UniCM 把氣候預測連成一張網實驗結果顯示,UniCM
UniCM:揭示極端 El Niño 和 La Niña 背後的跨洋盆信號。 作者丨鄭佳美 編輯丨馬曉寧 在全球氣候風險越來越難以用單一事件解釋的今天,氣候預測行業正面臨一個明顯轉向:預測對象不再只是某一次 El Niño 或某一個海溫指數,而是整個海洋和大氣系統中多個氣候模態的聯動變化。過去,很多預測方法更擅長處理 ENSO 這樣的核心模態,卻較難同時理解印度洋、大西洋和太平洋副熱帶區域之間的連鎖反應。現實中的氣候異常也往往不是單點發生的,例如一次太平洋海溫異常,可能會改變遠洋航線沿途的風浪條件,影響跨洋貨運的時間安排;一個印度洋或大西洋信號的變化,也可能影響大型賽事、旅遊旺季、保險定價和公共衛生部門對熱帶疾病傳播風險的預判。也就是說,氣候預測已經不只是科學問題,更關係到交通、商業、保險、旅遊、公共服務等許多普通人能感受到的生活場景。在這種背景下,來自清華大學李勇教授研究團隊提出了題為《Learning the coupled dynamics of global climate modes》的研究,嘗試用統一模型 UniCM 學習全球氣候模態之間的耦合動力學。研究的核心並不是把 ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD 分別預測一遍,而是把它們放進同一個相互牽動的系統中,讓模型同時理解海表溫度、風應力、溫躍層等物理場如何生成氣候模態,也理解這些氣候模態形成後如何反過來影響全球海氣系統的未來變化。這樣一來,預測就不再停留在某個指數會升高還是降低,而是進一步追問,不同海盆之間的信號如何傳遞,極端事件出現前哪些模態正在變得更活躍,以及全球氣候系統是否正在從分散波動走向有組織的異常狀態。論文地址:https://www.nature.com/articles/s42256-026-01245-501UniCM 把氣候預測連成一張網實驗結果顯示,UniCM 的預測能力整體強於 XRO、DESN、CNN、ResoNet 等基線方法,其主要優勢並不是單純提高某一個氣候指數的精度,而是同時提升多個氣候模態的整體預測能力,預測提升的關鍵來自“物理場變化”和“氣候模態相互作用”的聯合學習。雷峰網在 ENSO 預測方面,UniCM 的長提前期預測能力明顯增強,有效預測時間延長到約 19 個月,同時春季可預報性障礙的影響減弱,短期預測中能夠較準確捕捉 El Niño 和 La Niña 的變化趨勢,長期預測中仍能保持對 ENSO 相位和強弱變化的判斷,不只是預測“會不會發生”,還能夠較好捕捉事件的開始、發展、持續和衰退。雷峰網在典型歷史事件方面,1997 年至 1998 年極端 El Niño 被模型較好捕捉,2020 年至 2023 年三重 La Niña 也被模型較好還原,不同類型 ENSO 事件都能保持較穩定預測,說明模型沒有隻記住一種 ENSO 模式,而是學到多種 ENSO 演化路徑。在多氣候模態預測方面,UniCM 同時預測 ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD,把太平洋、印度洋、大西洋的氣候模態放在同一個系統中處理。其中 ENSO 仍然是最容易預測的模態,IOD、TNA、IOB、SIOD 等非 ENSO 模態的預測能力也有明顯改善,對於 TNA、IOB、SIOD 這類受複雜遙相關影響的模態,UniCM 比線性模型更穩定,多模態統一預測也比單獨預測每個模態更有優勢。在海表溫度預測方面,赤道中東太平洋區域的預測效果最突出,中太平洋區域在長提前期下仍保留較明顯信號,關鍵 ENSO 區域的異常變化能夠在較長時間後仍被模型識別,說明模型不是隻擬合氣候指數,而是學到了海表溫度空間場的演化規律。在模態關係識別方面,NPMM 對 ENSO 的提前影響、TNA 與 ENSO 之間的跨洋盆聯繫、SIOD 與 IOB 之間的印度洋內部聯繫都被模型捕捉,UniCM 對這些關係的時間先後、強弱變化、非對稱結構的還原效果優於 XRO,說明模型學到的不只是相關性,還有一定的動態耦合結構。在可解釋性方面,強 El Niño 前中東赤道太平洋信號更集中,部分 La Niña 前熱帶大西洋或西太平洋信號更突出,正常年份前注意力分佈更分散,模態關係較弱,而極端事件前氣候模態之間的聯繫更集中、更有組織,NPMM、TNA 等模態在極端 ENSO 事件前表現出更強前兆作用。02雙分支 Transformer 上場實驗經過方面,研究首先把目標確定為全球氣候模態的統一預測,研究團隊沒有隻圍繞 ENSO 建立單一預測框架,而是把 ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD 等多個氣候模態放進同一個氣候系統中,讓模型同時學習不同模態本身的變化規律、模態之間的相互影響,以及物理場和氣候模態之間的雙向反饋。研究的基本思路是,海表溫度、緯向表面風應力、經向表面風應力、溫躍層深度、上層 300 m 海溫等物理場變化,會在長期演化中形成 ENSO、IOD、TNA 等大尺度氣候模態。而這些氣候模態一旦形成,又會反過來影響未來的海溫分佈、風場變化和海洋上層結構,所以模型不能只看單個氣候指數,也不能只看局部物理變量,而要同時處理“物理場生成模態”和“模態調節物理場”兩個方向。數據準備階段,研究人員使用經過篩選的 CMIP6 歷史氣候模擬作為訓練數據,主要保留能夠較好再現主要氣候模態變化特徵的模擬結果,並使用多個再分析數據集進行測試,用來檢驗模型面對真實氣候資料時是否仍然有效。每個訓練樣本由過去 12 個月的氣候狀態和未來 24 個月的預測目標組成,過去 12 個月作為模型輸入,未來 24 個月作為模型需要學習和輸出的結果。進入模型之前,物理場數據先被處理成月異常,再進行標準化,以減少不同月份氣候背景差異帶來的影響,隨後被統一到 5° × 5° 的空間網格,並切分成空間塊,使模型能夠關注大尺度海氣變化,而不是被短期天氣噪聲干擾。氣候模態指數則從海表溫度場中計算得到,並經過 3 個月滑動平均處理,用來突出季節到年際尺度的變化。模型輸入分為兩條路徑,一條是物理場路徑,包含海表溫度、緯向表面風應力、經向表面風應力、溫躍層深度和上層 300 m 海溫,主要提供氣候模態形成的物理背景;另一條是模態路徑,包含 ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD 七個氣候模態指數,主要提供全球氣候系統當前的大尺度狀態。模型結構上,UniCM 採用雙分支 Transformer,Globalformer 負責處理物理場輸入,學習海溫、風應力、溫躍層和上層海溫在不同海區、不同月份之間的時空演化關係,Modeformer 負責處理模態指數輸入,學習 ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD 各自的時間變化,以及它們之間可能存在的非線性耦合和跨洋盆遙相關。兩個分支並不是各自獨立完成預測,而是通過耦合機制連接起來,Modeformer 先在模態層面提取整體氣候狀態和模態間關係,再把學到的模態信息注入 Globalformer,使物理場預測不僅依賴局部海溫、風場和溫躍層信息,也受到全球氣候模態狀態的約束。這樣設計之後,模型既能從底層物理場中識別氣候模態如何形成,也能從高層模態狀態中判斷未來物理場可能怎樣繼續演化。訓練完成後,研究團隊把 UniCM 與傳統氣候動力模型、普通深度學習模型、ENSO 專門預測模型和高分辨率場預測模型進行對比,重點比較 ENSO 長提前期預測、多氣候模態統一預測、海表溫度空間場預測、春季預測難點下的穩定性、極端 El Niño 和 La Niña 事件的還原能力,以及不同氣候模態之間滯後關係的重建能力。評估時,研究人員不僅看預測數值是否接近觀測結果,也看模型是否能保持正確的相位變化、是否能還原海表溫度異常的空間分佈、是否能重建 NPMM 與 ENSO、TNA 與 ENSO、SIOD 與 IOB 等模態之間的先後聯繫,還進一步分析模型內部的注意力機制,觀察極端事件發生前模型更關注哪些海區,以及哪些氣候模態之間的聯繫會明顯增強。整體實驗流程可以概括為:先用歷史模擬數據訓練模型,再用再分析數據測試模型,再通過預測精度、誤差表現、空間場預測、模態關係重建和注意力解釋結果,綜合判斷 UniCM 是否真正學到了全球氣候模態系統中的耦合動力學。03極端氣候應對,少一分被動整體來看,這項研究的意義不只是讓氣候預測更準確,而是讓人們更早看見全球氣候異常可能怎樣發展。對預測工作來說,UniCM 提升了 ENSO 的長提前期預測能力,也改善了 IOD、TNA、IOB、SIOD 等非 ENSO 模態的預測效果,使極端 El Niño、持續 La Niña 以及多氣候模態共同異常更容易被提前識別。這樣一來,氣候預警不再只關注某一個海區或某一個指數,而是能夠從太平洋、印度洋和大西洋之間的整體聯繫中判斷未來風險。對氣候科學來說,研究說明氣候模態之間的聯繫並不是雜亂無章的噪聲,跨洋盆遙相關中包含可以學習和識別的結構,極端事件發生前,不同模態之間往往會出現更集中、更有組織的聯繫。因此,全球氣候系統更適合被理解為一個相互牽動的耦合網絡,單獨研究 ENSO 可能會忽略來自印度洋、大西洋和太平洋副熱帶區域的早期信號。對方法發展來說,研究把氣候預測從單模態預測推進到多模態統一預測,從線性關係建模推進到非線性耦合建模,從只預測氣候指數推進到同時利用物理場和氣候指數進行聯合預測,也讓氣候 AI 不只是給出結果,還能通過注意力機制顯示哪些海區、哪些模態關係更可能影響極端事件。對普通人來說,這種研究最直接的價值在於爭取更多準備時間。更早識別 El Niño、La Niña 或印度洋、大西洋異常,意味著農業種植可以更早調整作物安排和灌溉計劃,水庫和城市供水系統可以更早準備乾旱或異常降雨,沿海和低窪地區可以更早評估洪水風險,電力部門可以提前估計高溫、寒潮或持續乾旱帶來的用電壓力,糧食供應鏈也可以提前考慮氣候異常對產量和價格的影響。科學發現方面,UniCM 能幫助研究人員自動識別極端事件前的關鍵前兆區域,發現 NPMM、TNA 等模態可能具有的驅動作用,為理解全球海氣耦合動力學提供數據驅動證據,也為腦網絡、生態網絡、社會經濟系統等其他複雜系統研究提供可以借鑑的建模思路。04UniCM 背後的研究團隊這篇論文的通訊作者為李勇教授,他是清華大學電子工程系的長聘教授、博士生導師,並擔任城市科學與計算研究中心負責人,是教育部長江學者。他長期從事人工智能、數據科學、複雜系統與社會計算等交叉學科研究,主持了多個國家重點研發計劃和國家自然科學基金重點項目。在科研成果方面,李勇教授在人工智能和數據科學方向積累了豐富研究成果,在 Nature Computational Science、Nature Machine Intelligence、Nature Human Behaviour、Nature Cities 等綜合性期刊,以及 ACM KDD、NeurIPS、ICLR、WWW 等國際會議上發表了大量高水平論文,累計引用超過三萬多次,並擁有多項授權專利。他曾入選全球高被引科學家、國家萬人計劃青年拔尖人才,獲得教育部科技進步一等獎、IEEE ComSoc 亞太傑出青年學者獎、吳文俊人工智能優秀青年獎等多項榮譽,同時也擔任多個國際會議籌委會成員和國際期刊編委。參考資料:https://fi.ee.tsinghua.edu.cn/~liyong/
Related
相關文章

GPT發AI原創新成果了
這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到:AI實現藥物全自動研發,還遠嗎? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

AI越強,越要“殺死”過去的自己
這篇消息聚焦「AI越強,越要“殺死”過去的自己」。原始導語提到:人類需要實現思維模式的轉變。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks
In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

Transformer之父離開谷歌,奧特曼等了他十年
這篇消息聚焦「Transformer之父離開谷歌,奧特曼等了他十年」。原始導語提到:27億美元也沒能留住,Noam Shazeer追尋下一代架構。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Dario訪談首曝:Mythos被稱為“超級武器”
這篇消息聚焦「Dario訪談首曝:Mythos被稱為“超級武器”」。原始導語提到:在這場69分鐘完整訪談裡,Dario Amodei 說人類真正面對的不是某個突然降臨的奇點,而是一條已經開始垂直起飛的指數曲線。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

用結構替代數據,因果世界模型如何重塑具身智能大腦
這篇消息聚焦「用結構替代數據,因果世界模型如何重塑具身智能大腦」。原始導語提到:因果世界模型需要一個標誌性的時刻來證明自己。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。