雷峰網AI Agent

ICML 2026前瞻:投稿翻倍背後,機器學習正在換擋

2026年7月2日 01:48

重點摘要

首爾見,ICML見,新方向見。 作者丨吳思夢 編輯丨岑 峰 7月6日–11日,第43屆國際機器學習大會(ICML 2026)將首次落地韓國首爾COEX會展中心舉行,會議主題為“Machine Learning for the Real World”,強調機器學習在真實場景中的落地。(圖源: CS Conf Stats)根據計算機科學會議統計看板 CS Conf Stats的最新數據顯示,今年共接收論文6352篇(常規主賽道論文),102%的增幅,接受率26.6%,與去年的26.9%基本持平。23918篇投稿,6352篇接收,26.6%接受率,Spotlight佔比2.2%,Oral 演講佔總投稿數的 0.7%——ICML創辦43年來,還沒有哪一年的投稿量像今年這樣翻倍式增長。而在投稿量翻倍的前提下維持接受率,也傳遞出會議正在主動擴容的訊號。除此之外,今年兩項全新的制度調整,為學術社區帶來了透明度的實質性變化:其一是參會展示改為可選,接收論文作者可以選擇僅以論文集形式收錄,在會議記錄中享有同等地位且均可參評獎項。其二是原始投稿版本將被公開,包括匿名評審意見、作者Rebuttal及審稿人、作者討論內容。01三大趨勢重塑行業走向,具身模型成熱門把近三年ICML的熱點關鍵詞串聯起來,機器學習的轉向脈絡會格外清晰:2024-2025年的熱點“Transformer變體、PEFT微調、擴散模型優化”已日漸飽和,純粹的增量改進在ICML極難生存。2025年底以來談論最多的的紅利方向,諸如Alignment、Agent、可解釋性、測試時訓練(TTT)正在成為今年論文的主體。而當前正在搶佔的戰略高地,是具身智能的世界模型、科學計算的深水區,以及可信AI的政策框架。如果說論文數量反映的是“關注度”,那論文方向的變化反映的是“行業焦慮”。從今年ICML論文反映的技術版圖裡,有三個不可忽視的信號:

站內 AI 整理稿

首爾見,ICML見,新方向見。 作者丨吳思夢 編輯丨岑 峰 7月6日–11日,第43屆國際機器學習大會(ICML 2026)將首次落地韓國首爾COEX會展中心舉行,會議主題為“Machine Learning for the Real World”,強調機器學習在真實場景中的落地。(圖源: CS Conf Stats)根據計算機科學會議統計看板 CS Conf Stats的最新數據顯示,今年共接收論文6352篇(常規主賽道論文),102%的增幅,接受率26.6%,與去年的26.9%基本持平。23918篇投稿,6352篇接收,26.6%接受率,Spotlight佔比2.2%,Oral 演講佔總投稿數的 0.7%——ICML創辦43年來,還沒有哪一年的投稿量像今年這樣翻倍式增長。而在投稿量翻倍的前提下維持接受率,也傳遞出會議正在主動擴容的訊號。除此之外,今年兩項全新的制度調整,為學術社區帶來了透明度的實質性變化:其一是參會展示改為可選,接收論文作者可以選擇僅以論文集形式收錄,在會議記錄中享有同等地位且均可參評獎項。其二是原始投稿版本將被公開,包括匿名評審意見、作者Rebuttal及審稿人、作者討論內容。01三大趨勢重塑行業走向,具身模型成熱門把近三年ICML的熱點關鍵詞串聯起來,機器學習的轉向脈絡會格外清晰:2024-2025年的熱點“Transformer變體、PEFT微調、擴散模型優化”已日漸飽和,純粹的增量改進在ICML極難生存。2025年底以來談論最多的的紅利方向,諸如Alignment、Agent、可解釋性、測試時訓練(TTT)正在成為今年論文的主體。而當前正在搶佔的戰略高地,是具身智能的世界模型、科學計算的深水區,以及可信AI的政策框架。如果說論文數量反映的是“關注度”,那論文方向的變化反映的是“行業焦慮”。從今年ICML論文反映的技術版圖裡,有三個不可忽視的信號:▎LLM 推理:從“更大模型”到“更好思考”通過對 OpenReview 中錄用論文的 Keywords 進行全量文本檢索,我們發現LLM相關論文佔今年接收論文的近20%,如果算上對齊、安全、Agent等間接相關方向,比例超過30%。但真正值得關注的是研究性質的變化。LLM相關論文佔今年接收論文的近20%,算上對齊、安全、Agent等間接相關方向,比例超過30%。但數字不是重點——重點是研究性質的根本變化:不再堆參數,更多的是堆"思考"。多篇論文追問同一個問題:在推理階段投入更多計算資源,能否超越單純增大參數量?有研究者將MCTS(蒙特卡洛樹搜索)引入LLM推理,提出預算感知的搜索策略;也有人從信息論視角分析隱式思維與顯式思維鏈的邊界,追問一個更根本的問題,即模型在“不說話”的時候,到底能不能推理?強化學習(RL)以886篇論文成為今年ICML第一大方向,PPO系列獨佔201篇。DeepSeek-R1背後的GRPO技術被多篇論文進一步變體化,研究者正拆解它為什麼有效、能否跨場景復現。中國的工作正在被系統性地引用和分析,這個信號比論文數量更重要。▎AI 安全正在理論化114 篇 AI 安全論文,使安全成為 ICML 2026 第三大熱門方向。CML 2026 的 6 位 Invited Talk 演講者中,有 3 位——Verena Rieser(Google DeepMind)、Arvind Narayanan(普林斯頓)和 Pascale Fung(港科大)——的核心研究方向都直接涉及 AI 安全、對齊或社會影響。ICML 2026特邀演講者,從左到右依次為 Pascale Fung 、Susan Athey 、Sham Kakade 、Aviv Regev、Verena Rieser 、Arvind Narayanan 今年的安全研究呈現出“攻防升級、方法論深化”的特徵。越獄攻擊方面,從激活引導到自適應攻擊,研究者正在系統化地揭示 LLM 的脆弱性邊界,安全研究正在從經驗主義走向理論化。對齊方法上,DPO變體繼續湧現,但同時有工作追問一個被長期忽視的問題:讓模型更“對齊”人類偏好,會不會損害它的推理能力和置信度校準?這不再只是一個錦上添花的優化問題,還是直接影響模型可靠性的基礎命題。▎模型壓縮與擴散加速並行116 篇模型壓縮論文,僅次於圖像生成,位列第二。背後是一個產業級的焦慮:大模型太貴,開發者苦token久矣。KV緩存優化是今年最熱的子話題,從關鍵token選擇到緩存複用策略,研究者正試圖解決LLM推理中最核心的內存瓶頸。MoE架構創新同樣活躍:可微最優傳輸驅動的Dense→MoE轉換、正交增長策略等方案,目標一致,試圖在不損失質量的前提下降低推理成本。這個方向的升溫傳遞出一個清晰的產業判斷:模型的能力競賽遠未結束,但“能不能用得起”已經從工程問題變成了核心研究問題。另一個有趣的方向是擴散 LLM 的加速。擴散模型相關論文446篇,擴散模型用於文本生成本身就比自迴歸更慢,但它在可控生成和多模態融合上有獨特優勢。ICML 2026 上出現的自適應緩存、並行解碼、熵感知分束等方法,正在縮小擴散 LLM 與自迴歸 LLM 之間的效率差距。除了上述三大趨勢,今年的論文版圖上還有兩個方向增速驚人。AI for Science方向約860篇論文,佔總量13.5%。從基因組序列基礎模型dnaHNet,到形式化數學自動證明APE-Bench,AI正在從“輔助科研工具”變成“科研的主體參與者”。具身智能方向約420篇,增長勢頭最猛。斯坦福團隊提出的VLAW方法,讓視覺-語言-動作策略與世界模型迭代協同改進,在真實世界操作任務中實現39.2%的性能提升——從虛擬環境走向物理世界,是今年最值得產業界關注的信號之一。02中國研究者的ICML時刻張潼——現任UIUC計算機系教授,曾任騰訊AI Lab主任、百度研究院副院長,擔任本屆ICML大會主席(General Chair),也是ICML歷史上首位華人主席。清華、北大、中科院、浙大、上交在接收論文作者列表中的出現頻率逐漸增加,據官網公開報道,北京大學、上海交通大學各有9篇高水平論文成功入選,浙江大學3篇。張潼中國研究者開始在具體方向上不只是做增量改進。一個具體的標誌是DeepSeek。過去一年裡,DeepSeek-R1讓整個社區重新審視“低成本高性能”的技術路線。原來不一定要堆幾萬張卡,也能做出有競爭力的推理模型。今年ICML接收論文中,至少有數十篇在正文中直接引用DeepSeek的工作。中國研究者正在從“跟隨者”變成“被引用者”,這個轉變雖然剛發生,但方向是清晰的。多模態方向同樣值得關注。Qwen-VL(阿里)、InternVL(OpenGVLab/復旦)、DeepSeek-VL等系列工作,使中國機構在視覺-語言模型方向上形成了從架構、訓練到評測的完整貢獻鏈。企業側,據公開信息,騰訊、阿里、字節、百度、華為均有論文被接收,且涉及核心算法創新而非僅僅是工程實現。華為昇思和百度飛槳在系統層面的貢獻,也開始獲得國際同行的實質性引用。差距當然還在。美國在基礎理論上的積累、歐洲在概率方法與理論方向上的深度,仍然明顯領先。但中國研究者的參與方式正在發生變化,在一些前沿方向上開始定義問題。這個變化雖然溫和,但是結構性的。03為什麼今年的ICML格外值得關注今年的 ICML 有一種“分水嶺”的氣質。投稿量翻倍這個事實本身就說明,AI 研究的生產力正在發生質變。無論是 LLM 輔助寫作帶來的效率提升,還是 AI 從業者群體本身的膨脹,23918 篇投稿是一個不可逆的臨界點。技術方向上,我們正在見證從“預訓練驅動”到“後訓練驅動”的範式轉移。LLM 推理、測試時計算、AI 安全、對齊方法的集中爆發,本質上都在回答同一個問題:當模型已經足夠大,下一步做什麼?ICML 2026 給出的答案是:讓模型學會思考,讓模型學會安全,讓模型變得高效。另一個值得留意的信號是今年ICML上出現了多篇Position論文——這類論文不報告實驗結果,而是提出“我們認為領域應該這樣做”的觀點性主張,涉及Agent實驗規範、可解釋性標準、輔助AI的個性化範式等。最後,雷峰網·AI科技評論將派團隊前往首爾,全程報道ICML 2026!帶著中國視角,實地去判斷哪些方向真正值得產業關注,而哪些只是紙上談兵。一個人讀論文太孤單,一群人刷頂會才好玩。ICML 2026 召開在即,我們正在召集一波含金量極高的 AI 研究者。群內主打實時論文跟蹤與硬核技術探討,拒絕灌水。? 進群傳送門: 掃碼進群或添加微信Vin_Vivid,備註:論文群 + 關注的 AI 方向。搞科研/搞技術,信息差很重要。來,一起快人一步!上車,帶你看遍全球 AI 頂會精華可獨家暢覽:專家演講PPT大會報告全文熱門論文解讀學術新星訪談掃描上方二維碼或點擊「閱讀原文」關注專區。

Related

相關文章

一個開源平臺,編織起了Agent「互聯網」

這篇消息聚焦「一個開源平臺,編織起了Agent「互聯網」」。原始導語提到:「Agents do. Humans decide. That’s Octo.」 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛