ICML 2026前瞻：投稿翻倍背後，機器學習正在換擋

2026年7月2日 01:48

重點摘要

站內 AI 整理稿

首爾見，ICML見，新方向見。作者丨吳思夢編輯丨岑峰 7月6日–11日，第43屆國際機器學習大會（ICML 2026）將首次落地韓國首爾COEX會展中心舉行，會議主題為“Machine Learning for the Real World”，強調機器學習在真實場景中的落地。（圖源： CS Conf Stats）根據計算機科學會議統計看板 CS Conf Stats的最新數據顯示，今年共接收論文6352篇（常規主賽道論文），102%的增幅，接受率26.6%，與去年的26.9%基本持平。23918篇投稿，6352篇接收，26.6%接受率，Spotlight佔比2.2%，Oral 演講佔總投稿數的 0.7%——ICML創辦43年來，還沒有哪一年的投稿量像今年這樣翻倍式增長。而在投稿量翻倍的前提下維持接受率，也傳遞出會議正在主動擴容的訊號。除此之外，今年兩項全新的制度調整，為學術社區帶來了透明度的實質性變化：其一是參會展示改為可選，接收論文作者可以選擇僅以論文集形式收錄，在會議記錄中享有同等地位且均可參評獎項。其二是原始投稿版本將被公開，包括匿名評審意見、作者Rebuttal及審稿人、作者討論內容。01三大趨勢重塑行業走向，具身模型成熱門把近三年ICML的熱點關鍵詞串聯起來，機器學習的轉向脈絡會格外清晰：2024-2025年的熱點“Transformer變體、PEFT微調、擴散模型優化”已日漸飽和，純粹的增量改進在ICML極難生存。2025年底以來談論最多的的紅利方向，諸如Alignment、Agent、可解釋性、測試時訓練（TTT）正在成為今年論文的主體。而當前正在搶佔的戰略高地，是具身智能的世界模型、科學計算的深水區，以及可信AI的政策框架。如果說論文數量反映的是“關注度”，那論文方向的變化反映的是“行業焦慮”。從今年ICML論文反映的技術版圖裡，有三個不可忽視的信號：▎LLM 推理：從“更大模型”到“更好思考”通過對 OpenReview 中錄用論文的 Keywords 進行全量文本檢索，我們發現LLM相關論文佔今年接收論文的近20%，如果算上對齊、安全、Agent等間接相關方向，比例超過30%。但真正值得關注的是研究性質的變化。LLM相關論文佔今年接收論文的近20%，算上對齊、安全、Agent等間接相關方向，比例超過30%。但數字不是重點——重點是研究性質的根本變化：不再堆參數，更多的是堆"思考"。多篇論文追問同一個問題：在推理階段投入更多計算資源，能否超越單純增大參數量？有研究者將MCTS（蒙特卡洛樹搜索）引入LLM推理，提出預算感知的搜索策略；也有人從信息論視角分析隱式思維與顯式思維鏈的邊界，追問一個更根本的問題，即模型在“不說話”的時候，到底能不能推理？強化學習（RL）以886篇論文成為今年ICML第一大方向，PPO系列獨佔201篇。DeepSeek-R1背後的GRPO技術被多篇論文進一步變體化，研究者正拆解它為什麼有效、能否跨場景復現。中國的工作正在被系統性地引用和分析，這個信號比論文數量更重要。▎AI 安全正在理論化114 篇 AI 安全論文，使安全成為 ICML 2026 第三大熱門方向。CML 2026 的 6 位 Invited Talk 演講者中，有 3 位——Verena Rieser（Google DeepMind）、Arvind Narayanan（普林斯頓）和 Pascale Fung（港科大）——的核心研究方向都直接涉及 AI 安全、對齊或社會影響。ICML 2026特邀演講者，從左到右依次為 Pascale Fung 、Susan Athey 、Sham Kakade 、Aviv Regev、Verena Rieser 、Arvind Narayanan 今年的安全研究呈現出“攻防升級、方法論深化”的特徵。越獄攻擊方面，從激活引導到自適應攻擊，研究者正在系統化地揭示 LLM 的脆弱性邊界，安全研究正在從經驗主義走向理論化。對齊方法上，DPO變體繼續湧現，但同時有工作追問一個被長期忽視的問題：讓模型更“對齊”人類偏好，會不會損害它的推理能力和置信度校準？這不再只是一個錦上添花的優化問題，還是直接影響模型可靠性的基礎命題。▎模型壓縮與擴散加速並行116 篇模型壓縮論文，僅次於圖像生成，位列第二。背後是一個產業級的焦慮：大模型太貴，開發者苦token久矣。KV緩存優化是今年最熱的子話題，從關鍵token選擇到緩存複用策略，研究者正試圖解決LLM推理中最核心的內存瓶頸。MoE架構創新同樣活躍：可微最優傳輸驅動的Dense→MoE轉換、正交增長策略等方案，目標一致，試圖在不損失質量的前提下降低推理成本。這個方向的升溫傳遞出一個清晰的產業判斷：模型的能力競賽遠未結束，但“能不能用得起”已經從工程問題變成了核心研究問題。另一個有趣的方向是擴散 LLM 的加速。擴散模型相關論文446篇，擴散模型用於文本生成本身就比自迴歸更慢，但它在可控生成和多模態融合上有獨特優勢。ICML 2026 上出現的自適應緩存、並行解碼、熵感知分束等方法，正在縮小擴散 LLM 與自迴歸 LLM 之間的效率差距。除了上述三大趨勢，今年的論文版圖上還有兩個方向增速驚人。AI for Science方向約860篇論文，佔總量13.5%。從基因組序列基礎模型dnaHNet，到形式化數學自動證明APE-Bench，AI正在從“輔助科研工具”變成“科研的主體參與者”。具身智能方向約420篇，增長勢頭最猛。斯坦福團隊提出的VLAW方法，讓視覺-語言-動作策略與世界模型迭代協同改進，在真實世界操作任務中實現39.2%的性能提升——從虛擬環境走向物理世界，是今年最值得產業界關注的信號之一。02中國研究者的ICML時刻張潼——現任UIUC計算機系教授，曾任騰訊AI Lab主任、百度研究院副院長，擔任本屆ICML大會主席（General Chair），也是ICML歷史上首位華人主席。清華、北大、中科院、浙大、上交在接收論文作者列表中的出現頻率逐漸增加，據官網公開報道，北京大學、上海交通大學各有9篇高水平論文成功入選，浙江大學3篇。張潼中國研究者開始在具體方向上不只是做增量改進。一個具體的標誌是DeepSeek。過去一年裡，DeepSeek-R1讓整個社區重新審視“低成本高性能”的技術路線。原來不一定要堆幾萬張卡，也能做出有競爭力的推理模型。今年ICML接收論文中，至少有數十篇在正文中直接引用DeepSeek的工作。中國研究者正在從“跟隨者”變成“被引用者”，這個轉變雖然剛發生，但方向是清晰的。多模態方向同樣值得關注。Qwen-VL（阿里）、InternVL（OpenGVLab/復旦）、DeepSeek-VL等系列工作，使中國機構在視覺-語言模型方向上形成了從架構、訓練到評測的完整貢獻鏈。企業側，據公開信息，騰訊、阿里、字節、百度、華為均有論文被接收，且涉及核心算法創新而非僅僅是工程實現。華為昇思和百度飛槳在系統層面的貢獻，也開始獲得國際同行的實質性引用。差距當然還在。美國在基礎理論上的積累、歐洲在概率方法與理論方向上的深度，仍然明顯領先。但中國研究者的參與方式正在發生變化，在一些前沿方向上開始定義問題。這個變化雖然溫和，但是結構性的。03為什麼今年的ICML格外值得關注今年的 ICML 有一種“分水嶺”的氣質。投稿量翻倍這個事實本身就說明，AI 研究的生產力正在發生質變。無論是 LLM 輔助寫作帶來的效率提升，還是 AI 從業者群體本身的膨脹，23918 篇投稿是一個不可逆的臨界點。技術方向上，我們正在見證從“預訓練驅動”到“後訓練驅動”的範式轉移。LLM 推理、測試時計算、AI 安全、對齊方法的集中爆發，本質上都在回答同一個問題：當模型已經足夠大，下一步做什麼？ICML 2026 給出的答案是：讓模型學會思考，讓模型學會安全，讓模型變得高效。另一個值得留意的信號是今年ICML上出現了多篇Position論文——這類論文不報告實驗結果，而是提出“我們認為領域應該這樣做”的觀點性主張，涉及Agent實驗規範、可解釋性標準、輔助AI的個性化範式等。最後，雷峰網·AI科技評論將派團隊前往首爾，全程報道ICML 2026！帶著中國視角，實地去判斷哪些方向真正值得產業關注，而哪些只是紙上談兵。一個人讀論文太孤單，一群人刷頂會才好玩。ICML 2026 召開在即，我們正在召集一波含金量極高的 AI 研究者。群內主打實時論文跟蹤與硬核技術探討，拒絕灌水。? 進群傳送門：掃碼進群或添加微信Vin_Vivid，備註：論文群 + 關注的 AI 方向。搞科研/搞技術，信息差很重要。來，一起快人一步！上車，帶你看遍全球 AI 頂會精華可獨家暢覽：專家演講PPT大會報告全文熱門論文解讀學術新星訪談掃描上方二維碼或點擊「閱讀原文」關注專區。

原始來源：雷峰網 ↗

查看原始來源

36氪AI Agent

35B Agent超越萬億參數模型？上海AI Lab開源Agents-A1：scaling the Horizon

這篇消息聚焦「35B Agent超越萬億參數模型？上海AI Lab開源Agents-A1：scaling the Horizon」。原始導語提到：不堆參數，也能很強。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪AI Agent

一個開源平臺，編織起了Agent「互聯網」

這篇消息聚焦「一個開源平臺，編織起了Agent「互聯網」」。原始導語提到：「Agents do. Humans decide. That’s Octo.」從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪AI Agent

國產AI六巨頭逐鹿Agent，望得到Claude Code的背影嗎？

阿里、騰訊、字節、Kimi、MiniMax、智譜等國產AI六巨頭正積極投入Agent領域的競爭。業界關注這些廠商的產品研發是否能追趕上Claude Code的技術水準。目前各方仍在快速迭代，尚難斷定誰能勝出。

剛剛閱讀分析

AIBaseAI Agent

兩分鐘上手生產級語音智能體：xAI 發佈 Voice Agent Builder 測試版

xAI推出Voice Agent Builder測試版，通過零代碼平臺和自研Grok Voice模型，將企業級語音智能體搭建縮短至兩分鐘。其核心為高度集成的端到端架構，解決了傳統方案語音轉文字等多環節割裂的痛點，大幅降低了開發與運營門檻。

1 小時前6900閱讀分析

AIBaseAI Agent

蘋果 Safari 預覽版新增 MCP 服務，AI 智能體助力網頁開發調試

7月1日，蘋果WebKit團隊在Safari技術預覽版247中上線MCP服務器，通過AI智能體簡化前端開發與調試。MCP即模型上下文協議，開放標準，可讓AI智能體對接工具和數據庫，實現讀寫與授權，打通AI開發數據通道。

3 小時前4900閱讀分析

AIBaseAI Agent

桌面端 AI 再進化：Gemini Spark 助力 macOS 實現本地文件自動化管理

近日，谷歌為macOS版Gemini正式推出“Gemini Spark”功能，突破純文本回復，可深入本地系統自動整理文件、提取數據。用戶只需在側邊欄Spark標籤授權訪問指定文件夾，即可讓AI代理執行任務，極大拓展辦公實用性。

4 小時前7600閱讀分析

相關文章

35B Agent超越萬億參數模型？上海AI Lab開源Agents-A1：scaling the Horizon

一個開源平臺，編織起了Agent「互聯網」

國產AI六巨頭逐鹿Agent，望得到Claude Code的背影嗎？

兩分鐘上手生產級語音智能體：xAI 發佈 Voice Agent Builder 測試版

蘋果 Safari 預覽版新增 MCP 服務，AI 智能體助力網頁開發調試

桌面端 AI 再進化：Gemini Spark 助力 macOS 實現本地文件自動化管理