雷峰網生成式AI

十年ICML,十次思想浪潮,當AI開始問“為誰而算”|ICML2026

2026年7月2日 05:36

重點摘要

作者|吳思夢編輯|岑峰 引言: 2016年6月,紐約。David Silver站到了ICML的講臺上,用66頁幻燈片,從Q-Learning一路推到AlphaGo。他傳遞出一種信念:把深度網絡嫁接到強化學習上,通用智能的湧現就只是算力和工程問題。彼時距AlphaGo在首爾4∶1擊敗李世石僅三個月。 十年後的2025年7月,溫哥華。

站內 AI 整理稿

## 十年ICML,十次思想浪潮:當AI開始問「為誰而算」

從2016年David Silver在紐約ICML講臺上描繪深度強化學習的宏圖,到2025年Anca Dragan在溫哥華展示機器人與人類對「正確」的認知鴻溝,這十年的ICML主題演講,如同一串思想時間膠囊,記錄了機器學習領域從技術狂熱到自我反思的完整軌跡。業界不再只是追問「演算法能解決什麼」,而是開始嚴肅探討「我們為誰而設計、獎勵函數隱藏了誰的偏見、自動化系統又剝奪了誰的選擇權」。這股思潮的轉向,最終將問題的焦點拉回人類自身。 2016年,AlphaGo擊敗李世石的餘波未平,David Silver在紐約的演講幾乎是深度強化學習的聖經式宣言。他將智能本質定義為最大化累積獎勵,認為只要獎勵函數定義得夠好,從圍棋到自動駕駛,所有問題都能被歸約為同一種數學形式。這套論述讓資本與公眾產生錯覺:通用智能的湧現,不過是算力與工程的問題。然而,到了2025年,Anca Dragan的影片給了當頭棒喝——機器人反覆舉杯只因獎勵函數設計與人類直覺脫節。十年間,業界終於撞上核心現實:規則由誰寫、利益歸誰、代價誰扛。 2017年Test of Time Award頒給Gelly與Silver的論文,見證了MCTS與價值函數融合如何催生AlphaGo。Gelly分享了一個悖論:更強的策略網絡反而窄化搜索,導致全局更容易錯失。這個隱喻在後續年份不斷應驗——當AI在特定任務上越來越「聰明」,反而可能在更廣闊的現實場景中暴露脆弱。同年「Attention is All You Need」低調問世,當時無人預見Transformer將重塑整個領域。而2018年Dawn Song的演講,則戳破了深度學習的泡沫:她展示熊貓圖片加噪聲後被識別為長臂猿,以及入侵模型竊取知識的簡易手法。她警告,能力進步與脆弱性認知之間的剪刀差正在擴大,自動駕駛、醫療診斷等部署決策,可能建立在沙堡般的地基上。 2019年,當GPT-2因「太危險」而部分隱藏、Amazon人臉識別被揭露種族偏誤時,ICML卻邀請了發展心理學家Alison Gopnik。她直言大語言模型不是智能體,而是「文化技術」,如同圖書館般承載人類知識但不具備求真意志。她指出兩歲兒童會自行設計因果實驗,而ChatGPT不在乎真假——其目標函數中根本沒有這個維度。這句話在2023年偽造判例事件中變得擲地有聲。2020年因疫情轉為線上的ICML,Brenna Argall則將視角拉至人機權力分配:輔助自主的核心不是讓機器替人做更多決策,而是讓用戶保持對自己身體的掌控權。她提出「感知控制感」可作為優化變量,每個自動化決策背後都隱含能動性的轉移。 2021年,Daphne Koller的演講將AI製藥的現實困境攤在陽光下:製藥業最關鍵的細胞表型數據,仍停留於手工顯微鏡觀察,數十年的溼實驗數據格式互不兼容、元數據缺失。演算法難題並非瓶頸,數據基礎設施的貧困才是。從這些年度聲音中,可以清晰看見一條行業脈絡:AI從盲目信奉演算法萬能,轉向對目標函數、數據品質、人機關係、權力分配的自我質疑。對讀者而言,後續值得關注的方向包括:獎勵函數設計如何納入多元人類價值觀;模型脆弱性檢測與反制技術的進展;以及AI應用在醫療、自動駕駛等領域時,監管與倫理框架如何跟上技術迭代。十年ICML告訴我們:真正的進步不在於算力突破,而在於問對問題——而終極問題始終關乎人。

Related

相關文章

Claude Fable 5,名存實亡

assistant: 根據提供的內容,這似乎是一則關於AI模型服務的報導或評論。摘要如下:Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。</think>Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。

剛剛
智東西生成式AI

對話Kimi B端負責人黃震昕:把國產大模型搬上亞馬遜雲科技,未來與海外“御三家”掰手腕

月之暗面Kimi與亞馬遜雲科技展開四層合作,涵蓋基礎設施、平台服務、業務合作及垂直行業,藉此拓展全球市場。Kimi B端負責人黃震昕透露,公司提供業界最高人均算力,B端業務快速增長,並在Token效率、長程推理及Agent集群等方面取得技術突破,目標是與海外頂尖模型競爭。他預測,雖然算力成本上漲推升模型價格,但技術優化將持續提升性價比。

5 小時前
雷峰網生成式AI

算力之外的博弈:ICML 2026 透露了哪些學術硬通貨?

告別盲目刷榜,28頁 PPT 帶你摸透 ICML 新風向。 作者丨陳淑瑜 編輯丨岑峰 ICML 2026 的投稿量從去年的 12107 篇直接飆升至 23,918 篇,幾近翻倍。然而,最終的接收率卻牢牢釘在 26.56%,與去年幾乎持平。這一數據傳遞出一個明確的信號:並非競爭變得盲目激烈,而是學術評審標準經歷了一次深刻的“重新校準”。

6 小時前
智東西生成式AI

獨家:阿里全面禁用Claude

智東西 作者 | 李水青 編輯 | 雲鵬 智東西7月3日獨家獲悉,今日,阿里巴巴內部宣佈反向禁用Claude。阿里全員被要求卸載Anthropic相關產品,包括Sonnet、Opus、Fable等多個系列模型,以及Claude Code在內的Agent產品。禁令於7月10日正式生效。

8 小時前
智東西生成式AI

超190億!AI視頻最大單筆融資誕生,阿里騰訊百度都投了

快手旗下AI視頻生成業務「可靈AI」完成190.48億元融資,阿里、騰訊、百度均參與投資,快手持股比例降至約68.33%。可靈AI自2024年6月上線以來已更新30多次,2025年營收約11億元,年化收入運行率達5億美元。快手同時宣布首次授予員工股權獎勵,並計劃在未來12個月內推動可靈AI赴港上市。

11 小時前
MarkTechPost AI生成式AI

RAG-Anything 教學:在 Colab 中建立支援文字、表格、方程式與圖像的多模態檢索管道

本教學示範如何在 Google Colab 中建立 RAG-Anything 多模態檢索管道,支援文字、表格、方程式與圖像。流程包括安裝依賴、設定 OpenAI API、建立合成多模態報告與 PDF,並測試 naive、local、global 與 hybrid 等不同檢索模式。最終實現從內容列表格式插入資料,並透過多模態嵌入與視覺功能進行靈活檢索。

15 小時前