CVPR 開幕式：全場淚目緬懷孫劍，廣工本科生靠「古董顯卡」逆襲 | CVPR 2026

2026年6月8日 02:20

重點摘要

站內 AI 整理稿

算力時代“微光”，廣工本科生靠古早Titan顯卡拼下頂會大獎；十年樹木，CV社區將最高榮譽授予已故先驅孫劍。作者丨小雷哥編輯丨岑峰美國當地時間6月5日，在結束了兩天的Workshop議程後，全球計算機視覺與模式識別領域的頂級學術盛會 CVPR 2026（IEEE Conference on Computer Vision and Pattern Recognition）正會，在科羅拉多州丹佛市正式拉開帷幕。隨著開幕式各項重磅數據與大獎的揭曉，現場氣氛被徹底點燃。01從物理世界重返視覺殿堂，雙城“無縫銜接”今年的學術圈格外忙碌。在此前的 Workshop 環節中，無論是探討如何將視覺-語言-動作（VLA）模型部署到自動駕駛和機器人上的 WDFM-EAI（具身智能基礎模型部署）專場，還是直接引入了真實機器人操控挑戰賽（ManipArena Competition）的具身智能論壇，都在向全行業傳遞一個極其明確的信號：計算機視覺已經徹底走出了“畫框識別”的屏幕舒適區，全面向具有物理法則的真實三維世界進軍。如果說前兩天的 Workshop 與工業展區預演了“具身智能”與“多模態”的狂熱，那麼6月5日的 CVPR 2026 正會開幕式，則是一場對計算機視覺基礎理論和底層創新的集中大閱兵。當數以萬計的學者湧入丹佛會議中心時，大家共同見證了屬於 CV 領域的歷史性跨越。在開幕式現場，組委會公佈了一系列令人驚歎的創紀錄數據，印證了 CV 領域依然是目前 AI 界最龐大、最活躍的科研陣地：▪ 驚人的參與規模：本屆大會共吸引了全球 97個國家/地區的 44,011名作者參與，審稿人數量高達 25,149人，領域主席（AC）增加至 909人。▪ 中國軍團斷層式領先：在作者來源國統計中，中國（CN）以高達 23,233 名作者數量高居榜首，幾乎是第二名美國（US，7,556人）的三倍以上。不僅是作者數量，在審稿人（Reviewers）貢獻榜上，中國同樣以 10,687 人位列第一。▪ 投稿量再創新高：大會共收到 16,092 篇有效投稿，相較於 CVPR 2025 暴漲了 24%。最終錄用論文 4,071 篇，錄取率穩定在 25.3% 左右。▪ 從現場公佈的論文主題分佈圖表來看，“圖像與視頻合成/生成（Image and video synthesis and generation）”、“視覺、語言與推理（Vision, language, and reasoning）”以及“3D視覺” 是本屆大會最為火熱的賽道。大模型驅動的生成式AI與三維場景重建，正在以前所未有的速度重塑 CV 的邊界。02最佳論文頒發：頂尖機構神仙打架，廣工本科生演繹極致“勵志”最受矚目的論文大獎（Best Paper）環節，同樣看點拉滿：▎【最佳論文 Best Paper】▪ 獲得者：Efficiently Reconstructing Dynamic Scenes One D4RT at a Time由 Google DeepMind、倫敦大學學院（UCL）和牛津大學的研究團隊摘得。該論文提出了一種極其優雅且高效的方法，將深度估計、相機位姿、3D點雲追蹤和4D點雲進行了驚豔的統一。▎【最佳論文榮譽提名 Best Paper Honorable Mention】▪ NitroGen: An Open Foundation Model for Generalist Gaming Agents該論文由 NVIDIA 知名研究科學家 Jim Fan 團隊獲得。Jim Fan 也在 Twitter 上激動表示，這是繼四年前 MineDojo 獲獎後，團隊向通用具身代理邁出的又一大步。▪ SAM3D: 3Dfy Anything in Images（Meta Superintelligence Labs 團隊出品）。▎【最佳學生論文與最勵志的逆襲】最佳學生論文（Best Student Paper）頒給了清華大學、微軟研究院（MSR）、中科大等聯合帶來的 3D 生成力作：Native and Compact Structured Latents for 3D Generation。而最讓國內學界直呼“太勵志”的，是獲得最佳學生論文榮譽提名（Best Student Paper Honorable Mention）的作品——ChordEdit: One-Step Low-Energy Transport for Image Editing。這篇含金量極高的論文，其第一作者和通訊作者均為廣東工業大學的本科生（聯合廣東工業大學、惠州學院、深圳大學、北京大學等共同發表）。在當今算力霸權、大廠與頂尖名校用千卡萬卡集群“大力出奇跡”的時代，這個本科生團隊甚至還在使用“古早的 Titan 顯卡”跑實驗！這無疑是本屆 CVPR 上最動人的硬核科研故事。它向全世界宣告：算力固然重要，但在學術的殿堂裡，純粹的熱愛、巧妙的構思（Training-free, one-step圖像編輯算法）與不屈的極客精神，依然能夠跨越資源的鴻溝，贏下世界的掌聲。03成就獎項：全場淚目，CV 社區沒有忘記孫劍開幕式的高潮，毫無疑問屬於 PAMI 青年研究員獎、黃煦濤紀念獎（Thomas Huang Memorial Prize）以及含金量極高的“時間檢驗獎（Longuet-Higgins Prize）”。▎黃煦濤紀念獎頒發給了康奈爾大學的 Noah Snavely。▎青年研究員獎則由卡內基梅隆大學（CMU）的 Deepak Pathak 和麻省理工學院（MIT）的 Vincent Sitzmann 斬獲。而在頒發旨在表彰“過去十年來對計算機視覺產生重大影響的論文”的 Longuet-Higgins Prize（時間檢驗獎）時，現場迎來了最動容的時刻。今年的大獎頒給了兩篇徹底改變 AI 歷史進程的 2016 年神作：ResNet（殘差網絡）：Deep Residual Learning for Image Recognition (Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun 孫劍)YOLO初代論文：You Only Look Once: Unified, Real-Time Object Detection (Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi)作為曠視前首席科學家、中國 AI 界的領軍人物，孫劍博士於 2022 年不幸猝然離世。CV 社區用最高榮譽證明了：他們沒有忘記孫劍。十年前，他指導團隊提出的 ResNet 解決了深層網絡難以訓練的世紀難題，奠定了今天幾乎所有大模型（包括 Transformer 架構）的底層基石；十年後，他的名字與成就，依然如燈塔般照耀著無數後來者的科研之路。04鎖定雷峰網 CVPR 2026 專區從打破紀錄的 16,092 篇投稿，到中國學者的全方位霸榜；從 ResNet 斬獲時間檢驗獎引發的集體追憶，到廣工本科生靠古董顯卡拼出的榮譽提名。CVPR 2026 的開幕式不僅是一場技術狂歡，更充滿了人性的光輝與科研的韌性。接下來的幾天，大會還將密集上演大量精彩的 Oral 分享與焦點論壇。端到端模型如何演進？3D 生成的下一步在哪？為了讓讀者能毫無時差地掌握前沿動態，雷峰網已推出【CVPR 2026 專區】：https://www.leiphone.com/special/491/202604/69e83f3248221.html我們將持續帶來：前方現場第一手見聞、核心 Oral 論文工程化深度解讀、重磅華人學者專訪等乾貨內容。敬請持續關注雷峰網，與全球頂尖 AI 大腦同頻共振！去哪看 CVPR 核心【演講/論文】詳解？為了讓國內的研發者、創業者與投資人能夠毫無時差地掌握本屆 CVPR 2026 的完整乾貨，雷峰網已全面上線【CVPR 2026 深度專區】。專區不僅全面收錄了核心 Oral 論文工程化深度解讀、重磅華人學者專訪等乾貨內容，更將持續更新前方現場的第一手會議動態。敬請持續關注雷峰網，與全球頂尖 AI 大腦同頻共振！掃描下方二維碼，或點擊「閱讀原文」關注專區。

原始來源：雷峰網 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

2 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

15 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

18 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

19 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

22 小時前閱讀分析