CVPR 2026完美落幕！D4RT封神最佳論文、牛津VGG兩連冠，中國本科生泰坦顯卡逆襲引爆全網

2026年6月8日 08:11

重點摘要

站內 AI 整理稿

CVPR 2026主會議於6月7日落下帷幕，三大重磅信號同頻共振：獎項端，Google DeepMind的D4RT摘得最佳論文獎，Oxford VGG實現CVPR最佳論文「背靠背」兩連冠，何愷明的ResNet/YOLO同獲Longuet-Higgins時間檢驗獎，微軟×清華的TRELLIS.2斬獲最佳學生論文獎；數據基建端，號稱「視覺物理ImageNet時刻」的PhysInOne以2M視頻、150K+3D場景、71種物理現象震撼發佈，VLA論文5倍增長、世界模型3倍增長已成共識；人才端，2名本科生半年攬5個頂會、大三學生憑老舊泰坦GPU拿下最佳學生論文提名，中國本科生頂會現象成為閉幕日全網熱議話題。以下三大熱門議題，雷峰網帶你一口氣看完CVPR 2026閉幕日的所有精華。熱門議題一：五大獎項全揭曉——D4RT封神、牛津VGG兩連冠、何愷明再獲至高榮譽閉幕式上，CVPR 2026五大獎項塵埃落定。Google DeepMind的D4RT以4D動態場景重建摘得最佳論文獎，標誌著Oxford VGG連續兩年站上CVPR最高領獎臺（VGGT'25 + D4RT'26）；何愷明團隊的ResNet/YOLO同獲Longuet-Higgins時間檢驗獎，再次印證其在計算機視覺史上的奠基地位；微軟×清華的TRELLIS.2以17秒生成PBR資產的驚豔表現斬獲最佳學生論文獎；SAM 3D獲最佳論文提名，NitroGen（NVIDIA）獲最佳論文榮譽提名。這五大獎項不僅是論文本身的勝利，更折射出計算機視覺從2D到4D、從感知到生成的範式遷移主線。 D4RT — CVPR 2026 Best Paper Award（Google DeepMind / UCL / Oxford · 閉幕式揭曉）[摘要] CVPR 2026最佳論文獎花落Google DeepMind、UCL和Oxford聯合團隊的D4RT。該論文提出了一套高效的4D動態場景重建方法，在重建質量與計算效率之間取得了突破性平衡。這是Oxford VGG實驗室連續兩年斬獲CVPR最佳論文——2025年的VGGT與2026年的D4RT共同寫就了「背靠背」兩連冠的傳奇，也標誌著4D重建已從研究前沿正式進入主流視野。 ResNet & YOLO — Longuet-Higgins 時間檢驗獎（何愷明團隊）[摘要] 何愷明團隊的ResNet與YOLO檢測框架同獲CVPR 2026 Longuet-Higgins時間檢驗獎，表彰其對計算機視覺研究與實踐長達十年以上的深遠影響。從2015年的ResNet到2016年的YOLO，這兩項工作經歷了大規模工業驗證後，其奠基性貢獻獲最高級別學術獎項認可，再次印證何愷明「一作即封神」的傳奇學術軌跡。 TRELLIS.2 — 最佳學生論文獎（微軟 × 清華 · 17秒生成PBR資產）[摘要] 微軟研究院與清華大學聯合提出的TRELLIS.2斬獲CVPR 2026最佳學生論文獎。TRELLIS.2作為原生3D大模型，能在17秒內生成超高精度的PBR（物理渲染）資產，將3D資產生成從「天級」縮短至「秒級」，被視為3D生成領域的新標杆。該論文是產學研結合的典範之作。 SAM 3D（最佳論文提名）& NitroGen（NVIDIA · 最佳論文榮譽提名）[摘要] SAM 3D提出從單張圖像進行3D重建的生成模型，獲CVPR 2026最佳論文提名（Best Paper Finalist）；NVIDIA的NitroGen則獲得最佳論文榮譽提名（Best Paper Honorable Mention），延續了NVIDIA在CVPR的強勢表現。兩篇論文分屬3D重建與圖像生成方向，代表了當前計算機視覺最具活力的兩個子領域。熱門議題二：PhysInOne發佈——「視覺物理ImageNet時刻」開啟，世界模型與具身智能論文暴漲如果說D4RT代表了過去，那麼PhysInOne的發佈則指向CV視覺的未來。這個包含2M視頻、150K+動態3D場景、71種物理現象（力學、光學、流體、磁學）的超大型數據集，被學界稱為「視覺物理的ImageNet時刻」——其意義不在於一項技術突破，而在於為世界模型和具身AI研究奠定了此前缺失的數據基礎設施。與此同時，CVPR 2026數據清晰顯示VLA論文數量增長了5倍、世界模型論文數量增長了3倍，前AlphaFold2核心成員Simon Kohl以一場被評價為「全場最佳」的Keynote，打通了從蛋白質設計到生成式AI的跨領域鏈路。具身智能正在從學術春天走向真正的產業夏天。 PhysInOne: Physics-Grounded World Models & Embodied AI Dataset（「視覺物理ImageNet時刻」）[摘要] PhysInOne是一個面向物理世界模型和具身AI的大規模數據集，包含200萬個視頻、150K+動態3D場景，覆蓋71種物理現象（力學、光學、流體、磁學），並提供完整的2D/3D/4D/文本標註。其發佈被視為世界模型訓練的分水嶺事件——在此之前，研究者缺少一個大規模、多元化、帶物理標註的數據集作為世界模型的學習基礎。PhysInOne有望成為具身智能時代的數據標準，推動機器人從「看懂世界」到「理解物理」的質變。[鏈接] https://x.com/boyang_vLAR/status/2063676557223514490Simon Kohl（前AlphaFold2 / Latent Labs CEO）Keynote [摘要] 前AlphaFold2核心成員、現任Latent Labs CEO Simon Kohl發表了被多位參會者評價為「全場最精彩Keynote」的演講。他以「預測器賦能生成模型」為核心洞見：在AlphaFold2中做的是預測器（Predictor），而在Latent Labs則轉向生成器（Generator），AI設計的抗體已在十人人類panel中展示低免疫激活。這場橫跨CV、計算生物學與藥物設計的演講，讓在場研究者看到了視覺模型與生命科學深度交匯的巨大潛力。 [鏈接] https://x.com/CVPR/status/2063001229672743180?s=20 MAPS: VLA魯棒微調框架 + VQ-VA World：具身智能方法論的集中爆發[摘要] CVPR 2026具身智能方向以「VLA論文5倍增長、世界模型3倍增長」的數據坐實了賽道熱度。MAPS提出了VLA模型魯棒微調框架，核心發現是VLA的不同組件需要不同級別的保留與適配策略；VQ-VA World等世界模型相關論文同期亮相。這標誌著具身智能從早期的單點突破階段，正式進入系統性方法論構建階段。熱門議題三：中國本科生頂會現象引爆網絡——2人半年5個頂會、大三學生老泰坦逆襲、美團560B開源模型齊登CVPRCVPR 2026閉幕日，最出圈的討論不是最佳論文花落誰家，而是一群中國本科生的驚豔表現。2名本科生半年內在CVPR/ICCV/ECCV等頂級會議上狂攬5篇論文；一位大三學生僅憑一塊老舊泰坦GPU完成的研究，成功獲得CVPR 2026最佳學生論文提名——這條消息以極快的速度在機器之心、新智元、量子位等頭部科技媒體間發酵，成為閉幕日全網最熱話題。與此同時，中國科技巨頭在CVPR現場同樣重量級：美團正式開源560B參數的LongCat MoE大模型，字節跳動的HiFi-Inpaint圖像修復新範式高調亮相，微軟×清華的TRELLIS.2更是讓產學研合作成果站上國際舞臺。中國力量，正在以不可忽視的姿態成為CVPR的主角。大三本科生憑老泰坦GPU斬獲CVPR最佳學生論文提名[摘要] 一名大三本科生使用一塊老舊泰坦（Titan）GPU完成的研究，脫穎而出獲得CVPR 2026最佳學生論文提名。該故事經量子位微信公眾號首發後迅速引爆全網，機器之心、新智元等頭部科技媒體陸續跟進。在算力軍備競賽愈演愈烈的今天，這一「低配逆襲」敘事擊中了學術界的集體共鳴點，也讓更多資源受限的高校學生看到了衝頂頂會的可能。 2名本科生半年5個頂會——中國青年學者全民出海[摘要] 兩名本科在讀學生，僅用半年時間便在CVPR、ICCV、ECCV等五大頂級會議上發表了5篇論文，並在CVPR 2026上獲得最佳學生論文提名。這一現象經新智元、機器之心等多家媒體報道後引發熱議，折射出中國計算機視覺教育——尤其是本科階段拔尖人才培養體系——的跨越式進步。 LongCat：美團開源560B MoE大模型（CVPR現場展出）[摘要] 美團在CVPR 2026現場正式發佈並開源LongCat模型家族：560B參數Mixture-of-Experts架構，每次推理僅需激活約27B參數，在推理速度與模型能力之間取得了出色平衡。這是中國互聯網巨頭在CVPR舞臺上最大規模的模型開源行動之一，標誌著美團AI戰略從應用層向基礎模型層的縱深延伸。[鏈接]https://x.com/VincentLogic/status/2063877403739558179?s=20 HiFi-Inpaint：字節跳動圖像修復新範式[摘要] 字節跳動在CVPR 2026上提出HiFi-Inpaint，以全新思路解決圖像修復（Image Inpainting）任務中的高頻細節恢復難題。該論文經CVer公眾號深度解讀後獲得廣泛傳播，成為本屆CVPR中國科技企業賽道中平面視覺方向最受關注的成果之一。 [CVPR 2026完美落幕] 視覺物理時代，才剛剛開始從D4RT的4D重建到PhysInOne的物理數據集，從中國本科生的泰坦逆襲到LongCat 560B的開源浪潮。CVPR 2026告訴我們：計算機視覺正在從「理解圖像」的時代，大踏步邁向「理解世界」的時代——而中國，已站上這場變革的中心舞臺。>> 點擊關注CVPR專題專區，獲取年度綜述、深度論文解讀與行業趨勢全盤點 <<

原始來源：雷峰網 ↗

查看原始來源

量子位研究與前沿

GPT發AI原創新成果了

這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到：AI實現藥物全自動研發，還遠嗎？從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪研究與前沿

AI越強，越要“殺死”過去的自己

這篇消息聚焦「AI越強，越要“殺死”過去的自己」。原始導語提到：人類需要實現思維模式的轉變。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 小時前閱讀分析

MarkTechPost AI研究與前沿

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

7 小時前閱讀分析

36氪研究與前沿

Transformer之父離開谷歌，奧特曼等了他十年

這篇消息聚焦「Transformer之父離開谷歌，奧特曼等了他十年」。原始導語提到：27億美元也沒能留住，Noam Shazeer追尋下一代架構。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

15 小時前閱讀分析

36氪研究與前沿

Dario訪談首曝：Mythos被稱為“超級武器”

這篇消息聚焦「Dario訪談首曝：Mythos被稱為“超級武器”」。原始導語提到：在這場69分鐘完整訪談裡，Dario Amodei 說人類真正面對的不是某個突然降臨的奇點，而是一條已經開始垂直起飛的指數曲線。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

19 小時前閱讀分析

鈦媒體研究與前沿

用結構替代數據，因果世界模型如何重塑具身智能大腦

這篇消息聚焦「用結構替代數據，因果世界模型如何重塑具身智能大腦」。原始導語提到：因果世界模型需要一個標誌性的時刻來證明自己。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

19 小時前閱讀分析

相關文章

GPT發AI原創新成果了

AI越強，越要“殺死”過去的自己

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

Transformer之父離開谷歌，奧特曼等了他十年

Dario訪談首曝：Mythos被稱為“超級武器”

用結構替代數據，因果世界模型如何重塑具身智能大腦