CVPR 2026完美落幕!D4RT封神最佳論文、牛津VGG兩連冠,中國本科生泰坦顯卡逆襲引爆全網
重點摘要
CVPR 2026主會議於6月7日落下帷幕,三大重磅信號同頻共振:獎項端,Google DeepMind的D4RT摘得最佳論文獎,Oxford VGG實現CVPR最佳論文「背靠背」兩連冠,何愷明的ResNet/YOLO同獲Longuet-Higgins時間檢驗獎,微軟×清華的TRELLIS.2斬獲最佳學生論文獎;數據基建端,號稱「視覺物理ImageNet時刻」的PhysInOne以2M視頻、150K+3D場景、71種物理現象震撼發佈,VLA論文5倍增長、世界模型3倍增長已成共識;人才端,2名本科生半年攬5個頂會、大三學生憑老舊泰坦GPU拿下最佳學生論文提名,中國本科生頂會現象成為閉幕日全網熱議話題。以下三大熱門議題,雷峰網帶你一口氣看完CVPR 2026閉幕日的所有精華。 熱門議題一:五大獎項全揭曉——D4RT封神、牛津VGG兩連冠、何愷明再獲至高榮譽閉幕式上,CVPR 2026五大獎項塵埃落定。Google DeepMind的D4RT以4D動態場景重建摘得最佳論文獎,標誌著Oxford VGG連續兩年站上CVPR最高領獎臺(VGGT'25 + D4RT'26);何愷明團隊的ResNet/YOLO同獲Longuet-Higgins時間檢驗獎,再次印證其在計算機視覺史上的奠基地位;微軟×清華的TRELLIS.2以17秒生成PBR資產的驚豔表現斬獲最佳學生論文獎;SAM 3D獲最佳論文提名,NitroGen(NVIDIA)獲最佳論文榮譽提名。這五大獎項不僅是論文本身的勝利,更折射出計算機視覺從2D到4D、從感知到生成的範式遷移主線。 D4RT — CVPR 2026 Best Paper Award(Google DeepMind / UCL / Oxford · 閉幕式揭曉)[摘要] CVPR 2026最佳論文獎花落Google DeepMind、UCL和Oxford聯合團隊
CVPR 2026主會議於6月7日落下帷幕,三大重磅信號同頻共振:獎項端,Google DeepMind的D4RT摘得最佳論文獎,Oxford VGG實現CVPR最佳論文「背靠背」兩連冠,何愷明的ResNet/YOLO同獲Longuet-Higgins時間檢驗獎,微軟×清華的TRELLIS.2斬獲最佳學生論文獎;數據基建端,號稱「視覺物理ImageNet時刻」的PhysInOne以2M視頻、150K+3D場景、71種物理現象震撼發佈,VLA論文5倍增長、世界模型3倍增長已成共識;人才端,2名本科生半年攬5個頂會、大三學生憑老舊泰坦GPU拿下最佳學生論文提名,中國本科生頂會現象成為閉幕日全網熱議話題。以下三大熱門議題,雷峰網帶你一口氣看完CVPR 2026閉幕日的所有精華。 熱門議題一:五大獎項全揭曉——D4RT封神、牛津VGG兩連冠、何愷明再獲至高榮譽閉幕式上,CVPR 2026五大獎項塵埃落定。Google DeepMind的D4RT以4D動態場景重建摘得最佳論文獎,標誌著Oxford VGG連續兩年站上CVPR最高領獎臺(VGGT'25 + D4RT'26);何愷明團隊的ResNet/YOLO同獲Longuet-Higgins時間檢驗獎,再次印證其在計算機視覺史上的奠基地位;微軟×清華的TRELLIS.2以17秒生成PBR資產的驚豔表現斬獲最佳學生論文獎;SAM 3D獲最佳論文提名,NitroGen(NVIDIA)獲最佳論文榮譽提名。這五大獎項不僅是論文本身的勝利,更折射出計算機視覺從2D到4D、從感知到生成的範式遷移主線。 D4RT — CVPR 2026 Best Paper Award(Google DeepMind / UCL / Oxford · 閉幕式揭曉)[摘要] CVPR 2026最佳論文獎花落Google DeepMind、UCL和Oxford聯合團隊的D4RT。該論文提出了一套高效的4D動態場景重建方法,在重建質量與計算效率之間取得了突破性平衡。這是Oxford VGG實驗室連續兩年斬獲CVPR最佳論文——2025年的VGGT與2026年的D4RT共同寫就了「背靠背」兩連冠的傳奇,也標誌著4D重建已從研究前沿正式進入主流視野。 ResNet & YOLO — Longuet-Higgins 時間檢驗獎(何愷明團隊)[摘要] 何愷明團隊的ResNet與YOLO檢測框架同獲CVPR 2026 Longuet-Higgins時間檢驗獎,表彰其對計算機視覺研究與實踐長達十年以上的深遠影響。從2015年的ResNet到2016年的YOLO,這兩項工作經歷了大規模工業驗證後,其奠基性貢獻獲最高級別學術獎項認可,再次印證何愷明「一作即封神」的傳奇學術軌跡。 TRELLIS.2 — 最佳學生論文獎(微軟 × 清華 · 17秒生成PBR資產)[摘要] 微軟研究院與清華大學聯合提出的TRELLIS.2斬獲CVPR 2026最佳學生論文獎。TRELLIS.2作為原生3D大模型,能在17秒內生成超高精度的PBR(物理渲染)資產,將3D資產生成從「天級」縮短至「秒級」,被視為3D生成領域的新標杆。該論文是產學研結合的典範之作。 SAM 3D(最佳論文提名)& NitroGen(NVIDIA · 最佳論文榮譽提名)[摘要] SAM 3D提出從單張圖像進行3D重建的生成模型,獲CVPR 2026最佳論文提名(Best Paper Finalist);NVIDIA的NitroGen則獲得最佳論文榮譽提名(Best Paper Honorable Mention),延續了NVIDIA在CVPR的強勢表現。兩篇論文分屬3D重建與圖像生成方向,代表了當前計算機視覺最具活力的兩個子領域。 熱門議題二:PhysInOne發佈——「視覺物理ImageNet時刻」開啟,世界模型與具身智能論文暴漲如果說D4RT代表了過去,那麼PhysInOne的發佈則指向CV視覺的未來。這個包含2M視頻、150K+動態3D場景、71種物理現象(力學、光學、流體、磁學)的超大型數據集,被學界稱為「視覺物理的ImageNet時刻」——其意義不在於一項技術突破,而在於為世界模型和具身AI研究奠定了此前缺失的數據基礎設施。與此同時,CVPR 2026數據清晰顯示VLA論文數量增長了5倍、世界模型論文數量增長了3倍,前AlphaFold2核心成員Simon Kohl以一場被評價為「全場最佳」的Keynote,打通了從蛋白質設計到生成式AI的跨領域鏈路。具身智能正在從學術春天走向真正的產業夏天。 PhysInOne: Physics-Grounded World Models & Embodied AI Dataset(「視覺物理ImageNet時刻」)[摘要] PhysInOne是一個面向物理世界模型和具身AI的大規模數據集,包含200萬個視頻、150K+動態3D場景,覆蓋71種物理現象(力學、光學、流體、磁學),並提供完整的2D/3D/4D/文本標註。其發佈被視為世界模型訓練的分水嶺事件——在此之前,研究者缺少一個大規模、多元化、帶物理標註的數據集作為世界模型的學習基礎。PhysInOne有望成為具身智能時代的數據標準,推動機器人從「看懂世界」到「理解物理」的質變。[鏈接] https://x.com/boyang_vLAR/status/2063676557223514490Simon Kohl(前AlphaFold2 / Latent Labs CEO)Keynote [摘要] 前AlphaFold2核心成員、現任Latent Labs CEO Simon Kohl發表了被多位參會者評價為「全場最精彩Keynote」的演講。他以「預測器賦能生成模型」為核心洞見:在AlphaFold2中做的是預測器(Predictor),而在Latent Labs則轉向生成器(Generator),AI設計的抗體已在十人人類panel中展示低免疫激活。這場橫跨CV、計算生物學與藥物設計的演講,讓在場研究者看到了視覺模型與生命科學深度交匯的巨大潛力。 [鏈接] https://x.com/CVPR/status/2063001229672743180?s=20 MAPS: VLA魯棒微調框架 + VQ-VA World:具身智能方法論的集中爆發[摘要] CVPR 2026具身智能方向以「VLA論文5倍增長、世界模型3倍增長」的數據坐實了賽道熱度。MAPS提出了VLA模型魯棒微調框架,核心發現是VLA的不同組件需要不同級別的保留與適配策略;VQ-VA World等世界模型相關論文同期亮相。這標誌著具身智能從早期的單點突破階段,正式進入系統性方法論構建階段。 熱門議題三:中國本科生頂會現象引爆網絡——2人半年5個頂會、大三學生老泰坦逆襲、美團560B開源模型齊登CVPRCVPR 2026閉幕日,最出圈的討論不是最佳論文花落誰家,而是一群中國本科生的驚豔表現。2名本科生半年內在CVPR/ICCV/ECCV等頂級會議上狂攬5篇論文;一位大三學生僅憑一塊老舊泰坦GPU完成的研究,成功獲得CVPR 2026最佳學生論文提名——這條消息以極快的速度在機器之心、新智元、量子位等頭部科技媒體間發酵,成為閉幕日全網最熱話題。與此同時,中國科技巨頭在CVPR現場同樣重量級:美團正式開源560B參數的LongCat MoE大模型,字節跳動的HiFi-Inpaint圖像修復新範式高調亮相,微軟×清華的TRELLIS.2更是讓產學研合作成果站上國際舞臺。中國力量,正在以不可忽視的姿態成為CVPR的主角。大三本科生憑老泰坦GPU斬獲CVPR最佳學生論文提名[摘要] 一名大三本科生使用一塊老舊泰坦(Titan)GPU完成的研究,脫穎而出獲得CVPR 2026最佳學生論文提名。該故事經量子位微信公眾號首發後迅速引爆全網,機器之心、新智元等頭部科技媒體陸續跟進。在算力軍備競賽愈演愈烈的今天,這一「低配逆襲」敘事擊中了學術界的集體共鳴點,也讓更多資源受限的高校學生看到了衝頂頂會的可能。 2名本科生半年5個頂會——中國青年學者全民出海[摘要] 兩名本科在讀學生,僅用半年時間便在CVPR、ICCV、ECCV等五大頂級會議上發表了5篇論文,並在CVPR 2026上獲得最佳學生論文提名。這一現象經新智元、機器之心等多家媒體報道後引發熱議,折射出中國計算機視覺教育——尤其是本科階段拔尖人才培養體系——的跨越式進步。 LongCat:美團開源560B MoE大模型(CVPR現場展出)[摘要] 美團在CVPR 2026現場正式發佈並開源LongCat模型家族:560B參數Mixture-of-Experts架構,每次推理僅需激活約27B參數,在推理速度與模型能力之間取得了出色平衡。這是中國互聯網巨頭在CVPR舞臺上最大規模的模型開源行動之一,標誌著美團AI戰略從應用層向基礎模型層的縱深延伸。[鏈接]https://x.com/VincentLogic/status/2063877403739558179?s=20 HiFi-Inpaint:字節跳動圖像修復新範式[摘要] 字節跳動在CVPR 2026上提出HiFi-Inpaint,以全新思路解決圖像修復(Image Inpainting)任務中的高頻細節恢復難題。該論文經CVer公眾號深度解讀後獲得廣泛傳播,成為本屆CVPR中國科技企業賽道中平面視覺方向最受關注的成果之一。 [CVPR 2026完美落幕] 視覺物理時代,才剛剛開始從D4RT的4D重建到PhysInOne的物理數據集,從中國本科生的泰坦逆襲到LongCat 560B的開源浪潮。CVPR 2026告訴我們:計算機視覺正在從「理解圖像」的時代,大踏步邁向「理解世界」的時代——而中國,已站上這場變革的中心舞臺。>> 點擊關注CVPR專題專區,獲取年度綜述、深度論文解讀與行業趨勢全盤點 <<
Related
相關文章

GPT發AI原創新成果了
這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到:AI實現藥物全自動研發,還遠嗎? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

AI越強,越要“殺死”過去的自己
這篇消息聚焦「AI越強,越要“殺死”過去的自己」。原始導語提到:人類需要實現思維模式的轉變。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks
In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

Transformer之父離開谷歌,奧特曼等了他十年
這篇消息聚焦「Transformer之父離開谷歌,奧特曼等了他十年」。原始導語提到:27億美元也沒能留住,Noam Shazeer追尋下一代架構。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Dario訪談首曝:Mythos被稱為“超級武器”
這篇消息聚焦「Dario訪談首曝:Mythos被稱為“超級武器”」。原始導語提到:在這場69分鐘完整訪談裡,Dario Amodei 說人類真正面對的不是某個突然降臨的奇點,而是一條已經開始垂直起飛的指數曲線。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

用結構替代數據,因果世界模型如何重塑具身智能大腦
這篇消息聚焦「用結構替代數據,因果世界模型如何重塑具身智能大腦」。原始導語提到:因果世界模型需要一個標誌性的時刻來證明自己。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。