ICRA 2026 現場：中國軍團主導維也納，新銳巨頭混戰具身智能深水區

2026年6月5日 02:50

重點摘要

站內 AI 整理稿

史上最大ICRA，中國驚豔世界。作者丨吳思夢編輯丨岑峰宇樹科技、千尋智能、帕西尼、智元機器人、加速進化、高擎機電、光輪智能、銀河通用、魔法原子、戴盟機器人、鹿明機器人等企業在本屆 ICRA 的核心工業展區，放眼望去皆是中國展商的身影。這一幕，讓日本參會學者Shohei Hido在現場直接感嘆：“China is dominating”——中國展商，已經成為本屆ICRA最醒目的存在。當多瑙河畔的音樂之都響起代碼與算法的交響，全球機器人學界一年一度的“奧林匹克”——IEEE國際機器人與自動化會議（ICRA 2026），於6月1日在奧地利維也納正式拉開帷幕。本屆大會以“Robots for All”為主題，於6月1日至5日舉行，匯聚了來自86個國家和地區的超過8000名學者與產業人士。雷峰網已抵達第一現場，從組委會獲取的最終數據顯示：本屆ICRA有效投稿達4947篇，最終錄用1882篇，錄用率為38.04%其中，11所中國高校佔Top 20的55%，清華74篇斷層第一，"清北交浙"四校合計212篇。三年間投稿量增幅超過50%，門檻不降反升。大會共設有153場Workshop，覆蓋具身智能、VLA、Sim-to-Real等前沿方向，另有20項競賽提案同臺競技。如果說去年的關鍵詞還是“大模型”，那麼今年ICRA的核心敘事已明確轉向“物理智能”——而在這場從感知到行動的範式轉移中，中國企業正在以前所未有的力度改寫全球機器人產業版圖。01ICRA 2026：VLA大爆發，中國力量“全棧壓制”在素有“歐洲心臟”之稱的維也納，具身智能正經歷一場底層範式轉移——「ICRA 2026的VLA時刻」已經從一種技術預測變成了全面鋪開的現實。雷峰網前方記者現場走訪與參加各類分論壇討論時注意到：今年圍繞VLA模型展開的探討，呈現出強烈的跨界收斂特徵。在往屆會議中，RL4IL（模仿學習中的強化學習）、Act to Sense（從動作到感知）和Synthetic Data（合成數據）往往散落各處、各自為戰。但在今年，一根隱形的線將它們徹底串聯：全行業都在試圖跨越“從語義理解到物理執行”的斷層。在這場跨越物理斷層的戰役中，中國軍團的表現已經不能僅僅用“參與”來形容，而是展現出了強大的生態壓制力。在以往機器人行業的敘事中，硅谷往往負責“定義大腦”，而中國被視生態鏈下游“提供軀幹”的硬件代工廠。但在今年的維也納，這種舊有格局被徹底打破：在算法頂層，中國大模型強勢衝頂。記者在現場看到，千尋智能展示了自研的具身基座模型 Spirit v1.6，現場絲滑演示“串糖葫蘆”這類極度依賴動態力量控制的柔性動作。令人矚目的是，正是這座純正的中國 VLA 模型，在不久前的行業盲測中力壓英偉達最新模型 Cosmos3 與 Physical Intelligence（PI）的 Pi0.5，霸榜全球第一，成為第一梯隊中最為耀眼的中國大腦。在硬件本體端，更是呈現出“諸神混戰”的盛況。除了明星初創 Booster T2 震撼的首秀，由知名學者蘇昊創立的蘇度科技也選擇在 ICRA 現場進行其最新機器人的驚豔首發，展臺被圍得水洩不通。老牌勁旅天機智能以鉑金合作伙伴身份坐鎮核心展區，其新一代 Gento 系列人形機器人平臺直接打包了從遙操作到具身智能的全棧開發工具鏈；高擎動力則帶著 15kg 輕量化機身的 Mini Pi plus 開源人形平臺，試圖用極致的性價比一舉填補科研端“買得起、用得上”的生態空白。為什麼中國軍團能跑出這樣的加速度？因為他們不僅在拼算力，更在啃“物理法則”的硬骨頭。過去，過度依賴純視覺和仿真的 VLA 模型一旦接觸真實的物理表面，就會暴露出“阿喀琉斯之踵”——它無法精準預測摩擦力、形變和剛度。而今年被參會者擠爆的“Act to Sense（從動作到感知）”論壇給出了明確的解法：具身智能絕不能只當一個被動看圖說話的“指令翻譯機”，機器人必須在“動作執行（Act）”的交互瞬間，反向去捕捉並適應物理世界的微觀反饋（Sense）。伴隨著百萬級泛化合成數據（Synthetic Data）的大規模引入，以及擴散策略（Diffusion Policy）對虛實差異（Sim-to-Real）的有效抹平，本屆 ICRA 釋放出了一個極其清晰的信號：VLA 模型終於不再只是給機械臂塞進去的一個“翻譯插件”，而是真正開始承擔起理解三維空間幾何、主導長時序規劃（Long-horizon Planning）的完整中樞功能。從鉑金贊助商到全球首發，從底層模型霸榜到開源硬件普惠，中國力量正在以全鏈條的姿態，在維也納的舞臺上重新定義全球具身智能的競賽規則。02人形機器人的“超級星期一”：硅谷定方向，中國定標準開幕同一天，至少四件標誌性事件密集發生：宇樹科技科創板IPO申請獲上交所上市委審議通過，73天“閃電”過會；英偉達CEO黃仁勳在GTC Taipei高調官宣與宇樹合作推出新一代人形機器人參考設計H2+（Isaac GR00T系統）；OpenAI CEO奧特曼發佈招賢令，正式宣佈OpenAI Robotics團隊迴歸，由DALL-E靈魂人物Aditya Ramesh掛帥；中國創業公司Booster Robotics選擇ICRA舞臺進行T2人形機器人全球首秀。這四件事的密集程度也絕非巧合。宇樹的73天過會速度刷新了中國科技企業IPO的紀錄，背後是資本市場對具身智能賽道的空前熱情。英偉達H2+人形機器人參考設計的發佈，"芯片+模型+機器人"三位一體的產業閉環正在形成。而OpenAI的迴歸則釋放了最強烈的信號——當這家定義了AI時代標準的公司重新殺回機器人賽道，整個行業的估值邏輯或將被改寫。這種全球範圍內的板塊漂移，直接導致ICRA現場的展示不再滿足於讓機器人死板地在平地上走兩步，而是被拉到了更加逼真的動態干擾環境中進行“抗壓測試”，全身操控（Whole-Body Control, WBC）在今年迎來了工程學上的質變：人形機器人在保持高動態步態行進的同時，上肢雙手還能穩定地執行動態插拔、搬運等複合任務，各家百花齊放，形成諸神黃昏般的競速。03數據驅動下，靈巧操作的產業化路線軟件層面的大模型數據焦慮，在ICRA 2026的工業展區找到了實質性的硬件鏡像。雷峰網前方記者現場走訪發現，今年的工業展臺呈現出高度一致的趨向性：過去那些帶有試驗性質、單純為了展示自由度的孤立機械手已經退出主舞臺，取而代之的是一條“數據驅動靈巧操作”的清晰產業路線。在展區現場，帕西尼、Sharpa 等一眾展商不再單賣硬件，而是集體以「靈巧手 + 高質量操控數據集 + 陣列式觸覺傳感」的成套方案進行對壘。這種參展組合的轉變，向市場釋放了極為明確的商業化量產信號：靈巧操作（Dexterous Manipulation）已經結束了“能不能抓起杯子”的純硬件競賽，進入了“如何在複雜工業裝配線和動態家庭環境中實現泛化”的成本和生態生態博弈。“有了硬件才能收集數據，有了好的數據才能反訓模型，從simulation到real world形成閉環。”Sharpa 展臺負責人在 ICRA 現場接受雷峰網採訪時表示，與其為了展會噱頭做 Demo，Sharpa 更看重在物理法則下的硬核打磨。數據採集方面，雷峰網瞭解到，Sharpa目前與英偉達合作，在Isaac平臺做simulation preload，同時用真機+Manus數據手套採集數據，對方透露Sharpa也在自研數據採集方案。今年，他們不僅現場升級了兼具多模態推導與手眼腦協調的發牌機器人，更亮出了打包 CraftNet大腦、全尺寸輪式整機以及 22 自由度靈巧手 Sharpa Wave 的 North 整機平臺。單純依賴視覺模型的具身方案，在物理操控中正遭遇精度懲罰。在具身智能當下的發展階段，視覺能提供宏觀的位置參考，但無法替代接觸瞬間的物理反饋。在面對工廠理線、精密插拔、或者易碎品抓取等長尾長距離的干擾時，沒有細膩的觸覺，機器人就只是一臺概率論操控下的笨拙機器。今年的展臺現場，帕西尼與YUBI等廠商展示的微型磁敏與柔性電阻抗複合觸覺皮膚，已經能夠提供亞毫米級的表面紋理與剛度識別。而像Nexdata這樣的多模態數據服務商，則把結構化的、帶有觸覺標籤的多視角靈巧操作數據集做成了標準的商品。這種軟硬件的無縫咬合和生態重構，正在將靈巧手從學術界昂貴的“象牙塔耗材”，洗牌為能夠實質性進入生產線的、可規模化交付的工業品。“最後一毫米”——這是千覺科技CTO趙浩南在ICRA現場接受雷峰網採訪時，對觸覺傳感器核心價值的定義。趙浩南向雷峰網指出，基於視覺的閉環反饋控制在分揀、上下料等任務中已取得成果，但在流水線的測試、插拔、組裝等精細操作中存在天然侷限——物體姿態不穩定，頭部相機和腕部相機易受遮擋，視覺定位有上限，微小偏差就可能導致裝配失敗甚至零部件損壞。而觸覺傳感器能感知物體在手中的姿態變化，是解決“最後一毫米”問題的關鍵。在數據採集端，雷峰網記者也和度量科技工作人員瞭解到，光學動捕系統正在成為另一條“隱形基礎設施”——通過多鏡頭系統採集手部精細操作數據，精度遠超手套設備的關節角度反算，為靈巧手訓練提供高質量的軌跡數據。從觸覺感知到動捕採集，一條“光學捕捉+觸覺傳感+靈巧執行”的完整數據閉環正在ICRA 2026的中國展商中悄然成型。04現場Keynote 前瞻：國內學者精彩開講在這場全球技術博弈中，中國學者與海外華人軍團正在用冷靜且務實的研究，扮演著行業平衡器的角色。在6月2日正會正式開始後的核心議程中，有兩位來自國內的機器人學界中堅力量登臺發表了重磅Keynote或特邀演講。碰巧的是，這兩位大咖都曾經在雷峰網主辦的GAIR大會上應邀發表過主題報告：王賀升教授（上海交通大學）：學習導航，從場景理解到決策作為視覺伺服（Visual Servoing）領域的全球頂尖學者，上海交通大學王賀升教授在當日的演講備受矚目。當下的具身智能賽道，正深陷於“端到端大模型”的唯技術論狂熱中。在試圖用黑盒模型吞噬一切物理控制的喧囂下，王賀升教授所堅持的嚴謹路徑，為行業注入了難得的清醒。作為大會首日上午的壓軸Keynote，王教授的報告緊扣機器人導航核心技術及其在複雜動態環境中的前沿應用，層層遞進地展示了一幅硬核的技術版圖：從多傳感器融合里程計、二維/三維光流估計，到四維動態重建、動態及語義 SLAM，再到極具挑戰的可變形環境建圖。面對人體組織等“非剛體”這一業界公認的醫療/服務痛點，其團隊創性地提出了可變形三維高斯地圖（3DGS）與連續性約束定位方法，讓機器人在複雜動態環境中的感知邊界大幅拓寬。不僅如此，團隊還深入探索了跨模態定位（2D圖像與3D地圖），並將 NeRF 的記憶機制與視覺語言模型（VLM）的推理能力融為一體，構建出下一代導航規劃框架。據瞭解，相關技術已在礦卡、倉儲機器人、自動泊車、移動通信平臺和割草機器人等場景中落地應用。徐天添研究員（中國科學院深圳先進技術研究院）：用於精密醫療的磁控微納機器人如果說人形機器人是宏觀世界的龐然大物，那麼中國科學院深圳先進技術研究院的徐天添研究員，則在今天的演講中將現場學者的視線帶入了神秘的微觀世界。徐天添研究員的演講將聚焦於磁控微納機器人的自動化操控及其在生物醫療工程中的應用。微納機器人在複雜的生物流體環境下面面臨著極其嚴重的長尾長距離干擾，傳統控制方法極難維持高穩定性。徐天添團隊通過巧妙的數據驅動方法與精密磁場控制的結合，壓榨出了亞微米級的自主操控精度。同時也間接證明，具身智能與大數據的邊界，不僅停留在端到端大模型和人形機器人上，物理智能在微納醫療領域的精細延伸，同樣是一條能實質性改變人類生命質量的“硬核賽道”。雷峰網將對這兩位Keynote嘉賓在ICRA上的最新演講進行文字總結整理，更多內容敬請關注雷峰網ICRA專區：https://www.leiphone.com/special/492/202604/69e84179d5132.html （點擊文末【閱讀原文】即可閱讀）05鎖定雷峰網專區，獨家搶先透視ICRA 2026的大幕已經徹底拉開。無論是VLA模型在維也納會場引發的技術爭論，靈巧手在工業展區展露出的商業化野心，還是王賀升、徐天添兩位華人學者在演講中透露出的底層技術突圍，都清晰地表明：行業正在向技術的深水區正面挺進。端到端大模型究竟是不是具身智能的終局？中國產業鏈優勢如何與前沿學術完成無縫對接？在接下來為期五天的議程中，雷峰網前方團隊將持續駐紮維也納會場一線，為您帶來第一手、不加濾鏡的深度觀察。06去哪看 ICRA 核心【演講/論文】詳解？為了讓國內的研發者、創業者與投資人能夠毫無時差地掌握本屆 ICRA 2026 的完整乾貨，雷峰網已全面上線【ICRA 2026 深度專區】。專區不僅全面收錄了重磅論文的工程化解讀、專家前沿演講，更將持續更新前方記者的第一手會議動態。掃描下方二維碼，或點擊「閱讀原文」關注專區。與全球 8000 名頂尖大腦同步呼吸，搶先透視具身智能的下一個五年

原始來源：雷峰網 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

2 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

15 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

18 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

19 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

22 小時前閱讀分析