雷峰網現場直擊,ICRA 2026開幕全景解碼!
重點摘要
當多瑙河畔的音樂之都響起代碼與算法的交響,全球機器人學界一年一度的“奧林匹克”——IEEE國際機器人與自動化會議(ICRA 2026),於6月1日在奧地利維也納正式拉開帷幕。本屆大會以“Robots for All”為主題,於6月1日至5日舉行,匯聚了來自86個國家和地區的超過8000名學者與產業人士。 雷峰網已抵達第一現場,從組委會獲取的最終數據顯示:本屆ICRA有效投稿達4947篇,最終錄用1882篇,錄用率為38.04%——三年間投稿量增幅超過50%,門檻不降反升。大會共設有153場Workshop,覆蓋具身智能、VLA、Sim-to-Real等前沿方向,另有20項競賽提案同臺競技。如果說去年的關鍵詞還是“大模型”,那麼今年ICRA的核心敘事已明確轉向“物理智能”——從感知到行動的範式轉移,正在維也納真實上演。 ICRA 2026的VLA時刻 在素有“歐洲心臟”之稱的維也納,具身智能正經歷一場底層範式轉移——「ICRA 2026的VLA時刻」已經從一種技術預測變成了全面鋪開的現實。 雷峰網記者在現場穿梭於各個分論壇時注意到,今年圍繞VLA模型展開的探討,呈現出強烈的跨界和跨區域特徵。在往屆會議中,RL4IL(模仿學習中的強化學習)、Act to Sense(從動作到感知)和Synthetic Data(合成數據)通常散落在不同的學術分支中。但在今年,這些看似孤立的Workshop正在被一根隱形的線串聯起來:大模型如何跨越“從語義理解到物理執行”的斷層。 在過往的敘事中,具身智能極度依賴人類專家通過遙操作餵養的高成本數據。純靠仿真和視覺的VLA模型,一到真實接觸面就會暴露致命的致命傷——它無法預測摩擦力、形變和剛度。今年被擠爆的 Act to Sense論壇給出了明確的解法:具身智能不能只當一個被動看圖說話的“二傳手”,機器人必須在“動作執行(Act)”的交互瞬間,反向
當多瑙河畔的音樂之都響起代碼與算法的交響,全球機器人學界一年一度的“奧林匹克”——IEEE國際機器人與自動化會議(ICRA 2026),於6月1日在奧地利維也納正式拉開帷幕。本屆大會以“Robots for All”為主題,於6月1日至5日舉行,匯聚了來自86個國家和地區的超過8000名學者與產業人士。 雷峰網已抵達第一現場,從組委會獲取的最終數據顯示:本屆ICRA有效投稿達4947篇,最終錄用1882篇,錄用率為38.04%——三年間投稿量增幅超過50%,門檻不降反升。大會共設有153場Workshop,覆蓋具身智能、VLA、Sim-to-Real等前沿方向,另有20項競賽提案同臺競技。如果說去年的關鍵詞還是“大模型”,那麼今年ICRA的核心敘事已明確轉向“物理智能”——從感知到行動的範式轉移,正在維也納真實上演。 ICRA 2026的VLA時刻 在素有“歐洲心臟”之稱的維也納,具身智能正經歷一場底層範式轉移——「ICRA 2026的VLA時刻」已經從一種技術預測變成了全面鋪開的現實。 雷峰網記者在現場穿梭於各個分論壇時注意到,今年圍繞VLA模型展開的探討,呈現出強烈的跨界和跨區域特徵。在往屆會議中,RL4IL(模仿學習中的強化學習)、Act to Sense(從動作到感知)和Synthetic Data(合成數據)通常散落在不同的學術分支中。但在今年,這些看似孤立的Workshop正在被一根隱形的線串聯起來:大模型如何跨越“從語義理解到物理執行”的斷層。 在過往的敘事中,具身智能極度依賴人類專家通過遙操作餵養的高成本數據。純靠仿真和視覺的VLA模型,一到真實接觸面就會暴露致命的致命傷——它無法預測摩擦力、形變和剛度。今年被擠爆的 Act to Sense論壇給出了明確的解法:具身智能不能只當一個被動看圖說話的“二傳手”,機器人必須在“動作執行(Act)”的交互瞬間,反向去“感知(Sense)”物理世界的微觀反饋。而本屆大會透露的趨勢也表明,越來越多的團隊開始轉向由仿真環境生成的百萬級泛化合成數據(Synthetic Data),並試圖通過擴散策略(Diffusion Policy)抹平模擬與現實之間的肉眼可見的差距。 VLA模型不再只是給機械臂塞一個大模型的“翻譯插件”,而是開始承擔起理解空間幾何、進行長時序規劃(Long-horizon Planning)的整個大腦功能。 數據驅動下,靈巧操作的產業化路線 軟件層面的大模型數據焦慮,在ICRA 2026的工業展區找到了實質性的硬件鏡像。雷峰網前方記者現場走訪發現,今年的工業展臺呈現出高度一致的趨向性:過去那些帶有試驗性質、單純為了展示自由度的孤立機械手已經,取而代之的是一條“數據驅動靈巧操作”的清晰產業路線。 在展會核心區,YUBI、ProHand、Nexdata、PaXini、Sharpa 等一眾展商不再單賣硬件,而是集體以「靈巧手 + 高質量操控數據集 + 陣列式觸覺傳感」的成套方案進行對壘。這種參展組合的轉變,向市場釋放了極為明確的商業化量產信號:靈巧操作(Dexterous Manipulation)已經結束了“能不能抓起杯子”的純硬件競賽,進入了“如何在複雜工業裝配線和動態家庭環境中實現泛化”的成本和生態生態博弈。 單純依賴視覺模型的具身方案,在物理操控中正遭遇精度懲罰。在具身智能當下的發展階段,視覺能提供宏觀的位置參考,但無法替代接觸瞬間的物理反饋。在面對工廠理線、精密插拔、或者易碎品抓取等長尾長距離干擾時,沒有細膩的觸覺,機器人就只是一臺概率論操控下的笨拙機器今年的展臺現場,帕西尼與YUBI等廠商展示的微型磁敏與柔性電阻抗複合觸覺皮膚,已經能夠提供亞毫米級的表面紋理與剛度識別。而像Nexdata這樣的多模態數據服務商,則把結構化的、帶有觸覺標籤的多視角靈巧操作數據集做成了標準的商品。這種軟硬件的無縫咬合和生態重構,正在將靈巧手從學術界昂貴的“象牙塔耗材”,洗牌為能夠實質性進入生產線的、可規模化交付的工業品。 從ICRA2026看人形機器人競賽格局 6月1日,人形機器人賽道迎來了一個“超級星期一”。 雷峰網在前線梳理發現,本屆ICRA舉辦的前後一週內,產業界密集的標誌性事件正在對學術界形成巨大的倒逼壓力。 同一天,至少四件標誌性事件密集發生:宇樹科技科創板IPO申請獲上交所上市委審議通過,73天“閃電”過會;英偉達CEO黃仁勳在GTC Taipei高調官宣與宇樹合作推出新一代人形機器人參考設計H2+(Isaac GR00T系統);OpenAI CEO奧特曼發佈招賢令,正式宣佈OpenAI Robotics團隊迴歸,由DALL-E靈魂人物Aditya Ramesh掛帥;中國創業公司Booster Robotics選擇ICRA舞臺進行T2人形機器人全球首秀。 這四件事的密集程度,也絕非巧合。宇樹的73天過會速度刷新了中國科技企業IPO的紀錄,背後是資本市場對具身智能賽道的空前熱情。英偉達H2+人形機器人參考設計的發佈,"芯片+模型+機器人"三位一體的產業閉環正在形成。而OpenAI的迴歸則釋放了最強烈的信號——當這家定義了AI時代標準的公司重新殺回機器人賽道,整個行業的估值邏輯或將被改寫。 在ICRA現場,中國企業的存在感同樣不可忽視。除了Booster T2的全球首秀,天機智能以鉑金合作伙伴身份亮相167號展位,攜新一代Gento系列人形機器人平臺提供從遙操作到具身智能的全棧開發工具鏈;高擎動力帶來Mini Pi plus開源人形機器人平臺,用15kg的輕量化機身試圖填補科研端"買得起、用得上"的空白。 蘇昊創立的 Hillbot 同樣選擇在ICRA 2026現場進行其機器人的全球首秀。這次首發也吸引了大量現場參會者的圍觀。 這種全球範圍內的板塊漂移,直接導致ICRA現場的展示不再滿足於讓機器人死板地在平地上走兩步,而是被拉到了更加逼真的動態干擾環境中進行“抗壓測試”。雷峰網在前線觀察到,全身操控(Whole-Body Control, WBC)在今年迎來了工程學上的質變:人形機器人在保持高動態步態行進的同時,上肢雙手還能穩定地執行動態插拔、搬運等複合任務,各家百花齊放,形成諸神黃昏般的競速。 現場 Keynote 前瞻:國內學者精彩開講 在這場全球技術博弈中,中國學者與海外華人軍團正在用極其冷靜且務實的研究,扮演著行業平衡器的角色。在今日(6月2日)的核心議程中,有兩位來自國內的機器人學界中堅力量即將登臺發表重磅Keynote或特邀演講,雷峰網前方團隊傳來獨家報道。1. 王賀升 教授(上海交通大學):視覺伺服與動態操控的數學確定性 作為視覺伺服(Visual Servoing)領域的全球頂尖學者,上海交通大學王賀升教授今天的演講備受矚目。在當前全行業瘋狂迷信端到端大模型、試圖用“黑盒”解決一切物理控制的浪潮下,王賀升教授的研究更像是一針冷靜劑。 根據雷峰網獲取的內容前瞻,王教授將直擊非結構化環境下高精度操控的底層痛點。端到端大模型雖然通過海量參數解決了宏觀的任務規劃(High-level Planning),但在物理世界毫米級的動態微調與強幹擾下,純AI模型往往由於不可預測性和時延,無法保障操作的絕對安全。王賀升教授將展示其團隊在不確定環境下,利用經典控制理論與現代深度反饋深度融合的魯棒操控成果。這一研究恰好從算法確定性的層面上,回答了VLA模型如何真正在物理世界“精準對位”的工程難題。2. 徐天添 研究員(中國科學院深圳先進技術研究院):微觀尺度的自適應與多源操控進化如果說人形機器人是宏觀世界的龐然大物,那麼中國科學院深圳先進技術研究院的徐天添研究員,則在今天的演講中將現場學者的視線帶入了神秘的微觀世界。徐天添研究員的演講將聚焦於磁控微納機器人的自動化操控及其在生物醫療工程中的應用。微納機器人在複雜的生物流體環境下面面臨著極其嚴重的長尾長距離干擾,傳統控制方法極難維持高穩定性。徐天添團隊通過巧妙的數據驅動方法與精密磁場控制的結合,壓榨出了亞微米級的自主操控精度。同時也間接證明,具身智能與大數據的邊界,不僅停留在端到端大模型和人形機器人上,物理智能在微納醫療領域的精細延伸,同樣是一條能實質性改變人類生命質量的“硬核賽道”。 結語:鎖定雷峰網專區,獨家搶先透視 ICRA 2026的大幕已經徹底拉開。無論是VLA模型在維也納會場引發的技術爭論,靈巧手在工業展區展露出的商業化野心,還是王賀升、徐天添兩位華人學者在今日演講中透露出的底層技術突圍,都清晰地表明:行業正在向技術的深水區正面挺進。 端到端大模型究竟是不是具身智能的終局?中國產業鏈優勢如何與前沿學術完成無縫對接?在接下來為期五天的議程中,雷峰網前方團隊將持續駐紮維也納會場一線,為您帶來第一手、不加濾鏡的深度觀察。 為了讓國內研發者、創業者與投資人能夠毫無時差地掌握本屆 ICRA 2026 的完整乾貨、核心 Oral 論文工程化解讀,雷峰網已在前端正式上線【ICRA 2026 全球直擊與深度解析專區】。掃描下方二維碼,或點擊“閱讀原文”關注專區,與全球 8000 名頂尖大腦同步呼吸,搶先透視具身智能的下一個五年!
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。