ICRA 2026|狹窄空間中機器人主動感知與操作
重點摘要
原文作者:用戶“胖頭魚在此”原文鏈接:https://www.xiaohongshu.com我們的論文被 ICRA 2026 錄取了!論文編號是 Paper TuI1I.294。 這篇工作想回答一個很實際的問題:如果機器人要在狹窄、雜亂、看不清的空間裡抓東西,它應該怎麼“邊看邊動”,而不是盲目伸手? 在很多真實場景裡,機器人並不是一開始就擁有完整地圖。比如目標物體可能被障礙物擋住,機械臂周圍也可能有箱子、牆壁、櫃子等限制。機器人既看不清目標,又不能隨便亂動,因為一不小心就會撞到環境,或者擺出一個根本抓不到東西的姿態。 所以,狹窄空間操作的難點不只是“怎麼抓”,而是:機器人要先安全地探索環境,找到目標,再生成真正可執行的抓取動作。 我們提出了 COMPASS,一個面向狹窄空間操作的主動感知與操作規劃框架。它主要包含三步: 第一步,機器人先做 Near-Field Awareness Scan,用腕部相機小心地掃描自己附近的空間,先搞清楚“身邊哪裡不能碰”。 第二步,機器人使用 Manipulation-Utility Exploration RRT主動選擇下一個觀察視角。它不是隻看哪裡信息最多,還會同時考慮機械臂是否容易運動、姿態是否接近奇異、路徑是否平滑、後續是否有利於抓取。 第三步,當目標被發現後,系統會生成滿足障礙物約束和運動學約束的抓取姿態,而不是隻選擇一個幾何上看起來不錯、但機器人實際伸不過去的抓取。 我們還構建了一個狹窄空間操作 benchmark,從簡單遮擋、嚴重遮擋,到強運動學約束,再到二者耦合的複雜場景,系統評估機器人在“看不清”和“伸不開手”同時存在時的表現。 實驗結果顯示,相比只考慮信息增益或傳統探索策略的方法,COMPASS 在仿真中顯著提升了整體操作成功率;在真實機器人實驗中,也能在未知、遮擋、狹窄的環境裡主動探索、找到目標,並完成約束下的抓取。 未
原文作者:用戶“胖頭魚在此”原文鏈接:https://www.xiaohongshu.com我們的論文被 ICRA 2026 錄取了!論文編號是 Paper TuI1I.294。 這篇工作想回答一個很實際的問題:如果機器人要在狹窄、雜亂、看不清的空間裡抓東西,它應該怎麼“邊看邊動”,而不是盲目伸手? 在很多真實場景裡,機器人並不是一開始就擁有完整地圖。比如目標物體可能被障礙物擋住,機械臂周圍也可能有箱子、牆壁、櫃子等限制。機器人既看不清目標,又不能隨便亂動,因為一不小心就會撞到環境,或者擺出一個根本抓不到東西的姿態。 所以,狹窄空間操作的難點不只是“怎麼抓”,而是:機器人要先安全地探索環境,找到目標,再生成真正可執行的抓取動作。 我們提出了 COMPASS,一個面向狹窄空間操作的主動感知與操作規劃框架。它主要包含三步: 第一步,機器人先做 Near-Field Awareness Scan,用腕部相機小心地掃描自己附近的空間,先搞清楚“身邊哪裡不能碰”。 第二步,機器人使用 Manipulation-Utility Exploration RRT主動選擇下一個觀察視角。它不是隻看哪裡信息最多,還會同時考慮機械臂是否容易運動、姿態是否接近奇異、路徑是否平滑、後續是否有利於抓取。 第三步,當目標被發現後,系統會生成滿足障礙物約束和運動學約束的抓取姿態,而不是隻選擇一個幾何上看起來不錯、但機器人實際伸不過去的抓取。 我們還構建了一個狹窄空間操作 benchmark,從簡單遮擋、嚴重遮擋,到強運動學約束,再到二者耦合的複雜場景,系統評估機器人在“看不清”和“伸不開手”同時存在時的表現。 實驗結果顯示,相比只考慮信息增益或傳統探索策略的方法,COMPASS 在仿真中顯著提升了整體操作成功率;在真實機器人實驗中,也能在未知、遮擋、狹窄的環境裡主動探索、找到目標,並完成約束下的抓取。 未來我們也會繼續探索主動感知、狹窄空間操作、機器人規劃、具身智能系統設計等方向。雷峰網
Related
相關文章

GPT發AI原創新成果了
這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到:AI實現藥物全自動研發,還遠嗎? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

AI越強,越要“殺死”過去的自己
這篇消息聚焦「AI越強,越要“殺死”過去的自己」。原始導語提到:人類需要實現思維模式的轉變。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks
In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

Transformer之父離開谷歌,奧特曼等了他十年
這篇消息聚焦「Transformer之父離開谷歌,奧特曼等了他十年」。原始導語提到:27億美元也沒能留住,Noam Shazeer追尋下一代架構。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Dario訪談首曝:Mythos被稱為“超級武器”
這篇消息聚焦「Dario訪談首曝:Mythos被稱為“超級武器”」。原始導語提到:在這場69分鐘完整訪談裡,Dario Amodei 說人類真正面對的不是某個突然降臨的奇點,而是一條已經開始垂直起飛的指數曲線。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

用結構替代數據,因果世界模型如何重塑具身智能大腦
這篇消息聚焦「用結構替代數據,因果世界模型如何重塑具身智能大腦」。原始導語提到:因果世界模型需要一個標誌性的時刻來證明自己。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。