ICRA 2026｜狹窄空間中機器人主動感知與操作

2026年6月1日 10:06

重點摘要

原文作者：用戶“胖頭魚在此”原文鏈接：https://www.xiaohongshu.com我們的論文被 ICRA 2026 錄取了！論文編號是 Paper TuI1I.294。這篇工作想回答一個很實際的問題：如果機器人要在狹窄、雜亂、看不清的空間裡抓東西，它應該怎麼“邊看邊動”，而不是盲目伸手？在很多真實場景裡，機器人並不是一開始就擁有完整地圖。比如目標物體可能被障礙物擋住，機械臂周圍也可能有箱子、牆壁、櫃子等限制。機器人既看不清目標，又不能隨便亂動，因為一不小心就會撞到環境，或者擺出一個根本抓不到東西的姿態。所以，狹窄空間操作的難點不只是“怎麼抓”，而是：機器人要先安全地探索環境，找到目標，再生成真正可執行的抓取動作。我們提出了 COMPASS，一個面向狹窄空間操作的主動感知與操作規劃框架。它主要包含三步：第一步，機器人先做 Near-Field Awareness Scan，用腕部相機小心地掃描自己附近的空間，先搞清楚“身邊哪裡不能碰”。第二步，機器人使用 Manipulation-Utility Exploration RRT主動選擇下一個觀察視角。它不是隻看哪裡信息最多，還會同時考慮機械臂是否容易運動、姿態是否接近奇異、路徑是否平滑、後續是否有利於抓取。第三步，當目標被發現後，系統會生成滿足障礙物約束和運動學約束的抓取姿態，而不是隻選擇一個幾何上看起來不錯、但機器人實際伸不過去的抓取。我們還構建了一個狹窄空間操作 benchmark，從簡單遮擋、嚴重遮擋，到強運動學約束，再到二者耦合的複雜場景，系統評估機器人在“看不清”和“伸不開手”同時存在時的表現。實驗結果顯示，相比只考慮信息增益或傳統探索策略的方法，COMPASS 在仿真中顯著提升了整體操作成功率；在真實機器人實驗中，也能在未知、遮擋、狹窄的環境裡主動探索、找到目標，並完成約束下的抓取。未

站內 AI 整理稿

原始來源：雷峰網 ↗

查看原始來源

量子位研究與前沿

GPT發AI原創新成果了

這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到：AI實現藥物全自動研發，還遠嗎？從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪研究與前沿

AI越強，越要“殺死”過去的自己

這篇消息聚焦「AI越強，越要“殺死”過去的自己」。原始導語提到：人類需要實現思維模式的轉變。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 小時前閱讀分析

MarkTechPost AI研究與前沿

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

8 小時前閱讀分析

36氪研究與前沿

Transformer之父離開谷歌，奧特曼等了他十年

這篇消息聚焦「Transformer之父離開谷歌，奧特曼等了他十年」。原始導語提到：27億美元也沒能留住，Noam Shazeer追尋下一代架構。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

15 小時前閱讀分析

36氪研究與前沿

Dario訪談首曝：Mythos被稱為“超級武器”

這篇消息聚焦「Dario訪談首曝：Mythos被稱為“超級武器”」。原始導語提到：在這場69分鐘完整訪談裡，Dario Amodei 說人類真正面對的不是某個突然降臨的奇點，而是一條已經開始垂直起飛的指數曲線。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

19 小時前閱讀分析

鈦媒體研究與前沿

用結構替代數據，因果世界模型如何重塑具身智能大腦

這篇消息聚焦「用結構替代數據，因果世界模型如何重塑具身智能大腦」。原始導語提到：因果世界模型需要一個標誌性的時刻來證明自己。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

20 小時前閱讀分析

相關文章

GPT發AI原創新成果了

AI越強，越要“殺死”過去的自己

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

Transformer之父離開谷歌，奧特曼等了他十年

Dario訪談首曝：Mythos被稱為“超級武器”

用結構替代數據，因果世界模型如何重塑具身智能大腦