ICRA 2026 | VPP-TC: 基於可行性理論的被動力矩安全控制框架

2026年6月1日 07:10

重點摘要

原文作者:公眾號“機器之心”原文鏈接:https://mp.weixin.qq.com/s/vPNP8686ZQ09KDzSMn-iaw本篇文章被 ICRA 2026 接收並獲得 IROS 2025 雙料 Workshop 最佳論文,第一作者張子哲(site: zizhe.io)是賓夕法尼亞大學機器人學碩士生,同時在 GRASP 實驗室擔任科研助理,導師為 Nadia Figueroa 教授,研究興趣涵蓋機器學習,安全控制以及人機交互。論文標題:Viability-Preserving Passive Torque Control論文鏈接:https://arxiv.org/abs/2510.03367項目主頁:https://vpp-tc.github.io/webpage/一、一句話總結本文提出了 VPP-TC(Viability-Preserving Passive Torque Control),一種基於可行性(viability)理論的被動力矩控制框架。該框架在關節位置 - 速度的增廣狀態空間中預計算安全集合,將可行性約束轉化為關節加速度(進而力矩)的仿射約束,通過二次規劃(QP)實時求解,確保機器人在無限時間範圍內始終處於安全集合內。相比基於控制屏障函數(CBF)的基線方法,VPP-TC 無需計算邊界函數的二階導數,控制迴路頻率更高、軌跡更平滑、路徑更短。圖 1:VPP-TC 控制框架示意圖。關節限位的力矩約束通過解析方法推導,自碰撞和外部碰撞約束通過數據驅動方法學習。二、研究背景與動機在物理人機交互(pHRI)場景中,機器人需要在與人類近距離協作時保持被動性(passivity)—— 即吸收的能量不少於釋放的能量,從而保證在外部擾動下的魯棒性和穩定性。經典的阻抗 / 導納控制框架、Port-Hamiltonian 方法以及基於動力系統(DS)的被動力矩控制器已

站內 AI 整理稿

原文作者:公眾號“機器之心”原文鏈接:https://mp.weixin.qq.com/s/vPNP8686ZQ09KDzSMn-iaw本篇文章被 ICRA 2026 接收並獲得 IROS 2025 雙料 Workshop 最佳論文,第一作者張子哲(site: zizhe.io)是賓夕法尼亞大學機器人學碩士生,同時在 GRASP 實驗室擔任科研助理,導師為 Nadia Figueroa 教授,研究興趣涵蓋機器學習,安全控制以及人機交互。論文標題:Viability-Preserving Passive Torque Control論文鏈接:https://arxiv.org/abs/2510.03367項目主頁:https://vpp-tc.github.io/webpage/一、一句話總結本文提出了 VPP-TC(Viability-Preserving Passive Torque Control),一種基於可行性(viability)理論的被動力矩控制框架。該框架在關節位置 - 速度的增廣狀態空間中預計算安全集合,將可行性約束轉化為關節加速度(進而力矩)的仿射約束,通過二次規劃(QP)實時求解,確保機器人在無限時間範圍內始終處於安全集合內。相比基於控制屏障函數(CBF)的基線方法,VPP-TC 無需計算邊界函數的二階導數,控制迴路頻率更高、軌跡更平滑、路徑更短。圖 1:VPP-TC 控制框架示意圖。關節限位的力矩約束通過解析方法推導,自碰撞和外部碰撞約束通過數據驅動方法學習。二、研究背景與動機在物理人機交互(pHRI)場景中,機器人需要在與人類近距離協作時保持被動性(passivity)—— 即吸收的能量不少於釋放的能量,從而保證在外部擾動下的魯棒性和穩定性。經典的阻抗 / 導納控制框架、Port-Hamiltonian 方法以及基於動力系統(DS)的被動力矩控制器已被廣泛研究。然而,這類被動控制器通常缺乏顯式的約束處理能力,無法保證在整個任務執行過程中的碰撞避免和關節限位滿足。先前工作 CPIC 利用控制屏障函數(CBF)框架和指數控制屏障函數(ECBF)來約束被動力矩控制器,但存在以下問題:硬約束之間可能互相沖突,導致 QP 不可行;QP 框架易陷入死鎖和關節空間的局部最小值;ECBF 需要計算邊界函數的 Hessian 矩陣(二階導數),當邊界由神經網絡表示時,實時性難以保證。正是這些侷限性,促使作者提出了基於可行性理論(viability theory)的全新安全控制框架。三、方法詳解3.1 核心思想:從 CBF 到 ViabilityVPP-TC 的核心創新在於:在關節位置 q 和關節速度 q̇的增廣狀態空間中引入安全邊界,而非僅在關節位置空間中。在這個增廣空間中操作的好處是,安全約束可以直接推導為關節加速度 q̈的仿射約束,再通過機器人動力學方程轉化為力矩約束 —— 整個過程無需計算邊界函數的二階導數。可行性的定義(Definition 1)是:從可行集 V 中的任意初始狀態出發,存在一個控制序列(加速度序列),使得產生的無限長狀態序列始終在可行集內。這比單純的「可行」(feasible)更強 —— 一個可行狀態可能在未來的控制下離開可行集,但一個 viable 狀態保證能永遠留在安全集內。圖 2:可行性(viability)概念。狀態 s1 既可行又 viable,而 s2 可行但不 viable—— 雖然當前滿足約束,但不存在一個控制序列能保證它永遠留在安全集內。3.2 自碰撞避免約束(SCA)作者保守地定義了自碰撞可行性(Definition 2):如果從當前狀態出發,以最大減速反向制動至完全停止的整條制動軌跡上都不發生自碰撞,則認為該狀態是自碰撞安全的。為學習這個可行集,作者使用了一個基於 Transformer 的神經網絡分類器 Γ(q, q̇)。訓練數據通過仿真生成:採樣 300 萬組 (q, q̇) 狀態對,模擬製動過程並標註 —— 若制動軌跡無自碰撞則標為 viable,否則標為 non-viable。網絡採用標準 Transformer-Encoder 架構(前饋維度 128、2 個注意力頭、4 層堆疊),訓練 30 個 epoch,測試集準確率達 99.27%,召回率達 99.74%。圖 3:自碰撞可行性數據生成。從狀態 (q₀, q̇₀) 出發執行制動直至靜止 (qₑ, 0):若整條軌跡無自碰撞,標記為 Safe;否則標記為 Self-Collide。約束的實施通過 Taylor 展開將 ΔΓ(q, q̇) ≥ 0 線性化為關於 q̈的仿射約束,再通過動力學方程轉化為力矩約束。關鍵公式為:g_se・M⁻¹τ ≥ g_se・M⁻¹(Cq̇ + G) − b_s其中 g_se 和 b_s 由邊界函數 Γ 對 q 和 q̇ 的一階梯度與時間步長計算得到。3.3 外部障礙物碰撞避免約束(ECA)對於外部碰撞,作者採用 Bernstein 多項式表示的符號距離函數(SDF) 編碼每個機器人連桿的幾何。定義可行性保持 SDF 為制動軌跡上的最小瞬時 SDF:S_v (p, q₀, q̇₀) = min_{t∈[0,T_br]} S (p, q (t))類似地,通過 Taylor 展開得到關於 q̈的仿射約束,並轉化為力矩約束。值得注意的是,該約束通過 Δp 項隱式地納入了障礙物速度信息,因此 VPP-TC 天然具備處理動態障礙物的能力。3.4 關節位置與速度限位約束受 Del Prete (2018) 啟發,作者通過解析推導獲得關節加速度的上下界 q̈_lb 和 q̈_ub,取位置可行性約束、速度約束和硬件加速度限制的交集,再通過動力學方程轉化為力矩約束。3.5 統一的 QP 控制框架最終的控制框架將所有約束統一到一個二次規劃(QP)問題中:目標函數最小化實際力矩與名義被動控制器力矩的偏差,約束條件包括關節限位(始終激活)、自碰撞約束(靠近邊界時激活)、外部碰撞約束(靠近邊界時激活)和力矩硬件限制。外部碰撞約束通過鬆弛變量軟化以保證 QP 可行性。圖 4:平面 3-DoF 示例。左:工作空間軌跡。右:在硬件限制 [−10, 10] rad/s² 下的可行加速度域。當外部碰撞約束激活時,允許的加速度域收縮。四、實驗結果4.1 仿真實驗在 7 自由度 Franka Panda 機械臂上(PyBullet 仿真),作者設計了三組對比實驗:僅自碰撞避免(SCA)、僅外部碰撞避免(ECA)、以及全約束(ALL)。與基線 CPIC 的定量對比如下表:表 1:CPIC 與 VPP-TC 在不同約束設置下的性能對比(5 次實驗平均值)VPP-TC 在所有設置下都顯著優於 CPIC:控制頻率提升 1.4–2.4 倍,軌跡長度更短,軌跡抖動降低了一個數量級以上(特別是在 ECA 和 ALL 場景下)。4.2 真機實驗作者在 7-DoF Franka Panda 真機上驗證了三個場景:自碰撞避免(SCA):未啟用 SCA 時,機械臂因自碰撞預警觸發 Reflex Mode 停止運動;啟用 SCA 後安全到達目標。更換 UMI 夾爪後重訓網絡,控制器仍有效。外部碰撞避免(ECA):面對靜態和動態障礙物,機械臂在被外力推向障礙物時能抵抗運動並保持安全間距;動態障礙物接近時主動退避。在約 200Hz 的控制頻率下實現真正的全身碰撞避免。綜合場景:遙操作按檯燈開關任務 —— 僅提供粗略目標位置,無預計算的避障軌跡。VPP-TC 同時處理外部碰撞(檯燈燈體)和自碰撞約束,安全完成任務。圖 5:真機實驗。上排:自碰撞避免(a-c)。下排:外部碰撞避免(d-f)。軌跡疊加顯示約束激活後機械臂保持正向間距。圖 6:遙操作任務 —— 僅提供粗略目標位置,VPP-TC 確保近燈安全並防止自碰撞,成功完成按燈開關任務。五、技術亮點與討論1. 無需二階導數。通過在 (q, q̇) 增廣狀態空間中操作,安全約束被表達為關於加速度的仿射函數,僅需要邊界函數的一階梯度。這大幅降低了計算負擔,是實現高控制頻率的關鍵。2. 統一框架處理多類約束。關節限位、自碰撞、外部碰撞三類約束在同一 QP 中統一處理,約束按需激活,框架簡潔優雅。3. 天然支持動態障礙物。外部碰撞約束的 Taylor 展開中包含障礙物位移 Δp 項,隱式編碼了障礙物速度,無需額外處理即可應對動態環境。4. 全身碰撞避免。得益於 Bernstein 多項式 SDF 的高效計算,VPP-TC 能考慮所有機器人連桿的幾何,而非像 CPIC 那樣僅考慮末端幾個連桿。5. 被動性保證。論文在附錄中證明了即使在約束激活時,控制器輸出的力矩仍保持任務空間被動性 —— 約束反作用力要麼被阻尼耗散,要麼被約束反力吸收,不向環境注入淨能量。未來方向:當前框架假設精確的動力學模型。作者計劃在未來工作中考慮有界的模型不確定性,設計在建模誤差下仍能保證可行性的魯棒控制器。六、總結VPP-TC 為被動力矩控制的安全性問題提供了一套優雅而高效的解決方案。它將可行性理論與數據驅動學習相結合,在增廣狀態空間中構建安全集合,並通過 QP 實時求解力矩約束。這一框架在 IROS 2025 兩個 Workshop 上分別獲得 Best Contribution Award 和 Best Student Paper Award,並被 ICRA 2026 錄用,充分體現了其學術價值和應用潛力。對於關注人機交互安全、力矩控制以及機器人安全保障的研究者而言,這是一篇值得深入研讀的工作。雷峰網

Related

相關文章

GPT發AI原創新成果了

這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到:AI實現藥物全自動研發,還遠嗎? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

AI越強,越要“殺死”過去的自己

這篇消息聚焦「AI越強,越要“殺死”過去的自己」。原始導語提到:人類需要實現思維模式的轉變。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

2 小時前
MarkTechPost AI研究與前沿

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

8 小時前

Transformer之父離開谷歌,奧特曼等了他十年

這篇消息聚焦「Transformer之父離開谷歌,奧特曼等了他十年」。原始導語提到:27億美元也沒能留住,Noam Shazeer追尋下一代架構。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前

Dario訪談首曝:Mythos被稱為“超級武器”

這篇消息聚焦「Dario訪談首曝:Mythos被稱為“超級武器”」。原始導語提到:在這場69分鐘完整訪談裡,Dario Amodei 說人類真正面對的不是某個突然降臨的奇點,而是一條已經開始垂直起飛的指數曲線。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

20 小時前

用結構替代數據,因果世界模型如何重塑具身智能大腦

這篇消息聚焦「用結構替代數據,因果世界模型如何重塑具身智能大腦」。原始導語提到:因果世界模型需要一個標誌性的時刻來證明自己。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

20 小時前