ICRA 2026 | VPP-TC: 基於可行性理論的被動力矩安全控制框架

2026年6月1日 07:10

重點摘要

站內 AI 整理稿

原文作者：公眾號“機器之心”原文鏈接：https://mp.weixin.qq.com/s/vPNP8686ZQ09KDzSMn-iaw本篇文章被 ICRA 2026 接收並獲得 IROS 2025 雙料 Workshop 最佳論文，第一作者張子哲(site: zizhe.io)是賓夕法尼亞大學機器人學碩士生，同時在 GRASP 實驗室擔任科研助理，導師為 Nadia Figueroa 教授，研究興趣涵蓋機器學習，安全控制以及人機交互。論文標題：Viability-Preserving Passive Torque Control論文鏈接：https://arxiv.org/abs/2510.03367項目主頁：https://vpp-tc.github.io/webpage/一、一句話總結本文提出了 VPP-TC（Viability-Preserving Passive Torque Control），一種基於可行性（viability）理論的被動力矩控制框架。該框架在關節位置 - 速度的增廣狀態空間中預計算安全集合，將可行性約束轉化為關節加速度（進而力矩）的仿射約束，通過二次規劃（QP）實時求解，確保機器人在無限時間範圍內始終處於安全集合內。相比基於控制屏障函數（CBF）的基線方法，VPP-TC 無需計算邊界函數的二階導數，控制迴路頻率更高、軌跡更平滑、路徑更短。圖 1：VPP-TC 控制框架示意圖。關節限位的力矩約束通過解析方法推導，自碰撞和外部碰撞約束通過數據驅動方法學習。二、研究背景與動機在物理人機交互（pHRI）場景中，機器人需要在與人類近距離協作時保持被動性（passivity）—— 即吸收的能量不少於釋放的能量，從而保證在外部擾動下的魯棒性和穩定性。經典的阻抗 / 導納控制框架、Port-Hamiltonian 方法以及基於動力系統（DS）的被動力矩控制器已被廣泛研究。然而，這類被動控制器通常缺乏顯式的約束處理能力，無法保證在整個任務執行過程中的碰撞避免和關節限位滿足。先前工作 CPIC 利用控制屏障函數（CBF）框架和指數控制屏障函數（ECBF）來約束被動力矩控制器，但存在以下問題：硬約束之間可能互相沖突，導致 QP 不可行；QP 框架易陷入死鎖和關節空間的局部最小值；ECBF 需要計算邊界函數的 Hessian 矩陣（二階導數），當邊界由神經網絡表示時，實時性難以保證。正是這些侷限性，促使作者提出了基於可行性理論（viability theory）的全新安全控制框架。三、方法詳解3.1 核心思想：從 CBF 到 ViabilityVPP-TC 的核心創新在於：在關節位置 q 和關節速度 q̇的增廣狀態空間中引入安全邊界，而非僅在關節位置空間中。在這個增廣空間中操作的好處是，安全約束可以直接推導為關節加速度 q̈的仿射約束，再通過機器人動力學方程轉化為力矩約束 —— 整個過程無需計算邊界函數的二階導數。可行性的定義（Definition 1）是：從可行集 V 中的任意初始狀態出發，存在一個控制序列（加速度序列），使得產生的無限長狀態序列始終在可行集內。這比單純的「可行」（feasible）更強 —— 一個可行狀態可能在未來的控制下離開可行集，但一個 viable 狀態保證能永遠留在安全集內。圖 2：可行性（viability）概念。狀態 s1 既可行又 viable，而 s2 可行但不 viable—— 雖然當前滿足約束，但不存在一個控制序列能保證它永遠留在安全集內。3.2 自碰撞避免約束（SCA）作者保守地定義了自碰撞可行性（Definition 2）：如果從當前狀態出發，以最大減速反向制動至完全停止的整條制動軌跡上都不發生自碰撞，則認為該狀態是自碰撞安全的。為學習這個可行集，作者使用了一個基於 Transformer 的神經網絡分類器 Γ(q, q̇)。訓練數據通過仿真生成：採樣 300 萬組 (q, q̇) 狀態對，模擬製動過程並標註 —— 若制動軌跡無自碰撞則標為 viable，否則標為 non-viable。網絡採用標準 Transformer-Encoder 架構（前饋維度 128、2 個注意力頭、4 層堆疊），訓練 30 個 epoch，測試集準確率達 99.27%，召回率達 99.74%。圖 3：自碰撞可行性數據生成。從狀態 (q₀, q̇₀) 出發執行制動直至靜止 (qₑ, 0)：若整條軌跡無自碰撞，標記為 Safe；否則標記為 Self-Collide。約束的實施通過 Taylor 展開將 ΔΓ(q, q̇) ≥ 0 線性化為關於 q̈的仿射約束，再通過動力學方程轉化為力矩約束。關鍵公式為：g_se・M⁻¹τ ≥ g_se・M⁻¹(Cq̇ + G) − b_s其中 g_se 和 b_s 由邊界函數 Γ 對 q 和 q̇ 的一階梯度與時間步長計算得到。3.3 外部障礙物碰撞避免約束（ECA）對於外部碰撞，作者採用 Bernstein 多項式表示的符號距離函數（SDF）編碼每個機器人連桿的幾何。定義可行性保持 SDF 為制動軌跡上的最小瞬時 SDF：S_v (p, q₀, q̇₀) = min_{t∈[0,T_br]} S (p, q (t))類似地，通過 Taylor 展開得到關於 q̈的仿射約束，並轉化為力矩約束。值得注意的是，該約束通過 Δp 項隱式地納入了障礙物速度信息，因此 VPP-TC 天然具備處理動態障礙物的能力。3.4 關節位置與速度限位約束受 Del Prete (2018) 啟發，作者通過解析推導獲得關節加速度的上下界 q̈_lb 和 q̈_ub，取位置可行性約束、速度約束和硬件加速度限制的交集，再通過動力學方程轉化為力矩約束。3.5 統一的 QP 控制框架最終的控制框架將所有約束統一到一個二次規劃（QP）問題中：目標函數最小化實際力矩與名義被動控制器力矩的偏差，約束條件包括關節限位（始終激活）、自碰撞約束（靠近邊界時激活）、外部碰撞約束（靠近邊界時激活）和力矩硬件限制。外部碰撞約束通過鬆弛變量軟化以保證 QP 可行性。圖 4：平面 3-DoF 示例。左：工作空間軌跡。右：在硬件限制 [−10, 10] rad/s² 下的可行加速度域。當外部碰撞約束激活時，允許的加速度域收縮。四、實驗結果4.1 仿真實驗在 7 自由度 Franka Panda 機械臂上（PyBullet 仿真），作者設計了三組對比實驗：僅自碰撞避免（SCA）、僅外部碰撞避免（ECA）、以及全約束（ALL）。與基線 CPIC 的定量對比如下表：表 1：CPIC 與 VPP-TC 在不同約束設置下的性能對比（5 次實驗平均值）VPP-TC 在所有設置下都顯著優於 CPIC：控制頻率提升 1.4–2.4 倍，軌跡長度更短，軌跡抖動降低了一個數量級以上（特別是在 ECA 和 ALL 場景下）。4.2 真機實驗作者在 7-DoF Franka Panda 真機上驗證了三個場景：自碰撞避免（SCA）：未啟用 SCA 時，機械臂因自碰撞預警觸發 Reflex Mode 停止運動；啟用 SCA 後安全到達目標。更換 UMI 夾爪後重訓網絡，控制器仍有效。外部碰撞避免（ECA）：面對靜態和動態障礙物，機械臂在被外力推向障礙物時能抵抗運動並保持安全間距；動態障礙物接近時主動退避。在約 200Hz 的控制頻率下實現真正的全身碰撞避免。綜合場景：遙操作按檯燈開關任務 —— 僅提供粗略目標位置，無預計算的避障軌跡。VPP-TC 同時處理外部碰撞（檯燈燈體）和自碰撞約束，安全完成任務。圖 5：真機實驗。上排：自碰撞避免（a-c）。下排：外部碰撞避免（d-f）。軌跡疊加顯示約束激活後機械臂保持正向間距。圖 6：遙操作任務 —— 僅提供粗略目標位置，VPP-TC 確保近燈安全並防止自碰撞，成功完成按燈開關任務。五、技術亮點與討論1. 無需二階導數。通過在 (q, q̇) 增廣狀態空間中操作，安全約束被表達為關於加速度的仿射函數，僅需要邊界函數的一階梯度。這大幅降低了計算負擔，是實現高控制頻率的關鍵。2. 統一框架處理多類約束。關節限位、自碰撞、外部碰撞三類約束在同一 QP 中統一處理，約束按需激活，框架簡潔優雅。3. 天然支持動態障礙物。外部碰撞約束的 Taylor 展開中包含障礙物位移 Δp 項，隱式編碼了障礙物速度，無需額外處理即可應對動態環境。4. 全身碰撞避免。得益於 Bernstein 多項式 SDF 的高效計算，VPP-TC 能考慮所有機器人連桿的幾何，而非像 CPIC 那樣僅考慮末端幾個連桿。5. 被動性保證。論文在附錄中證明了即使在約束激活時，控制器輸出的力矩仍保持任務空間被動性 —— 約束反作用力要麼被阻尼耗散，要麼被約束反力吸收，不向環境注入淨能量。未來方向：當前框架假設精確的動力學模型。作者計劃在未來工作中考慮有界的模型不確定性，設計在建模誤差下仍能保證可行性的魯棒控制器。六、總結VPP-TC 為被動力矩控制的安全性問題提供了一套優雅而高效的解決方案。它將可行性理論與數據驅動學習相結合，在增廣狀態空間中構建安全集合，並通過 QP 實時求解力矩約束。這一框架在 IROS 2025 兩個 Workshop 上分別獲得 Best Contribution Award 和 Best Student Paper Award，並被 ICRA 2026 錄用，充分體現了其學術價值和應用潛力。對於關注人機交互安全、力矩控制以及機器人安全保障的研究者而言，這是一篇值得深入研讀的工作。雷峰網

原始來源：雷峰網 ↗

查看原始來源

量子位研究與前沿

GPT發AI原創新成果了

這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到：AI實現藥物全自動研發，還遠嗎？從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪研究與前沿

AI越強，越要“殺死”過去的自己

這篇消息聚焦「AI越強，越要“殺死”過去的自己」。原始導語提到：人類需要實現思維模式的轉變。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

2 小時前閱讀分析

MarkTechPost AI研究與前沿

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

8 小時前閱讀分析

36氪研究與前沿

Transformer之父離開谷歌，奧特曼等了他十年

這篇消息聚焦「Transformer之父離開谷歌，奧特曼等了他十年」。原始導語提到：27億美元也沒能留住，Noam Shazeer追尋下一代架構。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前閱讀分析

36氪研究與前沿

Dario訪談首曝：Mythos被稱為“超級武器”

這篇消息聚焦「Dario訪談首曝：Mythos被稱為“超級武器”」。原始導語提到：在這場69分鐘完整訪談裡，Dario Amodei 說人類真正面對的不是某個突然降臨的奇點，而是一條已經開始垂直起飛的指數曲線。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

20 小時前閱讀分析

鈦媒體研究與前沿

用結構替代數據，因果世界模型如何重塑具身智能大腦

這篇消息聚焦「用結構替代數據，因果世界模型如何重塑具身智能大腦」。原始導語提到：因果世界模型需要一個標誌性的時刻來證明自己。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

20 小時前閱讀分析

相關文章

GPT發AI原創新成果了

AI越強，越要“殺死”過去的自己

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

Transformer之父離開谷歌，奧特曼等了他十年

Dario訪談首曝：Mythos被稱為“超級武器”

用結構替代數據，因果世界模型如何重塑具身智能大腦