大曉機器人開源 ACE-Ego 具身操作 VLA 模型,能穩定完成塑料袋打包、鞋子裝入鞋盒等操作

2026年6月17日 11:38
大曉機器人開源 ACE-Ego 具身操作 VLA 模型,能穩定完成塑料袋打包、鞋子裝入鞋盒等操作

重點摘要

大曉機器人與香港中文大學合作開源 ACE-Ego 具身操作 VLA 模型,採用「一腦多型」設計,可跨平台穩定執行塑料袋打包、鞋子裝入鞋盒等精細任務。此舉有助於降低具身智慧研究門檻,推動操作模型的跨平台遷移與應用。

站內 AI 整理稿

### 大曉機器人攜手港中文開源 ACE-Ego 模型:具身操作邁向「一腦多型」新階段

台灣產學界與開發者圈近期迎來一項值得關注的開源進展:大曉機器人宣布與香港中文大學多媒體實驗室合作,正式推出名為 ACE-Ego 的具身操作 VLA 模型。這款模型主打「一腦多型」概念,能夠在不同機器人平台上穩定執行如塑料袋打包、鞋子裝入鞋盒等精細操作任務,並已向全球開源釋出。

### 重點整理:ACE-Ego 的技術亮點與開源意義

ACE-Ego 全名為「ACE-Ego 具身操作 VLA 模型」,其中 VLA 指的是視覺-語言-行動(Vision-Language-Action)架構。該模型的核心特色在於「一腦多型」——意即同一套學習過的認知模型,可以適配多種不同型態的機器人本體,不需要每種硬體都從頭訓練。從官方展示的案例來看,ACE-Ego 能勝任塑料袋打包這類需要感知物體形變與力度的任務,也能完成將鞋子精準放入鞋盒這類對空間定位要求較高的操作,顯示出其在多樣化場景下的泛化能力。

### 背景脈絡:為何「一腦多型」是具身智慧的關鍵挑戰

過去,機器人操作模型往往高度依賴特定硬體,換一台機器人、甚至更換一隻夾爪,就需要重新收集數據與調整參數。這種「一機一腦」的限制嚴重阻礙了研究成果的落地與複製。ACE-Ego 提出的「一腦多型」路線,正是試圖解決這個痛點:讓模型學會的經驗能夠跨平台遷移。加上開源策略,學術界與業界研究者可以直接下載模型進行二次開發或測試,有助於加速整個領域的迭代速度。

### 可能影響:從實驗室到工廠與家庭場景的想像空間

ACE-Ego 開源後,最直接的影響在於降低具身操作研究的進入門檻。過去只有少數頂尖團隊有能力從頭訓練 VLA 模型,現在更多中小型團隊或個人開發者能基於 ACE-Ego 進行微調,針對特定任務(例如倉儲揀貨、家務輔助)做應用。長期來看,若「一腦多型」技術成熟,機器人製造商或許能推出通用型控制軟體,讓同一台機器人藉由軟體更新即可切換不同操作技能,這對台灣製造業的自動化升級、以及服務型機器人市場都將帶來深遠影響。

### 讀者可關注的後續:開源資源與落地案例

對於有興趣的讀者,可以關注以下幾個方向:首先,大曉機器人與港中文是否會在 GitHub 或官方網站上釋出模型權重、數據集與使用文件,方便開發者快速上手。其次,ACE-Ego 的實際部署表現——例如在不同機械臂品牌、不同夾爪配置下的成功率,以及是否能處理更多元且非結構化的環境(例如廚房、辦公室)。此外,開源社群的反饋與改進也值得追蹤,尤其是有無台灣團隊開始基於此模型進行本土場景的測試與應用。最後,後續是否有更詳細的技術論文發表,解釋模型架構與訓練策略,將有助於深入理解其設計邏輯。

### 總結:開源協作推動操作智慧的民主化

ACE-Ego 的開源,不僅是單一模型的釋出,更代表著具身操作領域正從封閉走向開放。大曉機器人與香港中文大學多媒體實驗室的合作,為台灣讀者提供了一個觀察全球具身智慧發展趨勢的窗口。隨著更多開源 VLA 模型的問世,未來我們或許能更快看到機器人學會「打包便當」、「整理鞋櫃」這類日常瑣事,逐步走入生活與工作現場。

Related

相關文章

全球首個人形機器人通用小腦來了!全球最大規模2萬小時人類動作數據,實現零樣本泛化

這篇消息聚焦「全球首個人形機器人通用小腦來了!全球最大規模2萬小時人類動作數據,實現零樣本泛化」。原始導語提到:人形機器人正式邁入“GPT時代” 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

13 分鐘前

擎倉機器人30天極速部署歐萊雅產線,輕量化VLA範式突破

擎倉機器人成功部署歐萊雅全球戰略生產基地,不僅證明國產輕量化VLA具身智能產品完全能夠勝任國際高端製造的嚴苛標準,更標誌著中國企業率先實現輕量化VLA技術的規模化商業突破,成為中國具身智能產業從技術研發邁向規模化、全球化商用的重要里程碑。

16 小時前