剛剛,LeCun團隊讓世界模型學會持續學習!

重點摘要
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 剛剛,LeCun團隊讓世界模型學會持續學習!
Yann LeCun 團隊與其共同創辦的人工智慧新創公司 AMI,近日發表了一項名為 AdaJEPA 的最新研究成果,讓世界模型首度實現真正的持續學習能力。這項突破來自 JEPA(聯合嵌入預測架構)系列的最新進展,由紐約大學與 AMI 聯手開發,將世界模型的應用推向全新階段。 傳統的世界模型在完成大規模預訓練之後,參數就會被凍結,後續推論與規劃過程中不再更新。這意味著模型對環境的理解停留在訓練資料所涵蓋的範圍內,一旦部署後遇到未曾見過的情境或動態變化的環境,模型的預測能力就會逐漸退化,無法主動適應新的現實狀況。AdaJEPA 的出現徹底改變了這個限制。 AdaJEPA 的核心概念是「測試時自適應」(Test-Time Adaptation, TTA),也就是在模型與真實環境互動的過程中,即時調整世界模型內部編碼器與預測器的權重。換句話說,AdaJEPA 不再是一套一勞永逸的靜態模型,而是一套能夠在每一次動作與觀察循環中持續自我校正的動態系統。 具體的運作方式形成一個緊密的閉環流程:先由模型進行規劃,接著執行模型預測控制(MPC)所規劃出的第一段動作,然後觀測環境回饋的真實下一幀狀態,再以該狀態做為自監督訊號來更新世界模型,最後重新啟動下一輪規劃。在每一次迭代中,模型使用的都是剛剛被當前環境「校準」過的最新版本,而不是最初部署時的那個凍結模型。 這個設計思路與經典強化學習中的 Dyna 演算法有異曲同工之妙。在 Dyna 架構中,模型並非訓練完就束之高閣,而是在與真實環境互動的過程中反覆修正自己對世界的理解,從而讓規劃與控制更貼近實際。AdaJEPA 同樣遵循這種「學習—行動—觀察—再學習」的反覆循環,只是將自適應機制更直接地嵌入世界模型的參數更新流程。 研究團隊指出,這種持續學習能力對於機器人、自動駕駛、虛擬環境模擬等需要長時間與環境互動的應用場景至關重要。例如,一台配備 AdaJEPA 的機器人在進入新工廠或面對不同地面材質時,不必重新訓練整個模型,而是能夠在幾步移動之後就自動調整對摩擦力、地形起伏的預測,進而修正行走策略。同樣地,自動駕駛車輛在行經從未見過的天候或道路施工區域時,也能即時更新對周圍車輛動態的模型,提升安全性。 從技術細節來看,AdaJEPA 將每一幀真實觀察到的狀態視為自監督學習的標籤,讓編碼器與預測器同時根據當前的預測誤差進行微調。這種做法避免了額外人工標註的需求,也大幅降低了持續學習所需的運算成本。由於更新僅發生在每次動作執行與觀測之間,整個流程可以在不中斷任務執行的前提下完成,非常適合即時性要求高的應用。 值得注意的是,AdaJEPA 並非從零開始訓練世界模型,而是以預先訓練好的 JEPA 模型為基礎,再透過測試時自適應機制在部署環境中持續演化。這意味著模型仍然受惠於大規模離線資料所提供的通用知識,同時又能針對特定環境進行個人化調整,兼顧了泛化能力與適應性。 LeCun 長期主張世界模型是實現通用人工智慧的關鍵拼圖,而 JEPA 系列正是他提出的核心架構之一。傳統 JEPA 在靜態資料集上表現優異,但缺乏動態環境下的自我更新能力。AdaJEPA 的出現補上了這塊缺口,讓世界模型不再只是離線訓練後就封印的靜態知識庫,而是能夠像生物有機體一樣,在與環境互動中不斷修正自己的內部表徵。 業界觀察認為,這項成果不僅代表世界模型技術的重要進展,也可能影響後續強化學習與模型預測控制領域的研究方向。過去,持續學習與世界模型經常被視為兩個獨立的研究分支,AdaJEPA 首次將兩者直接整合在同一個框架下,並透過 MPC 與自監督更新的緊密耦合,實現了實用且高效的自適應機制。 目前團隊已在多個模擬環境中驗證 AdaJEPA 的效果,結果顯示,具備持續學習能力的模型在長時間互動任務中的預測誤差明顯低於凍結參數的對照組,且隨著互動次數增加,優勢更加顯著。下一步,研究人員計劃將 AdaJEPA 部署到真實機器人平台上,測試其在非結構化環境中的適應表現。 隨著 AdaJEPA 的問世,世界模型不再只是能看懂過去、預測未來的靜態工具,而是進化為一套能夠隨著經驗成長的動態認知系統。這對於構築真正具備自主學習能力的 AI 系統來說,無疑是關鍵的一步。
Related
相關文章

Edge AI Daily 早報(7月5日)
Edge AI Daily 早報(7月5日)Edge AI Daily2026.07.05 08:39 · 來自北京全文4277字00:00 / 11:57Anthropic發佈Claude Fable 5編碼模型實現SWE-bench 95.0%突破,同時啟動內部藥物發現項目Claude Science,標誌AI公司從工具提供商向垂直領域深度滲透。
LlamaIndex ‘legal-kb’: Agentic Retrieval over Index v2 with retrieve, find, read, and grep Tools
LlamaIndex has published legal-kb, a public reference application on GitHub. It is described as a knowledge base for legal documents, powered by LlamaIndex Index v2 (the LlamaParse Platform).

趁火打劫,GPT-5.6三大模型全曝,定檔7月7日?
GPT-5.6 的三個模型底層代碼提前曝光,傳出將於下週二(7 月 7 日)正式發布。外界推測 OpenAI 刻意選在競爭對手 Claude 的關鍵時間點發布,意圖以高額度策略截殺對手氣勢。目前官方尚未證實模型細節與具體功能,但 7 月 7 日的發布已被視為業界重大事件。

光象科技累計完成數億元天使輪融資,佈局物理原生基座模型
量子位 消息指出,光象科技近日宣布,公司已累计完成数亿元天使轮融资,资金将主要用于布局物理原生基座模型的研发。这一融资事件表明市场对该公司在物理原生技术领域的前景充满信心,并为其后续技术突破与商业化落地提供了重要支持。

網友反饋 Claude Fable 5 重上架版“降智”,嚴苛 AI 護欄致頻繁回退 Opus 4.8
科技媒體 bleepingcomputer 昨日(7 月 3 日)發佈博文,報道稱 Anthropic 本月重新上架 Claude Fable 5 最強模型,除了額度限制外,多名用戶反饋存在“降智”情況,且更頻繁回退到 Opus 4.8 模型。
Mistral AI Releases Leanstral 1.5: An Apache-2.0 Lean 4 Code Agent Model Solving 587 of 672 PutnamBench Problems
Mistral AI 正式釋出 Leanstral 1.5,這是一款專為 Lean 4 證明助手打造的程式碼代理模型,採用 Apache 2.0 開源授權。該模型使用混合專家架構,總參數 119B,每次激活 6.5B,支援 256K 上下文長度與多模態輸入。在基準測試中,Leanstral 1.5 在 miniF2F 上達到 100% 準確率,解決了 PutnamBench 672 題中的 587 題,並在 FATE-H、FATE-X 及 FLTEval 上創下新紀錄,以不到七分之一的成本超越 Opus 4.6。