邢波再出手:上次「罵」完世界模型,這次輪到智能體了

2026年7月1日 19:27
邢波再出手:上次「罵」完世界模型,這次輪到智能體了

重點摘要

這篇消息聚焦「邢波再出手:上次「罵」完世界模型,這次輪到智能體了」。原始導語提到:邢波團隊拆解五大軟肋後,開出了智能體的「藥方」:GIC 架構 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

### 邢波再出手:從世界模型到智能體,這次他開出了 GIC 藥方

人工智慧領域知名學者、卡內基美隆大學教授邢波,近期再度成為業界焦點。繼先前公開「批判」世界模型的路線後,他這次將矛頭轉向另一個熱門方向——智能體(Agent)。邢波團隊在最新研究中,不僅點出當前智能體發展的五大軟肋,更提出了一套名為 **GIC(Generalized Intelligence Core)** 的架構,試圖為智能體的困境給出一張具體「藥方」。這項動作引發學術界與產業界高度關注,因為邢波向來以直言不諱、善於拆解技術迷思著稱。

#### 重點整理:五大軟肋與 GIC 架構

根據公開論述,邢波團隊認為目前主流智能體普遍存在五項結構性問題。這些軟肋包括:任務理解容易失焦、長期記憶與規劃能力薄弱、工具調用過於依賴硬編碼、跨場景泛化性不足,以及缺乏穩定的錯誤回饋機制。簡而言之,當前許多智能體看似能完成複雜任務,實則在面對動態環境或連續性工作時,容易出現「開頭漂亮、結尾崩盤」的現象。為此,團隊提出的 GIC 架構,核心在於將感知、推理與行動三個模組整合到一個統一的核心中,並透過「生成式推理迴路」來強化智能體的自我修正與環境適應能力,不再只是單純的「指令—執行」鏈路。

#### 背景脈絡:從罵世界模型到批智能體

邢波過去曾多次對「世界模型」這條研究路線發出警語,認為其過度浪漫化模型對物理世界的理解能力,實際上很難落實到真實應用。如今他將注意力轉向智能體,顯然是看到了同一種隱憂:業界對智能體的期待正在快速膨脹,但技術基礎並不穩固。從 OpenAI 的 GPT 系列到開源社群的 AutoGPT、BabyAGI,各大團隊都在競賽誰能把智能體做得更像「人類助手」,然而邢波點出的五大軟肋正好戳中這些系統的痛點——看似聰明,卻經常在關鍵時刻掉鏈子。GIC 架構的提出,或許正是希望把智能體從「炫技 demo」拉回到「可落地的工程系統」。

#### 可能影響:改變智能體開發的思考框架

GIC 架構如果能夠獲得實證支援,最大的影響可能不是在單一任務上超越現有系統,而是提供一個更穩定的開發範式。現階段的智能體往往需要為每個場景寫大量的規則或提示詞(prompt),GIC 則試圖透過核心的生成式推理模組,讓智能體在運行中自主判斷該如何調整工具使用與決策路徑。這對於企業級應用尤其關鍵——工廠排程、金融風控、醫療輔助等場景,需要的不是「偶爾超神、經常翻車」的智能體,而是可解釋、可收斂、可除錯的系統。如果 GIC 的架構能降低智能體的不確定性,勢必加速 AI 從聊天機器人進化到真正的任務代理人。

#### 讀者可關注的後續

對於關心 AI 發展的讀者,接下來有幾個值得追蹤的方向。第一,GIC 架構是否有公開的開源實作或基準測試?邢波團隊向來重視實證,很可能會推出對應的程式庫與評估數據。第二,學界與產業界如何回應?尤其那些已經投入大量資源打造自有智能體的公司(如 Microsoft、Google、Anthropic),是否會吸收或挑戰 GIC 的概念。第三,邢波本人是否會持續對其他 AI 熱點(例如多模態、機器人)發表類似「拆解性評論」?他的每次出手都不只是技術討論,更反映了學術界對產業路線的冷靜反思。總之,智能體還沒到終局,GIC 或許只是其中一塊重要的拼圖。

Related

相關文章

Claude有“編制”了,Anthropic發的

Anthropic 推出 Claude Tag,讓 AI 擁有專屬工牌和權限,能以獨立身份直接入駐 Slack 頻道,無需再借用他人帳號。此舉使 Claude 成為團隊中的固定 AI 同事,強化協作便利性。

剛剛
雷峰網AI Agent

即夢AI攜創作者亮相法國昂西動畫節,3000份全球投稿勾勒AI動畫創作新圖景

2026年6月23日,法國昂西國際動畫電影節期間,由即夢AI與Dreamina AI主辦的“AI動畫國際峰會”在MIFA市場舉行。這場以“技術與藝術的融合”為主題的峰會,匯聚了來自全球的獲獎創作者、資深動畫製片人與行業專家,通過作品展映與深度對談,共同探索AI時代動畫創作的新可能。今年5月,即夢AI和Dreamina AI面向全球發起AI動畫作品及項目徵集,共收到來自40多個國家和地區的近3000份投稿,風格涵蓋定格動畫、水墨畫風、超現實主義、都市寫實等多種類型。經國際評審團遴選,25部短片與5個項目最終入圍,並從中評選出4部榮譽作品。剛剛結束的昂西動畫節上,這些榮譽作品的創作者受邀到現場展映自己的短片,在全球動畫行業的最高舞臺上分享創作歷程與技術探索。四位創作者,四種AI創作路徑此次展映的4部榮譽作品,分別代表了AI動畫創作的四種典型路徑,展現了技術與藝術結合的多元可能性。來自葡萄牙的資深動畫導演Cláudio Sá帶來了改編自果戈裡經典的超現實短片《THE NOSE》。擁有18年2D、3D及傳統動畫經驗的Cláudio,此次以個人身份完成了這部作品。他將即夢AI作為核心視頻與渲染引擎,重度使用Seedance 2.0的全能參考模式,“這讓我能夠擁有眾多角色、眾多服裝、眾多場景,這在傳統製作中是不現實的,就好像擁有了無限預算。”為了精確控制主角“鼻子”的運動,他甚至親手雕刻了一個物理版本的鼻子模型作為動畫參考,這種“實體參考+AI生成”的混合工作流,讓他在保持藝術控制力的同時大幅提升了製作效率。現場展映榮譽作品及即夢ai最新技術能力美國創作者C.E. Whitmore的黑色懸疑作品《The Last Waltz》,則呈現了另一種創作哲學。這部設定在1948年英國哥特式莊園的謀殺謎案,圍繞四位女性的故事展開,探討謊言、表演性奉獻與真相的本質。與許多創作者將AI視為工具不同,

2 小時前
MarkTechPost AIAI Agent

CUP(通用實用 Python):用百度工具套件打造可靠的 Python 工作流程

在本教學中,我們深入探討百度推出的 CUP(Common Useful Python)函式庫,這是一套實用的工具套件,能協助建立更穩健的 Python 工作流程。我們先在適合 Colab 的環境中安裝該函式庫,接著逐步介紹其主要子系統,包括日誌記錄、裝飾器、巢狀設定、快取、ID 生成、執行緒池、可中斷執行緒、延遲執行、時間工具、Linux 資源監控、檔案鎖定、網路輔助功能、物件儲存介面、型別對應,以及內建測試斷言。過程中,我們並非隨意呼叫函式,而是觀察每個模組如何應用於實際開發任務,例如監控、自動化、並行處理、設定管理與可靠性檢查。CUP 安裝與日誌記錄程式碼範例

6 小時前
雷峰網AI Agent

Agent 落地,數據庫先變

雷峰網訊 AI 的競爭越靠近落地,越展現出其殘酷的一面。Benchmark 上幾分的得失正變得意義有限,取而代之的,是真金白銀的投入產出比。Agent 如何真正讀懂業務,模型智能如何在業務端釋放出更大的價值,成為了這一階段競爭最核心的命題。而一同被推向舞臺中央的,還有數據庫。過去,它扮演的角色很簡單,本質就是一個長期、安全、可查詢的數據存儲系統。比如用戶在淘寶購物,完成了下單、支付、退款、查物流等一系列操作,最基本的需求就是這些記錄不能丟失、不能出錯、可查詢,以及能支撐高峰期幾億人同時下單的高併發壓力。這就是移動互聯網時代數據庫的核心能力,圍繞著存儲和查詢,衍生出一致性、併發處理和容災備份的需求。但是當 Agent 越發深入地走進生產場景,它們也自然而然地成為了數據庫的新用戶。Agent 需要實時訪問各種結構化和非結構化數據,數據庫也從服務於人寫 SQL 查數據的存儲模塊,變成了 Agent 的記憶系統。這個新的角色,意味著數據庫在存儲之外,還要支撐 RAG(檢索增強生成)和實時數據流驅動的 AI。RAG 場景下,AI 回答問題需要從數據庫召回資料再生成回答,沒有數據庫就等於 AI “失憶”。而實時數據流驅動的 AI,更有賴於毫秒到秒級的用戶行為數據實時讀取。這兩者是今天 Agent 落地最常見的兩種場景。可以說,當我們討論 Agent 是否已經邁過那條名為“可用”的界限時,數據庫的重要程度,並不亞於模型智能水平。那麼 AI 時代,到底需要什麼樣的數據庫?01當數據庫開始服務 Agent據 Gartner 預測,到 2028 年,AI Agent 生態系統將能夠使多個專業化的智能體在不同企業應用間動態協作。屆時,約有三分之一的用戶體驗將從使用原生應用,轉向由 Agent 前端來主導。數據庫是這種轉變的一個鮮明代表。當 Agent 成為數據的使用者,對數據庫的訪問頻率將遠遠高

9 小時前