Engram創始人:模型再大,記不住也是白搭

重點摘要
這篇消息聚焦「Engram創始人:模型再大,記不住也是白搭」。原始導語提到:模型沒記性,提示詞再好也沒用。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
好的,以下是根據您提供的主題寫成的文章,共6段,字數約650字。
---
近年來,大型語言模型在參數規模上不斷突破,從數十億到數千億甚至更高的量級,展現出令人驚嘆的語言理解與生成能力。然而,許多頂尖的AI研究者與創業者逐漸意識到一個關鍵瓶頸:模型的記憶能力遠遠落後於其計算能力。Engram創始人提出的觀點「模型再大,記不住也是白搭」,精準點出了當前AI發展的核心矛盾。沒有有效的記憶機制,模型就像一個患有順行性遺忘症的天才,每次對話都得從零開始,無法累積經驗與知識。
記憶對AI模型的意義,遠不止於「記住對話歷史」。真正的記憶能力包含短期的工作記憶(如多輪上下文)、長期的知識沉澱(如用戶偏好、專業領域情報),以及跨會話的持續學習能力。目前的模型雖然透過巨大的上下文視窗(例如128K tokens)來處理長文本,但這仍是「偽記憶」——一種有限且消耗巨大的緩存策略。當對話結束或超出窗口範圍,這些資訊便煙消雲散,無法形成持久的知識結構,導致AI無法真正成長。
提示詞工程(Prompt Engineering)被許多人視為提升模型表現的捷徑,透過精心設計的指令來引導模型給出更好的答案。但Engram創始人的論點提醒我們:提示詞的優化好比給一個記憶力差的人提供更詳細的備忘錄,雖然能應急,卻無法從根本上解決記憶缺失的問題。當模型本身沒有長期記憶的底層支持,即使提示詞設計得再完美,遇到需要跨對話聯結的任務、需要理解用戶長期偏好的場景,依然會頻頻出錯,前後矛盾。
Engram的核心理念正是為大模型打造「類人化」的記憶系統。這不是簡單的向量資料庫檢索,而是建構一個具有聯想、遺忘與鞏固機制的記憶網絡。讓模型能夠像人類一樣,將重要的資訊從短期記憶轉移到長期記憶,並且在需要時靈活提取。這種動態記憶架構可以讓AI在數百次、數千次對話後,持續累積對用戶的深度理解,從而實現真正的個人化服務,而不是每一次都像初次見面的陌生人。
從應用場景來看,擁有記憶的模型將徹底改變人機互動的模式。例如在教育領域,AI導師能記住學生過去的錯題與思維習慣,提供針對性的輔導;在醫療領域,AI助手能持續追蹤病患的病史與用藥反應,形成連貫的健康檔案;在創意工作中,AI夥伴能理解使用者長期以來的創作風格與偏好,進行更協同的產出。沒有記憶,這些場景都只能停留在淺層的問答,無法深入且持續地創造價值。
歸根結柢,模型的未來競爭力,不再只是參數量的軍備競賽,而是記憶架構的深層革命。Engram創始人的警示無疑為業界敲響了警鐘:推動模型記憶技術的突破,讓AI真正擁有「記性」,才是解鎖下一代通用人工智慧的關鍵密碼。唯有如此,巨量參數才能轉化為真正的智慧,而不是困在即時反應的桎梏之中。
Related
相關文章

Mistral AI 推出 OCR 4 模型:支持 170 種語言,輸出更受人類青睞
這篇消息聚焦「Mistral AI 推出 OCR 4 模型:支持 170 種語言,輸出更受人類青睞」。原始導語提到:Mistral OCR 4 基礎 API 調用定價為每千頁 4 美元,批處理方式可享受 50% 優惠;文檔人工智能定價則是每千頁 5 美元。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

大模型最後的瘋狂:GPT-5.6深夜遭曝光,為什麼2026下半場成了“AI檢測AI”的絞肉機?
這篇消息聚焦「大模型最後的瘋狂:GPT-5.6深夜遭曝光,為什麼2026下半場成了“AI檢測AI”的絞肉機?」。原始導語提到:卷無可卷的 OpenAI:GPT-5.6 的深夜自救 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

“現代 AI 九成突破都來自我們!”面對核心團隊被挖,谷歌 DeepMind 掌門人的回應挺硬
谷歌 DeepMind 掌門人面對核心團隊遭挖角時強硬回應,聲稱現代 AI 九成突破都來自他們。同時文章探討為何擁有萬億參數的大型語言模型,仍無法理解愛因斯坦在休息時構思出的相對論等基礎科學理論。
Adobe宣佈收購視頻與圖像AI模型開發商Topaz Labs,深化Firefly生態佈局
Adobe正式宣佈收購專注圖像視頻增強AI二十餘年的Topaz Labs,將其併入創意業務。此舉意在強化專業影像修復與端側優化。Topaz曾獲艾美獎,近期推出視頻放大模型“Astra”與圖像修飾模型“Wonder”,並在消費級GPU高效運行上取得進展。
組建不到兩月即重組,Google加碼中期訓練欲追趕Anthropic編碼優勢
Google成立AI代碼突擊隊不到兩個月就進行重組,轉而聚焦於模型的中期訓練,意圖從底層技術補足差距。此舉旨在縮小與Anthropic在生成式AI編程領域的領先優勢。中期訓練是指在預訓練之後、微調之前進行的數據投餵環節。
性能提升 475 倍!富士通推出PHOTON新架構,劍指AI算力瓶頸
富士通發佈創新架構PHOTON,採用自上而下網絡並行分層計算,針對Transformer在長文本、高併發等場景下因頻繁訪存調取歷史信息導致處理緩慢的痛點,旨在突破算力成本與效率瓶頸。