讓AI自我構建的RSI火了,Google潑冷水,DeepSeek們摸到了邊

2026年6月7日 07:28
讓AI自我構建的RSI火了,Google潑冷水,DeepSeek們摸到了邊

重點摘要

這篇消息聚焦「讓AI自我構建的RSI火了,Google潑冷水,DeepSeek們摸到了邊」。原始導語提到:AI將靠「遞歸」進行自我構建? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

## 讓AI自我構建的RSI火了,Google潑冷水,DeepSeek們摸到了邊

最近在AI圈引發熱議的「遞歸自我改進」(Recursive Self-Improvement, RSI)概念,被許多人視為通往更強大智慧的可能路徑。簡單來說,RSI指的是一套讓AI能夠反覆優化自身架構、演算法或訓練流程的機制——模型先學會如何改進自己,再用改進後的能力去進行下一輪更高效的改進,形成類似「正回饋」的上升螺旋。支持者認為,一旦這個循環成功啟動,AI便有可能在極短時間內跳脫人類設計的限制,實現能力的爆發式躍進。

不過,Google近期對此概念公開「潑了冷水」。該公司的研究團隊在一篇技術論文中指出,現階段的RSI面臨三大本質難題:自我參照的邏輯矛盾、驗證循環的無限倒退,以及算力與數據資源的邊際效益遞減。簡單來講,AI若要改寫自己的核心程式碼,必須先正確理解自身的運作方式,但「理解自己」這件事本身就容易產生悖論;而每一次改進後的結果是否真的變好,又需要更強大的驗證機制來判斷,這會形成一個無止盡的驗證鏈。Google認為,至少在可預見的未來,完全自主、閉環的遞歸自我構建仍接近「永動機」般的幻想。

然而,來自中國的深度求索(DeepSeek)等新創團隊,卻在實作中「摸到了邊」。他們並沒有試圖打造一個萬能的自我改進引擎,而是從更具體的工程痛點切入。例如,DeepSeek的模型訓練過程中,已經應用了類似「自動化超參數調校」與「線上自我蒸餾」的技術——模型在推理階段產生的高品質思維鏈,可以被回收作為下一輪微調的訓練資料,間接形成一個封閉的改進迴路。雖然這與學術上純粹的RSI還有距離,但確實展現出「讓模型幫助自己進步」的可行雛形。

這場討論的背後,凸顯了當前AI發展方向上的路線差異。Google、OpenAI等巨頭傾向於以更嚴謹、更保守的態度看待自我改進,認為與其追求難以控制的遞歸爆發,不如把資源投入可驗證的基礎研究與大規模算力堆疊。而DeepSeek這類團隊則更願意在有限資源下「動手試錯」,從工程實務中挖掘出類似RSI精神的局部應用。這兩種思維沒有絕對的對錯,卻會直接影響未來三年AI產品的迭代速度與安全性設計。

從更宏觀的角度看,RSI能否真正落地,將決定AI是「受人持續引導的工具」還是「具備自主演化能力的主體」。如果遞歸自我構建真的成為現實,AI的智慧可能在數小時內跨越人類數十年的研究累積,這對勞動市場、國安控管甚至倫理框架都會帶來巨大衝擊。反之,如果Google的質疑成立,那麼我們就得接受「人類監督永遠是瓶頸」的事實,AI能力的邊界將長期卡在工程師的創意與除錯效率上。

讀者接下來可以關注三個方向:第一,各開源模型社群是否出現「自我優化」的實驗性套件,例如能自動產生訓練資料或調整神經網路結構的工具;第二,Google、Meta等大廠是否會在未來論文中提出可局部實現的「弱RSI」框架,放棄完全自主的目標,轉而追求人機協作的遞歸改進;第三,DeepSeek等團隊的下一個公開版本,若揭露更多關於「模型自我蒸餾」或「在線學習」的細節,將是評估這項技術成熟度的關鍵指標。無論最終結果如何,這場關於AI能否「自己長大」的辯論,都將深刻影響我們對智慧本質的理解。

Related

相關文章

GPT發AI原創新成果了

這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到:AI實現藥物全自動研發,還遠嗎? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

AI越強,越要“殺死”過去的自己

這篇消息聚焦「AI越強,越要“殺死”過去的自己」。原始導語提到:人類需要實現思維模式的轉變。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 小時前
MarkTechPost AI研究與前沿

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

8 小時前

Transformer之父離開谷歌,奧特曼等了他十年

這篇消息聚焦「Transformer之父離開谷歌,奧特曼等了他十年」。原始導語提到:27億美元也沒能留住,Noam Shazeer追尋下一代架構。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

15 小時前

Dario訪談首曝:Mythos被稱為“超級武器”

這篇消息聚焦「Dario訪談首曝:Mythos被稱為“超級武器”」。原始導語提到:在這場69分鐘完整訪談裡,Dario Amodei 說人類真正面對的不是某個突然降臨的奇點,而是一條已經開始垂直起飛的指數曲線。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

19 小時前

用結構替代數據,因果世界模型如何重塑具身智能大腦

這篇消息聚焦「用結構替代數據,因果世界模型如何重塑具身智能大腦」。原始導語提到:因果世界模型需要一個標誌性的時刻來證明自己。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

19 小時前