Anthropic全球警告，OpenAI已跨“可靠性閾值”：AI自我加速啟動

2026年6月6日 07:10

重點摘要

這篇消息聚焦「Anthropic全球警告，OpenAI已跨“可靠性閾值”：AI自我加速啟動」。原始導語提到：剛過及格線，AI已經開始給自己提速從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

## 全球AI大廠發出重磅警告：AI正接近「自己造自己」的臨界點

就在上週，AI圈被一則重磅消息震撼——OpenAI最大競爭對手Anthropic正式向全球發出呼籲，要求在建立可驗證的跨國監督機制前提下，共同放緩或暫停前沿AI研究。這家市值近萬億美元、正準備首次公開募股的AI巨頭，為何在上市前夕突然喊出「技術煞車」？其背後揭示的「AI自我加速」現象，恐怕比多數人想像的來得更快、更猛。

在6月4日發布的萬字長文《When AI Builds Itself》（當AI開始自我構建）中，Anthropic指出，AI正沿著一條名為「遞迴自我改進」的軌跡加速前進，未來AI系統將有能力完全自主地設計、開發和訓練出超越自身的下一代模型。換句話說，AI「自己造自己」不再只是科幻小說的橋段，而是一個已經露出明確徵兆、甚至可能比學術界和監管機構預期更快到來的現實。一旦這一趨勢走到極致，人類恐怕將成為按下啟動鍵卻再也無法控制走向的旁觀者。

### OpenAI的「可靠性門檻」：AI從玩具變成員工的分水嶺

不過，真正的關鍵問題是：AI現在到底進步到哪個階段了？OpenAI後訓練前沿團隊聯合負責人Yann Dubois在最新訪談中給出了一個非常具啟發性的微觀視角：AI之所以讓大家突然感受到「能力跳躍」，核心原因不是模型突然變得超級聰明，而是它剛剛跨過了一道至關重要的門檻——「可靠性門檻」。

Yann的解釋相當直白：在跨過這道門檻之前，AI像一個聰明但動不動就出包的實習生——能寫、能算、能提出不錯的點子，但你就是不敢把真正重要的工作完全交給它。一旦跨過門檻，它就變成了可以放心託付任務的正式員工，你才敢讓它真正上崗。根據他的判斷，OpenAI大約在2025年12月左右才正式跨過了這道坎，這也是為什麼外界在這段時間突然感受到了AI能力的「階梯式躍遷」。

更值得關注的是第二層效應：一旦AI模型變得足夠可靠，它就會反過來加速AI自身的研發進程。特別是在程式開發場景中，AI既能幫助研究人員搭建工具鏈，也能在訓練下一代模型時發揮關鍵作用，形成一個「以AI養AI」的正向加速迴路，而且這個迴路會越轉越快。

### Anthropic內部實證：程式開發已八倍加速、AI首次自主完成安全研究

Anthropic不是空口說白話。這家公司用內部真實數據向外界證明了加速迴路已經全面啟動。截至2025年5月，Anthropic主程式庫中超過80%的程式碼都是由Claude自主撰寫的，而在2025年2月推出Claude Code之前，這一比例還停留在個位數。到了2026年第二季度，Anthropic的工程師人均每季交付的程式碼量，已經是2024年的整整8倍。

程式碼數量固然不是衡量品質的唯一指標，但在開放式、高難度的程式任務中，Claude的自主成功率已經攀升到76%，僅半年時間就提升了50個百分點。許多工程師認為Claude目前的程式碼品質已與人類相當，甚至預期一年內將超越人類水平。此外，在AI安全研究領域，Claude代理今年4月首次獨立完成了一個端到端的開放式研究項目，從提出假設、測試到迭代分析，僅用約800小時就恢復了97%的性能差距，而兩名人類研究員花了一整週只恢復了23%。

這些數據揭示了一個不容忽視的事實：在AI的開發過程中，人類的角色正在逐漸縮小。目前人類的比較優勢主要集中在研究品味與判斷力上——決定哪些問題值得研究、哪些結果值得信賴——但這道防線未來還能撐多久，仍是個巨大的未知數。

### 爭議之聲：安全警報還是IPO行銷手法？

不過，Anthropic發布這則警告的時間點，也讓不少人打了個問號。就在幾天前（6月1日），該公司才正式向美國證券交易委員會祕密遞交了S-1註冊聲明草稿，啟動IPO籌備流程，最快可能在今年秋天掛牌上市。在上市前夕突然高呼「AI發展太快了，請踩煞車」，不免讓外界質疑這究竟是真切的安全憂慮，還是別有用心的行銷操作。

批評者指出，Anthropic向來以「安全第一」的形象自我標榜，但今年2月才悄悄修改了其「負責任擴展政策」，拿掉了「在安全措施不足時暫停訓練」的核心承諾，改為較為寬鬆的透明度機制。川普顧問David Sacks更直言，這可能是一套以「負責任AI」為包裝的「監管捕獲」策略，目的是在競爭對手的研發速度。另一方面，華頓商學院教授Ethan Mollick則認為，Anthropic內部確實有不少人是真心相信安全議題的，AI業界的真實面貌其實相當複雜，兩者兼有之。

### 未來觀察重點

接下來值得讀者關注的幾個關鍵方向如下。第一，所謂的「遞迴自我改進」並非一個單點事件，而是從AI局部協助研發、到半自動研究閉環、再到完全自主構建下一代模型的逐步過程。目前各家大廠究竟處在這道光譜的哪個位置，將直接決定風險的程度與應對的時間窗口。

第二，OpenAI提出的「可靠性門檻」概念暗示了一個更務實的判斷標準：AI要真正改變世界，靠的或許不是模型參數的無限膨脹，而是在特定任務領域的穩定可靠程度。當AI能夠在更多產業場景中穩定扮演「可信賴員工」的角色時，社會結構的衝擊才會真正顯現。

第三，監管機制的腳步顯然還遠遠跟不上技術的進化速度。Anthropic呼籲建立跨國可驗證的協同放緩機制，但在各國利益高度分歧、龍頭大廠紛紛搶攻上市先機的現實下，這條路恐怕相當崎嶇難行。人類能否在AI徹底失控之前，為自己爭取到足夠的調適與應對時間，恐怕是接下來整個科技界最緊迫的課題。

原始來源：36氪 ↗

查看原始來源

IT之家AI倫理與安全

因批評 AI 數據中心迅速擴張，多名亞馬遜工程師遭內部調查

亞馬遜多名工程師因公開批評AI數據中心快速擴張，遭到公司內部調查。亞馬遜告知員工，調查可能導致紀律處分，甚至明確警告最嚴重後果為解僱。此舉使受調查員工深感威脅，並對就業穩定性產生不安。

剛剛閱讀分析

IT之家AI倫理與安全

因用 AI 編造證據材料，英國一警員面臨刑事調查

英國德比郡一名警探涉嫌利用警局內部AI聊天機器人，刻意下達偏頗指令以捏造有利於起訴的證據，包括誇大被害者影響聲明，目前該警員已遭停職並面臨「妨礙司法公正」的刑事調查。此案為英國首起執法人員濫用AI干預司法的事件，可能影響其經手案件的判決效力，也引發對警方導入AI技術監管機制的檢討。

剛剛閱讀分析

IT之家AI倫理與安全

AI 賬單失控：AT&T、Meta 等巨頭急剎車，從“瘋狂消耗”到“嚴苛限制”

科技媒體 The Information 昨日（6 月 18 日）發佈博文，報道稱包括 AT&T、Meta、Uber、微軟在內的諸多科技公司已嚴苛限制內部 AI 工具使用，正從鼓勵 AI 無限使用（tokenmaxxing）轉向嚴格限制（tokenminimizing）。

1 小時前閱讀分析

IT之家AI倫理與安全

蓋洛普最新研究：不經常使用 AI 的員工更容易成為被裁員對象

這篇消息聚焦「蓋洛普最新研究：不經常使用 AI 的員工更容易成為被裁員對象」。原始導語提到：在美國科技行業，每月至少使用一次 AI 的員工，預計遭裁員的概率約為 6%；使用 AI 較少的員工，預計遭裁員的概率達到 18%，是前者的三倍。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

11 小時前閱讀分析

IT之家AI倫理與安全

皮尤研究中心民調：63% 美國人認為 AI 發展速度過快

這篇消息聚焦「皮尤研究中心民調：63% 美國人認為 AI 發展速度過快」。原始導語提到：49% 的美國人偶爾會使用聊天機器人，63% 則認為 AI 發展速度過快。2024 年，使用過 AI 聊天機器人的受訪者比例只有 33%。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

14 小時前閱讀分析

IT之家AI倫理與安全

Anthropic CEO 阿莫迪：公司治理機構隨時有權解僱我

Anthropic CEO 阿莫迪接受採訪時表示，AI 技術主要由私營企業推動，他本人並不完全認同此模式。為防範權力濫用，公司設立了“長期利益信託”治理結構，該機構有權撤換董事會成員甚至解僱 CEO。他強調，政府與企業應合作引入公共監督機制，確保 AI 安全發展。#AI 治理##Anthropic#

16 小時前閱讀分析

相關文章

因批評 AI 數據中心迅速擴張，多名亞馬遜工程師遭內部調查

因用 AI 編造證據材料，英國一警員面臨刑事調查

AI 賬單失控：AT&T、Meta 等巨頭急剎車，從“瘋狂消耗”到“嚴苛限制”

蓋洛普最新研究：不經常使用 AI 的員工更容易成為被裁員對象

皮尤研究中心民調：63% 美國人認為 AI 發展速度過快

Anthropic CEO 阿莫迪：公司治理機構隨時有權解僱我