Anthropic全球警告,OpenAI已跨“可靠性閾值”:AI自我加速啟動

2026年6月6日 07:10
Anthropic全球警告,OpenAI已跨“可靠性閾值”:AI自我加速啟動

重點摘要

這篇消息聚焦「Anthropic全球警告,OpenAI已跨“可靠性閾值”:AI自我加速啟動」。原始導語提到:剛過及格線,AI已經開始給自己提速 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

## 全球AI大廠發出重磅警告:AI正接近「自己造自己」的臨界點

就在上週,AI圈被一則重磅消息震撼——OpenAI最大競爭對手Anthropic正式向全球發出呼籲,要求在建立可驗證的跨國監督機制前提下,共同放緩或暫停前沿AI研究。這家市值近萬億美元、正準備首次公開募股的AI巨頭,為何在上市前夕突然喊出「技術煞車」?其背後揭示的「AI自我加速」現象,恐怕比多數人想像的來得更快、更猛。

在6月4日發布的萬字長文《When AI Builds Itself》(當AI開始自我構建)中,Anthropic指出,AI正沿著一條名為「遞迴自我改進」的軌跡加速前進,未來AI系統將有能力完全自主地設計、開發和訓練出超越自身的下一代模型。換句話說,AI「自己造自己」不再只是科幻小說的橋段,而是一個已經露出明確徵兆、甚至可能比學術界和監管機構預期更快到來的現實。一旦這一趨勢走到極致,人類恐怕將成為按下啟動鍵卻再也無法控制走向的旁觀者。

### OpenAI的「可靠性門檻」:AI從玩具變成員工的分水嶺

不過,真正的關鍵問題是:AI現在到底進步到哪個階段了?OpenAI後訓練前沿團隊聯合負責人Yann Dubois在最新訪談中給出了一個非常具啟發性的微觀視角:AI之所以讓大家突然感受到「能力跳躍」,核心原因不是模型突然變得超級聰明,而是它剛剛跨過了一道至關重要的門檻——「可靠性門檻」。

Yann的解釋相當直白:在跨過這道門檻之前,AI像一個聰明但動不動就出包的實習生——能寫、能算、能提出不錯的點子,但你就是不敢把真正重要的工作完全交給它。一旦跨過門檻,它就變成了可以放心託付任務的正式員工,你才敢讓它真正上崗。根據他的判斷,OpenAI大約在2025年12月左右才正式跨過了這道坎,這也是為什麼外界在這段時間突然感受到了AI能力的「階梯式躍遷」。

更值得關注的是第二層效應:一旦AI模型變得足夠可靠,它就會反過來加速AI自身的研發進程。特別是在程式開發場景中,AI既能幫助研究人員搭建工具鏈,也能在訓練下一代模型時發揮關鍵作用,形成一個「以AI養AI」的正向加速迴路,而且這個迴路會越轉越快。

### Anthropic內部實證:程式開發已八倍加速、AI首次自主完成安全研究

Anthropic不是空口說白話。這家公司用內部真實數據向外界證明了加速迴路已經全面啟動。截至2025年5月,Anthropic主程式庫中超過80%的程式碼都是由Claude自主撰寫的,而在2025年2月推出Claude Code之前,這一比例還停留在個位數。到了2026年第二季度,Anthropic的工程師人均每季交付的程式碼量,已經是2024年的整整8倍。

程式碼數量固然不是衡量品質的唯一指標,但在開放式、高難度的程式任務中,Claude的自主成功率已經攀升到76%,僅半年時間就提升了50個百分點。許多工程師認為Claude目前的程式碼品質已與人類相當,甚至預期一年內將超越人類水平。此外,在AI安全研究領域,Claude代理今年4月首次獨立完成了一個端到端的開放式研究項目,從提出假設、測試到迭代分析,僅用約800小時就恢復了97%的性能差距,而兩名人類研究員花了一整週只恢復了23%。

這些數據揭示了一個不容忽視的事實:在AI的開發過程中,人類的角色正在逐漸縮小。目前人類的比較優勢主要集中在研究品味與判斷力上——決定哪些問題值得研究、哪些結果值得信賴——但這道防線未來還能撐多久,仍是個巨大的未知數。

### 爭議之聲:安全警報還是IPO行銷手法?

不過,Anthropic發布這則警告的時間點,也讓不少人打了個問號。就在幾天前(6月1日),該公司才正式向美國證券交易委員會祕密遞交了S-1註冊聲明草稿,啟動IPO籌備流程,最快可能在今年秋天掛牌上市。在上市前夕突然高呼「AI發展太快了,請踩煞車」,不免讓外界質疑這究竟是真切的安全憂慮,還是別有用心的行銷操作。

批評者指出,Anthropic向來以「安全第一」的形象自我標榜,但今年2月才悄悄修改了其「負責任擴展政策」,拿掉了「在安全措施不足時暫停訓練」的核心承諾,改為較為寬鬆的透明度機制。川普顧問David Sacks更直言,這可能是一套以「負責任AI」為包裝的「監管捕獲」策略,目的是在競爭對手的研發速度。另一方面,華頓商學院教授Ethan Mollick則認為,Anthropic內部確實有不少人是真心相信安全議題的,AI業界的真實面貌其實相當複雜,兩者兼有之。

### 未來觀察重點

接下來值得讀者關注的幾個關鍵方向如下。第一,所謂的「遞迴自我改進」並非一個單點事件,而是從AI局部協助研發、到半自動研究閉環、再到完全自主構建下一代模型的逐步過程。目前各家大廠究竟處在這道光譜的哪個位置,將直接決定風險的程度與應對的時間窗口。

第二,OpenAI提出的「可靠性門檻」概念暗示了一個更務實的判斷標準:AI要真正改變世界,靠的或許不是模型參數的無限膨脹,而是在特定任務領域的穩定可靠程度。當AI能夠在更多產業場景中穩定扮演「可信賴員工」的角色時,社會結構的衝擊才會真正顯現。

第三,監管機制的腳步顯然還遠遠跟不上技術的進化速度。Anthropic呼籲建立跨國可驗證的協同放緩機制,但在各國利益高度分歧、龍頭大廠紛紛搶攻上市先機的現實下,這條路恐怕相當崎嶇難行。人類能否在AI徹底失控之前,為自己爭取到足夠的調適與應對時間,恐怕是接下來整個科技界最緊迫的課題。

Related

相關文章

因用 AI 編造證據材料,英國一警員面臨刑事調查

英國德比郡一名警探涉嫌利用警局內部AI聊天機器人,刻意下達偏頗指令以捏造有利於起訴的證據,包括誇大被害者影響聲明,目前該警員已遭停職並面臨「妨礙司法公正」的刑事調查。此案為英國首起執法人員濫用AI干預司法的事件,可能影響其經手案件的判決效力,也引發對警方導入AI技術監管機制的檢討。

剛剛

蓋洛普最新研究:不經常使用 AI 的員工更容易成為被裁員對象

這篇消息聚焦「蓋洛普最新研究:不經常使用 AI 的員工更容易成為被裁員對象」。原始導語提到:在美國科技行業,每月至少使用一次 AI 的員工,預計遭裁員的概率約為 6%;使用 AI 較少的員工,預計遭裁員的概率達到 18%,是前者的三倍。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

11 小時前

皮尤研究中心民調:63% 美國人認為 AI 發展速度過快

這篇消息聚焦「皮尤研究中心民調:63% 美國人認為 AI 發展速度過快」。原始導語提到:49% 的美國人偶爾會使用聊天機器人,63% 則認為 AI 發展速度過快。2024 年,使用過 AI 聊天機器人的受訪者比例只有 33%。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

14 小時前

Anthropic CEO 阿莫迪:公司治理機構隨時有權解僱我

Anthropic CEO 阿莫迪接受採訪時表示,AI 技術主要由私營企業推動,他本人並不完全認同此模式。為防範權力濫用,公司設立了“長期利益信託”治理結構,該機構有權撤換董事會成員甚至解僱 CEO。他強調,政府與企業應合作引入公共監督機制,確保 AI 安全發展。#AI 治理##Anthropic#

16 小時前