Mythos 5顛覆性能曝光:訓練代碼52倍加速碾壓人類

2026年6月8日 19:50
Mythos 5顛覆性能曝光:訓練代碼52倍加速碾壓人類

重點摘要

Anthropic 的神秘 AI 模型「Mythos 5」在訓練程式碼優化上達到 52 倍加速效果,遠超人類工程師與前代模型。該模型參數高達 10 萬億,但因具備極強的網路安全能力(例如 90 分鐘內發現並利用存在 20 年的 Linux 核心漏洞),被評估風險過大,因此未對公眾開放,僅透過「Project Glasswing」計畫提供給特定合作夥伴進行防禦性研究。

站內 AI 整理稿

## Anthropic 最神秘 AI 模型 Mythos 5:52 倍訓練加速,因「太危險」未向大眾開放

### 事件重點整理

2026 年 6 月初,Anthropic 發布了一份備受矚目的 AI 進展報告,披露其內部代號為 **Mythos Preview** 的先進模型的驚人表現。該模型在優化小型 AI 模型的訓練程式碼測試中,達到了 **52 倍的加速效果**;相比之下,2024 年 5 月的 Claude Opus 4 平均僅約 3 倍,而一名熟練的人類工程師通常需要 4 至 8 小時才能實現約 4 倍的優化。此外,Mythos 在輔助 AI 研究決策的測試中,有 64% 的情況下給出的建議優於人類研究員,相較於 2024 年同類測試僅 22% 的勝率,呈現爆發性增長。值得留意的是,這些數據來自 **Anthropic 官方公開報告**,並非傳聞或內部洩漏,公信力相對較高。

### 訓練規模曝光:10 萬億參數與巨量算力

關於 Mythos 5 的規模,多方消息指向其總參數達到 10 萬億(10 trillion)等級。這個數字極具震撼力——GPT-4 估算參數約 1.8 萬億,而 Mythos 5 是其 5 倍以上。不過業界分析認為,這個模型極可能採用稀疏專家架構(MoE),每次推理時僅激活部分參數,而非毫無效率地調動全部 10 萬億參數。在訓練算力方面,一份疑似來自 Microsoft 的幻燈片揭露 Mythos 的訓練使用了 **6.1 × 10²⁷ FLOPs** 的規模,與 Gemini 3.1 Pro 大致相當,再次驗證 Scaling Law 正以超越過往預期的速度持續推進。

### 引發安全顧慮的最強模型:Glasswing 計劃

然而,Mythos 5 之所以引發巨大關注,不只是因為其規模或加速數字,更是因為 Anthropic 選擇**不對公眾開放**這個模型。根據該公司基於「責任擴展政策」的評估,Mythos 的潛在風險大於收益,因而只以「Project Glasswing」的封閉形式提供給特定合作夥伴與關鍵基礎設施機構,用於防禦性網路安全研究。這背後的顧慮其來有自——Mythos 在網路安全方面的能力已達到前所未有的層級。英國 AI 安全研究所(AISI)實際測試發現,Mythos 在模擬企業內網的 32 步滲透任務中,10 次嘗試成功 6 次,而人類安全專家走完整個流程約需 20 小時。更驚人的是,Anthropic 的安全研究員曾在公開演示中以 Mythos 模型在 **90 分鐘內發現並利用了 Linux 內核中存在長達 20 年的堆疊緩衝區溢出漏洞**,這是 AI 首次在真實環境中完成從漏洞發現到成功觸發的完整攻擊鏈。

### 技術架構新思維:從通用到巨型專業化

從更宏觀的角度來看,Mythos 5 的出現標誌著 AI 產業思維的轉變。過去幾年,模型開發的主流方向是打造「通用型 AI」,一個模型要同時應付對話、寫程式、研究、創作等所有任務。然而 Mythos 5 走的是一條更專精的路線:將龐大的參數集中投入**網路安全這個單一領域**,而非試圖面面俱到。這種「巨型專業化」模式若能證明可行,將可能開啟 AI 應用的大規模垂直細分——醫療診斷、法律審閱、金融風控等領域都可能出現類似規模的專業模型。對企業用戶而言,代表未來可望獲得更精準、更可靠的垂直 AI 工具;但對一般消費者來說,這類模型很可能長期維持在封閉或高價的企業級市場,與日常生活應用將有一段不小距離。

### 潛在影響與關注方向

Mythos 5 的問世,可能從幾個層面影響產業生態。首先,網路安全領域的人才需求結構可能發生轉變——未來不是不需要安全專家,而是專家的工作方式將從「親手找漏洞」轉為「覆核與引導 AI 生成的結果」。其次,Anthropic 此舉已領先主要競爭對手率先觸及「自我監管」的臨界點,未來其他 AI 公司在開發極高能力模型時,勢必也得面對「要不要發布」的類似難題。最後,市場也傳出 Anthropic 正考慮最早於 2026 年第四季進行首次公開募股(IPO)——若屬實,Mythos 5 展現的技術高度將成為其向投資人證明競爭力的關鍵籌碼。

### 讀者後續可關注的發展

**第一**,留意 Project Glasswing 的擴張進度。Anthropic 目前已將該計畫從約 50 個機構擴大到 15 個國家的 200 個組織,包括 Microsoft、Google、Nvidia 等科技巨頭皆為參與者。合作範圍的擴大意味著 Mythos 的漏洞檢測能力正在被全球資安體系驗證。**第二**,觀察競爭對手的回應策略。OpenAI、Google 等公司是否會跟進推出類似規格的專業模型,將深刻影響整體產業走向。**第三**,關注政策與監管動向。歐盟委員會已正式確認將向 Anthropic 取得 Mythos 的訪問權限,隨著更多政府機構與監管單位介入,AI 模型的安全標準與發布審查機制可能出現新的國際規範。

Related

相關文章

MarkTechPost AI模型更新

Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages

This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather

1 小時前
MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

15 小時前

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

17 小時前