馬斯克：Grok 4.5 已在 SpaceX 和特斯拉內部測試，性能接近 Opus 模型

2026年6月28日 19:05

重點摘要

這篇消息聚焦「馬斯克：Grok 4.5 已在 SpaceX 和特斯拉內部測試，性能接近 Opus 模型」。原始導語提到：馬斯克還透露，SpaceX 今年每個月都會推出一批完全從零開始訓練的全新模型。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

### 馬斯克：Grok 4.5 已在 SpaceX 和特斯拉內部測試，性能接近 Opus 模型

根據最新消息，馬斯克（Elon Musk）在近期公開場合透露，旗下 AI 公司 xAI 開發的新一代語言模型 Grok 4.5，已經在 SpaceX 與特斯拉內部進行測試。他更指出，這款模型的整體表現已接近當前業界頂尖的 Opus 系列模型（外界普遍推測為 Anthropic 的 Claude Opus 或 OpenAI 的相關高階版本），展現出 xAI 在大型語言模型領域的快速追趕能力。馬斯克還補充，SpaceX 今年將以每月一次的頻率，推出完全從零開始訓練的全新模型，顯示其對 AI 技術布局的高度野心。

#### 重點整理：Grok 4.5 的內部測試與效能定位

Grok 4.5 目前並非公開版本，而是鎖定在 SpaceX 與特斯拉內部進行封閉測試。這意味著該模型將優先應用於兩家企業的實際業務場景，例如 SpaceX 的火箭控制系統、衛星通訊分析，或特斯拉的自動駕駛決策、工廠自動化等。馬斯克強調其性能「接近 Opus 模型」，暗示 Grok 4.5 在推理能力、知識準確度、多輪對話流暢度等關鍵指標上，已可與市場上最先進的付費模型一較高下。值得注意的是，他並未透露具體評測分數或基準測試數據，但「接近」一詞已為外界留下想像空間。

#### 背景脈絡：xAI 的快速崛起與多頭佈局

xAI 成立於 2023 年，相較 OpenAI 等先行者起步較晚，但馬斯克憑藉其對技術資源的調度能力，迅速推出 Grok 系列。從 Grok-1 到 Grok-2、Grok-3，每一代都以更快的迭代週期和獨特的「幽默模式」吸引關注。此次 Grok 4.5 的內部測試，結合 SpaceX 每月推出全新訓練模型的計畫，顯示 xAI 正嘗試打破業界「以季度或半年為單位更新模型」的慣例。此外，SpaceX 本身擁有龐大的運算基礎設施（例如自建的超級電腦集群），加上特斯拉的車載數據量，為模型訓練提供了獨特的資料優勢——這與其他 AI 公司依賴公開網際網路資料的做法截然不同。

#### 可能影響：對 AI 競賽與企業應用的衝擊

若 Grok 4.5 真能達到接近 Opus 的效能，將直接挑戰 OpenAI 的 GPT-4o、Anthropic 的 Claude Opus 等高階模型的市場地位。尤其馬斯克旗下公司擁有強烈的垂直整合能力：特斯拉需要即時、低延遲的邊緣運算模型，SpaceX 則對物理模擬與航天任務邏輯有高度要求。這意味著 Grok 4.5 不僅是對話式 AI，更可能被優化成特定領域的專用模型。對於一般用戶而言，一旦 xAI 開放 Grok 4.5 的付費訂閱或 API，用戶將有機會以更有競爭力的價格獲得頂級效能。然而，內部測試到正式發布通常需要數月時間，這段期間的穩定性與安全性驗證將是關鍵。

#### 讀者可關注的後續發展

接下來值得留意以下幾點：第一，xAI 是否會公布 Grok 4.5 的公開測試時間表或基準測試結果，例如在 MMLU、HumanEval 等常見評測上的成績。第二，SpaceX 每月推出的全新模型究竟應用於哪些任務——是針對星鏈網路的流量預測、火箭發射模擬，還是更前瞻的太空機器人控制？第三，特斯拉是否會將 Grok 4.5 整合進近期發表的 Cybertruck 或 Optimus 機器人中，進一步提升其自主決策能力。最後，由於馬斯克一向喜歡在社群平台（如 X）上「劇透」，讀者不妨追蹤他的動態，可能搶先獲得更多第一手消息。

#### 總結：xAI 正在改寫 AI 模型的開發節奏

從 Grok 4.5 的內部測試到 SpaceX 高頻次的模型產出，不難看出馬斯克正試圖用「硬體公司+AI」的雙軸策略，走出有別於傳統 AI 實驗室的路線。這種做法最大的優勢在於：模型訓練不再依賴理論研究，而是直接與真實世界的產品需求對接。然而，每月從零開始訓練全新模型也伴隨著巨大的運算成本與風險，一旦某個模型效能不如預期，可能導致 SpaceX 或特斯拉的部署延遲。不過，對於長期關注 AI 產業的台灣讀者來說，這無疑是一個觀察「邊緣 AI」與「實體世界 AI」如何落地的絕佳案例。未來幾個月，Grok 4.5 是否會從內部測試走向公眾，又將如何影響其他模型廠商的定價與功能策略，都值得持續追蹤。

原始來源：IT之家 ↗

查看原始來源

36氪自然語言處理

大神Karpathy用Claude的方式，原來是這樣的？

這篇消息聚焦「大神Karpathy用Claude的方式，原來是這樣的？」。原始導語提到：有了它，Claude終於不再和我對著幹。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

21 小時前閱讀分析

量子位自然語言處理

GPT-5.6突然發佈！Fable5痛失最強基模王座

這篇消息聚焦「GPT-5.6突然發佈！Fable5痛失最強基模王座」。原始導語提到：一口氣端出三款GPT 5.6系列模型從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 天前閱讀分析

36氪自然語言處理

英偉達MoE新開源：一行import，微調加速3.7倍

這篇消息聚焦「英偉達MoE新開源：一行import，微調加速3.7倍」。原始導語提到：兼容HuggingFace Transformers的API 從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 天前閱讀分析

AIBase自然語言處理

Mistral AI發佈OCR4 模型：支持 170 種語言，輸出質量超越GPT與Gemini

法國Mistral AI發佈文檔識別模型OCR 4，支持10個語族170種語言，在權威測試獲93.07分，輸出質量經人類評審優於GPT-5.5 Pro等競品。該模型小巧全面，覆蓋多場景任務，專精文檔識別。

2 天前4900閱讀分析

AIBase自然語言處理

法國 AI 初創企業 Mistral AI 發佈 OCR4模型:覆蓋170種語言，交互體驗更人性化

法國Mistral AI推出OCR4文檔識別模型，支持跨越10個語族的170種語言。該模型在OmniDocBench測試中獲93.07分，輸出準確自然，用戶體驗優於GPT5.5Pro和Gemini3.1Pro。

2 天前5400閱讀分析

AIBase自然語言處理

AI數據庫交互迎來里程碑：谷歌新模型Gemini-SQL2 刷新行業標杆

Google Research於6月12日發佈Gemini-SQL2模型，基於Gemini3.1Pro打造，專注於“文本轉SQL”任務，能精準將日常對話轉化為數據庫查詢指令，在權威評測中登頂，推動AI理解與處理數據庫查詢技術的突破。

1 週前閱讀分析

相關文章

大神Karpathy用Claude的方式，原來是這樣的？

GPT-5.6突然發佈！Fable5痛失最強基模王座

英偉達MoE新開源：一行import，微調加速3.7倍

Mistral AI發佈OCR4 模型：支持 170 種語言，輸出質量超越GPT與Gemini

法國 AI 初創企業 Mistral AI 發佈 OCR4模型:覆蓋170種語言，交互體驗更人性化

AI數據庫交互迎來里程碑：谷歌新模型Gemini-SQL2 刷新行業標杆