微軟也燒不起 Token ，該 DeepSeek 上位了

2026年6月22日 08:57

重點摘要

這篇消息聚焦「微軟也燒不起 Token ，該 DeepSeek 上位了」。原始導語提到：免費又無限的 AI 蜜月期，正在結束從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

### 微軟也燒不起 Token，該 DeepSeek 上位了

「免費又無限的 AI 蜜月期，正在結束。」這句來自 36氪的簡短觀察，點出了當前人工智慧產業最敏感的神經。當全球科技巨頭還在為大型語言模型的訓練與推理成本焦頭爛額時，市場卻悄悄傳出一個訊號：就連微軟這樣的雲端霸主，也開始感受到 token 費用帶來的壓力。與此同時，中國新創公司 DeepSeek 正憑藉更高效的架構與極具競爭力的成本，逐漸站上舞台中央。這不是單純的技術競賽，而是一場關於商業模式與資源分配的根本性轉變。

### 重點整理：AI 成本壓力與新玩家的崛起

核心議題在於，過去兩年 AI 業界慣用的「免費餵養」策略，已難以為繼。大型模型每次回應都需要消耗大量運算資源，每一筆 token 的生成都代表著電費、GPU 租用與資料中心的實際支出。即便微軟擁有 Azure 的規模優勢，也無法無止盡地補貼使用者免費體驗。DeepSeek 則透過更精簡的模型架構與訓練技巧，大幅降低了單位 token 的成本，使它在提供相近品質服務的同時，擁有更健康的經濟模型。這意味著，誰能控制成本，誰就能在下一階段的 AI 普及戰中取得先機。

### 背景脈絡：從「軍備競賽」到「精算競賽」

過去兩年，OpenAI、Google 與微軟的焦點都放在「誰的模型更大、誰的參數更多」，這是一場典型的軍備競賽。然而隨著市場逐漸理性，投資人與企業客戶開始追問：這些巨量的算力投入，究竟能轉化為多少實質營收？微軟的 Copilot 服務雖然帶動了 Office 365 的升級，但背後高昂的推理成本始終是財報裡的隱憂。對比之下，DeepSeek 選擇了一條不同的路徑：不追求參數量的極限，而是透過架構創新（例如混合專家模型與資料效率最佳化）來達成「夠用且便宜」的目標。這讓它得以避開與巨頭正面對決，轉而服務那些對成本敏感的長尾需求。

### 可能影響：AI 收費模式將全面改寫

當微這類巨頭都開始喊「燒不起」，最直接的影響就是消費級 AI 服務的收費趨勢。過去使用者習慣的免費無限對話、無限制圖片生成，很可能逐一轉為訂閱制或用量計費。這對一般用戶與中小企業來說，無疑是增加了使用門檻。但另一方面，DeepSeek 這類低成本的替代方案反而會加速普及——只要效能落差在可接受範圍內，企業會更願意轉向更便宜的選項。此外，晶片製造商也必須重新評估需求：如果高效能但昂貴的 H100 不再是唯一的解答，那麼更多針對低成本推論設計的專用晶片將迎來機會。

### 讀者可關注的後續：DeepSeek 的商業化進程與巨頭的反應

接下來有幾個值得追蹤的發展。第一，DeepSeek 是否會推出正式的企業級 API 方案，以及它的定價策略能否真正威脅到 OpenAI 與 Azure OpenAI 服務。第二，微軟可能會採取雙重策略：一方面調整 Copilot 的免費額度，另一方面投資或採用類似 DeepSeek 的輕量化技術來降低成本。第三，這場「成本戰」可能會促使監管機構關注 AI 產業的資源集中問題——如果只有少數巨型企業養得起最先進模型，市場競爭力是否會失衡？最後，對一般使用者而言，最好的因應方式就是養成「比較不同 AI 服務」的習慣，不再死守單一平台，因為未來的 AI 世界，將不再是強者恆強，而是省者生存。

原始來源：36氪 ↗

查看原始來源

36氪模型更新

Fable 5準備復活？Anthropic聯創：我們徹底低估了Scaling

{"id":"76e8a120-147d-400f-8380-d1ee13ed9f43","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":138,"output_tokens":200,"total_tokens":338}}

剛剛閱讀分析

36氪模型更新

具身賽道現狀素描：腦子靈，模型好，不是百億，就是獨角

{"id":"5a7f2f9c-e426-4e79-a648-8e0c13ad4b2e","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":157,"output_tokens":1400,"total_to...

13 小時前閱讀分析

量子位模型更新

擼貓擼出SOTA！3個00後2個月，造出史上最快流式音視頻社交模型

## 三個00後兩個月打造「擼貓級」模型！速度狂甩Veo 3，成本僅1/2000 近期AI界傳來一則令人振奮的消息：三位年僅19～23歲的開發者，僅用兩個月時間，便自主研發出一款流式音視頻社交模型，並在關鍵指標上宣稱達到業界頂尖水準（SOTA）。據報導，這款模型在推理速度上比Google的Veo 3快上7倍，而訓練與部署成本更只有Veo 3的二千分之一。

1 天前閱讀分析

IT之家模型更新

LM Studio 與蘋果合作，成功用四臺 Mac Studio 運行萬億參數 Kimi K2.6 大模型

在 WWDC 2026 上，LM Studio 與蘋果合作，成功在由四臺 Mac Studio 組成的集群上本地運行了月之暗面發佈的萬億參數模型 Kimi K2.6。演示通過蘋果的內存共享技術，實現了約 1.5TB 的統一內存容量，並展示了通過 LM Link 從 MacBook Neo 和 iPhone 進行安全遠程訪問的能力。 #AI #蘋果 WWDC #本地部署

1 天前閱讀分析