微軟也燒不起 Token ,該 DeepSeek 上位了

重點摘要
這篇消息聚焦「微軟也燒不起 Token ,該 DeepSeek 上位了」。原始導語提到:免費又無限的 AI 蜜月期,正在結束 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
### 微軟也燒不起 Token,該 DeepSeek 上位了
「免費又無限的 AI 蜜月期,正在結束。」這句來自 36氪的簡短觀察,點出了當前人工智慧產業最敏感的神經。當全球科技巨頭還在為大型語言模型的訓練與推理成本焦頭爛額時,市場卻悄悄傳出一個訊號:就連微軟這樣的雲端霸主,也開始感受到 token 費用帶來的壓力。與此同時,中國新創公司 DeepSeek 正憑藉更高效的架構與極具競爭力的成本,逐漸站上舞台中央。這不是單純的技術競賽,而是一場關於商業模式與資源分配的根本性轉變。
### 重點整理:AI 成本壓力與新玩家的崛起
核心議題在於,過去兩年 AI 業界慣用的「免費餵養」策略,已難以為繼。大型模型每次回應都需要消耗大量運算資源,每一筆 token 的生成都代表著電費、GPU 租用與資料中心的實際支出。即便微軟擁有 Azure 的規模優勢,也無法無止盡地補貼使用者免費體驗。DeepSeek 則透過更精簡的模型架構與訓練技巧,大幅降低了單位 token 的成本,使它在提供相近品質服務的同時,擁有更健康的經濟模型。這意味著,誰能控制成本,誰就能在下一階段的 AI 普及戰中取得先機。
### 背景脈絡:從「軍備競賽」到「精算競賽」
過去兩年,OpenAI、Google 與微軟的焦點都放在「誰的模型更大、誰的參數更多」,這是一場典型的軍備競賽。然而隨著市場逐漸理性,投資人與企業客戶開始追問:這些巨量的算力投入,究竟能轉化為多少實質營收?微軟的 Copilot 服務雖然帶動了 Office 365 的升級,但背後高昂的推理成本始終是財報裡的隱憂。對比之下,DeepSeek 選擇了一條不同的路徑:不追求參數量的極限,而是透過架構創新(例如混合專家模型與資料效率最佳化)來達成「夠用且便宜」的目標。這讓它得以避開與巨頭正面對決,轉而服務那些對成本敏感的長尾需求。
### 可能影響:AI 收費模式將全面改寫
當微這類巨頭都開始喊「燒不起」,最直接的影響就是消費級 AI 服務的收費趨勢。過去使用者習慣的免費無限對話、無限制圖片生成,很可能逐一轉為訂閱制或用量計費。這對一般用戶與中小企業來說,無疑是增加了使用門檻。但另一方面,DeepSeek 這類低成本的替代方案反而會加速普及——只要效能落差在可接受範圍內,企業會更願意轉向更便宜的選項。此外,晶片製造商也必須重新評估需求:如果高效能但昂貴的 H100 不再是唯一的解答,那麼更多針對低成本推論設計的專用晶片將迎來機會。
### 讀者可關注的後續:DeepSeek 的商業化進程與巨頭的反應
接下來有幾個值得追蹤的發展。第一,DeepSeek 是否會推出正式的企業級 API 方案,以及它的定價策略能否真正威脅到 OpenAI 與 Azure OpenAI 服務。第二,微軟可能會採取雙重策略:一方面調整 Copilot 的免費額度,另一方面投資或採用類似 DeepSeek 的輕量化技術來降低成本。第三,這場「成本戰」可能會促使監管機構關注 AI 產業的資源集中問題——如果只有少數巨型企業養得起最先進模型,市場競爭力是否會失衡?最後,對一般使用者而言,最好的因應方式就是養成「比較不同 AI 服務」的習慣,不再死守單一平台,因為未來的 AI 世界,將不再是強者恆強,而是省者生存。
Related
相關文章

Fable 5準備復活?Anthropic聯創:我們徹底低估了Scaling
{"id":"76e8a120-147d-400f-8380-d1ee13ed9f43","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":138,"output_tokens":200,"total_tokens":338}}

具身賽道現狀素描:腦子靈,模型好,不是百億,就是獨角
{"id":"5a7f2f9c-e426-4e79-a648-8e0c13ad4b2e","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":157,"output_tokens":1400,"total_to...

擼貓擼出SOTA!3個00後2個月,造出史上最快流式音視頻社交模型
## 三個00後兩個月打造「擼貓級」模型!速度狂甩Veo 3,成本僅1/2000 近期AI界傳來一則令人振奮的消息:三位年僅19~23歲的開發者,僅用兩個月時間,便自主研發出一款流式音視頻社交模型,並在關鍵指標上宣稱達到業界頂尖水準(SOTA)。據報導,這款模型在推理速度上比Google的Veo 3快上7倍,而訓練與部署成本更只有Veo 3的二千分之一。

LM Studio 與蘋果合作,成功用四臺 Mac Studio 運行萬億參數 Kimi K2.6 大模型
在 WWDC 2026 上,LM Studio 與蘋果合作,成功在由四臺 Mac Studio 組成的集群上本地運行了月之暗面發佈的萬億參數模型 Kimi K2.6。演示通過蘋果的內存共享技術,實現了約 1.5TB 的統一內存容量,並展示了通過 LM Link 從 MacBook Neo 和 iPhone 進行安全遠程訪問的能力。 #AI #蘋果 WWDC #本地部署

OpenAI 最強 AI 模型:GPT-5.6 系列有望下週登場,生成 Win11 SVG 測試優於 Claude Mythos
科技媒體 testingcatalog 昨日(6 月 19 日)發佈博文,報道稱 OpenAI 有望下週推出 GPT-5.6 系列模型,涵蓋 mini、標準版以及 Pro 版。

智譜創始人唐傑隔空對話馬斯克:趕超Claude Fable 5不用等到2027年
這篇消息聚焦「智譜創始人唐傑隔空對話馬斯克:趕超Claude Fable 5不用等到2027年」。原始導語提到:重新校準中美大模型能力的時間差 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。