AI 太燒錢!微軟選擇「倒戈」DeepSeek
重點摘要
Claude、GPT 不再獨佔 Copilot。 作者丨樊天驕、鄭佳美 編輯丨鄭佳美 這兩天,微軟連續釋放了兩條重磅消息。第一條來自產品層面。微軟宣佈 Copilot Cowork 在全球正式上線。這款能夠跨 Outlook、Teams、Excel 等應用自主執行任務的 AI Agent 系統將正式商用。據微軟披露,超過一半的《財富》500 強企業已經在預覽期進行了部署。第二條則來自商業模式層面。Copilot Cowork 將不再完全沿用每月 30 美元的固定訂閱模式,而是開始引入按使用量計費機制。幾乎在同一時間,Axios 又披露了一則消息:微軟正評估將 DeepSeek V4 引入 Copilot Cowork,作為低成本模型選項。如果最終落地,這將成為美國大型科技公司首次在核心企業級 AI 產品中引入中國大模型。這兩條消息似乎釋放出一個信號,即Agent 的普及正在讓 AI 的成本問題變得前所未有地突出。過去的聊天機器人更像一次性服務。用戶提問,模型回答,任務到此結束。而在 Agent 模式下,一個任務往往需要經歷任務拆解、數據檢索、工具調用、結果生成和反覆修正等多個環節。用戶看到的是一次任務交付,系統背後卻可能已經完成了數十次甚至上百次模型調用。當下的模型市場價格體系也在迅速拉開差距。從 Anthropic 高端模型每百萬 Token 數十美元的推理成本,到 DeepSeek V4 Flash 每百萬 Token 不足 0.3 美元,價格跨度已經達到數百倍。當任務量持續增長、模型價格不斷分化,企業需要解決的問題便不再是“選擇哪個模型”,而是“什麼任務應該使用什麼模型”。模型路由、成本控制和資源調度,也因此開始從後臺基礎設施問題,走向 AI 產品競爭的核心位置。01算力成本為何激增要理解微軟此次架構重構的必要性,首先需要看到一個正在發生的變化:Agent 正在改變
Claude、GPT 不再獨佔 Copilot。 作者丨樊天驕、鄭佳美 編輯丨鄭佳美 這兩天,微軟連續釋放了兩條重磅消息。第一條來自產品層面。微軟宣佈 Copilot Cowork 在全球正式上線。這款能夠跨 Outlook、Teams、Excel 等應用自主執行任務的 AI Agent 系統將正式商用。據微軟披露,超過一半的《財富》500 強企業已經在預覽期進行了部署。第二條則來自商業模式層面。Copilot Cowork 將不再完全沿用每月 30 美元的固定訂閱模式,而是開始引入按使用量計費機制。幾乎在同一時間,Axios 又披露了一則消息:微軟正評估將 DeepSeek V4 引入 Copilot Cowork,作為低成本模型選項。如果最終落地,這將成為美國大型科技公司首次在核心企業級 AI 產品中引入中國大模型。這兩條消息似乎釋放出一個信號,即Agent 的普及正在讓 AI 的成本問題變得前所未有地突出。過去的聊天機器人更像一次性服務。用戶提問,模型回答,任務到此結束。而在 Agent 模式下,一個任務往往需要經歷任務拆解、數據檢索、工具調用、結果生成和反覆修正等多個環節。用戶看到的是一次任務交付,系統背後卻可能已經完成了數十次甚至上百次模型調用。當下的模型市場價格體系也在迅速拉開差距。從 Anthropic 高端模型每百萬 Token 數十美元的推理成本,到 DeepSeek V4 Flash 每百萬 Token 不足 0.3 美元,價格跨度已經達到數百倍。當任務量持續增長、模型價格不斷分化,企業需要解決的問題便不再是“選擇哪個模型”,而是“什麼任務應該使用什麼模型”。模型路由、成本控制和資源調度,也因此開始從後臺基礎設施問題,走向 AI 產品競爭的核心位置。01算力成本為何激增要理解微軟此次架構重構的必要性,首先需要看到一個正在發生的變化:Agent 正在改變 AI 的成本結構。在傳統聊天式 AI 中,用戶發起一次請求,系統返回一次響應。而固定訂閱模式之所以能夠成立,本質上依賴於一種成本平均主義:即少數重度用戶所消耗的 token,會被大量低頻用戶的閒置額度所攤薄。雷峰網但 Agent 打破了這一平衡。以 Copilot Cowork 為代表的新一代 Agent 的工作模式已不再是單次問答工具,而是持續運行的任務執行系統。一次簡單的“整理客戶反饋並生成報告”,背後可能涉及任務拆解、企業數據檢索、工具調用、內容生成與多輪修訂等多個環節,對應數十次甚至上百次模型調用。微軟 Copilot 產品負責人 Aparna Chennapragada 透露,部分用戶每週會讓 Agent 執行數百項任務。在這種模式下,重度用戶的算力消耗可以達到普通聊天用戶的數百倍甚至上千倍。而這種變化已經反映在真實生產數據中。Vercel AI Gateway 的統計顯示,不足四分之一的請求包含工具調用,但卻貢獻了超過一半的 Token 消耗;與此同時,Agent 類請求的平均 Token 密度約為普通對話的 2.5 倍。換句話說,AI 成本不是均勻分佈的,而是高度集中了在少數複雜任務之中。除此之外,模型市場本身也在快速分層。雷峰網高端模型價格持續攀升。Anthropic Fable 5 的定價達到輸入 10 美元、輸出 50 美元/百萬 Token;而另一端,DeepSeek V4 Flash 的價格僅為輸入 0.14 美元、輸出 0.28 美元/百萬 Token。整個市場的輸出價格跨度已經達到約 180 倍,若按照部分場景價格計算,能力與成本之間的價差甚至超過 600 倍。這意味著企業面對的已經不再是用貴模型還是便宜模型的問題,而是一條覆蓋數百倍成本差異的能力光譜。如何讓不同複雜度的任務匹配不同成本層級的模型成為了一個新的工程問題:當算力成本從可預測變量演變為持續波動的結構性風險後,如何通過定價、路由和架構設計,讓它重新回到可管理、可控制的範圍之內。02350 倍價差,模型光譜如何生效面對 Agent 帶來的成本失控風險,微軟進行了一次圍繞計費、觀測與調度的系統性重構。最先被改變的是定價邏輯。在新的 Copilot Cowork 體系中,用戶仍需支付 Microsoft 365 Copilot 的基礎訂閱費用,但 Agent 的額外消耗將按照實際資源使用情況單獨計費。微軟將任務成本拆解為模型調用、上下文檢索、工具使用和運行時長四個維度,並提供按需付費(PAYG)與預購套餐(P3)兩種模式。通過基礎訂閱覆蓋穩定需求,按量計費則對應 Agent 帶來的增量消耗。固定訂閱模式的問題在於,由於價格統一,用戶無法感知價格背後的資源消耗;而純按量計費則會放大預算不確定性,增加企業採用門檻。當模型調用、工具使用和運行時長被拆解為可量化指標後,算力第一次從後臺資源變成了可以被觀察、管理和優化的經營成本。但成本被看見之後,一個新的問題隨之浮現:這些預算應該如何分配?一端是 GPT、Claude 等高端模型持續突破能力邊界,另一端則是 DeepSeek 等開源模型不斷壓縮推理成本。從旗艦模型到低成本模型,價格跨度達數百倍,但模型能力的差距卻遠沒有價格差距那樣誇張。一味購入旗艦模型未必是一個盈利的選擇,大量辦公、檢索和流程自動化這樣的場景下,性能提升帶來的邊際收益,往往不足以支撐數倍甚至數十倍的成本增長。微軟推動模型分層路由,本質上正是在順應這一變化。對於複雜任務,系統調用 GPT 或 Claude 等旗艦模型;對於常規工作流,則優先使用 DeepSeek 或自研模型;而路由系統負責在質量、成本與響應速度之間尋找最優解。這也是納德拉近年來反覆強調多模型生態的原因。Azure AI Foundry 已經集成 GPT、Claude、Gemini、DeepSeek 等多個模型體系,而即將推出的 Cowork 1,則進一步補全了微軟在低成本辦公場景中的能力佈局。從這個角度看,微軟正在構建的並不是一個由單一模型驅動的 Agent 平臺,而是一套面向 Agent 時代的智能調度系統。當模型能力逐漸趨同之後,競爭焦點也將隨之轉移:決定企業優勢的,或許不再是誰擁有最強模型,而是誰能夠以最低成本,將最合適的模型部署到最合適的任務之中。03降本後的質量問題成本控制,只是第一步。降低成本後的質量問題才是這套體系穩定運行的關鍵。對於任何企業級 AI 產品而言,降本的前提始終是質量能夠滿足實際業務需求。如果低成本模型無法完成工作,那麼再低的價格也沒有意義。所以,在將 DeepSeek V4 引入 Copilot Cowork 的同時,微軟也在構建一套與成本控制並行的質量保障體系。首先,對於微軟來說 DeepSeek 並非默認模型,而是作為可選方案存在。對於高複雜度任務,企業仍然可以選擇 Claude 等旗艦模型。這意味著微軟並沒有試圖用低成本模型替代所有模型,而是在不同能力層級之間建立分工。 Copilot Cowork的模型選擇界面其次,DeepSeek V4 完全部署在 Azure 雲環境中,數據始終留存在微軟基礎設施內部,受到企業級安全、合規與數據駐留策略保護。對於企業客戶而言,這種託管方式的重要性不亞於模型能力本身。更重要的是,微軟針對企業場景進行了額外的安全對齊與偏見治理微調(fine-tuning with safeguards against bias),確保模型輸出符合企業級應用標準。這些措施背後反映出一個越來越清晰的行業判斷:並非所有任務都需要最頂級的大模型能力。對於文檔整理、信息檢索、代碼補全和流程自動化等高頻辦公場景而言,經過針對性優化的開源模型已經能夠達到“足夠好”的水平。而真正昂貴的旗艦模型,則被保留給複雜推理、關鍵決策以及高風險業務場景。這也是 Cowork 1 的定位邏輯。微軟將其描述為“post-trained to handle tasks at a substantially lower cost”,即通過後訓練讓模型以更低成本完成特定任務。這其實是對大模型資源的重新配置:讓針對辦公場景優化的模型處理辦公場景任務,讓最昂貴的算力資源只服務於真正需要高階智能的場景。04成本競賽,正在取代模型競賽過去兩年,大模型行業的主流敘事仍然是“模型能力競賽”——誰更強、誰分數更高、誰率先突破能力邊界;而到了 2026 年,競爭重心正在悄然轉向另一條軌道:成本工程化能力。微軟對 Copilot Cowork 的重構之所以具有行業意義,在於它代表了一類大廠正在形成的共識:當 AI 從“可選工具”演化為持續運行的 Agent 系統後,企業必須同時管理三件事——模型能力、算力成本與系統調度能力。從這一點看,微軟所構建的路徑,可能正在成為未來大廠的標準範式:通過定價機制讓成本顯性化,通過模型分層壓縮平均推理成本,通過多模型生態分散供應鏈風險,再通過路由與抽象層實現系統級調度,使 AI 架構從“模型中心化”走向“系統工程化”。這一趨勢也已經開始在企業側顯現。AT&T、Meta、Uber、沃爾瑪等公司正在逐步限制員工 AI 使用強度,從鼓勵“最大化使用”轉向主動控制 token 消耗。這更像是一種工業化階段的必然結果——當成本曲線開始反向約束技術擴張時,工程能力就會取代模型能力,成為新的核心競爭力。或許,從Tokenmaxxing到Tokenminimizing,AI 的下半場競爭不再是誰的模型更強,而是誰能夠在可控成本下,持續釋放更高的系統效能。參考鏈接:https://vercel.com/blog/ai-gateway-production-index-june-2026?上車,帶你看遍全球 AI 頂會精華可獨家暢覽:專家演講PPT大會報告全文熱門論文解讀學術新星訪談掃描上方二維碼或點擊「閱讀原文」關注專區。
Related
相關文章

Claude下一代神級模型秘密出爐,Sonnet-5被曝下週上線
這篇消息聚焦「Claude下一代神級模型秘密出爐,Sonnet-5被曝下週上線」。原始導語提到:封禁,反而讓Anthropic更快了? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
LiblibAI 母公司完成近 3 億美元融資:AI 應用層開始進入「收入說話」的階段
演語科技,正在成為這一輪變化中最值得觀察的中國樣本之一。 作者丨鄭佳美 編輯丨馬曉寧 AI 應用公司的競爭,正在發生變化。過去兩年,行業最關心的是誰能率先做出令人眼前一亮的產品,誰能更快抓住大模型帶來的流量紅利。但到了 2026 年,問題開始變得更現實:用戶會不會持續使用?客戶願不願意付費?一家公司能不能從單個產品,長成一個真正有收入、有生態、有複利的業務體系?演語科技(Evoken)最近完成的這輪融資,正好提供了一個觀察窗口。近日,演語科技正式對外披露近 3 億美元 B+ 輪融資。該輪融資實際已於今年上半年早些時候完成,投後估值超過 20 億美元。本輪融資由 Granite Asia、騰訊、順為資本聯合領投,HT Investment、時代資本共同參與投資。高榕資本、螞蟻集團、渶策資本、明勢創投、源碼資本、紅杉中國以及其他數家知名投資機構等現有股東持續加碼支持。這也是目前國內 AI 應用層金額最大的單輪融資之一。但相比融資金額本身,更值得注意的是,這家公司已經不再只是講一個“AI 產品”的故事。演語科技正在把 LiblibAI、LibTV、星流等業務整合到同一個更大的敘事裡:圍繞 AI 創意內容生產,構建一個從社區、素材、視頻到設計 Agent 的應用矩陣。這也是演語科技首次以集團品牌 Evoken 統一對外發聲的重要背景。01AI 應用層到了拼商業化的時候過去一段時間,AI 行業的焦點大多集中在模型公司身上。誰的模型能力更強,誰的生成效果更好,誰能把成本降下來,往往決定了外界對一家公司的想象空間。但應用層的邏輯並不完全一樣。應用公司最終要回答的問題,不只是“能不能生成”,而是“生成之後是否真的進入了生產流程”。一個 AI 產品如果只是被用戶嚐鮮,它很難形成長期價值。但如果它進入設計師、短劇團隊、廣告公司、品牌方和影視製作機構的日常工作流,就意味著 AI 不再只是工具,而
Claude Code 修了幾個小 bug,卻揭開了 Agent 落地的大麻煩
工具狀態、權限邊界和後臺任務,正在成為 AI 編程產品的新考驗。 作者丨鄭佳美 編輯丨馬曉寧 剛剛,Anthropic 給 Claude Code 發了一次看起來並不起眼的更新。沒有新模型,沒有新的 benchmark,也沒有代碼能力提升多少的宣傳。Claude Code 2.1.179 的 changelog 裡,主要是一些細碎的 bug fix:連接中斷後保留 partial response,工具執行的 spinner 不再卡住,Linux sandbox 裡的 denyRead / allowRead glob 不再把 Bash tool description 撐到巨大,遠程 session 裡的後臺任務也不會在多個 turn 之間一直顯示 still running。如果只看字面,這些都像是產品使用過程中的小毛病。但放在 AI 編程產品的演進裡,它們其實指向同一個變化:Claude Code 這樣一類 coding agent,已經不只是“幫你寫代碼的聊天框”,而是在變成一個真正替你執行任務的系統。雷峰網過去我們討論 AI 編程產品,最常看的還是模型能力。誰的代碼生成更強,誰能理解更長的上下文,誰在 SWE-bench 上拿到更高分,誰能一次性給出更完整的修復方案。這些當然重要,但它們主要回答的是一個問題:模型夠不夠聰明。而 Claude Code 這次修的幾個問題,回答的是另一個問題:當模型真的開始替用戶幹活,外層系統能不能穩定地把這件事做完。雷峰網01Bug 之外 ,是 Agent 落地的執行問題傳統聊天機器人主要是在“回答”。用戶問一句,它回一句。即使回答中途斷了,或者內容不夠完整,通常也只是重新生成一次。但 coding agent 面對的是另一種任務。用戶不是問“這段代碼是什麼意思”,而是讓它“幫我修這個 bug”“跑一下測試”“把這個模塊重構掉”“看
從代碼到產線:恩和發佈 BPL 協議語言,定義生物製造的“工業級編譯器”
雷峰網訊。近日,恩和科技在《bioRxiv》發佈Biology Protocol Language(BPL)及其生成管線BPL-COGEN,首次為生物實驗協議建立了一套形式化的語言體系,打通了Physical AI進入物理世界的標準接口。BPL是專為生物實驗協議設計的可編譯、可驗證的形式化語言。BPL-COGEN把自然語言協議自動翻譯為BPL程序,由一個300億參數微調大語言模型與確定性編譯器構成“生成—驗證—修復”閉環。在基於300篇《Nature Protocols》論文的基準測試中,BPL-COGEN實現95.1%的首輪一致性,通過2輪編譯-仿真閉環將正確率推進至98.6%。目前,相關代碼已在GitLab完全開源(MIT License)。AI已會“思考”,但還不會“動手”當前,AI已經能在數字世界生成假設與設計實驗。材料科學領域已經出現自主驅動的Self-driving Lab。但在生物學領域,無論上游AI多麼強大,其輸出最終仍須被翻譯為物理操作,而這一過程,至今仍依賴自然語言文本這是一個半導體和軟件行業幾十年前就已跨越的問題。半導體設計通過Verilog和VHDL完成了從自然語言向硬件描述語言的躍遷,軟件工程通過類型化語言確立了可驗證的穩定性。生物學一直缺少與之對應的、具備編譯器驗證能力的底層語言,這正是當前AI驅動實驗設計與可復現物理執行之間的速率限制環節。代價是清晰的。《Nature》在2016年針對1,576名研究者的調查顯示,超過70%的人無法復現他人實驗,超過一半的人無法復現自己的實驗(Baker, *Nature*, 2016)。恩和團隊的論文進一步將問題歸納為三個維度:協議精確度。典型指令中常隱藏濃度、時間、體積等多處未明分支點。幾十條此類指令疊加,使實驗可復現性完全依賴於人員的經驗補全。協議驗證。自然語言缺乏在執行前模擬物理一致性的機制,內部邏輯錯
Snap分拆生成式AI視頻團隊成立新公司Dotmo 緩解高昂研發成本壓力
Snap因內部生成式AI成本高昂,將AI視頻團隊分拆為獨立公司Dotmo,以減輕財務壓力並提升運營靈活性。新公司專注開發可生成互動遊戲體驗的AI模型,核心團隊由Snap離職員工組成。Dotmo雖架構獨立,但與Snap仍保持緊密的資本和技術紐帶。
視覺盛宴接入 AI:Getty Images 與 OpenAI 達成戰略授權合作
Getty Images與OpenAI達成合作,將龐大授權圖片庫接入ChatGPT,為用戶搜索提供視覺化內容支持。作為全球視覺素材巨頭,Getty此前已與英偉達在生成式AI領域佈局,此次合作進一步深化其AI賦能戰略。