騰訊雲 DeepSeek-V3.2 模型 7 月 16 日下線，官方建議用戶遷移至 V4 系列

2026年6月16日 17:25

重點摘要

根據調整規劃，原知識引擎原子能力平臺和大模型服務平臺 TokenHub 的 DeepSeek-V3.2 模型將於北京時間 2026 年 7 月 16 日 00:00 起正式下線，屆時不再提供上述模型的接入服務。推薦遷移至能力更優的 DeepSeek-V4 系列模型。

站內 AI 整理稿

### 重點整理

騰訊雲近日公告，旗下的 DeepSeek-V3.2 模型將於 2026 年 7 月 16 日零時起正式下線，屆時知識引擎原子能力平臺與 TokenHub 大模型服務平臺將不再提供該模型的接入服務。官方同步建議現有用戶儘早規劃，將應用遷移至效能更優的 DeepSeek-V4 系列模型。這項調整屬於產品生命週期的常態更新，對於正在使用 V3.2 的開發者與企業用戶，需密切注意時間節點，避免服務中斷。

### 背景脈絡

DeepSeek 是騰訊雲推出的大語言模型系列，自問世以來歷經多次版本迭代。V3.2 作為該系列的中期版本，曾在特定應用場景中展現出不錯的理解與生成能力，並透過騰訊雲的兩大服務管道提供給開發者：一個是專注於知識萃取與原子能力的「知識引擎原子能力平臺」；另一個是整合多種模型並提供統一身分驗證與計費的「TokenHub」。隨著大模型技術快速演進，騰訊雲選擇在 2026 年中將 V3.2 退役，並引導用戶轉向最新的 V4 系列。此舉反映雲端 AI 服務的常見策略——透過版本迭代來提升競爭力，並簡化維護成本。

### 可能影響

這項政策首先會直接影響到仍在依賴 DeepSeek-V3.2 的既有用戶。若未能及時遷移，其應用程式在 2026 年 7 月 16 日後將無法呼叫該模型，可能導致服務中斷或功能失效。對於那些將 V3.2 深度整合在流程中的企業，遷移過程需要重新測試、調整提示詞（prompt）與回應格式，短期內會增加開發資源的投入。另一方面，轉移至 V4 系列雖然可能帶來更佳的推理能力與更低的延遲，但若新版模型在部分任務上的行為與 V3.2 有顯著差異，使用者也需要重新驗證其準確性與安全性。此外，定價結構若有變動，也會影響後續的營運成本。

### V4 系列的潛在優勢

雖然官方公告中僅簡短提及「能力更優」，未具體說明 V4 系列與 V3.2 的差異，但從常見的大模型升級方向推測，新版模型可能在多輪對話連貫性、長文本理解、代碼生成準確率以及多模態（若適用）等方面有所精進。騰訊雲通常會同步更新 API 文件、提供遷移工具與對照指南，以降低用戶轉換門檻。V4 系列也可能引入更彈性的參數調整選項，讓開發者能根據應用場景微調模型行為。實際效能如何，仍需等待官方釋出更完整的評測報告或社群分享。

### 讀者可關注的後續

首先，DeepSeek-V3.2 的使用者應立即確認當前應用的呼叫方式，並記錄模型所使用的參數設定與輸出範例，作為後續比對的基準。其次，密切留意騰訊雲後續發布的遷移指引、相容性說明以及可能提供的免費試用額度，常見的做法是開放一段時間的並行使用期，讓新版與舊版模型能同時測試。第三，可關注 V4 系列的定價公告與服務等級協議（SLA），評估是否需調整用量預算。最後，若有社群論壇或官方技術支援群組，可以先參與討論，了解其他用戶在遷移時遇到的問題與解決方案，從而提前規畫測試時程。

### 長期觀察重點

這件事情也反映出大模型服務市場的競爭節奏：模型迭代週期逐漸縮短，雲端平台必須定期淘汰舊版以集中資源開發新技術。對於企業用戶而言，模型的連續性與穩定性變得更加重要，未來在選擇雲端 AI 服務時，除了關注模型當下能力，也應留意平台對舊版模型的支援年限與遷移政策。此外，DeepSeek 系列作為騰訊雲自研模型，其 V4 版本能否在中文理解、知識問答與場景適配等面向保持競爭力，也將影響後續其他廠商的策略布局。總而言之，即早規劃、保持對官方公告的敏感度，是避免服務中斷的關鍵。

原始來源：IT之家 ↗

查看原始來源

MarkTechPost AI模型更新

Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages

This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather

12 分鐘前閱讀分析

MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

14 小時前閱讀分析

36氪模型更新

智譜新高，MiniMax承壓，“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高，MiniMax承壓，“大模型雙雄”命運殊途」。原始導語提到：大模型在被市場重新定價從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前閱讀分析

IT之家模型更新

華為昇騰 0 Day 支持智譜 GLM-5.2 模型，提供全面推理優化

華為昇騰 AI 宣佈在智譜開源 GLM-5.2 大模型當天即完成深度推理優化。通過 MOE 大融合算子、通信計算融合、高併發調度等七項關鍵技術，顯著提升編程和長程任務的處理效率，現已支持 A3 系列產品部署。#AI 大模型# #國產算力#

23 小時前閱讀分析

AIBase模型更新

企業AI轉型再添利器：青雲科技算力雲接入 MiniMax-M3 模型

企業AI落地面臨高效低成本難題。青雲科技旗下基石智算平臺接入國產開源大模型MiniMax-M3，提供新算力支持。MiniMax-M3以卓越上下文處理能力等三大核心技術見長，依託自研架構，助企業便捷部署AI業務。

1 天前7000閱讀分析

AIBase模型更新

阿里開源統一科學大模型 LOGOS，僅用五十六分之一參數超越微軟

阿里 ATH-Token Foundry 聯閤中國人民大學高瓴人工智能學院開源科學基礎模型 LOGOS。該模型採用統一科學語法與純序列建模範式，在六大科學任務上匹配或超越傳統專用方法。其中 LOGOS-1B 僅 1B 參數，即展現出極高效率，性能超越參數量達 8×7B 的微軟模型。

1 天前9300閱讀分析

相關文章