小米宣佈 MiMo-V2-Pro/Omni 將於2026年6月下線,全面切換 V2.5系列

2026年5月29日 08:019800 次瀏覽

重點摘要

小米宣佈將於2026年6月30日下線舊版MiMo-V2-Pro/Omni模型,升級至MiMo V2.5系列,其中mimo-v2-pro遷移至v2.5-pro,mimo-v2-omni升級為v2.5新模型。新版本已全面上線,旨在提供更強推理能力和更高性價比,推動開發者遷移。

站內 AI 整理稿

### 小米 AI 模型大翻新:MiMo-V2 系列將於 2026 年 6 月正式退役

小米近期宣布,旗下 MiMo(多模態模型)系列將迎來重大版本更迭。根據官方公告,現有的 **MiMo-V2-Pro 與 MiMo-V2-Omni** 兩款模型,預計將在 **2026 年 6 月 30 日** 正式下線,屆時所有舊版服務將停止運作。小米同步推出全新的 **MiMo V2.5 系列**,其中 V2-Pro 將遷移至 **V2.5-Pro**,而 V2-Omni 則升級為 **V2.5 新模型**。新版模型已全面上線,開發者即日起便可開始遷移作業。

### 重點整理:版本對應與時程細節

這次更新的核心是 **從 V2 系列無縫轉移至 V2.5 系列**。具體對應關係如下:原本的 `mimo-v2-pro` 模型會由 `v2.5-pro` 取代;`mimo-v2-omni` 則升級為全新的 `v2.5` 模型。小米明確給出 **2026 年 6 月 30 日** 作為舊版下線的截止日期,提醒開發者務必在此之前完成 API 或模型權重的切換。目前新版本已全面開放,開發者可透過小米 AI 平台直接調用,無需額外申請。

### 背景脈絡:小米 AI 模型的演進與布局

小米近年持續深耕 AI 領域,MiMo 系列是其針對多模態應用(圖像、文字、語音等)打造的主力模型。從最早的 V1 到 V2,再到如今的 V2.5,每一次升級都伴隨著推理能力與效率的顯著提升。此次 V2.5 系列被官方定位為「更強推理能力」與「更高性價比」的組合,反映小米在模型優化上的雙重目標:不僅要讓模型更聰明,還要讓開發者用得更划算。值得注意的是,V2.5 系列並非單純的補丁式更新,而是從底層架構到應用策略的全面調整,預示小米正試圖在競爭激烈的多模態模型市場中,以更精準的產品分層搶佔生態位。

### 可能影響:開發者生態與應用情境的轉變

對開發者而言,此次遷移可謂一次「不得不做」的升級。首先,舊版將在 2026 年中徹底關閉,若未及時切換,既有應用可能面臨服務中斷的風險。不過,新版提供的「更強推理能力」意味著開發者能在相同甚至更低成本下,獲得更好的生成品質與更快的回應速度,有助於提升終端用戶體驗。另一方面,V2.5 系列分為 Pro 與通用兩種規格,可能讓開發者更容易根據場景(如需要高精度推論的專業領域,或需要廣泛泛化的通用對話)挑選合適模型,從而降低不必要的算力浪費。

### 讀者可關注的後續:遷移進度與新功能測試

未來一年內,幾個關鍵面向值得留意。第一是 **遷移工具與文件支援**:小米是否會提供一鍵轉換或自動化測試工具,將直接影響開發者遷移的順暢度。第二是 **新模型的實際表現**:V2.5 系列在繁體中文、多輪對話、圖像理解等台灣常見應用場景中的成效,將是開發者評估是否值得投入的關鍵。第三是 **價格與配額調整**:若 V2.5 系列確實如官方所稱「性價比更高」,則可能帶動 API 調用價格下調,進一步刺激中小型團隊與獨立開發者採用。此外,後續小米是否會基於 V2.5 推出更進階的專屬模型(例如針對邊緣裝置的輕量版),也值得追蹤。

### 給台灣開發者的建議:把握緩衝期,逐步測試新模型

對於正在使用 MiMo-V2 系列的台灣開發者而言,現在正是評估與測試的最佳時機。建議從即日起,利用小米提供的測試環境,將部分流量導向 V2.5-Pro 或 V2.

Related

相關文章

MarkTechPost AI模型更新

Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages

This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather

16 分鐘前
MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

14 小時前

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前