MiniMax 因新模型計費模式變更致歉:承認溝通不足,公佈老用戶補償與退款方案
重點摘要
稀宇科技(MiniMax)推出新一代旗艦模型MiniMax-M3時,將按次計費改為按Token消耗量計費,未提前充分溝通。由於Token消耗遠超預期,導致重度用戶額度快速耗盡,引發開發者強烈不滿。6月2日晚,MiniMax發佈致歉聲明,承認溝通不足。
## 新模型計費轉向Token制引爆反彈:MiniMax火速致歉,老用戶補償方案出爐
中國人工智慧新創公司稀宇科技(MiniMax)近日陷入一場風暴。該公司在推出新一代旗艦模型「MiniMax-M3」時,未經充分預告便將原本的「按次計費」模式,改為以「Token消耗量」計價。這項變動導致許多重度使用者發現自己的帳戶額度在短時間內被大幅耗盡,引發開發者社群強烈不滿。6月2日晚間,MiniMax終於打破沉默,正式發布致歉聲明,坦承「溝通不足」,並公布對老用戶的補償與退款方案。
## 計費邏輯驟變:從「每次呼叫」到「每顆Token」
過去,許多開發者習慣以「API呼叫次數」來估算成本,也就是每發送一次請求就扣除一次額度。然而MiniMax-M3導入的Token計費制,改為依據模型處理的輸入與輸出文字長度收費——每一千個Token(約750個中文字)對應一個價格。問題在於,新模型的Token消耗量遠超預期:同樣一段對話,在舊模式下可能只算一次呼叫,但在Token制下,若上下文長度較長或生成內容豐富,額度會以倍數速度流失。不少重度用戶反映,原本足以支撐數千次呼叫的點數,換到新模型後竟在數小時內歸零,開發與測試工作被迫中斷。
## 溝通斷層引爆怒火:MiniMax坦承「事先未充分說明」
這起事件的核心爭議,在於MiniMax推出新模型的同時,並未提前以顯著方式告知計費規則將徹底翻新。許多開發者是實際發現餘額異常下降後,才回頭查閱公告,驚覺計費邏輯已變。部分社群平台隨即湧現批評聲浪,認為這不僅影響既有專案的營運成本,更破壞了平台與開發者之間的信任。MiniMax在6月2日晚間的致歉聲明中,承認「新一代模型推出時,未能提前充分溝通計費模式的調整」,並向受影響用戶表達歉意。這份聲明也被外界解讀為該公司試圖在第一時間止血,避免更多開發者轉移至其他AI模型供應商。
## 老用戶補償與退款方案:如何挽回流失信任?
根據MiniMax公布的補救措施,針對新計費模式上路後遭受損失的既有客戶,公司將提供額度補償與彈性退款管道。具體而言,凡是新舊計費轉換期間因Token消耗過快而導致服務中斷的帳號,可透過客服申請退回超額扣除的點數;另外,所有在變更生效前即訂閱服務的老用戶,將額外獲得一組免費的API調用額度,以緩解轉換期的衝擊。不過,補償細節仍引發部分開發者討論:有人認為應全面恢復舊計費模式至少一段過渡期,而非僅以「補點數」方式處理;也有人肯定MiniMax願意快速認錯並提供具體補償,在中國AI模型市場激烈競爭中,這樣的危機處理速度仍屬少見。
## 對開發者生態與產業競爭的潛在影響
從更廣的產業視角來看,這起事件凸顯了AI模型商業化過程中的一個尖銳矛盾:模型效能提升往往伴隨著更複雜的運算與更長的上下文處理,而Token計費雖是國際主流(如OpenAI、Anthropic均採用),但供應商在轉換收費邏輯時,必須提供足夠的試算工具與溝通預告。MiniMax的案例顯示,即便是技術成熟的團隊,若忽略使用者的既有習慣與成本預期,仍可能引發大規模反彈。另一方面,此事件也可能促使其他中國AI業者重新檢視自己的計費調整流程,避免踩到同樣的地雷。對於重度依賴API的開發者而言,未來選擇模型時,除了比較價格與效能,「供應商對計費變更的溝通透明程度」可能也將成為關鍵評估指標。
## 讀者可關注的後續發展
接下來值得觀察的方向有三:第一,MiniMax的補償方案能否真正平息開發者的怒火,還是會有更多用戶要求全面恢復舊制一段緩衝期?第二,該公司是否會進一步公開Token消耗量的試算範例,或推出預估消耗量的小工具,幫助開發者避免再發生額度暴衝?第三,競爭對手如智譜AI、阿里通義千問、百度文心一言等,是否會藉此機會推出更具吸引力的計費方案或轉換優惠,搶奪MiniMax流失的開發者。建議正在使用或考慮導入MiniMax-M3的台灣開發者與企業,密切關注官方後續的技術文件更新與補償申請期限,並在完成成本評估前,暫時以較小規模的測試流量來驗證實際Token消耗量,避免再次發生額度意外耗盡的狀況。
我们根据用户要求,写一篇原创整理稿。标题:MiniMax 因新模型计费模式变更致歉。内容需要包含重点整理、背景脉络、可能影响、读者可关注后续。用台湾常用繁体中文,5-8段,至少500字。不要逐字复制,用自己的话写。
Related
相關文章
Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages
This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather
Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight
Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途
這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

華為昇騰 0 Day 支持智譜 GLM-5.2 模型,提供全面推理優化
華為昇騰 AI 宣佈在智譜開源 GLM-5.2 大模型當天即完成深度推理優化。通過 MOE 大融合算子、通信計算融合、高併發調度等七項關鍵技術,顯著提升編程和長程任務的處理效率,現已支持 A3 系列產品部署。#AI 大模型# #國產算力#
企業AI轉型再添利器:青雲科技算力雲接入 MiniMax-M3 模型
企業AI落地面臨高效低成本難題。青雲科技旗下基石智算平臺接入國產開源大模型MiniMax-M3,提供新算力支持。MiniMax-M3以卓越上下文處理能力等三大核心技術見長,依託自研架構,助企業便捷部署AI業務。
阿里開源統一科學大模型 LOGOS,僅用五十六分之一參數超越微軟
阿里 ATH-Token Foundry 聯閤中國人民大學高瓴人工智能學院開源科學基礎模型 LOGOS。該模型採用統一科學語法與純序列建模範式,在六大科學任務上匹配或超越傳統專用方法。其中 LOGOS-1B 僅 1B 參數,即展現出極高效率,性能超越參數量達 8×7B 的微軟模型。