MiniMax發佈M3 大模型:首創MSA架構並支持1M上下文,全面開源對標海外旗艦
重點摘要
MiniMax稀宇科技於2026年6月1日發佈新一代前沿大模型M3,這是國內首個集成頂尖編程、1M超長上下文及原生多模態能力的開源模型,對標海外閉源旗艦。針對複雜智能體任務的上下文擴展瓶頸,M3自主研發稀疏注意力架構(MSA),實現更精確的KV分塊與算子層優化,計算速度較同類開源方案提升4倍以上,在1M上下文下每Token計算量顯著降低。
### MiniMax 發佈 M3 大模型:開源長上下文、多模態與 MSA 架構,挑戰海外旗艦
中國 AI 新創公司 MiniMax(稀宇科技)於 2026 年 6 月 1 日正式發表新一代前沿大模型 M3,這是國內首款同時整合頂尖程式能力、1M(百萬 tokens)超長上下文及原生多模態能力的開源模型,直接對標海外閉源旗艦產品。M3 的推出不僅代表 MiniMax 在技術路線上的重大突破,也為開源大模型社群注入一股強勁的競爭動能。
### 重點整理:三大亮點與自主架構
M3 的核心特色可歸納為三項:第一,支援最高 1M tokens 的上下文長度,這意味著模型能夠一次性處理整本小說、長篇技術文件或複雜的對話歷史,對需要長期依賴的智能應用尤其關鍵。第二,模型具備「原生多模態」能力,能同時理解與生成文字、程式碼等多種資料形式,無需外掛模組。第三,M3 採用 MiniMax 自主研發的稀疏注意力架構(MSA),針對長上下文場景中的計算瓶頸進行優化,不僅實現更精確的 KV 分塊與算子層優化,更讓計算速度較同類開源方案提升至少 4 倍,同時大幅降低每 Token 的推理成本。
### 背景脈絡:長上下文與開源策略的雙重賽局
近年來,大語言模型的上下文長度已成為評比重點。OpenAI、Google、Anthropic 等海外巨頭陸續推出支援 128K、256K 甚至 1M 上下文的功能,但多以閉源 API 形式提供。開源社群雖有 Llama、Mistral 等模型接力,卻常受限於記憶體與計算效率,難以在高吞吐量的實際場景中穩定處理超長序列。MiniMax 過去以即時語音、角色扮演等應用聞名,此次直接攻堅 1M 開源模型,並公開 MSA 架構細節,顯示其想在基礎模型層級與海外一線產品正面交鋒的企圖心。值得注意的是,M3 對標的「海外閉源旗艦」很可能包括 GPT-4 Turbo 或 Claude 3 系列,凸顯中國 AI 團隊在開源路線上的追趕速度。
### MSA 架構:稀疏注意力如何破解長上下文困境
傳統注意力機制的計算複雜度隨序列長度呈二次方成長,導致 1M tokens 在實務上難以負擔。MSA(MiniMax Sparse Attention)是 MiniMax 提出的解方:透過動態篩選關鍵的 KV(Key-Value)對,僅計算對當前輸出最有貢獻的注意力分數,並在算子層進行硬體友好的優化,使整體計算量從 O(n²) 大幅下降。根據官方資訊,MSA 在 1M 上下文下的「每 Token 計算量」顯著低於現有開源稀疏方案,這意味著開發者可以在相同硬體預算下,部署更長上下文的應用,或是用更低的成本獲得相同品質的輸出。
### 可能影響一:開發者生態與企業應用門檻降低
M3 全面開源,將直接讓全球開發者獲得一個具備頂尖編程與長上下文能力的大型模型基底。過往要實現 1M 上下文處理,往往需自行搭建複雜的檢索增強生成(RAG)系統或切割文檔;如今 M3 的開源釋出,可望讓企業在客服系統、程式碼審查、法律文件分析等場景中,直接用單一模型完成端到端推理,減少系統整合成本。同時,程式能力的強化也讓 M3 在自動化程式碼生成與除錯領域具備
Related
相關文章
Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages
This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather
Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight
Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途
這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

華為昇騰 0 Day 支持智譜 GLM-5.2 模型,提供全面推理優化
華為昇騰 AI 宣佈在智譜開源 GLM-5.2 大模型當天即完成深度推理優化。通過 MOE 大融合算子、通信計算融合、高併發調度等七項關鍵技術,顯著提升編程和長程任務的處理效率,現已支持 A3 系列產品部署。#AI 大模型# #國產算力#
企業AI轉型再添利器:青雲科技算力雲接入 MiniMax-M3 模型
企業AI落地面臨高效低成本難題。青雲科技旗下基石智算平臺接入國產開源大模型MiniMax-M3,提供新算力支持。MiniMax-M3以卓越上下文處理能力等三大核心技術見長,依託自研架構,助企業便捷部署AI業務。
阿里開源統一科學大模型 LOGOS,僅用五十六分之一參數超越微軟
阿里 ATH-Token Foundry 聯閤中國人民大學高瓴人工智能學院開源科學基礎模型 LOGOS。該模型採用統一科學語法與純序列建模範式,在六大科學任務上匹配或超越傳統專用方法。其中 LOGOS-1B 僅 1B 參數,即展現出極高效率,性能超越參數量達 8×7B 的微軟模型。