國產多模態大模型迎來里程碑,MiniMax M3 正式開源且響應速度倍增

2026年6月16日 02:005700 次瀏覽

重點摘要

稀宇科技今日宣佈開源其原生多模態旗艦模型MiniMax M3,總參數428B,激活參數23B,為行業首個此類模型。此前已開放權重併發布稀疏注意力機制論文,引發廣泛關注。該模型綜合性能在開源模型中排名第一。

站內 AI 整理稿

### 國產多模態大模型里程碑:MiniMax M3 正式開源,速度與性能雙雙突破

近日,稀宇科技(MiniMax)宣布正式開源其原生多模態旗艦模型 MiniMax M3,這款模型不僅採用業界首見的架構設計,更在綜合性能上奪下開源模型排行榜第一的寶座。根據官方資訊,M3 的總參數量達到 428B,但每次推理僅需激活 23B 參數,在確保強大能力的同時,顯著降低運算成本與回應延遲。這一開源動作不僅代表技術的重大躍進,也為國產大模型社群注入一劑強心針。

### 稀疏注意力機制成關鍵,原生多模態設計打破框架

MiniMax M3 的核心亮點之一,是其內建的稀疏注意力機制。不同於傳統模型對所有輸入資訊一視同仁,稀疏注意力讓模型能夠動態聚焦於關鍵特徵,大幅提升長序列處理效率。搭配原生多模態設計,M3 可直接處理文字、圖片、語音等多種輸入,無需額外拼接子模型,從而實現更流暢的跨模態理解與生成。稀宇科技先前已公開相關論文與模型權重,讓學術與開發社群得以深入探究其技術細節。

### 綜合性能開源第一,實測表現引發關注

在各大開源模型評測基準中,MiniMax M3 憑藉其優異的綜合能力脫穎而出,尤其在問答、摘要、圖文理解等任務上展現逼近封閉模型的表現。值得注意的是,官方宣稱其響應速度較前代或同級模型倍增,這對於需要即時互動的應用場景(如聊天機器人、多模態客服)極具吸引力。開發者將能以更低的硬體門檻,部署具有企業級水準的多模態 AI 服務。

### 背景脈絡:國產大模型開源生態持續壯大

近年來,中國 AI 團隊在開源大模型領域奮起直追,從語言模型到多模態模型,已形成一條完整鏈路。MiniMax 作為其中一員,早年曾以 MiniMax-01 系列打響名號,如今 M3 的開源則進一步鞏固其技術領先地位。在 OpenAI、Google 等國際巨頭持續封閉原始碼的背景下,這類本土開源模型不僅讓中小型開發者與研究機構能取得先進技術,也間接促進整體產業的自主可控發展。

### 可能影響:降低多模態應用門檻,激發創新應用

MiniMax M3 的開源,首先意味著更多團隊能基於此模型開發垂直領域工具,例如智慧教育、醫療影像解讀、自動化內容生成等。由於其激活參數量僅 23B,一般消費級 GPU 甚至雲端實例即可順暢運行,這將大幅降低部署成本。此外,稀疏注意力機制的論文公開,也有望啟發學術界提出更高效的注意力變體,加速下一代模型架構的演進。

### 讀者可關注的後續發展

對於有意嘗試者,目前可從官方倉庫下載模型權重與推論程式碼,並參考稀疏注意力論文的實作細節。接下來值得關注的包括:社群回饋是否揭露新的使用瓶頸、其他開源項目是否跟進採用類似架構、以及稀宇科技是否會發布更小尺寸的蒸餾版本以擴大應用場景。此外,多模態安全與倫理議題也將隨之浮上檯面——如何在開源環境中防止模型被惡意濫用,將是整個社群必須共同面對的課題。

### 結語:開源的力量,驅動下一波 AI 民主化

MiniMax M3 的問世,不僅是國產多模態大模型技術實力的證明,更象徵開源社群在頂尖模型競賽中逐漸佔有一席之地。當模型權重與論文細節完全公開,創新便不再受限於少數巨頭,而是回歸到每一個開發者、研究員與創作者手中。未來,我們有望看到更多基於 M3 的應用開花結果,也期待台灣團隊能把握此波開源浪潮,發展出在地化的多模態解決方案。

Related

相關文章

MarkTechPost AI模型更新

Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages

This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather

15 分鐘前
MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

14 小時前

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前