IT之家模型更新

華為發佈開源盤古 2.0 模型:最高 505B 參數,餘承東坦言自己留的算力很有限

2026年6月12日 15:01
華為發佈開源盤古 2.0 模型:最高 505B 參數,餘承東坦言自己留的算力很有限

重點摘要

在今日的華為開發者大會 HDC 2026 主題演講中,華為常務董事、產品投資評審委員會主任、終端 BG 董事長餘承東正式發佈開源盤古 openPangu 2.0。

站內 AI 整理稿

### 華為開源盤古 2.0 模型:505B 參數登場,算力資源成關鍵課題

華為在 HDC 2026 開發者大會上正式發表開源盤古 openPangu 2.0 模型,成為今年科技圈的重磅消息。這款模型最高可達 505B(5050 億)參數,是目前少數開源的大型語言模型之一。余承東在演講中罕見透露,華為內部能分配給盤古模型的算力其實相當有限,這句話背後反映出大型模型訓練與部署的真實成本,也讓外界對華為的 AI 戰略產生更多想像。

### 重點整理:開源盤古 2.0 的關鍵特點

根據大會公開資訊,開源盤古 2.0 採用混合專家架構(MoE),主打高效率與低延遲。最高 505B 參數版本適合需要高精度理解的場景,同時華為也提供較小的精簡版本供開發者測試。余承東強調,開源不僅是為了學術界與企業用戶,更是希望透過社群力量加速模型迭代。值得注意的是,他坦承華為自身算力儲備並不如外界想像充裕,這或許解釋了為何選擇開源路線—讓更多參與者分攤開發負擔。

### 背景脈絡:從盤古 1.0 到開源策略的轉折

華為盤古系列自 2021 年推出以來,主打行業大模型,初期聚焦於自然語言處理與計算機視覺。2025 年的版本已具備多模態能力,但始終未全面開源。此次 2.0 版選擇以 Apache 2.0 授權公開,意味著華為正試圖複製 Meta 旗下 LLaMA 系列的成功模式—透過開放權重吸引開發者,再透過硬體生態(如昇騰晶片)獲利。然而,余承東的算力自白也凸顯出一個現實:即使是全球通訊巨頭,在 GPU 短缺與電力成本高漲的背景下,也無法獨力養活一個千億級大模型。

### 可能影響:AI 開源生態的權力重組

開源盤古 2.0 的出現,首先衝擊的是原本由 Meta、微軟與 Google 主導的開源大模型市場。華為提供了一套基於國產架構(昇騰)的訓練與推理解決方案,對於受制於美國出口管制的中國開發者尤其重要。其次,505B 參數的中文模型能降低企業部署本地化 AI 的門檻,特別是在金融、醫療、製造等需要數據主權的領域。不過,算力限制可能導致社群在微調超大模型時遭遇瓶頸,華為是否會提供雲端算力補貼或訓練工具,將決定這款模型能否真正落地。

### 讀者可關注的後續發展

接下來值得觀察的重點有三:第一,開源盤古 2.0 的具體訓練成本與硬體需求,華為是否會公布完整基準測試?第二,余承東提到的「算力有限」是否會影響後續版本更新?第三,其他中國廠商(如百度、騰訊)是否會跟進開源策略,形成新一波大模型開源潮。對於開發者而言,現在即可從華為開源社群下載模型權重與程式碼,嘗試在昇騰硬體上進行微調。未來數月內,華為預計還會推出模型壓縮工具與邊緣部署方案,值得密切追蹤。

### 結語:開源背後的務實策略

華為選擇在算力相對匱乏的時刻推出開源大模型,表面上看是技術自信,實際上更像是一場精心計算的資源槓桿。透過開放模型權重,華為不僅能蒐集大量使用場景數據,還能吸引第三方開發者貢獻算力與程式碼,加速模型演進。對台灣的 AI 從業者來說,這款模型提供了一個無需依賴美國雲端服務即可進行繁體中文處理的選項,但能否順利適應台灣用語與在地需求,仍有待實測。無論如何,盤古 2.0 的開源宣言已經為 2026 年的 AI 競爭格局寫下新頁。

Related

相關文章

MarkTechPost AI模型更新

Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages

This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather

15 分鐘前
MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

14 小時前

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前