華為雲發佈Agentic AI系列新品打造智能時代“硅基黑土地”

2026年6月5日 07:11

重點摘要

站內 AI 整理稿

[中國，上海，2026年6月5日] 今天，華為雲INSPIRE創想者大會在上海西岸國際會展中心開幕。華為雲在本次新品發佈會上正式提出Agentic Infra新範式，併發布Agentic Infra通智一體化基礎設施、新一代模型訓推平臺、企業級智能體平臺等系列Agentic AI新品，打造企業級Agentic AI創新的“硅基黑土地”。大會還宣佈正式上線“行業AI夢工廠”智慧醫療、具身智能、智能製造、科學計算四大專區，堅持用AI解行業難題，加速發展行業數智化生態。定義Agentic Infra新範式，軟硬芯協同做厚“硅基黑土地”華為公司董事、華為雲CEO周躍峰指出，Agentic AI時代正在引發計算範式的根本性躍遷。華為公司董事、華為雲CEO周躍峰主題演講本次發佈會上，華為雲正式提出Agentic Infra新範式，即“高效Token工廠+持續學習+通智一體化調度+安全自治”，併發布四大Agentic Infra新品：Ÿ AICS靈衢智算集群基於超大帶寬靈衢網絡，支持10萬卡級集群規模，總算力高達200EFLOPS，並將Tokens生成的時延降低到10毫秒以內，千卡每秒吞吐達到500萬Tokens，在線服務可用性高達99.95%，打造極致效率的Token工廠。Ÿ AMS Agentic記憶存儲解決方案通過NPU直通CMS（上下文記憶存儲）硬件，打造PB級超大記憶空間，並支持KV Cache分層池化，降低推理成本的同時支持天級長程任務，打破Agent的記憶瓶頸，助力Agent持續學習。Ÿ CCE Volcano Next通智一體化調度引擎通過“訓推共池+碎片整合”實現通智混合算力負載調度革新，可將資源利用率提升30%以上。Ÿ AgentSphere打造安全自治的Agent運行環境，提供極速彈性、意圖主動防護的安全自治運行底座，憑藉羽量級沙箱技術實現100毫秒級極速啟動與每分鐘十萬級批創能力，助力智能體安全、高效規模化上雲。發佈新一代ModelArtsNext模型訓推平臺，使能模型深入企業場景ModelArts Next模型訓推平臺構建了RL強化學習服務、機密推理、模型路由、模型矩陣四大核心能力。其中，MaaS模型路由支持成本優先、效果優先、均衡模式三種策略，根據請求特徵動態智能擇優調度最佳模型。截至目前，已提供15餘款SOTA模型服務，模型調度精準率超過95%，調用成本平均降低20%。企業級RLaaS服務讓強化學習成為每個企業都能調用的核心能力，實現一分鐘創建任務、全程可視化觀測、訓推一致性保障，讓大模型深入細分場景，越用越聰明。公測智果AgentArts企業級智能體平臺，並同步貢獻開源華為雲智果（AgentArts）企業級智能體平臺全面踐行Harness工程，構建了生產級長程任務、企業級安全、行業知識深度與全鏈路可觀測四大核心能力，加速行業智能體規模化落地。智果開源版openJiuwen也已經上線，其內核與AgentArts企業版同源度超過90%。同時，華為雲發佈全新Agentic華為雲入口“智果園”，聚合“全棧Agentic雲服務+豐富智能體+百模千態大模型”的一體化能力，並將這些能力全面Skill化、CLI化，完成從意圖理解、功能開發、資源發放到應用部署的全流程智能體化，提供按需、高效的Tokens服務，為用戶帶來全新交互體驗。推出面向Agentic AI的全套安全方案，守護智能體安全安全是華為雲提供數智化服務的底線。華為雲構建了覆蓋AI全鏈路的安全方案，端到端防護Agent安全、模型安全與Agentic Infra安全。大會發布數據安全專區，通過硬件專屬加密和HYOK技術、數據膠囊技術、Agentic基礎設施多維度隔離三大創新，保障數據上雲端到端的安全，讓企業牢牢掌握數據主權。同時發佈AI機密計算方案，通過構築機密虛機、雲端遠程證明服務、機密計算密鑰管理、機密推理網關、NPU設備PCIPC直通五大核心能力，支持機密推理、機密預訓練、機密聯邦學習三大核心場景，讓高價值數據和模型真正值得託付。截至目前，華為雲連續穩定運行零重大事故的天數達到了1037天，成為客戶最值得信賴的雲服務提供商。發佈面向智能體混合雲白皮書混合雲+AI加速國計民生數智化華為混合雲已成為政企數智化轉型的核心底座，在政府、金融、央國企等國計民生關鍵行業連續多年保持市場份額第一，服務全球超過5500家客戶。會上，《企業如何構建面向智能體的混合雲》白皮書正式發佈，從構建AI數據湖打破數據煙囪、模型線上線下穩態與敏態協同、構築安全可靠的智能體開發運行環境等方面，為Agentic時代的混合雲架構演進及企業實踐提供參考指引，幫助政企安全高效地實現企業智能體的私有化部署，釋放數據價值。發佈行業AI夢工廠四大專區，加速行業AI普惠智慧醫療專區持續升級，華為雲醫療AI使能平臺將於6月30日升級並公測。華為雲智慧病理方案已在全國實現規模複製，覆蓋頂級三甲、地市級、縣域醫院，加速醫療AI普惠。大會現場，包括上海交通大學醫學院附屬瑞金醫院、邯鄲市中心醫院、河北工程大學附屬醫院、瑞安市人民醫院、黔西南州興義市人民醫院、武安市第一人民醫院等20餘家醫院正式入駐智慧醫療專區，標誌著智慧病理方案實現全國規模落地，實現AI普惠。具身智能專區提供一站式具身智能數據合成、模型開發、仿真驗證平臺，幫助具身智能企業加速場景落地。同時華為雲發佈全球首個全流程具身智能開發平臺CloudRobo，提供安全可信的PB級數據底座及開發管線、業界首個雲原生具身模型生產引擎及首個全國產Real-Sim數據生產及模型評測體系，幫助機器人小時級上雲，模型分鐘級部署。該平臺將於6月30日公測。本次大會還發布了智能製造專區，提供一站式工業智能體創新創業環境，使能工業智能體創新落地；發佈科學計算專區，面向AI4S行業客戶提供統一豐富的模型、智能體使用體驗，助力敏捷科研創新。聯合TOP模型廠商發佈“百模千態，雲聚共贏”生態合作計劃會上，華為雲聯合智譜、DeepSeek、Minimax、Kimi、階躍星辰、百度、訊飛星火、美團、愛詩科技、生數科技等20餘家TOP模型廠商，發佈“百模千態，雲聚共贏”生態合作計劃，共建系統化商業生態，打造多方共贏的產業發展新模式。面向未來，華為雲將通過軟硬芯協同創新，構建企業級AI創新的“硅基黑土地”，攜手全球客戶、夥伴和開發者，共同開創全新Agentic AI時代。

原始來源：雷峰網 ↗

查看原始來源

MarkTechPost AI模型更新

Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages

This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather

1 小時前閱讀分析

MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

15 小時前閱讀分析

36氪模型更新

智譜新高，MiniMax承壓，“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高，MiniMax承壓，“大模型雙雄”命運殊途」。原始導語提到：大模型在被市場重新定價從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

17 小時前閱讀分析

IT之家模型更新

華為昇騰 0 Day 支持智譜 GLM-5.2 模型，提供全面推理優化

華為昇騰 AI 宣佈在智譜開源 GLM-5.2 大模型當天即完成深度推理優化。通過 MOE 大融合算子、通信計算融合、高併發調度等七項關鍵技術，顯著提升編程和長程任務的處理效率，現已支持 A3 系列產品部署。#AI 大模型# #國產算力#

1 天前閱讀分析

AIBase模型更新

企業AI轉型再添利器：青雲科技算力雲接入 MiniMax-M3 模型

企業AI落地面臨高效低成本難題。青雲科技旗下基石智算平臺接入國產開源大模型MiniMax-M3，提供新算力支持。MiniMax-M3以卓越上下文處理能力等三大核心技術見長，依託自研架構，助企業便捷部署AI業務。

1 天前7000閱讀分析

AIBase模型更新

阿里開源統一科學大模型 LOGOS，僅用五十六分之一參數超越微軟

阿里 ATH-Token Foundry 聯閤中國人民大學高瓴人工智能學院開源科學基礎模型 LOGOS。該模型採用統一科學語法與純序列建模範式，在六大科學任務上匹配或超越傳統專用方法。其中 LOGOS-1B 僅 1B 參數，即展現出極高效率，性能超越參數量達 8×7B 的微軟模型。

1 天前9300閱讀分析

相關文章