當AI大模型被重新定價：雲知聲發佈U2，迎來「DeepSeek時刻」

2026年6月8日 19:35

重點摘要

雲知聲於2026年6月8日正式發表新一代自研大語言模型U2，採用快慢思考融合的MoE架構，並推出MaaS平台TokenPlan，最低1.9元即可獲得1.8億Credits。該公司提出「智能密度」概念，強調以更少算力實現更高商業價值，標誌著大模型行業從參數軍備競賽轉向成本效率與真實落地能力的競爭。

站內 AI 整理稿

## 當AI大模型被重新定價：雲知聲正式發表U2，「DeepSeek時刻」來臨

### 一、事件重點整理：U2大模型正式登場

港股「AGI第一股」雲知聲（09678.HK）於2026年6月8日正式發表新一代自研通用大語言模型——U2。這不僅是該公司上市以來最重要的基座模型技術升級，更代表雲知聲正全面轉向「原生智能體」公司的關鍵里程碑。

技術層面，U2採用基於快慢思考融合的MoE混合專家架構，總參數規模約為2660億至3000億。模型設計初衷是為任務執行而生，原生整合了工具調用、任務拆解、狀態管理與多步驟規劃能力。在指令遵循、長上下文處理、科學推理與Agent能力等硬核評測中，U2表現均達到可與全球頂尖模型對標的水準。

商業層面，雲知聲同步推出MaaS平台TokenPlan，採用通用Credits計費模式，最低方案僅1.9元即可獲得1.8億Credits，涵蓋U2原生Agent模型、OCR、ASR、TTS及音色複刻等5款核心模型能力。

### 二、技術背景脈絡：從參數軍備競賽到「智能密度」

過去三年，大模型行業長期陷入「參數越大就越強」的敘事框架，大量資源投入被導向盲目擴張模型規模的軍備競賽。然而，企業客戶最終關心的並不是參數絕對值，而是每一塊錢的算力投入能換回多少實際產出。這層商業考量正在重新定義大模型的競爭邏輯。

雲知聲創始人黃偉針對這個矛盾提出了「智能密度」的概念，公式為：AI商業價值 = 智能密度 × Token價值。換句話說，用更少的計算資源實現更高的智能產出，追求每個參數的投入產出比，而非一味堆砌參數。這個邏輯與DeepSeek在2025年走通的路徑相似：更小的參數、更低的成本，但單位Token的商業價值更高。

黃偉在接受媒體訪談時曾以一個淺顯的比喻來說明：「我不需要一個中科院院士來開滴滴。很多任務場景不需要最高智能，碩士博士水平就夠了。」這段話精準點出了U2的設計哲學：不追求全能無敵的最高智能，而是追求在真實工作場景中可信、可執行、可負擔的智能服務。

### 三、商業模式變革：從項目制走向按需計費

雲知聲同步上線了基於U2的OPC公有雲MaaS平台，開放標準化API，允許開發者與企業按Token調用量付費，標誌著其商業模式從傳統的項目制交付，轉向可持續的按需計費模式。

最受到市場關注的是TokenPlan的定價策略。雲知聲推出的通用Credits制度，讓不同模態的模型能力共用一個額度池，開發者不再需要分別接入多個模型服務、計算不同的Token消耗，一個Key即可調用文本、視覺與語音等多模態能力。對個人開發者與小型團隊而言，Agent開發的門檻大幅降低；對企業而言，多模態應用的整體擁有成本也顯著下降。

### 四、公司背景與市場定位

雲知聲成立於2012年，是中國最早將深度學習應用於商業語音識別的公司之一。公司於2025年6月底歷經四次IPO衝刺後正式登陸港交所，上市初期市值約166億至221億港元。這家AI語音領域的老將，如今正全力朝大模型與智能體領域轉型，力圖在競爭激烈的市場中建立差異化定位。

從財務數據來看，雲知聲2025年大模型相關業務收入約為6.0億至6.2億元人民幣，年增幅達1057%至1095％，佔整體營收約48%至53％。大模型收入已從技術實驗轉變為公司的核心現金牛，顯示其垂直行業落地策略正逐步被市場驗證。

值得一提的是，這家公司在行業競爭中長期保持相對低調，主要深耕醫療、保險與交通等高價值垂直領域，在這些場域中逐步累積了獨有的行業數據與領域知識，形成有別於純通用模型的競爭壁壘。業界普遍認為，U2的正式發表將是市場重新認識雲知聲、消弭資訊落差的重要起點。

### 五、可能帶來的產業影響

**首先，大模型定價邏輯正在被重新定義。** 就在百度、阿里雲與智譜等廠商陸續調漲API價格之際，雲知聲反其道而行，推出極具競爭力的低價方案。這種「價格分化」趨勢並非偶然，背後反映的是大模型行業正在從單純的參數競爭走向商業化運營競爭。具備成本優勢的廠商將有機會在擴展生態規模的同時建立起護城河；而成本壓力較大的廠商則可能被迫將成本轉嫁給用戶，維持高價位運營。

**其次，原生智能體能力將成為大模型競爭的新維度。** 傳統大模型的設計目標是「回答問題」，而U2的設計目標是「完成任務」。這種設計差異在真實工作場景中的影響是巨大的。當AI從聊天機器人升級為可以自主拆解任務、調用工具、執行工作流程的智能體時，其競爭對象就不再是其他大模型，而是企業現有的外包團隊與流程型軟體——這是一個截然不同且更具商業潛力的市場。

**第三，AI開發者生態可能迎來新一輪的加速與鬆綁。** 1.9元的極低入門價與統一的Credits制度，大幅降低了開發者嘗試與迭代的成本門檻。這不僅有利於更多個人與小型團隊投入AI應用開發，也可能促成更多創新應用的誕生，間接帶動整個大模型生態的活絡。

### 六、讀者可關注的後續方向

**其一，開發者社群與企業客戶的實際採用情況。** 極具吸引力的定價能否有效轉化為用戶成長與留存，將是檢驗此次商業策略的關鍵指標。後續可關注雲知聲MaaS平台的API調用量成長、開發者數量以及垂直行業的落地案例。

**其二，競爭對手的回應動作。** 在大模型行業價格分化的關鍵節點上，其他廠商是否會跟進降價或調整產品策略，將直接影響未來一到兩年的市場格局走向。開發者在選擇模型底座時也應密切關注這波價格變動的長期趨勢。

**其三，U2在高風險行業的可靠性驗證。** 雲知聲在醫療與保險領域擁有較深的耕耘基礎，U2是否能在這些嚴肅商業場景中維持低誤差、高可靠性的運作，將是證明其技術價值與商業價值的關鍵考驗。

**其四，港股市場對雲知聲的估值變化。** 過去市場對雲知聲的認知長期停留在「語音技術公司」的標籤上，U2的發表是否足以改變資本市場對其定位，並帶動股價重新估值，值得投資人持續關注。

總體而言，U2的發表不僅是雲知聲從語音技術老兵轉向原生智能體大模型公司的重要宣言，更預示著大模型行業正從盲目追逐參數規模的狂歡，進入到比拼智能密度、成本效率與真實商業價值的下半場。對於開發者、企業與投資人來說，這個「DeepSeek時刻」的到來，意味著AI技術將變得更加落地、更加可負擔，也更加貼近真實世界的生產力需求。

原始來源：36氪 ↗

查看原始來源

MarkTechPost AI模型更新

Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages

This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather

1 小時前閱讀分析

MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

15 小時前閱讀分析

36氪模型更新

智譜新高，MiniMax承壓，“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高，MiniMax承壓，“大模型雙雄”命運殊途」。原始導語提到：大模型在被市場重新定價從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

17 小時前閱讀分析

IT之家模型更新

華為昇騰 0 Day 支持智譜 GLM-5.2 模型，提供全面推理優化

華為昇騰 AI 宣佈在智譜開源 GLM-5.2 大模型當天即完成深度推理優化。通過 MOE 大融合算子、通信計算融合、高併發調度等七項關鍵技術，顯著提升編程和長程任務的處理效率，現已支持 A3 系列產品部署。#AI 大模型# #國產算力#

1 天前閱讀分析

AIBase模型更新

企業AI轉型再添利器：青雲科技算力雲接入 MiniMax-M3 模型

企業AI落地面臨高效低成本難題。青雲科技旗下基石智算平臺接入國產開源大模型MiniMax-M3，提供新算力支持。MiniMax-M3以卓越上下文處理能力等三大核心技術見長，依託自研架構，助企業便捷部署AI業務。

1 天前7000閱讀分析

AIBase模型更新

阿里開源統一科學大模型 LOGOS，僅用五十六分之一參數超越微軟

阿里 ATH-Token Foundry 聯閤中國人民大學高瓴人工智能學院開源科學基礎模型 LOGOS。該模型採用統一科學語法與純序列建模範式，在六大科學任務上匹配或超越傳統專用方法。其中 LOGOS-1B 僅 1B 參數，即展現出極高效率，性能超越參數量達 8×7B 的微軟模型。

1 天前9300閱讀分析

相關文章