全球AI工廠4萬億激戰！這家國產廠商領先一個身位了

2026年5月27日 09:54

重點摘要

站內 AI 整理稿

智東西作者 | 李水青編輯 | 漠影一場圍繞Agent的全球基建競賽，已跨越不可逆的臨界點。全球權威研究機構Omdia最新報告預測，2026年，全球科技巨頭在AI基礎設施上的資本支出將超過6000億美元（約合4.07萬億元人民幣），規模堪比一個世紀前的工業電氣化革命。國際AI巨頭紛紛斥重資打造AI工廠。OpenAI剛剛披露，其2026年全年算力預算500億美元，並牽頭千億級 “星際之門” 超級算力工廠；Anthropic先後與谷歌、亞馬遜達成數百億美元算力及投資合作，租賃SpaceX大型超算作為推理算力工廠，同時投入500億美元自建數據中心集群…… 當英偉達CEO黃仁勳斷言“AI不是軟件，而是工廠”，微軟CEO納德拉將Azure重構成“全球最大的AI工廠網絡”，產業競爭的焦點已不是模型，而是能否穩定、低成本、規模化地“生產智能”。 Omdia這份名為《2026全球AI工廠市場格局》的報告，點明瞭新時代的核心邏輯——決定勝負的，不再是誰擁有更多GPU，而是誰能夠更高效地把“電力+算力+數據”轉化為真正有價值的Token。更值得關注的是，這份報告首次系統性梳理了全球AI工廠玩家的不同路徑。其中，一個來自中國的樣本，被Omdia單獨定義為“智能精煉（Intelligence Refiner）”範式的代表——商湯大裝置。 ▲Omdia報告截圖與此同時，IDC最新中國企業級MaaS市場報告顯示，商湯大裝置“萬象”大模型平臺憑藉11.3%的市場份額，位居中國大模型平臺私有化市場第二，躋身行業第一梯隊。當下正值OpenAI、Anthropic等全球AI巨頭紛紛殺入企業級服務市場，競賽的號角吹響，國產廠商如何守住陣地並向外圍突破？商湯大裝置憑什麼被國際權威機構蓋章認證為“開創者”？智東西結合Omdia報告，並獨家對話商湯大裝置解決方案總經理代繼，試圖從產業最前線拆解：AI工廠為什麼突然爆火，以及一家中國企業如何提前卡位這場新基礎設施競賽。一、AI工廠爆火：從訓練模型到生產智能，“精煉師”登場 AI工廠為什麼會在今年突然爆火？代繼給出的答案很直接：因為Agent真正逼近了產業爆發臨界點，AI產業的水位變了。過去兩年，行業更關注模型訓練，重點始終是“大模型能力夠不夠強”，刷榜快不快；如今隨著Agent加速落地，越來越多企業開始發現，真正消耗海量資源的其實是推理階段。訓練可能只發生一次，但推理會長期持續發生。未來80%以上的算力消耗，都可能來自推理與Agent運行。這意味著，AI產業開始從一次性研發邏輯，轉向持續性的工業化運營邏輯。企業開始關心新的問題：模型已經足夠聰明，如何把它變成穩定、可控、可規模化的AI生產系統？這也正是AI工廠概念迅速升溫的核心原因。根據Omdia報告的定義，傳統數據中心，本質上是在提供服務器、存儲與網絡資源；AIDC（智算中心）則主要提供GPU算力；而AI工廠輸出的，已經不再只是“計算資源”，而是企業級AI能力、智能體與Token生產能力。而一旦進入AI工業化運營邏輯，企業開始關心的不再只是模型性能參數，而是：單位Token成本到底是多少？GPU利用率能不能持續提升？多種國產芯片能否混合運行？推理與訓練能否動態調度？電力成本是否還能壓縮？Agent失控時如何保障業務安全？等等。這些問題，本質上都是基礎設施問題。 Omdia在報告中明確指出，AI工廠已經不是傳統數據中心的升級版，而是一種“以生產智能為目標的新型工業基礎設施”。全球科技產業的重心，也開始集體向這裡遷移。一邊是海外巨頭全面加碼。英偉達、微軟、亞馬遜、谷歌持續擴張AI基礎設施；另一邊，中國市場也正在進入AI工廠建設高峰期。特別是在金融、政務、能源、製造等行業，越來越多企業開始推進私有化AI工廠建設。全球AI工廠市場隨之演變出了不同類型的核心參與者：有賣“盒子”的一站式私有AI底座商，有賣端到端服務的全棧公有云巨頭，有賣極致性能的算力原生AI雲，也有賣本地化服務的區域運營商。競爭的焦點在於，誰能把Token的價值密度做得更高，誰就有望佔據優勢生態位。 ▲全球AI工廠市場演變出了四類核心玩家群體在激烈的角逐中，Omdia之所以將商湯大裝置推舉為“智能精煉範式”的開創者，核心在於其率先完成了從“算力生產能源公司”向“企業級智能製造工廠”的進化。所謂“智能精煉”，本質上是通過一套圍繞模型生產和智能輸出構建的完整系統工程，形成“智能生產線” 的運行模式，把原始算力、推理服務、數據處理、模型測評、算力調度等融合，最終實現更高效的Token生產。代繼告訴智東西，商湯大裝置是在這一領域最早佈局的代表玩家之一。 ▲商湯臨港智算中心二、為什麼是商湯大裝置？五層架構，把算力數據煉成生產力事實上，商湯佈局AI工廠，並不是今年才開始。早在2022年，行業還在討論“大模型到底有沒有商業價值”時，商湯內部就已經提出“AI數字工廠”構想。過去幾年，商湯大裝置逐漸形成了一套完整的“五層架構”。而這套架構，本質上也是圍繞AI工廠落地過程中最棘手的問題逐層展開。 ▲商湯大裝置AI工廠架構 1、能源與物理層：聯手“寧王”，先解決“電老虎”痛點 AI工廠首先面對的，是能源問題。 AI時代的數據中心，耗電量遠超傳統IDC。尤其在推理規模持續爆發之後，電力已經開始成為AI工廠最核心的運營成本之一。因此，AI工廠的競爭，首先是能源的競爭。為此，商湯大裝置與寧德時代合作，在臨港AIDC落地算電協同平臺：其核心目標是通過電力預測、儲能調度與負載優化，讓整個AI工廠運行效率最大化。 Omdia數據顯示，該系統能源預測準確率達到88%，決策準確率達到93%，PUE降至1.265，年節約電費約7%，碳減排每萬P 4000噸。在AI進入高耗能時代後，“電”已經不再是輔助資源，而是AI工廠核心生產資料的一部分。 2、異構算力層：真正難啃的，是國產芯片碎片化如果說能源是AI工廠的血液，那麼異構芯片協同，就是最難打通的神經系統。代繼向智東西坦言，五層架構裡最難的一層，就是異構算力層。原因很簡單：國產芯片生態高度碎片化。每一家國產AI芯片或GPU廠商，幾乎都是一個“黑盒”。不同芯片擁有不同通信協議、不同調度方式、不同硬件架構，很難通過統一方法實現協同。而現實情況是，很多大型企業內部，本身就已經採購了多個品牌AI芯片。“每個客戶基本都會有一點。”代繼說，“你必須幫他把這些東西真正協同起來。” 據瞭解，商湯大裝置率先實現了萬卡級國產GPU集群異構混訓。Omdia數據顯示，其異構訓練效率已達到同構訓練95%的水平。這意味著，客戶無需再過多關注不同芯片之間的適配與調度問題，商湯在底層就把這些碎片化問題解決了。而這背後，是長期底層優化積累。代繼透露，很多國產AI芯片優化，往往需要針對具體超級節點、交換機結構、通信協議逐層寫代碼調優。不是把任務拉起來跑就行，而是你得知道每一層瓶頸在哪裡，不斷調到最優值。這種能力，很難通過短期堆資源獲得。 3、調度平臺層：AI工廠最大的浪費，是GPU閒著 AI工廠需要同時服務訓練和推理兩種截然不同的工作負載，需要“訓推共池”。過去很多訓練集群，一旦訓練結束，大量GPU會出現空轉；推理系統則可能在高峰期爆滿、低谷期閒置。如何在同一資源池中實現兩者的高效共存，避免資源浪費同時保障SLA，是全行業的共同難題。為此，商湯大裝置通過自研訓練框架，開發並優化多種並行策略，提升訓練性能和顯存管理，另外，支持開源vLLM及自研LightLLM雙推理引擎，極大提升推理效率並壓低推理成本。本質上，AI工廠已經越來越像現代工業流水線。對於金融、政務等對穩定性要求極高的客戶而言，這一層直接決定了AI能力能否進入核心生產環節。 4、MaaS層：模型正在變成開放部署的“工業零部件” 在模型層，行業也發生了明顯變化。過去，大模型公司普遍希望通過閉源模型建立壁壘；但隨著開源模型快速成熟，行業開始意識到模型本身，正在逐漸變成標準化能力。商湯大裝置的MaaS層，不是單純提供自研模型，而是整合“日日新”與大量第三方開源模型，形成統一調用平臺，提供模型部署、模型推理、Agent開發能力等。企業面對琳琅滿目的開源模型和商業模型，往往不知道如何選擇、如何調優、如何部署模型，商湯的MaaS層整合了“日日新”大模型及第三方開源模型，提供一站式模型服務，讓企業可以從海量選項中抽身，聚焦於自身業務邏輯。模型，正在從“明星產品”變成開放選項的“工業零部件”。 5、產業應用層：真正有價值的，是場景化Token 而五層架構裡，最接近業務價值的一層是應用層，也是客戶獲得感最強的層面。代繼認為，企業真正需要的不是“通用Token”，而是“場景化Token”。也就是說，這個Token必須具備行業理解能力，結合了結合AIGC、具身智能、AI4S等場景的高濃度產業知識，從而成為真正理解業務流程、專業知識與安全邊界的智能系統。商湯過去十幾年積累的大量產業經驗，也開始在這一層形成複利。例如，其與鐵一院打造鐵路設計首個多模態大模型，貫通28個專業知識，測試準確率超90%；與上海市規劃資源局共建6000億參數的“雲宇星空”大模型，構建“1+6”模型體系，精準支撐複雜的城市空間治理。 ▲“雲宇星空”大模型應用界面代繼告訴智東西，相比純SaaS層的後來者，商湯大裝置擁有更深的物理層控制力，它是智能的“原始生產商”，交付成本更低、穩定性更強。而相比傳統雲廠商，商湯大裝置又是AI原生的，沒有歷史包袱。三、OpenAI、Anthropic剛下場，中國廠商已提前卡位“場景化Token” 近期，Anthropic與黑石成立AI原生企業服務公司，OpenAI也設立新公司殺入企業級部署。當模型巨頭們紛紛從線上走向線下，商湯大裝置的護城河在哪裡？代繼告訴智東西，核心還在於“場景化Token”。他談道，企業級AI與消費級AI有較大區別。製造、能源、交通、城市治理等傳統行業客戶往往缺少AI技術團隊，或技術人才儲備不足，難以直接把GPU和模型轉化為生產力。從基礎設施到業務價值之間，存在一條極長的落地鴻溝。而真正決定企業AI成敗的，往往是行業Know-How、部署能力與場景理解。這也是為什麼，OpenAI和Anthropic開始大量招聘行業專家，並向FDE（前沿部署工程師）模式靠攏。但當這些巨頭剛剛開始敲門，商湯大裝置早已提前在門內佈局。過去十幾年，商湯在智慧城市、醫療、交通、具身智能、AIGC等領域積累的大量行業知識，被重新萃取、嵌入模型與服務體系之中。最終，客戶調用的已經不是一個“裸模型”，而是一套具備場景理解能力的智能能力。這也正切中當前企業市場最核心的變化。國內各行業客戶的核心訴求尤為鮮明：強調全掌控、私有化、可控、安全、深度參與。代繼透露，目前國內增長最快的，仍然是私有化AI工廠。因為企業並不希望AI成為一個無法掌控的黑盒。“如果你用這套系統驅動核心業務，一旦失控，整個產線都可能掛掉。”他說。因此，未來企業AI大概率不會是完全自主Agent，而會是“Agent + Workflow”的混合架構。在企業服務商業模式的探索上，美國數據巨頭Palantir依靠FDE（前沿部署工程師）模式斬獲的高速增長震動了業界。代繼坦言，商湯大裝置目前的進化邏輯與Palantir不謀而合，正重點推動FDE深度賦能模式，集中重兵突破頭部的Key Account（大客戶）。這也從行業角度，解釋了為什麼AI工廠最終會越來越像工業系統，而非互聯網產品。從金融行業的碎片化算力整合，到與上海市規劃資源局共建的6000億參數的政務大模型，再到企業核心業務中的可控Agent體系，商湯大裝置正在通過一次次高複雜度項目，把自己的“原生AI雲 + 深刻場景理解”融入AI工廠，修築起一道難以逾越的護城河。結語：2030年的AI贏家，屬於今天的“智能精煉師” Omdia預測，到2030年，全球數據中心市場累計投資將接近1.6萬億美元。資本正從“買算力”轉向“建工廠”，這場競賽的終局，將是能源、算力、算法、場景與服務的系統性角力。 OpenAI與Anthropic的入場，印證了企業級AI市場的巨大引力。而商湯大裝置憑藉其前瞻佈局的“AI數字工廠”五層架構，包括硬核的算電協同與異構混訓能力，以及深入產業肌理的“智能精煉”範式，已在這場全球性的基礎設施重構中，率先卡住了生態位。正如黃仁勳所言，AI模型可以複製，但AI工廠不能。那些率先成為“智能精煉師”的先行者，有望定義下一個時代的產業格局。

原始來源：智東西 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

2 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

15 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

18 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

19 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

22 小時前閱讀分析

36氪生成式AI

微軟，考慮接入DeepSeek

這篇消息聚焦「微軟，考慮接入DeepSeek」。原始導語提到：Copilot Cowork轉為按量計費。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前閱讀分析

相關文章