全球AI工廠4萬億激戰!這家國產廠商領先一個身位了
重點摘要
智東西 作者 | 李水青 編輯 | 漠影 一場圍繞Agent的全球基建競賽,已跨越不可逆的臨界點。 全球權威研究機構Omdia最新報告預測,2026年,全球科技巨頭在AI基礎設施上的資本支出將超過6000億美元(約合4.07萬億元人民幣),規模堪比一個世紀前的工業電氣化革命。 國際AI巨頭紛紛斥重資打造AI工廠。OpenAI剛剛披露,其2026年全年算力預算500億美元,並牽頭千億級 “星際之門” 超級算力工廠;Anthropic先後與谷歌、亞馬遜達成數百億美元算力及投資合作,租賃SpaceX大型超算作為推理算力工廠,同時投入500億美元自建數據中心集群…… 當英偉達CEO黃仁勳斷言“AI不是軟件,而是工廠”,微軟CEO納德拉將Azure重構成“全球最大的AI工廠網絡”,產業競爭的焦點已不是模型,而是能否穩定、低成本、規模化地“生產智能”。 Omdia這份名為《2026全球AI工廠市場格局》的報告,點明瞭新時代的核心邏輯——決定勝負的,不再是誰擁有更多GPU,而是誰能夠更高效地把“電力+算力+數據”轉化為真正有價值的Token。 更值得關注的是,這份報告首次系統性梳理了全球AI工廠玩家的不同路徑。其中,一個來自中國的樣本,被Omdia單獨定義為“智能精煉(Intelligence Refiner)”範式的代表——商湯大裝置。 ▲Omdia報告截圖 與此同時,IDC最新中國企業級MaaS市場報告顯示,商湯大裝置“萬象”大模型平臺憑藉11.3%的市場份額,位居中國大模型平臺私有化市場第二,躋身行業第一梯隊。 當下正值OpenAI、Anthropic等全球AI巨頭紛紛殺入企業級服務市場,競賽的號角吹響,國產廠商如何守住陣地並向外圍突破?商湯大裝置憑什麼被國際權威機構蓋章認證為“開創者”? 智東西結合Omdia報告,並獨家對話商湯大裝置解決方案總經理代繼,試圖從產業最前線拆解:AI
智東西 作者 | 李水青 編輯 | 漠影 一場圍繞Agent的全球基建競賽,已跨越不可逆的臨界點。 全球權威研究機構Omdia最新報告預測,2026年,全球科技巨頭在AI基礎設施上的資本支出將超過6000億美元(約合4.07萬億元人民幣),規模堪比一個世紀前的工業電氣化革命。 國際AI巨頭紛紛斥重資打造AI工廠。OpenAI剛剛披露,其2026年全年算力預算500億美元,並牽頭千億級 “星際之門” 超級算力工廠;Anthropic先後與谷歌、亞馬遜達成數百億美元算力及投資合作,租賃SpaceX大型超算作為推理算力工廠,同時投入500億美元自建數據中心集群…… 當英偉達CEO黃仁勳斷言“AI不是軟件,而是工廠”,微軟CEO納德拉將Azure重構成“全球最大的AI工廠網絡”,產業競爭的焦點已不是模型,而是能否穩定、低成本、規模化地“生產智能”。 Omdia這份名為《2026全球AI工廠市場格局》的報告,點明瞭新時代的核心邏輯——決定勝負的,不再是誰擁有更多GPU,而是誰能夠更高效地把“電力+算力+數據”轉化為真正有價值的Token。 更值得關注的是,這份報告首次系統性梳理了全球AI工廠玩家的不同路徑。其中,一個來自中國的樣本,被Omdia單獨定義為“智能精煉(Intelligence Refiner)”範式的代表——商湯大裝置。 ▲Omdia報告截圖 與此同時,IDC最新中國企業級MaaS市場報告顯示,商湯大裝置“萬象”大模型平臺憑藉11.3%的市場份額,位居中國大模型平臺私有化市場第二,躋身行業第一梯隊。 當下正值OpenAI、Anthropic等全球AI巨頭紛紛殺入企業級服務市場,競賽的號角吹響,國產廠商如何守住陣地並向外圍突破?商湯大裝置憑什麼被國際權威機構蓋章認證為“開創者”? 智東西結合Omdia報告,並獨家對話商湯大裝置解決方案總經理代繼,試圖從產業最前線拆解:AI工廠為什麼突然爆火,以及一家中國企業如何提前卡位這場新基礎設施競賽。 一、AI工廠爆火:從訓練模型到生產智能,“精煉師”登場 AI工廠為什麼會在今年突然爆火? 代繼給出的答案很直接:因為Agent真正逼近了產業爆發臨界點,AI產業的水位變了。 過去兩年,行業更關注模型訓練,重點始終是“大模型能力夠不夠強”,刷榜快不快;如今隨著Agent加速落地,越來越多企業開始發現,真正消耗海量資源的其實是推理階段。訓練可能只發生一次,但推理會長期持續發生。未來80%以上的算力消耗,都可能來自推理與Agent運行。 這意味著,AI產業開始從一次性研發邏輯,轉向持續性的工業化運營邏輯。企業開始關心新的問題:模型已經足夠聰明,如何把它變成穩定、可控、可規模化的AI生產系統? 這也正是AI工廠概念迅速升溫的核心原因。 根據Omdia報告的定義,傳統數據中心,本質上是在提供服務器、存儲與網絡資源;AIDC(智算中心)則主要提供GPU算力;而AI工廠輸出的,已經不再只是“計算資源”,而是企業級AI能力、智能體與Token生產能力。 而一旦進入AI工業化運營邏輯,企業開始關心的不再只是模型性能參數,而是:單位Token成本到底是多少?GPU利用率能不能持續提升?多種國產芯片能否混合運行?推理與訓練能否動態調度?電力成本是否還能壓縮?Agent失控時如何保障業務安全?等等。 這些問題,本質上都是基礎設施問題。 Omdia在報告中明確指出,AI工廠已經不是傳統數據中心的升級版,而是一種“以生產智能為目標的新型工業基礎設施”。 全球科技產業的重心,也開始集體向這裡遷移。 一邊是海外巨頭全面加碼。英偉達、微軟、亞馬遜、谷歌持續擴張AI基礎設施;另一邊,中國市場也正在進入AI工廠建設高峰期。特別是在金融、政務、能源、製造等行業,越來越多企業開始推進私有化AI工廠建設。 全球AI工廠市場隨之演變出了不同類型的核心參與者:有賣“盒子”的一站式私有AI底座商,有賣端到端服務的全棧公有云巨頭,有賣極致性能的算力原生AI雲,也有賣本地化服務的區域運營商。競爭的焦點在於,誰能把Token的價值密度做得更高,誰就有望佔據優勢生態位。 ▲全球AI工廠市場演變出了四類核心玩家群體 在激烈的角逐中,Omdia之所以將商湯大裝置推舉為“智能精煉範式”的開創者,核心在於其率先完成了從“算力生產能源公司”向“企業級智能製造工廠”的進化 。 所謂“智能精煉”,本質上是通過一套圍繞模型生產和智能輸出構建的完整系統工程,形成“智能生產線” 的運行模式,把原始算力、推理服務、數據處理、模型測評、算力調度等融合,最終實現更高效的Token生產。代繼告訴智東西,商湯大裝置是在這一領域最早佈局的代表玩家之一。 ▲商湯臨港智算中心 二、為什麼是商湯大裝置?五層架構,把算力數據煉成生產力 事實上,商湯佈局AI工廠,並不是今年才開始。 早在2022年,行業還在討論“大模型到底有沒有商業價值”時,商湯內部就已經提出“AI數字工廠”構想。 過去幾年,商湯大裝置逐漸形成了一套完整的“五層架構”。而這套架構,本質上也是圍繞AI工廠落地過程中最棘手的問題逐層展開。 ▲商湯大裝置AI工廠架構 1、能源與物理層:聯手“寧王”,先解決“電老虎”痛點 AI工廠首先面對的,是能源問題。 AI時代的數據中心,耗電量遠超傳統IDC。尤其在推理規模持續爆發之後,電力已經開始成為AI工廠最核心的運營成本之一。因此,AI工廠的競爭,首先是能源的競爭。 為此,商湯大裝置與寧德時代合作,在臨港AIDC落地算電協同平臺:其核心目標是通過電力預測、儲能調度與負載優化,讓整個AI工廠運行效率最大化。 Omdia數據顯示,該系統能源預測準確率達到88%,決策準確率達到93%,PUE降至1.265,年節約電費約7%,碳減排每萬P 4000噸。 在AI進入高耗能時代後,“電”已經不再是輔助資源,而是AI工廠核心生產資料的一部分。 2、異構算力層:真正難啃的,是國產芯片碎片化 如果說能源是AI工廠的血液,那麼異構芯片協同,就是最難打通的神經系統。 代繼向智東西坦言,五層架構裡最難的一層,就是異構算力層。原因很簡單:國產芯片生態高度碎片化。每一家國產AI芯片或GPU廠商,幾乎都是一個“黑盒”。不同芯片擁有不同通信協議、不同調度方式、不同硬件架構,很難通過統一方法實現協同。 而現實情況是,很多大型企業內部,本身就已經採購了多個品牌AI芯片。“每個客戶基本都會有一點。”代繼說,“你必須幫他把這些東西真正協同起來。” 據瞭解,商湯大裝置率先實現了萬卡級國產GPU集群異構混訓。Omdia數據顯示,其異構訓練效率已達到同構訓練95%的水平。這意味著,客戶無需再過多關注不同芯片之間的適配與調度問題,商湯在底層就把這些碎片化問題解決了。 而這背後,是長期底層優化積累。代繼透露,很多國產AI芯片優化,往往需要針對具體超級節點、交換機結構、通信協議逐層寫代碼調優。不是把任務拉起來跑就行,而是你得知道每一層瓶頸在哪裡,不斷調到最優值。 這種能力,很難通過短期堆資源獲得。 3、調度平臺層:AI工廠最大的浪費,是GPU閒著 AI工廠需要同時服務訓練和推理兩種截然不同的工作負載,需要“訓推共池”。 過去很多訓練集群,一旦訓練結束,大量GPU會出現空轉;推理系統則可能在高峰期爆滿、低谷期閒置。如何在同一資源池中實現兩者的高效共存,避免資源浪費同時保障SLA,是全行業的共同難題。 為此,商湯大裝置通過自研訓練框架,開發並優化多種並行策略,提升訓練性能和顯存管理,另外,支持開源vLLM及自研LightLLM雙推理引擎,極大提升推理效率並壓低推理成本。 本質上,AI工廠已經越來越像現代工業流水線。對於金融、政務等對穩定性要求極高的客戶而言,這一層直接決定了AI能力能否進入核心生產環節。 4、MaaS層:模型正在變成開放部署的“工業零部件” 在模型層,行業也發生了明顯變化。 過去,大模型公司普遍希望通過閉源模型建立壁壘;但隨著開源模型快速成熟,行業開始意識到模型本身,正在逐漸變成標準化能力。 商湯大裝置的MaaS層,不是單純提供自研模型,而是整合“日日新”與大量第三方開源模型,形成統一調用平臺,提供模型部署、模型推理、Agent開發能力等。 企業面對琳琅滿目的開源模型和商業模型,往往不知道如何選擇、如何調優、如何部署模型,商湯的MaaS層整合了“日日新”大模型及第三方開源模型,提供一站式模型服務,讓企業可以從海量選項中抽身,聚焦於自身業務邏輯。 模型,正在從“明星產品”變成開放選項的“工業零部件”。 5、產業應用層:真正有價值的,是場景化Token 而五層架構裡,最接近業務價值的一層是應用層,也是客戶獲得感最強的層面。 代繼認為,企業真正需要的不是“通用Token”,而是“場景化Token”。也就是說,這個Token必須具備行業理解能力,結合了結合AIGC、具身智能、AI4S等場景的高濃度產業知識,從而成為真正理解業務流程、專業知識與安全邊界的智能系統。 商湯過去十幾年積累的大量產業經驗,也開始在這一層形成複利。 例如,其與鐵一院打造鐵路設計首個多模態大模型,貫通28個專業知識,測試準確率超90%;與上海市規劃資源局共建6000億參數的“雲宇星空”大模型,構建“1+6”模型體系,精準支撐複雜的城市空間治理。 ▲“雲宇星空”大模型應用界面 代繼告訴智東西,相比純SaaS層的後來者,商湯大裝置擁有更深的物理層控制力,它是智能的“原始生產商”,交付成本更低、穩定性更強。而相比傳統雲廠商,商湯大裝置又是AI原生的,沒有歷史包袱。 三、OpenAI、Anthropic剛下場,中國廠商已提前卡位“場景化Token” 近期,Anthropic與黑石成立AI原生企業服務公司,OpenAI也設立新公司殺入企業級部署。當模型巨頭們紛紛從線上走向線下,商湯大裝置的護城河在哪裡? 代繼告訴智東西,核心還在於“場景化Token”。 他談道,企業級AI與消費級AI有較大區別。製造、能源、交通、城市治理等傳統行業客戶往往缺少AI技術團隊,或技術人才儲備不足,難以直接把GPU和模型轉化為生產力。從基礎設施到業務價值之間,存在一條極長的落地鴻溝。而真正決定企業AI成敗的,往往是行業Know-How、部署能力與場景理解。 這也是為什麼,OpenAI和Anthropic開始大量招聘行業專家,並向FDE(前沿部署工程師)模式靠攏。但當這些巨頭剛剛開始敲門,商湯大裝置早已提前在門內佈局。 過去十幾年,商湯在智慧城市、醫療、交通、具身智能、AIGC等領域積累的大量行業知識,被重新萃取、嵌入模型與服務體系之中。最終,客戶調用的已經不是一個“裸模型”,而是一套具備場景理解能力的智能能力。 這也正切中當前企業市場最核心的變化。國內各行業客戶的核心訴求尤為鮮明:強調全掌控、私有化、可控、安全、深度參與。 代繼透露,目前國內增長最快的,仍然是私有化AI工廠。因為企業並不希望AI成為一個無法掌控的黑盒。“如果你用這套系統驅動核心業務,一旦失控,整個產線都可能掛掉。”他說。 因此,未來企業AI大概率不會是完全自主Agent,而會是“Agent + Workflow”的混合架構。 在企業服務商業模式的探索上,美國數據巨頭Palantir依靠FDE(前沿部署工程師)模式斬獲的高速增長震動了業界。代繼坦言,商湯大裝置目前的進化邏輯與Palantir不謀而合,正重點推動FDE深度賦能模式,集中重兵突破頭部的Key Account(大客戶)。 這也從行業角度,解釋了為什麼AI工廠最終會越來越像工業系統,而非互聯網產品。 從金融行業的碎片化算力整合,到與上海市規劃資源局共建的6000億參數的政務大模型,再到企業核心業務中的可控Agent體系,商湯大裝置正在通過一次次高複雜度項目,把自己的“原生AI雲 + 深刻場景理解”融入AI工廠,修築起一道難以逾越的護城河。 結語:2030年的AI贏家,屬於今天的“智能精煉師” Omdia預測,到2030年,全球數據中心市場累計投資將接近1.6萬億美元。資本正從“買算力”轉向“建工廠”,這場競賽的終局,將是能源、算力、算法、場景與服務的系統性角力。 OpenAI與Anthropic的入場,印證了企業級AI市場的巨大引力。而商湯大裝置憑藉其前瞻佈局的“AI數字工廠”五層架構,包括硬核的算電協同與異構混訓能力,以及深入產業肌理的“智能精煉”範式,已在這場全球性的基礎設施重構中,率先卡住了生態位。 正如黃仁勳所言,AI模型可以複製,但AI工廠不能。那些率先成為“智能精煉師”的先行者,有望定義下一個時代的產業格局。
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。