給 AI 建「流水線」,九章雲極看清了什麼?
重點摘要
當一個行業的核心問題開始轉移,舊的基礎設施就會在無聲中失效——AI,正在經歷這樣的時刻。2026年3月,國家數據局公佈了一個數字:中國日均Token調用量已達140萬億;4月,斯坦福人工智能指數報告寫道,過去兩年推理成本下降了280倍;Gartner的預測則顯示,2026年將有40%的企業把AI Agent嵌入自己的業務系統。這些數字拼在一起,看起來像是一個時代到來的宣告。九章雲極創始人兼董事長方磊打了一個比方:第一次工業革命,始於瓦特的蒸汽機,但真正定義那個時代的,是福特的流水線——它把天才的一次性靈感,變成了每個人都能享用的產品。AI正站在完全相同的拐點上:過去幾年的大模型突破是"蒸汽機時刻",而現在,真正的考驗是能不能建起那條"流水線"。但這條"流水線",究竟建起來了多少?把視線從宏觀數字移開,去問那些真正在大規模部署AI的工程師,你會發現數字的另一面,是一組依然懸而未決的問題——大量Token消耗並未轉化為實際的業務成功,代碼在本地、算力在雲端的開發環境依然割裂,企業在評估AI項目的真實回報率時缺乏可靠的工具。這些現象指向一個根源:整個行業缺少一套能夠度量“智能生產”的基礎設施。6月17日,九章雲極正式發佈“AI工廠”核心戰略,推出基於AI工廠鍛造的新一代智算雲Alaya NeW Cloud 3.0——一套從算力投入到專業智能交付的工程體系。這是一家擁有超過十年AI技術積澱的公司,對當下這組困境給出的系統性回答。理解它的設計邏輯,需要先把問題看清楚。AI工業化卡在了度量上AI產業的競爭重心,正在悄然轉向。九章雲極副總裁胡宗星把這個轉變拆成了三段歷史:模型發明期,核心問題是“能不能做出更強的模型”,基礎設施形態是算法、參數和單點突破;產業驗證期,核心問題是“能不能跑通行業場景”,基礎設施形態是項目制、PoC和私有部署。而現在,正在進入的是第三個階段——智能工業化期,核
當一個行業的核心問題開始轉移,舊的基礎設施就會在無聲中失效——AI,正在經歷這樣的時刻。2026年3月,國家數據局公佈了一個數字:中國日均Token調用量已達140萬億;4月,斯坦福人工智能指數報告寫道,過去兩年推理成本下降了280倍;Gartner的預測則顯示,2026年將有40%的企業把AI Agent嵌入自己的業務系統。這些數字拼在一起,看起來像是一個時代到來的宣告。九章雲極創始人兼董事長方磊打了一個比方:第一次工業革命,始於瓦特的蒸汽機,但真正定義那個時代的,是福特的流水線——它把天才的一次性靈感,變成了每個人都能享用的產品。AI正站在完全相同的拐點上:過去幾年的大模型突破是"蒸汽機時刻",而現在,真正的考驗是能不能建起那條"流水線"。但這條"流水線",究竟建起來了多少?把視線從宏觀數字移開,去問那些真正在大規模部署AI的工程師,你會發現數字的另一面,是一組依然懸而未決的問題——大量Token消耗並未轉化為實際的業務成功,代碼在本地、算力在雲端的開發環境依然割裂,企業在評估AI項目的真實回報率時缺乏可靠的工具。這些現象指向一個根源:整個行業缺少一套能夠度量“智能生產”的基礎設施。6月17日,九章雲極正式發佈“AI工廠”核心戰略,推出基於AI工廠鍛造的新一代智算雲Alaya NeW Cloud 3.0——一套從算力投入到專業智能交付的工程體系。這是一家擁有超過十年AI技術積澱的公司,對當下這組困境給出的系統性回答。理解它的設計邏輯,需要先把問題看清楚。AI工業化卡在了度量上AI產業的競爭重心,正在悄然轉向。九章雲極副總裁胡宗星把這個轉變拆成了三段歷史:模型發明期,核心問題是“能不能做出更強的模型”,基礎設施形態是算法、參數和單點突破;產業驗證期,核心問題是“能不能跑通行業場景”,基礎設施形態是項目制、PoC和私有部署。而現在,正在進入的是第三個階段——智能工業化期,核心問題變成了“能不能規模化生產與交付智能”,需要的基礎設施是AI工廠、標準化生產和專業Token。胡宗星認為,前兩個階段,行業已經走完;第三個階段,才是真正的硬仗。它意味著基礎設施的競爭邏輯已經徹底改變,而大多數企業賴以運轉的基礎設施,還停留在上一個階段。這種錯配,正在讓三件事同時失效。▎第一重失效:算力投入無法被標準化度量今天,一家企業如果同時採購了不同架構的GPU和NPU,它很難用一把統一的尺子回答:這筆錢到底換來了多少“有效算力”?不同芯片的FLOPS數字互不可比,不同廠商的“X卡時”定義各異,算力利用率更因架構差異天壤之別。這不只是報表難看的問題,更深的麻煩在於:一旦說不清投入了多少,優化就無從下手——換芯片、調調度、改模型,哪個更值得試?根本沒有判斷的依據。對於需要長期規劃算力預算的智算中心運營方而言,這直接決定了採購能否理性化、資源能否跨平臺調度、規模擴張的邊際成本能否被真正管控。沒有統一的“度”,就沒有現代電力工業;同樣,沒有統一的算力度量,算力就無法成為可以被採購、被運營、被持續優化的社會級基礎設施。▎第二重失效:Token單價已經不是成本標尺Token價格戰打了兩年,中端模型的Token單價已經接近為零。但對於企業而言,比起“每百萬Token多少錢”,更關心完成一項業務的總成本,即真實成本。這兩者的差距,遠比想象中大。假設一個AI Agent執行一項20步的自動化任務,每一步的成功率是85%,那麼整個任務完成的概率只有約4%。如果把單步成功率從85%提升到98%,任務完成率就會躍升至67%——模型的專業程度,在多步任務中產生的收益,是指數級而非線性的。胡宗星把這個邏輯拆成了一個公式:AI應用成本=Token消耗×推理時延×重試次數×人工兜底成本。這意味著,任意一項失控,即使單Token再便宜,任務總成本也會面臨失控的風險,這也解釋了為什麼在Token價格大幅下降的當下,很多企業的AI部署成本反而還在上升。▎第三重失效:專業模型生產還停留在“手工作坊”階段每家行業客戶都需要一個真正理解自己業務的專業模型,但今天,訓練一個垂類模型的路徑,往往是:收集數據、清洗數據、精調、評測、部署、運維——每一步都是定製的、不可複用的、需要大量人工介入的。手工生產最大的問題,不只是慢,而且經驗難以形成複用。一次金融領域的專業模型訓練積累的業務知識,很難直接遷移到製造業的專業模型生產中;每個客戶的模型交付,在數據和業務層面幾乎都是從零開始的新項目。這意味著,無論做多少個項目,邊際成本都很難實質性下降。大量企業因此陷在PoC(概念驗證)階段出不來,從模型研發到上線動輒半年以上,模型交付,正是在“作坊化”裡被大規模浪費。三種失效,指向同一個本質:AI競爭的形態已經改變,但工業化所需要的基礎設施——一套能夠標準化度量投入、降低任務完成成本,並實現模型規模化生產的體系——至今仍然缺位。而這,正是九章雲極試圖填補的空白。AI工廠如何讓「算力到智能」第一次可被計量從本質上看,AI工廠試圖讓“智能生產”第一次具備工業體系中的三要素:統一計量、標準生產與規模交付。胡宗星在發佈會上給AI工廠下了一個定義:"AI工廠,是智能工業化的工程底座。"“工程底座”這個定語,透露了產品的底層邏輯:一套能被度量、被管理、能持續優化的生產體系。工廠的本質,是一條可以持續運轉、不斷降低邊際成本的生產線。沿著這個邏輯,AI工廠的完整鏈條可以概括為:DCU(標準化算力單位)→訓練工廠(專業模型生成)→Token工廠(專業智能流通)→企業任務(價值實現)→數據迴流(模型迭代)。鏈條的起點是DCU。九章雲極把DCU定義為1度算力=312TFLOPS*1小時,第一次把異構、多廠商、多架構的算力資源折算成一個可以跨平臺比較的標準量。客戶按DCU採購,不必理解底層芯片型號和集群拓撲,GPU、NPU、不同代際的芯片,都可以換算成統一的DCU單位進行採購和結算。只有投入側有了度量,生產才有核算的基礎。有了標準化的算力投入,下一步是把它轉化為專業智能,這是訓練工廠的任務。訓練工廠負責把“通用智能”冶煉為“專業智能”,胡宗星特意用了“冶煉”這個詞,其背後的工藝由四個節點構成:數據處理、領域精調、強化學習、評測反饋。其中強化學習是最關鍵的一環,也是訓練工廠區別於平臺精調服務最核心的地方。通用大模型經過領域精調之後,能更好地“回答問題”;但只有經過強化學習,模型才能真正學會“完成任務”——拆解複雜目標、調用外部工具、在失敗後調整路徑。胡宗星把這個區別概括為:讓專業模型從"會回答"走向"會執行"。這個區別在Agent大規模落地的今天尤為重要,對企業而言,模型會不會回答問題早已不是門檻,真正的門檻是:模型能不能在有容錯率約束、有工具調用鏈路、有業務邊界限制的真實生產環境裡穩定執行任務。專業模型從訓練工廠產出後,需要經過壓縮、量化、評測和分發,才能進入下一段——Token工廠,胡宗星將這個“中間環節”稱之為“模型轉運”,是專業智能從“被生產”到“被消費”之間不可省略的工程步驟。Token工廠則負責專業智能的流通與交付,不同於行業常說的推理工廠,推理工廠的出發點是資源調度,核心命題是如何把已有模型部署穩、服務好、延時低,優化的是單任務性能。而Token工廠的出發點是價值交付,核心命題是如何把智能封裝為可以精確計量的價值單元,優化的是規模化產出的效率。這意味著Token工廠交付的不是泛化的Token,而是分層分檔的專業Token——消費級、專業級、前沿級,對應不同類型的模型、不同複雜度的任務和不同的服務等級。每一類Token的定義,對應的是它所封裝的智能密度與業務價值,而不只是它背後消耗的算力成本。在這個框架下,“每任務完成成本”終於有了被計算的基礎:投入側用DCU度量,產出側用專業Token度量,兩者之間的轉換效率,就是工廠效率。胡宗星將其總結為:"同樣的DCU,能不能生產更多、更穩定、更高價值的專業Token,這就是工廠效率,也是客戶價值。"每一次企業任務的完成,都會產生反饋數據——成功了什麼、失敗了什麼、哪裡卡殼、哪個步驟需要人工兜底,這些數據會持續迴流到訓練工廠,驅動專業模型的下一代迭代。至此,閉環完成。AI工廠因此不只是算力到智能的一次性轉化,更成為了一個可以自我優化的生產體系,每一輪任務,都在為下一個更專業的模型積累原料。這套體系為企業用戶帶來的變化,可以歸結為三個更直接的結果:第一,算力成本開始具備可預測性。通過DCU統一計量,算力投入不再依賴多廠商、多口徑的碎片化統計,而是可以像電力一樣被預算、被核算。第二,智能交付效率顯著提升。Token Factory將底層芯片、模型與調度能力封裝為標準化的Token服務,專業Token的分層分檔交付,使不同複雜度的業務任務可以被更穩定地規模化執行,減少重複試錯與人工兜底。第三,模型能力可以持續複用與迭代。業務任務產生的反饋數據持續迴流至訓練工廠,驅動專業模型的下一代迭代,形成“越用越強”的價值增強迴路。工廠用得越多,模型越專業;模型越專業,任務完成率越高;任務完成率越高企業落地 AI 項目的綜合價值可清晰衡量。這是雙工廠區別於單純算力租賃和推理服務的本質所在。在算力與模型之間,AI開始出現“中立工廠層”當前,智算賽道參與者日趨多元,綜合雲廠商、大模型企業、傳統 IDC 服務商紛紛佈局算力領域,行業競爭維度不斷豐富。九章雲極堅持獨立智算雲定位,走出差異化發展路徑。綜合雲廠商業務佈局較為全面,同時覆蓋算力、應用等多個領域。九章不競爭模型,不競爭應用,意味著它和每一家模型公司、每一家行業客戶之間,理論上都不存在利益對立——平臺的中立性,讓它有可能成為整個生態的"公共基礎設施"。而不做模型、不做應用,就意味著九章的價值,需要通過生態的繁榮來兌現。平臺不以單一業務作為利潤核心,價值依託整個產業生態共同成長實現。只有當足夠多的專業模型在平臺上被訓練、被交付、被調用,當足夠多的行業任務在AI工廠裡跑通,平臺的價值才得以實現。這套體系要真正運轉起來,前提是必須有足夠多、足夠好的專業模型進入Token工廠——沒有專業模型,專業Token就是一個空概念。於是,九章啟動了"智算開放計劃",計劃遴選並孵化1000個高價值專業模型與智能應用,通過算力支持、技術共創、商業分成、市場聯動,與行業開拓者深度綁定,這是整個雙工廠體系能否成立的公開驗證。目前持有的籌碼來自三處。首先是已被驗證的規模:九章累計服務超過3萬次客戶算力任務,平臺上已經預置了50多款主流基座模型 以及100餘款的面向金融、製造、政務、科研等真實開源數據集。其次是全棧自研的效率護城河:全棧自研的智算操作系統、算電協同優化、跨中心跨型號全局調度、模型量化與推理優化,五條路徑相乘,構成獨立於硬件之外的效率優勢,即使競爭對手購入同等算力,也未必能在任務完成成本上達到同等水平。第三是更遠處的一個思考。當千倍降本實現、算力便宜如水電,什麼會成為下一道關卡?九章的判斷指向高質量產業數據,以及傳統企業缺乏AI原生工作流與組織能力。打通算力這一關,正是為了讓產業界儘早面對這些更深層次的"軟性"瓶頸。這個判斷,或許是理解九章戰略的另一個視角:AI工廠既回應了當下的競爭格局,也提前布了一局棋——關於“算力之後是什麼”。推理成本的下降,確實讓AI進入了規模化應用的臨界點,但下一階段產業效率的真正決定因素,已經從“能否用AI”轉向了“能否用工業化方式持續生產智能”。在這一點上,AI行業仍處於基礎設施重構的早期階段:算力需要統一計量,智能需要標準化生產,模型需要工程化交付。九章雲極提出的AI工廠,本質上是在嘗試回答一個更基礎的問題:當AI從能力競爭進入工業化競爭階段,誰來定義“智能生產”的基礎設施標準?這套體系的成熟度,最終取決於兩個層面的驗證:它能否支撐更多行業場景中穩定運行的專業模型,以及這些模型能否在真實業務中持續創造可衡量的價值。雷峰網雷峰網
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。