給 AI 建「流水線」，九章雲極看清了什麼？

2026年6月17日 10:32

重點摘要

站內 AI 整理稿

當一個行業的核心問題開始轉移，舊的基礎設施就會在無聲中失效——AI，正在經歷這樣的時刻。2026年3月，國家數據局公佈了一個數字：中國日均Token調用量已達140萬億；4月，斯坦福人工智能指數報告寫道，過去兩年推理成本下降了280倍；Gartner的預測則顯示，2026年將有40%的企業把AI Agent嵌入自己的業務系統。這些數字拼在一起，看起來像是一個時代到來的宣告。九章雲極創始人兼董事長方磊打了一個比方：第一次工業革命，始於瓦特的蒸汽機，但真正定義那個時代的，是福特的流水線——它把天才的一次性靈感，變成了每個人都能享用的產品。AI正站在完全相同的拐點上：過去幾年的大模型突破是"蒸汽機時刻"，而現在，真正的考驗是能不能建起那條"流水線"。但這條"流水線"，究竟建起來了多少？把視線從宏觀數字移開，去問那些真正在大規模部署AI的工程師，你會發現數字的另一面，是一組依然懸而未決的問題——大量Token消耗並未轉化為實際的業務成功，代碼在本地、算力在雲端的開發環境依然割裂，企業在評估AI項目的真實回報率時缺乏可靠的工具。這些現象指向一個根源：整個行業缺少一套能夠度量“智能生產”的基礎設施。6月17日，九章雲極正式發佈“AI工廠”核心戰略，推出基於AI工廠鍛造的新一代智算雲Alaya NeW Cloud 3.0——一套從算力投入到專業智能交付的工程體系。這是一家擁有超過十年AI技術積澱的公司，對當下這組困境給出的系統性回答。理解它的設計邏輯，需要先把問題看清楚。AI工業化卡在了度量上AI產業的競爭重心，正在悄然轉向。九章雲極副總裁胡宗星把這個轉變拆成了三段歷史：模型發明期，核心問題是“能不能做出更強的模型”，基礎設施形態是算法、參數和單點突破；產業驗證期，核心問題是“能不能跑通行業場景”，基礎設施形態是項目制、PoC和私有部署。而現在，正在進入的是第三個階段——智能工業化期，核心問題變成了“能不能規模化生產與交付智能”，需要的基礎設施是AI工廠、標準化生產和專業Token。胡宗星認為，前兩個階段，行業已經走完；第三個階段，才是真正的硬仗。它意味著基礎設施的競爭邏輯已經徹底改變，而大多數企業賴以運轉的基礎設施，還停留在上一個階段。這種錯配，正在讓三件事同時失效。▎第一重失效：算力投入無法被標準化度量今天，一家企業如果同時採購了不同架構的GPU和NPU，它很難用一把統一的尺子回答：這筆錢到底換來了多少“有效算力”？不同芯片的FLOPS數字互不可比，不同廠商的“X卡時”定義各異，算力利用率更因架構差異天壤之別。這不只是報表難看的問題，更深的麻煩在於：一旦說不清投入了多少，優化就無從下手——換芯片、調調度、改模型，哪個更值得試？根本沒有判斷的依據。對於需要長期規劃算力預算的智算中心運營方而言，這直接決定了採購能否理性化、資源能否跨平臺調度、規模擴張的邊際成本能否被真正管控。沒有統一的“度”，就沒有現代電力工業；同樣，沒有統一的算力度量，算力就無法成為可以被採購、被運營、被持續優化的社會級基礎設施。▎第二重失效：Token單價已經不是成本標尺Token價格戰打了兩年，中端模型的Token單價已經接近為零。但對於企業而言，比起“每百萬Token多少錢”，更關心完成一項業務的總成本，即真實成本。這兩者的差距，遠比想象中大。假設一個AI Agent執行一項20步的自動化任務，每一步的成功率是85%，那麼整個任務完成的概率只有約4%。如果把單步成功率從85%提升到98%，任務完成率就會躍升至67%——模型的專業程度，在多步任務中產生的收益，是指數級而非線性的。胡宗星把這個邏輯拆成了一個公式：AI應用成本=Token消耗×推理時延×重試次數×人工兜底成本。這意味著，任意一項失控，即使單Token再便宜，任務總成本也會面臨失控的風險，這也解釋了為什麼在Token價格大幅下降的當下，很多企業的AI部署成本反而還在上升。▎第三重失效：專業模型生產還停留在“手工作坊”階段每家行業客戶都需要一個真正理解自己業務的專業模型，但今天，訓練一個垂類模型的路徑，往往是：收集數據、清洗數據、精調、評測、部署、運維——每一步都是定製的、不可複用的、需要大量人工介入的。手工生產最大的問題，不只是慢，而且經驗難以形成複用。一次金融領域的專業模型訓練積累的業務知識，很難直接遷移到製造業的專業模型生產中；每個客戶的模型交付，在數據和業務層面幾乎都是從零開始的新項目。這意味著，無論做多少個項目，邊際成本都很難實質性下降。大量企業因此陷在PoC（概念驗證）階段出不來，從模型研發到上線動輒半年以上，模型交付，正是在“作坊化”裡被大規模浪費。三種失效，指向同一個本質：AI競爭的形態已經改變，但工業化所需要的基礎設施——一套能夠標準化度量投入、降低任務完成成本，並實現模型規模化生產的體系——至今仍然缺位。而這，正是九章雲極試圖填補的空白。AI工廠如何讓「算力到智能」第一次可被計量從本質上看，AI工廠試圖讓“智能生產”第一次具備工業體系中的三要素：統一計量、標準生產與規模交付。胡宗星在發佈會上給AI工廠下了一個定義："AI工廠，是智能工業化的工程底座。"“工程底座”這個定語，透露了產品的底層邏輯：一套能被度量、被管理、能持續優化的生產體系。工廠的本質，是一條可以持續運轉、不斷降低邊際成本的生產線。沿著這個邏輯，AI工廠的完整鏈條可以概括為：DCU（標準化算力單位）→訓練工廠（專業模型生成）→Token工廠（專業智能流通）→企業任務（價值實現）→數據迴流（模型迭代）。鏈條的起點是DCU。九章雲極把DCU定義為1度算力=312TFLOPS*1小時，第一次把異構、多廠商、多架構的算力資源折算成一個可以跨平臺比較的標準量。客戶按DCU採購，不必理解底層芯片型號和集群拓撲，GPU、NPU、不同代際的芯片，都可以換算成統一的DCU單位進行採購和結算。只有投入側有了度量，生產才有核算的基礎。有了標準化的算力投入，下一步是把它轉化為專業智能，這是訓練工廠的任務。訓練工廠負責把“通用智能”冶煉為“專業智能”，胡宗星特意用了“冶煉”這個詞，其背後的工藝由四個節點構成：數據處理、領域精調、強化學習、評測反饋。其中強化學習是最關鍵的一環，也是訓練工廠區別於平臺精調服務最核心的地方。通用大模型經過領域精調之後，能更好地“回答問題”；但只有經過強化學習，模型才能真正學會“完成任務”——拆解複雜目標、調用外部工具、在失敗後調整路徑。胡宗星把這個區別概括為：讓專業模型從"會回答"走向"會執行"。這個區別在Agent大規模落地的今天尤為重要，對企業而言，模型會不會回答問題早已不是門檻，真正的門檻是：模型能不能在有容錯率約束、有工具調用鏈路、有業務邊界限制的真實生產環境裡穩定執行任務。專業模型從訓練工廠產出後，需要經過壓縮、量化、評測和分發，才能進入下一段——Token工廠，胡宗星將這個“中間環節”稱之為“模型轉運”，是專業智能從“被生產”到“被消費”之間不可省略的工程步驟。Token工廠則負責專業智能的流通與交付，不同於行業常說的推理工廠，推理工廠的出發點是資源調度，核心命題是如何把已有模型部署穩、服務好、延時低，優化的是單任務性能。而Token工廠的出發點是價值交付，核心命題是如何把智能封裝為可以精確計量的價值單元，優化的是規模化產出的效率。這意味著Token工廠交付的不是泛化的Token，而是分層分檔的專業Token——消費級、專業級、前沿級，對應不同類型的模型、不同複雜度的任務和不同的服務等級。每一類Token的定義，對應的是它所封裝的智能密度與業務價值，而不只是它背後消耗的算力成本。在這個框架下，“每任務完成成本”終於有了被計算的基礎：投入側用DCU度量，產出側用專業Token度量，兩者之間的轉換效率，就是工廠效率。胡宗星將其總結為："同樣的DCU，能不能生產更多、更穩定、更高價值的專業Token，這就是工廠效率，也是客戶價值。"每一次企業任務的完成，都會產生反饋數據——成功了什麼、失敗了什麼、哪裡卡殼、哪個步驟需要人工兜底，這些數據會持續迴流到訓練工廠，驅動專業模型的下一代迭代。至此，閉環完成。AI工廠因此不只是算力到智能的一次性轉化，更成為了一個可以自我優化的生產體系，每一輪任務，都在為下一個更專業的模型積累原料。這套體系為企業用戶帶來的變化，可以歸結為三個更直接的結果：第一，算力成本開始具備可預測性。通過DCU統一計量，算力投入不再依賴多廠商、多口徑的碎片化統計，而是可以像電力一樣被預算、被核算。第二，智能交付效率顯著提升。Token Factory將底層芯片、模型與調度能力封裝為標準化的Token服務，專業Token的分層分檔交付，使不同複雜度的業務任務可以被更穩定地規模化執行，減少重複試錯與人工兜底。第三，模型能力可以持續複用與迭代。業務任務產生的反饋數據持續迴流至訓練工廠，驅動專業模型的下一代迭代，形成“越用越強”的價值增強迴路。工廠用得越多，模型越專業；模型越專業，任務完成率越高；任務完成率越高企業落地 AI 項目的綜合價值可清晰衡量。這是雙工廠區別於單純算力租賃和推理服務的本質所在。在算力與模型之間，AI開始出現“中立工廠層”當前，智算賽道參與者日趨多元，綜合雲廠商、大模型企業、傳統 IDC 服務商紛紛佈局算力領域，行業競爭維度不斷豐富。九章雲極堅持獨立智算雲定位，走出差異化發展路徑。綜合雲廠商業務佈局較為全面，同時覆蓋算力、應用等多個領域。九章不競爭模型，不競爭應用，意味著它和每一家模型公司、每一家行業客戶之間，理論上都不存在利益對立——平臺的中立性，讓它有可能成為整個生態的"公共基礎設施"。而不做模型、不做應用，就意味著九章的價值，需要通過生態的繁榮來兌現。平臺不以單一業務作為利潤核心，價值依託整個產業生態共同成長實現。只有當足夠多的專業模型在平臺上被訓練、被交付、被調用，當足夠多的行業任務在AI工廠裡跑通，平臺的價值才得以實現。這套體系要真正運轉起來，前提是必須有足夠多、足夠好的專業模型進入Token工廠——沒有專業模型，專業Token就是一個空概念。於是，九章啟動了"智算開放計劃"，計劃遴選並孵化1000個高價值專業模型與智能應用，通過算力支持、技術共創、商業分成、市場聯動，與行業開拓者深度綁定，這是整個雙工廠體系能否成立的公開驗證。目前持有的籌碼來自三處。首先是已被驗證的規模：九章累計服務超過3萬次客戶算力任務，平臺上已經預置了50多款主流基座模型以及100餘款的面向金融、製造、政務、科研等真實開源數據集。其次是全棧自研的效率護城河：全棧自研的智算操作系統、算電協同優化、跨中心跨型號全局調度、模型量化與推理優化，五條路徑相乘，構成獨立於硬件之外的效率優勢，即使競爭對手購入同等算力，也未必能在任務完成成本上達到同等水平。第三是更遠處的一個思考。當千倍降本實現、算力便宜如水電，什麼會成為下一道關卡？九章的判斷指向高質量產業數據，以及傳統企業缺乏AI原生工作流與組織能力。打通算力這一關，正是為了讓產業界儘早面對這些更深層次的"軟性"瓶頸。這個判斷，或許是理解九章戰略的另一個視角：AI工廠既回應了當下的競爭格局，也提前布了一局棋——關於“算力之後是什麼”。推理成本的下降，確實讓AI進入了規模化應用的臨界點，但下一階段產業效率的真正決定因素，已經從“能否用AI”轉向了“能否用工業化方式持續生產智能”。在這一點上，AI行業仍處於基礎設施重構的早期階段：算力需要統一計量，智能需要標準化生產，模型需要工程化交付。九章雲極提出的AI工廠，本質上是在嘗試回答一個更基礎的問題：當AI從能力競爭進入工業化競爭階段，誰來定義“智能生產”的基礎設施標準？這套體系的成熟度，最終取決於兩個層面的驗證：它能否支撐更多行業場景中穩定運行的專業模型，以及這些模型能否在真實業務中持續創造可衡量的價值。雷峰網雷峰網

原始來源：雷峰網 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

3 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

16 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

19 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

20 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

23 小時前閱讀分析

36氪生成式AI

微軟，考慮接入DeepSeek

這篇消息聚焦「微軟，考慮接入DeepSeek」。原始導語提到：Copilot Cowork轉為按量計費。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 天前閱讀分析

相關文章