十年榜單首迎中國雙料冠軍：這次贏的不只是性能

2026年7月2日 06:16

重點摘要

站內 AI 整理稿

6月，在德國漢堡ISC高性能計算大會的展臺上，GPU、液冷、量子計算的聲浪依舊洶湧，但今年，會場的主角悄悄換了人。IO500榜單——全球高性能計算存儲領域最權威的評測體系——公佈了最新一期結果：中科曙光ParaStor F9000分佈式全閃存儲系統，同時拿下生產型全節點和10節點兩大榜單的第一名。在這一榜單近十年的歷史中，能夠同時統領這兩個維度的，此前只有少數幾家美國廠商，中科曙光成為首家達成此成就的中國公司。與研究性榜單不同，生產型榜單的評選有一條硬性要求：存儲系統必須已在真實業務環境中不間斷運行超過一年，這意味著F9000並非實驗室裡的測試樣機，而是一套正在產線上承擔生產任務、隨時會被業務中斷打擾的真實系統。中科曙光北京公司副總裁何振則將這一差異概括為評價標準的遷移：從“峰值性能”轉向“真實系統能力”，考核的重點變成了長期穩定性、複雜負載適配能力和大規模擴展時的一致性表現。在何振看來，這次奪冠的意義遠不止“拿了一個冠軍”：“這是國產高端存儲第一次在全球最嚴格的真實生產型評測體系中，形成了系統性領先。” ParaStor F9000憑什麼贏？中科曙光分佈式存儲總工程師袁清波，把F9000的技術壁壘歸納成三層，並坦言這三層的技術難度是遞進的。最顯性的差異在硬件形態上，市面上2U24盤位的NVMe全閃機型並不罕見，但F9000採用了一種業內稱為“雙子星”的特殊設計——在2U的空間裡塞進兩個完全獨立的物理節點，每個節點都有自己的主板、CPU、內存、網卡和SSD。更關鍵的創新藏在連接方式裡：CPU一側直連NVMe介質，另一側直連網卡，中間完全不經過PCIe Switch轉接。“這給我們提供了兩倍的PCIe Lane數量。”袁清波說。與此同時，這兩倍的Lane數量被有意識地“對半分”給了SSD和網卡，袁清波指出，“這種均衡恰恰是行業裡容易被忽視的地方，做標準服務器的人，對網絡和SSD這兩個硬件的定位是相同的，但對存儲系統來說，讀的時候數據從盤上讀出經網卡發出，寫的時候從網卡收進再下到盤上，數據流動方向剛好相反。”ParaStor圍繞每個CPU核心，把與之相關的內存、網卡、SSD綁定成一個獨立的IO子域，確保混合負載之間相互隔離又能靈活配置。“用戶發出的每一次IO，從發出那一刻起，我們就知道它要走哪個網卡、用哪塊內存、經哪個核，最後落在哪塊盤上。”袁清波說。效果體現在一個具體指標上：系統吞吐量已被推至內存帶寬的峰值。“基本上沒有傳統方案能做到這一點，”袁清波說，“一旦後面硬件有提升，比如網卡頻率提高10%，我們的性能也能同步提升10%。”在這套架構之上，還疊加了一層QoS調控機制，能針對不同業務分別設定帶寬和IOPS的上下限——這正是F9000在“業務不能停”的生產環境裡，額外完成打榜測試而不互相干擾的關鍵。硬件形態和軟件架構再往下走，是一層更難以複製的壁壘：全棧自研，石靜的體會很直接：如果軟硬件不是從底層設計的，跨層、跨參數的相互影響根本無從優化，只能在別人定好的邊界裡小修小補。從戰略的視角來看，何振表示：“全國產自研的意義，並不只是供應鏈層面的可靠保障，更重要的是帶來了體系級優化空間——核心軟硬件棧完全可控，使存儲系統可以在協議棧、數據路徑、調度機制等多個層面進行深度協同優化。”把存儲本身跑快，只是基礎。F9000面向AI場景，能夠做到“以存提算、以存代算、以存降本”三級協同——本質上是把存儲從被動的數據供給層，升級為參與計算路徑設計的一部分。在計算節點側，F9000做了三層加速：把節點本地內存和NVMe SSD池化為近算力緩存，在訓練前先將數據集“預熱”進來，避免每次跨網絡回源到後端存儲；再通過XDS技術，讓數據直接從網卡進入GPU顯存，繞開CPU內存轉發。“我們已經把內存帶寬跑到了峰值，但XDS可以進一步突破內存帶寬的限制——數據根本不走內存了。”袁清波解釋，這之所以關鍵，是因為AI訓練對數據供給的容錯率極低，一旦數據沒供到位，GPU集群就只能空轉等待。網絡側，F9000優先適配的是曙光自研的scaleFabric——一款400G原生無損RDMA網絡，中科曙光高速網絡互聯產品部總工程師萬偉透露，網卡設計之初就考慮了存儲的極端需求：在10萬卡集群規模下，存儲節點需要面向所有計算節點的併發訪問，現有IB的QP規模根本撐不住，團隊直接把這一指標擴展了一倍。存儲側的重心，則從“更快供給”轉向“主動分擔”。兩項能力承擔了這個角色：KV Cache offload自動將GPU閒置的KV緩存塊遷移到後端全閃存儲，推理時再通過XDS高速通路回傳顯存，實測降低60%以上GPU顯存佔用，單卡併發推理承載量提升2到10倍；存儲端AI算子加速庫則把數據清洗、向量編碼等預處理操作下沉到存儲側執行，跨節點數據傳輸量減少70%。袁清波把這套組合拳的意義概括為一句話：“未來存儲系統的競爭將從單一性能指標，轉向系統級綜合能力——數據路徑效率、端到端延遲控制能力、GPU利用率提升能力，以及高併發場景下的整體吞吐穩定性，這些指標共同決定系統在真實AI負載下的有效價值。” 把存儲從數據倉庫變成AI調度中樞大模型訓練進入萬卡、十萬卡規模之後，一個共識正在行業裡形成：瓶頸，已經從“算力不足”轉移到了“數據供給不足”。袁清波表示：“在大規模AI訓練體系中，算力本身已經高度冗餘，真正限制系統效率的是數據供給能力。如果存儲無法持續提供高帶寬、低時延的數據流，GPU將處於等待狀態，導致算力資源浪費。”這種瓶頸轉移，正在逼著存儲的角色發生根本性變化，石靜的判斷是，ParaStor不再是一個數據容器，在AI的驅動下，它正在向“AI數據工廠”躍遷，存儲開始成為計算路徑設計的一部分。這種躍遷已經發生在具體場景裡。在具身智能領域，曙光為智元機器人提供了超過500GB/s聚合讀帶寬的專屬存儲方案，支撐多款通用型機器人的快速迭代；自動駕駛領域，曙光連續為國內頭部造車新勢力提供超百PB存儲資源，覆蓋從數據採集到仿真驗證的全流程閉環，模型研發週期縮短40%以上；科學計算領域，F9000支撐了414.7億原子規模的液態水分子動力學模擬——存儲開始直接參與數據與計算高度耦合的科學發現過程。截至目前，ParaStor F9000已搭載於曙光scaleX萬卡超集群，支撐了百餘個AI與高性能計算領域的生產應用。而下一代AI基礎設施的競爭焦點，已從單一硬件能力轉向系統級協同，何振將這種競爭的核心概括為三個維度：存算網一體化的數據流動效率、跨層資源調度能力，以及整體TCO優化。“國產廠商的優勢，在於更完整的系統工程能力——可以從整機、網絡到軟件棧進行端到端優化，而不是侷限於單點性能提升。”這套系統級競爭的邏輯，恰好撞上了當前存儲市場近15年來最陡峭的漲價週期，海外巨頭把產能向HBM、DDR5等高附加值領域傾斜，傳統存儲市場出現供給缺口。但何振認為，這輪漲價的本質不是單一器件價格波動，而是AI算力需求爆發後，存儲、網絡、算力同步擴張帶來的系統性成本上升。正是在這個矛盾裡，“以技術換效率、以效率降成本”開始成為國產存儲的差異化路徑。F9000的智能數據分層，把高頻數據放到高性能路徑上，低頻數據沉澱到性價比更高的介質，再疊加軟硬件協同優化提升單節點帶寬——本質上是把原本需要線性堆疊硬件的投入，轉化為更高密度、更高利用率的系統能力。何振的判斷很乾脆：“誰能在同等算力需求下，用更少的資源、更高的利用率完成計算任務，誰就能在新一輪基礎設施建設中獲得優勢。” 告別“替代”敘事，中國存儲換了一張牌這次雙榜登頂，放在更大的座標系裡看，踩在了一次範式轉換的節點上——從“國產替代”切換到“全球並跑”。2026年第一季度，中國存儲器出口額同比增長174.2%，長江存儲全球NAND閃存市佔率升至13%，國產存儲正在從“政策單引擎”切換到“政策+性能”雙引擎並驅。產業層面的數據提供了宏觀註腳，但具體到每一款產品能否真正打開局面，仍需要接受市場和時間的檢驗，也正是基於這一認知，曙光內部對這次登頂的定位保持著清醒與剋制。何振首先劃清了能力驗證與商業成功之間的邊界：“這次在IO500的突破，更多是對產品能力的一次國際級驗證，不直接等同於商業市場的規模化結果。”基於這一判斷，曙光的海外策略沒有奔著規模擴張去，而是以科研機構、超算中心為切入點，優先進入對性能和工程能力要求更高的細分市場。石靜的判斷同樣剋制：“它不算一張全球通行證，只是代表我們具有這樣一個能力——算是給全球的一個亮相。”但亮相的意義，從來不只是被看見，石靜說："未來競爭的核心不在於'替換多少存量'，而在於'能否在新一代AI基礎設施中成為默認選項'。"從產業大勢到產品定位，從海外策略到生態願景，這些冷靜的研判背後，是二十年技術積累所沉澱出的底氣。被問到拿下雙第一的心情時，石靜用了八個字："行穩致遠、長期主義。"二十多年，足夠一條技術路線從實驗室走到全球評測的聚光燈下。這次IO500雙榜登頂，是一個節點，不是句號。雷峰網雷峰網

原始來源：雷峰網 ↗

查看原始來源