十年榜單首迎中國雙料冠軍:這次贏的不只是性能
重點摘要
6月,在德國漢堡ISC高性能計算大會的展臺上,GPU、液冷、量子計算的聲浪依舊洶湧,但今年,會場的主角悄悄換了人。IO500榜單——全球高性能計算存儲領域最權威的評測體系——公佈了最新一期結果:中科曙光ParaStor F9000分佈式全閃存儲系統,同時拿下生產型全節點和10節點兩大榜單的第一名。在這一榜單近十年的歷史中,能夠同時統領這兩個維度的,此前只有少數幾家美國廠商,中科曙光成為首家達成此成就的中國公司。與研究性榜單不同,生產型榜單的評選有一條硬性要求:存儲系統必須已在真實業務環境中不間斷運行超過一年,這意味著F9000並非實驗室裡的測試樣機,而是一套正在產線上承擔生產任務、隨時會被業務中斷打擾的真實系統。中科曙光北京公司副總裁何振則將這一差異概括為評價標準的遷移:從“峰值性能”轉向“真實系統能力”,考核的重點變成了長期穩定性、複雜負載適配能力和大規模擴展時的一致性表現。在何振看來,這次奪冠的意義遠不止“拿了一個冠軍”:“這是國產高端存儲第一次在全球最嚴格的真實生產型評測體系中,形成了系統性領先。” ParaStor F9000憑什麼贏?中科曙光分佈式存儲總工程師袁清波,把F9000的技術壁壘歸納成三層,並坦言這三層的技術難度是遞進的。最顯性的差異在硬件形態上,市面上2U24盤位的NVMe全閃機型並不罕見,但F9000採用了一種業內稱為“雙子星”的特殊設計——在2U的空間裡塞進兩個完全獨立的物理節點,每個節點都有自己的主板、CPU、內存、網卡和SSD。更關鍵的創新藏在連接方式裡:CPU一側直連NVMe介質,另一側直連網卡,中間完全不經過PCIe Switch轉接。“這給我們提供了兩倍的PCIe Lane數量。”袁清波說。與此同時,這兩倍的Lane數量被有意識地“對半分”給了SSD和網卡,袁清波指出,“這種均衡恰恰是行業裡容易被忽視的地方,做標準服務器的人,對網絡和SS
6月,在德國漢堡ISC高性能計算大會的展臺上,GPU、液冷、量子計算的聲浪依舊洶湧,但今年,會場的主角悄悄換了人。IO500榜單——全球高性能計算存儲領域最權威的評測體系——公佈了最新一期結果:中科曙光ParaStor F9000分佈式全閃存儲系統,同時拿下生產型全節點和10節點兩大榜單的第一名。在這一榜單近十年的歷史中,能夠同時統領這兩個維度的,此前只有少數幾家美國廠商,中科曙光成為首家達成此成就的中國公司。與研究性榜單不同,生產型榜單的評選有一條硬性要求:存儲系統必須已在真實業務環境中不間斷運行超過一年,這意味著F9000並非實驗室裡的測試樣機,而是一套正在產線上承擔生產任務、隨時會被業務中斷打擾的真實系統。中科曙光北京公司副總裁何振則將這一差異概括為評價標準的遷移:從“峰值性能”轉向“真實系統能力”,考核的重點變成了長期穩定性、複雜負載適配能力和大規模擴展時的一致性表現。在何振看來,這次奪冠的意義遠不止“拿了一個冠軍”:“這是國產高端存儲第一次在全球最嚴格的真實生產型評測體系中,形成了系統性領先。” ParaStor F9000憑什麼贏?中科曙光分佈式存儲總工程師袁清波,把F9000的技術壁壘歸納成三層,並坦言這三層的技術難度是遞進的。最顯性的差異在硬件形態上,市面上2U24盤位的NVMe全閃機型並不罕見,但F9000採用了一種業內稱為“雙子星”的特殊設計——在2U的空間裡塞進兩個完全獨立的物理節點,每個節點都有自己的主板、CPU、內存、網卡和SSD。更關鍵的創新藏在連接方式裡:CPU一側直連NVMe介質,另一側直連網卡,中間完全不經過PCIe Switch轉接。“這給我們提供了兩倍的PCIe Lane數量。”袁清波說。與此同時,這兩倍的Lane數量被有意識地“對半分”給了SSD和網卡,袁清波指出,“這種均衡恰恰是行業裡容易被忽視的地方,做標準服務器的人,對網絡和SSD這兩個硬件的定位是相同的,但對存儲系統來說,讀的時候數據從盤上讀出經網卡發出,寫的時候從網卡收進再下到盤上,數據流動方向剛好相反。”ParaStor圍繞每個CPU核心,把與之相關的內存、網卡、SSD綁定成一個獨立的IO子域,確保混合負載之間相互隔離又能靈活配置。“用戶發出的每一次IO,從發出那一刻起,我們就知道它要走哪個網卡、用哪塊內存、經哪個核,最後落在哪塊盤上。”袁清波說。效果體現在一個具體指標上:系統吞吐量已被推至內存帶寬的峰值。“基本上沒有傳統方案能做到這一點,”袁清波說,“一旦後面硬件有提升,比如網卡頻率提高10%,我們的性能也能同步提升10%。”在這套架構之上,還疊加了一層QoS調控機制,能針對不同業務分別設定帶寬和IOPS的上下限——這正是F9000在“業務不能停”的生產環境裡,額外完成打榜測試而不互相干擾的關鍵。硬件形態和軟件架構再往下走,是一層更難以複製的壁壘:全棧自研,石靜的體會很直接:如果軟硬件不是從底層設計的,跨層、跨參數的相互影響根本無從優化,只能在別人定好的邊界裡小修小補。從戰略的視角來看,何振表示:“全國產自研的意義,並不只是供應鏈層面的可靠保障,更重要的是帶來了體系級優化空間——核心軟硬件棧完全可控,使存儲系統可以在協議棧、數據路徑、調度機制等多個層面進行深度協同優化。”把存儲本身跑快,只是基礎。F9000面向AI場景,能夠做到“以存提算、以存代算、以存降本”三級協同——本質上是把存儲從被動的數據供給層,升級為參與計算路徑設計的一部分。在計算節點側,F9000做了三層加速:把節點本地內存和NVMe SSD池化為近算力緩存,在訓練前先將數據集“預熱”進來,避免每次跨網絡回源到後端存儲;再通過XDS技術,讓數據直接從網卡進入GPU顯存,繞開CPU內存轉發。“我們已經把內存帶寬跑到了峰值,但XDS可以進一步突破內存帶寬的限制——數據根本不走內存了。”袁清波解釋,這之所以關鍵,是因為AI訓練對數據供給的容錯率極低,一旦數據沒供到位,GPU集群就只能空轉等待。網絡側,F9000優先適配的是曙光自研的scaleFabric——一款400G原生無損RDMA網絡,中科曙光高速網絡互聯產品部總工程師萬偉透露,網卡設計之初就考慮了存儲的極端需求:在10萬卡集群規模下,存儲節點需要面向所有計算節點的併發訪問,現有IB的QP規模根本撐不住,團隊直接把這一指標擴展了一倍。存儲側的重心,則從“更快供給”轉向“主動分擔”。兩項能力承擔了這個角色:KV Cache offload自動將GPU閒置的KV緩存塊遷移到後端全閃存儲,推理時再通過XDS高速通路回傳顯存,實測降低60%以上GPU顯存佔用,單卡併發推理承載量提升2到10倍;存儲端AI算子加速庫則把數據清洗、向量編碼等預處理操作下沉到存儲側執行,跨節點數據傳輸量減少70%。袁清波把這套組合拳的意義概括為一句話:“未來存儲系統的競爭將從單一性能指標,轉向系統級綜合能力——數據路徑效率、端到端延遲控制能力、GPU利用率提升能力,以及高併發場景下的整體吞吐穩定性,這些指標共同決定系統在真實AI負載下的有效價值。” 把存儲從數據倉庫變成AI調度中樞大模型訓練進入萬卡、十萬卡規模之後,一個共識正在行業裡形成:瓶頸,已經從“算力不足”轉移到了“數據供給不足”。袁清波表示:“在大規模AI訓練體系中,算力本身已經高度冗餘,真正限制系統效率的是數據供給能力。如果存儲無法持續提供高帶寬、低時延的數據流,GPU將處於等待狀態,導致算力資源浪費。”這種瓶頸轉移,正在逼著存儲的角色發生根本性變化,石靜的判斷是,ParaStor不再是一個數據容器,在AI的驅動下,它正在向“AI數據工廠”躍遷,存儲開始成為計算路徑設計的一部分。這種躍遷已經發生在具體場景裡。在具身智能領域,曙光為智元機器人提供了超過500GB/s聚合讀帶寬的專屬存儲方案,支撐多款通用型機器人的快速迭代;自動駕駛領域,曙光連續為國內頭部造車新勢力提供超百PB存儲資源,覆蓋從數據採集到仿真驗證的全流程閉環,模型研發週期縮短40%以上;科學計算領域,F9000支撐了414.7億原子規模的液態水分子動力學模擬——存儲開始直接參與數據與計算高度耦合的科學發現過程。截至目前,ParaStor F9000已搭載於曙光scaleX萬卡超集群,支撐了百餘個AI與高性能計算領域的生產應用。而下一代AI基礎設施的競爭焦點,已從單一硬件能力轉向系統級協同,何振將這種競爭的核心概括為三個維度:存算網一體化的數據流動效率、跨層資源調度能力,以及整體TCO優化。“國產廠商的優勢,在於更完整的系統工程能力——可以從整機、網絡到軟件棧進行端到端優化,而不是侷限於單點性能提升。”這套系統級競爭的邏輯,恰好撞上了當前存儲市場近15年來最陡峭的漲價週期,海外巨頭把產能向HBM、DDR5等高附加值領域傾斜,傳統存儲市場出現供給缺口。但何振認為,這輪漲價的本質不是單一器件價格波動,而是AI算力需求爆發後,存儲、網絡、算力同步擴張帶來的系統性成本上升。正是在這個矛盾裡,“以技術換效率、以效率降成本”開始成為國產存儲的差異化路徑。F9000的智能數據分層,把高頻數據放到高性能路徑上,低頻數據沉澱到性價比更高的介質,再疊加軟硬件協同優化提升單節點帶寬——本質上是把原本需要線性堆疊硬件的投入,轉化為更高密度、更高利用率的系統能力。何振的判斷很乾脆:“誰能在同等算力需求下,用更少的資源、更高的利用率完成計算任務,誰就能在新一輪基礎設施建設中獲得優勢。” 告別“替代”敘事,中國存儲換了一張牌這次雙榜登頂,放在更大的座標系裡看,踩在了一次範式轉換的節點上——從“國產替代”切換到“全球並跑”。2026年第一季度,中國存儲器出口額同比增長174.2%,長江存儲全球NAND閃存市佔率升至13%,國產存儲正在從“政策單引擎”切換到“政策+性能”雙引擎並驅。產業層面的數據提供了宏觀註腳,但具體到每一款產品能否真正打開局面,仍需要接受市場和時間的檢驗,也正是基於這一認知,曙光內部對這次登頂的定位保持著清醒與剋制。何振首先劃清了能力驗證與商業成功之間的邊界:“這次在IO500的突破,更多是對產品能力的一次國際級驗證,不直接等同於商業市場的規模化結果。”基於這一判斷,曙光的海外策略沒有奔著規模擴張去,而是以科研機構、超算中心為切入點,優先進入對性能和工程能力要求更高的細分市場。石靜的判斷同樣剋制:“它不算一張全球通行證,只是代表我們具有這樣一個能力——算是給全球的一個亮相。”但亮相的意義,從來不只是被看見,石靜說:"未來競爭的核心不在於'替換多少存量',而在於'能否在新一代AI基礎設施中成為默認選項'。"從產業大勢到產品定位,從海外策略到生態願景,這些冷靜的研判背後,是二十年技術積累所沉澱出的底氣。被問到拿下雙第一的心情時,石靜用了八個字:"行穩致遠、長期主義。"二十多年,足夠一條技術路線從實驗室走到全球評測的聚光燈下。這次IO500雙榜登頂,是一個節點,不是句號。雷峰網雷峰網
Related
相關文章

訓練世界模型,開始從人類的肌肉和腦子裡偷師了
這篇消息聚焦「訓練世界模型,開始從人類的肌肉和腦子裡偷師了」。原始導語提到:具身智能數採迎來了新範式 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
OpenAI 發佈 GeneBench-Pro 基準測試,提升 AI 模型生物學分析能力!
OpenAI推出GeneBench-Pro基準,聚焦評估AI在基因組學、蛋白質組學等複雜生物數據分析中的實際研究能力,尤其檢驗模型處理混亂、不完整數據時的判斷與決策水平,與傳統基準截然不同。

字節Seed最新論文,解決了AI改圖的核心難點
這篇消息聚焦「字節Seed最新論文,解決了AI改圖的核心難點」。原始導語提到:字節與新加坡國立大學最新成果。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Loop世界模型論文登頂Hugging Face,來自中國一家初創,周鴻禕陸奇都投了
這篇消息聚焦「Loop世界模型論文登頂Hugging Face,來自中國一家初創,周鴻禕陸奇都投了」。原始導語提到:重寫“AI如何反覆推演世界” 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

AI 沒書可讀之後,兩個 AI 教父賭上了相反未來
這篇消息聚焦「AI 沒書可讀之後,兩個 AI 教父賭上了相反未來」。原始導語提到:AI 沒書可讀之後,誰掌握“裁判”,誰掌握下一輪進化。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

百億估值只是起點,跨維智能的物理AGI之路
這篇消息聚焦「百億估值只是起點,跨維智能的物理AGI之路」。目前來源未提供完整摘要。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。