黃仁勳突襲英特爾AMD腹地，聯手王興興，打平三大國產模型

2026年6月1日 13:02

重點摘要

站內 AI 整理稿

智東西作者 | ZeR0 編輯 | 漠影英偉達憋了許久的芯片大招，終於來了。智東西6月1日報道，今日，在GTC臺北大會上，英偉達創始人兼CEO黃仁勳穿著閃亮的黑色皮衣發表主題演講，發佈2款芯片、1款桌面級AI超算、多款開源AI模型、框架、函數庫，還與宇樹科技聯合發佈了基於宇樹H2 Plus機器人的全新人形機器人參考設計。傳聞已久的英偉達首款Arm架構PC芯片終於亮相，名為RTX Spark超級芯片。黃仁勳宣佈與微軟推出全新PC產品線，並稱“這是40年來PC產品線首次全面革新”，同樣的智能體處理模式還將延展到各種設備上。他說，計算機的這次革命，重要程度不亞於普通手機演變為智能手機，英偉達已為此制定產品路線圖，每一代架構（Grace Blackwell、Vera Rubin、Rosa Feynman）都將配備臺式機、筆記本和工作站。英偉達還發布了全球最強大的Windows平臺桌面AI超級計算機DGX Station，以及英偉達豪賭2000億美元市場的大招——專為智能體設計的Vera CPU。這正是英偉達為智能體運行開拓的兩大全新市場。 Anthropic、OpenAI、SpaceX三家AI巨頭均率先部署Vera CPU。在Q1財報期間，英偉達曾透露全新Vera CPU將開啟一個價值2000億美元的市場，預計Vera芯片收入將在本財年末達到200億美元，成為“第二大銷售貢獻者”。今日，黃仁勳稱Vera CPU具有革命性意義，其產能爬坡令他非常滿意，“目前的訂單量已註定它將成為我們公司歷史上最快速、最成功的產品發佈。” “NVIDIA Vera是英特爾和AMD x86_64處理器有史以來最強大的競爭對手。”Phoronix CPU Benchmark Suite作者Michael Larabel評價說。面向智能體部署，英偉達推出迄今最強模型Nemotron 3 Ultra、企業級智能體工具箱。其中，Nemotron 3 Ultra的智能體生產力測試分數超過或打平了三個領先的國產智能體模型智譜GLM 5.1、月之暗面Kimi K2.6、阿里Qwen3.5。面向物理AI，英偉達開源世界基礎模型Cosmos 3、自動駕駛推理模型Alpamayo 2 Super，並宣佈成立Cosmos聯盟。面向AI工廠，英偉達宣佈Vera Rubin全面投產，並掏出了幫AI工廠更穩定、節能的兩大利器DSX OS和DSX MaxLPS。黃仁勳也一如既往地曬了一下英偉達龐大的“朋友圈”，並繼續鞏固熱愛美食的人設，特別感謝了在夜市的水果攤販，還給了花娘小館、富霸王豬腳餐廳等幾家飯店名字的特寫鏡頭。在演講中，黃仁勳繼續飆新金句： “實用AI時代已經到來。” “AI現在是利潤生成器、GDP生成器。” “計算即收入。” “買得越多，賺得越多。” “Token已成為盈利的收入單位。” “僅僅因為芯片更便宜就選擇錯誤的架構，是沒有意義的。” 黃仁勳認為，在AI工廠時代，每產生1個token就能盈利，每瓦性能、可靠性和系統壽命才是核心財務槓桿。 AI工廠每吉瓦成本是200億~300億美元起步，現已攀升至500億~600億美元，不久後將達到800億~1000億美元。這些投資必須確保一次成功。在黃仁勳看來，AI會減少工作崗位的說法“完全是無稽之談”，AI反而推動了軟件工程師需求的增長。作為GTC慣例，英偉達的機器人生態全家福再次展出。最後，在演講末尾，英偉達播放了由一群人形機器人、OpenClaw龍蝦、黃仁勳數字人共同參演的音樂MV。一、英偉達自研PC芯片登場：3nm製程，最高1P算力，能跑1200億參數大模型 “時隔40年，微軟與英偉達將重新發明PC（個人計算機）。”黃仁勳宣佈，英偉達與微軟面向個人智能體時代重新構想PC，推出為遊戲和智能體而生的RTX Spark超級芯片。 RTX Spark超級芯片採用臺積電3nm工藝，內置700億顆晶體管，提供128GB LPDDR5X統一內存和1PetaFLOPS FP4 AI算力，號稱是“史上能效最高的RTX芯片”。其中，Blackwell RTX GPU有6144個CUDA核心和第五代Tensor Core，並通過NVLink C2C芯片間互連技術連接到與聯發科合作開發的定製20核Grace CPU。黃仁勳將RTX Spark稱作“世界上製造過的最神奇的芯片”，“英偉達100%的軟件棧都在其上運行”。 RTX Spark融合了英偉達33年的創新成果，為全球首款專為個人智能體打造的Windows PC提供動力。英偉達CUDA可在RTX Spark上原生運行。搭載RTX Spark的PC，可以使用OptiX和DLSS渲染90GB超大型3D場景，使用英偉達Blackwell解碼器編輯12K 4:2:2視頻，運行具有100萬個token上下文的1200億參數大語言模型，以及使用光線追蹤、DLSS和Reflex以1440p分辨率和每秒100幀以上的速度玩3A遊戲。以前使用PC，用戶要啟動應用程序，點擊鼠標，輸入文字。現在使用RTX Spark和微軟Windows，用戶只需提出請求，電腦就能完成工作。此外，Adobe為RTX Spark重新設計了Adobe Photoshop和Premiere的架構，新版本在創意工作流程中，可將AI、編輯、調色和特效的處理速度最高提升至2倍。微軟與英偉達正在對整個PC進行全面重塑，發佈了面向智能體的全新三大Windows產品線，涵蓋筆記本電腦、臺式機、桌面超算。搭載RTX Spark的筆記本電腦和緊湊型臺式機將於今年秋季推出。筆記本電腦厚度僅為14mm，重量僅3磅，有14至16英寸多種尺寸選擇，可以24小時不間斷本地“養龍蝦”。二、全球最強桌面級AI超算：748GB內存，20P算力，能跑萬億參數模型英偉達今日還推出了一款適用於Windows的桌面AI超級計算機DGX Station。 DGX Station for Windows由微軟合作開發，基於英偉達DGX Station系統設計，搭載英偉達GB300 Grace Blackwell Ultra桌面級超級芯片，提供最高748GB統一內存、20PetaFLOPS FP4算力、800Gbps ConnectX-8 SuperNIC網絡，與所有Windows軟件兼容，可運行萬億參數級AI模型，並可同時運行數百個智能體。它支持額外配置一張RTX Pro 6000工作站級GPU，將前沿AI算力與光線追蹤可視化相融合，用於跨創意設計和工程應用運行智能體。 DGX Station for Windows預計將於今年第四季度由主流系統集成商上市。黃仁勳預言，未來有一天，每個家庭都會有一臺AI超級計算機，運行著你所有的智能體和助手。三、Vera CPU：88核、1.2TB/s內存帶寬，專為智能體設計傳統CPU追求每顆插槽的核心數，切片、虛擬化、按小時出租。在智能體時代，CPU已成為GPU利用率的瓶頸，直接影響token吞吐量、時延與用戶體驗。對此，英偉達推出其最先進的CPU——專為智能體而生的Vera CPU。 Vera CPU採用LPDDR5X內存（帶寬1.2TB/s）、支持PCIe Gen6，內外帶寬均達同類最高性能CPU的2至3倍，也是首款在糾正多位錯誤的同時不損失帶寬的CPU。它基於英偉達第二代可擴展一致性架構，將88個英偉達定製Arm核心Olympus統一在一個單片Mesh網絡上，在智能體工作負載上實現了最高的單線程性能與最佳能效比。其核心並未分散在多個Chiplet上，核心之間的通信速度比傳統CPU快50%。Vera支持內存一致性，NVLink-C2C芯片間互聯可將GPU直連到架構，還可以將Vera擴展到多個插槽，在CPU之間實現巨大頻寬。與Grace CPU相比，Vera的每個核心每時鐘週期可多執行50%的指令。與配備DDR5的x86 CPU相比，Vera每個核心的帶寬多達3倍；與x86 CPU相比，峰值內存延遲降低了40%，在檢索分析與沙箱執行中保持核心供給及時。在Python代碼分析、代碼編譯等常見智能體工具的行業標準基準測試中，Vera的智能體沙箱性能是與x86 CPU競品性能的1.8倍。該處理器有四大核心設計原則：領先的每時鐘指令數（IPC）/ 單線程性能、每核心帶寬、總帶寬以及能效。 Vera每時鐘可取指、解碼並執行10條指令，IPC全球最高。英偉達Olympus核心專為現代數據中心工作負載、分支密集型Python運行時、工具調用和沙箱代碼執行而優化。每顆核心均為吞吐量調優：神經分支預測器可在每個週期評估兩個選定分支，10-Wide解碼引擎可在每個週期代入更多工作負載，大型亂序執行引擎維持著指令的運作，新型圖引擎的高階預取器可預測下一個數據路徑。 Vera片上高速互聯總線帶寬達3.4TB/s，無芯粒稅（chiplet tax），無跨片邊界損耗，所有核心可與其他任何核心及緩存無延遲通信，不存在調度衝突。 Vera CPU已進入全面量產，並將於今年秋季通過系統合作伙伴正式上市。 Anthropic、OpenAI、SpaceX均是Vera CPU的早期採用者。在SQL 1TB基準測試中，Vera CPU的SQL運行速度達到競品的3倍。 Vera CPU正在為紐約證券交易所（NYSE）運行實時流處理，實現了6倍的性能提升。四、人形機器人參考設計：宇樹機身+Sharpa靈巧手，開箱即用 NVIDIA Isaac GR00T參考人形機器人是首款基於英偉達Jetson Thor和Isaac GR00T平臺構建的開放人形機器人參考設計。這個參考設計集成了宇樹H2 Plus人形機器人、Sharpa Wave五指靈巧手、英偉達Jetson Thor處理器以及Isaac GR00T軟件和工作流程，並預裝了英偉達GR00T 1.7人形機器人模型，開箱即用。具體包括：宇樹H2人形機器人底盤：身高近6英尺，重150磅，全身有31個自由度，用於人體尺度測試。雙Sharpa Wave觸覺五指靈巧手：可實現22個自由度的靈巧操作，使機器人在身體和手部達到75個自由度。多視角傳感器：包括一個頭戴式立體攝像頭（水平140度，垂直102度），用於近距離操作的腕部攝像頭，以及一個用於運動跟蹤的慣性測量單元。全身控制：手臂扭矩高達120N·m，腿部扭矩達360N·m，手臂額定有效載荷為7公斤，峰值有效載荷為15公斤，舉升和伸展能力更強。英偉達Jetson AGX Thor T5000板載計算：配備NVIDIA Blackwell GPU，FP4 AI性能達2070TFLOPS，14核Arm CPU，128GB統一內存，以及可配置的40至130瓦功率範圍，用於實時傳感器處理和機器人推理。支持以太網、Wi-Fi 6、藍牙5.2、USB連接，並配備一系列麥克風和揚聲器，用於語音交互。電池容量為15Ah，0.972kWh，續航時間約為3小時，可延長運行時間。遠程緊急停止功能，可快速安全地脫離機器人。宇樹科技已在官方公佈Isaac GR00T參考人形機器人的全身配置：今年年底，NVIDIA Isaac GR00T參考人形機器人將由宇樹科技提供。 NVIDIA Isaac GR00T開發者平臺還將支持宇樹G1人形機器人。針對宇樹G1的參考工作流程預計很快將在GitHub和Hugging Face上提供給機器人開發人員。為什麼要做這件事？黃仁勳說，研究實驗室從人形機器人制造商那裡獲得的機器人，尚未達到量產就緒狀態，因此，實驗室將大量時間和精力花在使機器人的基本功能正常運作上。而一個能夠規模化開發、配備備用零件、開箱即用的平臺，將計算、軟件棧、手部和機身全部集成在一起，統一設計協同運行，並配備完整的仿真能力，使研究實驗室能直接開箱使用，立即投入研究。四、開源英偉達最強世界模型：5500億參數，5倍速度、成本降低30% 英偉達致力於為全世界構建開源模型，讓人人都能打造屬於自己的智能體。 Nemotron 3 Ultra是英偉達迄今最強的新一代開源基礎模型，也是面向自主智能體能力最強的模型，共有5500億個參數。這是全球首個基於SSM（狀態空間模型）與專家混合（MoE）混合架構的模型。它的速度是同級別領先模型的5倍，完成相同智能體任務所需的運行成本降低30%。 “無論是總浮點運算量還是總推理時間，均優於目前最具性價比的開源模型。”黃仁勳總結說。目前英偉達正在研發Nemotron 4。五、打造智能體工具包，智能體將芯片設計驗證提速40多倍黃仁勳說，下面這張圖是本場演講中最重要的一張幻燈片，也是最核心的結論：這是未來十年的應用模式、計算模式，每家公司都會採用。如何幫助企業安全地構建和運行智能體？為此，英偉達推出了企業級智能體工具包（NVIDIA Agent Toolkit for Enterprise AI）。英偉達智能體工具包結合了大語言模型、智能體框架和企業級運行時，能為企業內部提供高度安全的環境。所有智能體都可以使用基於NVIDIA CUDA-X庫（包括 cuDF、cuOpt、AI-Q、NeMo、PhysicsNeMo和CUDA-Q）的智能體Skills。這些經過驗證的英偉達智能體Skills可在Claude Code插件市場和Hermes Skills Hub中找到。 NVIDIA OpenShell是這些自主智能體的安全運行時環境，為智能體操作提供獨立的沙箱、集中式策略執行和治理管理網關，並可在Ubuntu、Windows、Red Hat OpenShift等主流企業平臺上運行。黃仁勳說，他最喜歡的智能體應用案例之一是芯片設計。英偉達與Cadence合作，打造了一款芯片設計超級智能體。通過協調寄存器傳輸級生成、測試平臺創建、迴歸測試和調試，這個超級智能體可自動運行數百次模擬和形式化檢查，可將原本耗時數週的工作壓縮到幾小時，驗證週期快了40多倍。 “英偉達擁有數千名芯片設計師。我們將引入數十萬名Cadence超級智能體與我們協同工作，加速公司發展。”黃仁勳說。六、物理AI：全新世界模型、自動駕駛推理模型開源物理AI最大的挑戰是數據。對此，英偉達推出一款面向物理AI的開源世界基礎模型Cosmos 3。 Cosmos 3基於混合Transformer架構，將視覺推理和跨文本、視頻、圖像、環境音效和動作的多模態生成功能整合到一個模型中，幫助開發者創建具有物理上下文的世界數據。該模型是VANTAGE-Bench測試榜上排名第一的開放視覺語言模型。開發者可針對不同形態和應用場景對Cosmos 3進行後訓練（post-train），比如用於世界推理、合成數據、閉環仿真器或世界動作模型。所有模型、代碼和訓練方案均已在Hugging Face和GitHub上開放。同時，英偉達宣佈成立Cosmos聯盟（Cosmos Coalition），Agile Robots、Black Forest Labs、Runway、LightTricks、Skilled AI等部分頂尖AI實驗室正與英偉達共同開發下一代Cosmos。面向自動駕駛領域，英偉達也推出了全新物理AI模型、框架、函數庫：（1）Alpamayo 2 Super：一款擁有320億參數的開放自動駕駛推理模型，專為推理、規劃、標註和評估設計。（2）AlpaGym：一款開源閉環強化學習框架，讓開發者能夠在仿真環境中訓練自動駕駛策略，模型動作能夠真實影響後續仿真結果。（3）OmniDreams：一款基於Cosmos構建的專用角色模型，可大規模生成稀有、逼真的長尾駕駛場景。（4）全新Omniverse NeRF函數庫：能在單塊GPU上以25ms以內的速度完成真實世界的重建與渲染，使開發者可實時評估模型的感知效果。這些發佈共同為自動駕駛開發者提供了一條更快速、更安全的L4自動駕駛實現路徑。七、Vera Rubin已全面投產今年年初發布的Vera Rubin，現已全面投產。黃仁勳說，Vera Rubin是英偉達史上最具雄心的項目，全公司40000名工程師都參與其中。 Vera Rubin專為運行智能體而生，是一套完整的分解式分佈式智能體處理系統，包含Vera Rubin NVL72系統、液冷Vera CPU機架、Vera BlueField-4 STX存儲和安全系統、Groq 3 LPX低延遲推理托架和Spectrum-X Ethernet Photonics網絡。該平臺由中國臺灣超過150家供應鏈生態合作伙伴參與，遍佈數百個工廠。所有組件均通過極致協同設計（extreme co-design）打造。英偉達為Vera Rubin打造的供應鏈，規模是Grace Blackwell的2倍。以前組裝一個 Grace Blackwell機架需要2小時，現在只需5分鐘。產能更高，出貨速度也大幅提升。單個液冷Vera CPU機架容納256顆CPU，負責模型編排、內存調度與工具調用。在富士康與廣達，Groq LPX逐步成形。256顆Groq LPU分佈於16個托盤，片上靜態隨機存儲器（SRAM）帶寬高達40PB/s，實現超低時延。 Spectrum-X Ethernet Photonics是全球首款採用共封裝光器件的200Gb/s SerDes以太網交換機，現已投入生產。 Vera BlueField-4 STX由BlueField-4加速，在芯片層面處理安全問題：DOCA Argus可將威脅檢測時間從分鐘縮短至毫秒；DOCA Vault可在機架規模上保護AI數據。八、DSX：幫企業構建和管理AI工廠，相同功耗下多塞40%的GPU 英偉達曾經在計算機內部設計一顆芯片，然後在計算機內部仿真一個系統，如今終於可以在數字框架、數字仿真器、數字世界中構建這些龐大的系統，在破土動工、投入真金白銀之前驗證一切。黃仁勳解釋說，RTX對應GPU，DGX對應系統，而DSX對應基礎設施。世界正在競相建設AI工廠芯片、機架、網絡、電力、冷卻、電網每一層都必須從頭到尾協同設計，因為“計算即收入”。 NVIDIA DSX是以最高效率和盈利能力設計、建設與運營AI工廠的參考設計，致力於實現最低Token成本，並守護能源電網安全。今日，英偉達推出適用於DSX平臺的全新AI工廠操作系統DSX OS和DSX MaxLPS。 DSX OS是一款模塊化、開源、可擴展的基礎設施軟件，專為AI工廠運營商設計，負責配置、運營、監控和修復基礎設施，將已安裝的系統轉化為可信賴的多租戶、高彈性、AI就緒的算力容量。 DSX OS開源組件的生態合作伙伴可接入自有軟件，並通過ISV（獨立軟件供應商）生態加以擴展。 DSX MaxLPS是一套專門設計的技術組合，能與Vera Rubin硬件的動態功耗特性協同配合，統籌優化算力吞吐，幫助數據中心運營商在相同功耗、電力預算下可多提供40%的GPU，每年可新增數十億美元的營收。熱液冷卻技術在45℃下運行，耗水更少、能耗更低，將更多電力導向創收算力；動態電力調配技術將電力從機架到機架靈活調度，回收閒置功耗，將其輸送至有工作負載的地方；機架內削峰平滑技術抑制電流尖峰和功率浪湧，穩定整個工廠的供電；

原始來源：智東西 ↗

查看原始來源

TechWebAI Agent

網易有道全面向AI轉型全場景Agent矩陣亮相圖博會

{"id":"39ef5947-b77a-4904-bf03-ff6264f08dc4","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":154,"output_tokens":200,"total_tokens":354}}

剛剛閱讀分析

Hugging Face BlogAI Agent

MosaicLeaks: Can your research agent keep a secret?

Back to Articles MosaicLeaks: Can your research agent keep a secret? Enterprise Article Published June 18, 2026 Upvote - Alexander Gurung agurung Follow ServiceNow Rafael Pardinas rafapi-snow Follow ServiceNow TL;DR Deep research agents increasingly combine private local documents with external tools like web retrieval, creating a privacy risk: an agent's external queries may leak sensitive information. MosaicLeaks proposes a new deep-research task with multi-hop questions that interleave public and private information. Across the models we tested, agents frequently leaked private information, and training only for task performance made it worse. We propose a mosaic-leakage-aware RL training method, Privacy-Aware Deep Research (PA-DR), which raises strict chain success (the share of chains

17 小時前閱讀分析