微軟Build大會一文看盡：9款自研模型、Windows版龍蝦、“夢中情機”，黃仁勳猛誇

2026年6月2日 23:04

重點摘要

站內 AI 整理稿

智東西作者 | 陳駿達編輯 | 心緣智東西6月3日報道，今天凌晨，在微軟Build 2026開發者大會上，微軟一口氣發佈了超20項重磅更新，包括9款自研模型、與英偉達合作的全新PC產品、Windows版“龍蝦”，以及超10款智能體應用和開發工具。英偉達創始人兼CEO黃仁勳從臺北遠程連線，深夜和微軟董事長兼CEO薩蒂亞·納德拉（Satya Nadella）納德拉展開對談。黃仁勳說，AI基礎設施已經進入智能體時代，而微軟與英偉達正在共同定義下一代AI計算平臺。 “如果我們能把算力、內存都最大化，那會造出怎樣一臺開發者的「夢中情機」？” 納德拉用一個問題引出微軟重磅PC新品——搭載英偉達RTX Spark超級芯片的Surface RTX Spark Dev Box桌面工作站，AI算力達1PFLOPS，本地能跑120B參數的大模型。 ▲Surface RTX Spark Dev Box 除了新型PC外，微軟還展示了為多智能體世界而生的兩款新型AI硬件：一款是能塞在胸前的AI可穿戴設備，另一款是AI桌面伴侶，主打以低成本、即插即用、隨時響應的方式來使用智能體。值得一提的是，在扶持OpenAI七年後，微軟AI超級智能團隊終於發力，連推7款自研大模型：首款旗艦推理模型MAI-Thinking-1性能追平Claude Opus 4.6，圖像模型MAI-Image-2.5盲測分數超過歌的Nano Banana 2。微軟首款自動駕駛智能體Microsoft Scout也正式登場，基於OpenClaw構建，採用企業級安全架構，可直接操作電腦及日常使用軟件。納德拉將其稱為企業級“龍蝦”。還有Windows版OpenClaw，現已推出預覽版。微軟與OpenClaw合作，將OpenClaw與微軟MXC結合，幫IT管理員輕鬆做好智能體安全保護。此外，微軟發佈新一代量子計算芯片Majorana 2，量子比特可靠度是上一代的1000倍，平均壽命為20秒，偶爾甚至超過1分鐘。微軟預計在2029年實現真正可規模化的量子計算機。一、迷你工作站塞入128GB統一內存，自帶“開發者特調版”Win11 微軟與英偉達的合作是本次Build大會上的重點。微軟本週早些時候推出的Surface Laptop Ultra首發了英偉達RTX Spark超級芯片，預計今年秋天上市。面向開發者，微軟打造了Surface RTX Spark Dev Box。這是一款桌面工作站產品，使用英偉達的RTX Spark超級芯片，擁有1 Petaflop的AI計算能力、20個CPU核心和128GB統一內存，同樣將於今年秋天推出。微軟稱，Surface RTX Spark Dev Box可以支持本地運行1200億個參數、100萬上下文的模型，或者對模型進行微調。散熱對這類高性能桌面設備尤為關鍵。Surface RTX Spark Dev Box採用鋁製機殼，兼作散熱器。 Surface RTX Spark Dev Box自帶面向開發者優化的Windows 11，預配置了所有必備開發工具，比如Visual Studio Code、Windows終端內嵌的GitHub Copilot、WSL、PowerShell 7。其設置也面向開發的需求進行了調整，沒有新聞推送，沒有彈出的小組件，沒有通知，默認採用深色模式。這一設置可通過GitHub上的Windows Developer Config項目一鍵部署。 ▲面向開發者優化的Windows 11 安全性方面，Surface RTX Spark Dev Box擁有安全核心PC架構、BitLocker加密和Microsoft Defender防護，並面向企業提供了Entra ID和Intune功能，可實現大規模管理。二、聯手高通、聯發科推出參考設計，智能體硬件要直接殺入工作場景微軟全球副總裁、應用科學組負責人Steven Bathiche分享了微軟在新型硬件方面的探索——Project Solara，併發布兩款硬件參考設計。 Bathiche認為，下一代計算設備不一定是一臺電腦、一部手機或一副眼鏡，而是多個設備協同組成的系統。用戶的智能體會根據場景需要，在最合適的時間和地點出現，並通過不同形態完成工作。 Project Solara是一個智能體優先的設備平臺，建立在三大基礎之上：首先是面向企業級部署的微軟設備生態系統；其次是智能體驅動的全新交互模型；最後是擴展能力，允許企業接入自己的智能體。在Build大會上，微軟首次展示了兩類參考設備。第一類是固定式設備。這是一款面向辦公桌場景設計的智能體終端，採用聯發科平臺，支持Windows Hello企業身份認證。用戶走近設備即可完成安全登錄，直接訪問自己的智能體服務。設備會基於用戶的工作上下文持續提供信息和建議。例如提醒當天最重要的待辦事項、協助規劃工作流程，甚至幫助用戶直接將任務委託給智能體執行。與此同時，這一設備還能夠與Windows PC和Windows 365雲電腦無縫協同，成為現有辦公環境的補充。相比固定設備，第二種形態更加靈活，是一款類似數字工牌的可穿戴設備原型。這款設備採用高通驍龍平臺打造，體積小於傳統移動終端。現場演示中，Bathiche通過指紋完成身份驗證後，直接調用個人智能體執行任務。他按下錄製按鈕，設備側邊攝像頭開始採集現場畫面，並向智能體下達指令：整理Build大會現場素材，生成內容併發送給團隊審核。隨後整個流程由智能體自動完成，包括內容收集、整理、歸檔和分發。 Bathiche強調，這類設備的價值並不在於硬件本身，而在於能夠將智能體能力直接帶到工作發生的地方。以醫療場景為例，護士佩戴設備後，可以通過語音與智能體實時交互，自動完成病歷記錄、語音轉寫、發言人識別以及護理記錄整理。同樣的能力也適用於零售、製造業、金融服務、法律服務等眾多行業。這些設備是一類參考設計。企業可以在相同的軟件架構基礎上調整外觀形態、屏幕尺寸、傳感器配置甚至輸入方式，並加載各自的智能體系統，從而快速構建針對特定場景的專用設備。微軟透露，目前已經有多家企業開始參與相關探索，包括Best Buy、CVS Health、Levi’s、Target等公司都在研究如何將智能體設備引入自身業務流程。納德拉總結道，Project Solara最重要的意義並不是推出一種新的平臺，而是在重新定義了一套平臺規則，讓開發者和企業能夠自由想象智能體應該存在於何處，以及它們將以什麼樣的形態出現。三、MAI連發7款自研模型，旗艦推理模型比肩Claude Opus 4.6 本屆Build大會上，微軟的AI研究部門MAI集中發佈了7款新模型，涵蓋旗艦推理模型、編程模型、圖像生成模型、語音識別模型和語音模型等多個類別。微軟首個推理模型MAI-Thinking-1採用混合專家（MoE）架構，擁有350億激活參數、大約1萬億和256K上下文窗口。微軟AI CEO Mustafa Suleyman稱，在與行業主流模型的對比測試中，MAI-Thinking-1獲得了更高的人類評測偏好率。在多個推理基準測試中，其表現達到行業領先水平。尤其是在軟件工程基準SWE-bench Pro上，該模型取得53%的成績，與Claude Opus 4.6處於同一梯隊。 Mustafa特別強調：“MAI-Thinking-1完全從零開始訓練，沒有針對特定基準進行優化，也沒有采用蒸餾技術。”這意味著模型擁有清晰、可追溯且具備商業授權的數據來源，更適合企業級生產環境部署。圖像模型方面，微軟推出了MAI-Image-2.5及其輕量化版本MAI-Image-2.5-Flash。兩款模型在圖像質量和編輯能力方面實現了突破，MAI-Image-2.5在大模型競技場圖像編輯排行榜中排名第二，超過了多個主流競爭對手。目前，兩款模型已經集成至PowerPoint，並正在向OneDrive推廣，同時已在Azure Foundry開放使用。微軟同時發佈了新一代語音轉錄模型MAI-Transcribe-1.5。根據微軟公佈的數據，該模型支持43種語言，在轉錄準確率方面達到行業領先水平，並在多項測試中超過現有旗艦模型。在語音生成領域，微軟發佈了MAI-Voice 2和MAI-Voice-2-Flash。 MAI-Voice 2支持15種語言，具備更加自然的語調、情感表達以及細粒度控制能力；而Flash版本則重點面向實時語音智能體場景，以更低延遲和更高效率滿足企業需求。微軟還推出了專門針對編程任務優化的MAI-Code-1-Flash。儘管僅擁有50億參數，但該模型在SWE-bench Pro測試中取得51%的成績，展現出較高的推理效率。該模型針對VS Code和GitHub Copilot CLI進行了深度優化，能夠以更低成本提供接近大型模型的代碼生成與推理能力。除了Azure Foundry之外，微軟宣佈將把MAI系列模型同步提供給多個第三方AI生態平臺，包括OpenRouter、Fireworks AI、Baseten等。開發者未來可以直接在這些平臺上獲取模型權重並進行個性化微調。 Mustafa還重點介紹了微軟在模型與芯片協同設計方面的最新進展。 MAI-Thinking-1已針對微軟自研的Maia 200 AI芯片進行了專項優化。MAI-Thinking-1+Maia 200的組合，每瓦性能是英偉達GB200的1.4倍。微軟計劃將這些優化後的模型部署至即將推出的N1X設備平臺，以進一步提升Windows端側AI體驗。微軟重點介紹了名為“Frontier Fine-Tuning（前沿微調）”的新能力。微軟認為，未來企業競爭的關鍵不再是使用統一的大模型，而是擁有基於自身數據、工作流程和知識資產訓練出來的專屬模型。通過強化學習環境（RLE）和定製訓練平臺，企業能夠持續優化模型，使其更加貼合自身業務場景。微軟披露，在內部測試中，經過前沿微調的MAI模型在部分任務上已達到與最新旗艦模型相當的效果，同時實現約10倍的成本效率提升。四、Windows AI API支持範圍拓展，兩款自研小語言模型將登陸Windows 納德拉稱，邊緣端的算力總量，其實是相當驚人的。如今已有許多AI功能依靠Windows設備的本地AI能力運行，比如Outlook的摘要、PowerPoint超分辨率功能、Adobe的AE、Premiere也都在Windows上利用NPU和GPU進行本地處理。為了充分挖掘這些計算潛力，微軟宣佈擴大本地AI推理框架Windows ML和Windows AI API（無需自備模型即可使用的內置AI能力接口）的支持範圍。這樣一來，任何開發者都能利用設備上已安裝的GPU，為本地AI構建應用，並在整個系統環境中流暢運行。同時，微軟還發布了兩個將在Windows本地運行的小語言模型（SLM）：一個是更高效的文本模型Aion 1.0 Instruct，支持日常文字處理工作，還集成到了Edge瀏覽器中。另一個是規劃模型Aion 1.0 Plan。這一模型擁有140億個參數，可以作為本地智能體引擎，幫助開發者構建完全離線的智能體循環，實現意圖識別、工具調用、文件管理和多智能體編排，無需雲端參與即可完成任務執行。在開發工具方面，微軟推出了一系列更新：無干擾開發環境、內置GitHub Copilot的智能終端、70多個Linux實用工具。此外，微軟還發布了WSL容器，讓開發者在本地構建和部署時不會被複雜的環境依賴等問題干擾。其中一個WSL配置文件能在Windows上支持Mac用戶熟悉的Starship、Zsh和Homebrew等工具和命令行環境。未來幾個月WSL容器將進行公開預覽。五、微軟版“龍蝦”來了！支持多智能體協作、權限控制在企業智能體層面，微軟發佈了Microsoft Scout，這是一款能操作本地設備的智能體，基於OpenClaw框架，適用於Windows和macOS。 Microsoft Scout將本地和雲功能整合到一個桌面應用中，擁有獨立的身份與個性，可以創建、編輯和搜索文檔，能直接加入Teams群組聊天或處理Outlook郵件，並以數字團隊成員的身份與人類協作，幫助企業減少繁瑣工作並提升效率。這一智能體也可以啟動專門的子智能體，用於並行研究、代碼審查和複雜任務，或是按照用戶的要求自主在後臺運行。 Microsoft Scout內置了用於常見任務的Skill，比如Office操作、網頁開發等。安全性方面，用戶可以通過詳細的權限系統對Microsoft Scout進行控制，比如啟用或禁用特定功能類別、標記敏感文件目錄等等。 Microsoft Scout是微軟企業級智能體Autopilots中的默認智能體，用戶也可在Autopilots中自行創建更多類型的智能體。六、為Windows版“龍蝦”的安全保駕護航與傳統的應用不同，智能體正在採取越來越多自主性的行動。隨著它們成為軟件系統中的持續參與者，新的控制和信任風險問題也出現了。為解決這一問題，微軟推出了不少新功能和產品。 1、MXC SDK 為了在不限制生產力提升的前提下限制智能體的影響，微軟推出了微軟執行容器（MXC，Microsoft Execution Container）SDK的早期預覽版，這是一個跨平臺、策略驅動的Windows和WSL Agent執行層。開發者定義了在應用和Agent中需要約束的內容，Windows通過MXC在運行時持續執行這些約束。MXC在隔離原語之間提供了抽象層，因此開發者無需管理底層隔離細節。 MXC目前能夠在實現進程與會話隔離，前者適合編程Agent，後者適合長時間運行的自動化工作流。未來，MXC還計劃加入對微虛擬機、Linux容器隔離的支持。微軟正與Hermes、Manus、英偉達、OpenAI、OpenClaw等夥伴合作，確保MXC的方案滿足真實開發需求。該技術現已在Windows平臺上的OpenClaw中得到應用，使多步驟工作流能夠在這些由操作系統強制實施的邊界內執行。面向自主智能體的NVIDIA OpenShell安全運行環境，也是基於MXC構建的，並引入了策略管理、推理路由以及個人身份信息（PII）脫敏功能。 2、OpenClaw Windows套件大會上的一個亮點是適用於OpenClaw的Windows套件。這套系統能長期自主運行，替用戶管理郵件、跟蹤包裹、處理GitHub任務，甚至管理個人健康數據或自動購買電影票。微軟與OpenClaw團隊共同開發了OpenClaw Windows Companion App ，採用WinUI 3界面，可實現權限管理和企業級策略控制。現場演示中，OpenClaw拿到了刪除桌面文件的命令，但因為MXC被設置為只讀模式，所有操作全被阻止。 OpenClaw創始人Peter Steinberger感慨地說，如今，企業可以放心地使用OpenClaw了。看著OpenClaw試圖刪除文件卻失敗了，這讓他非常高興，因為6個月前，OpenClaw真的能把那些文件刪掉。 3、Windows 365 for Agents Windows 365 for Agents現已正式發佈，它可以將隔離擴展到本地設備之外，讓智能體在Intune管理的雲PC中運行。隨著MXC集成未來的加入，Windows 365 for Agents將在單一的SDK和政策模型下，從輕量級本地隔離擴展到更多的硬件類型。 4、Agent 365 針對大規模部署智能體的管理需求，微軟強調了可觀測、可治理與可防護的重要性，並通過今年5月發佈的Agent 365作為智能體的管理控制中心。微軟將現有的Entra（身份）、Defender（防禦）與Purview（合規）等企業級服務擴展至智能體，確保每個智能體都能以特定身份運行並受到完整保護。 5、MDASH MDASH是微軟打造的多模型智能體安全系統，通過部署超過100個智能體，從數據流、業務邏輯和利用鏈進行推理，來發現可被利用的漏洞，並結合上下文提供修復建議。該系統直接呈現在Defender Portal中。七、給智能體配齊全套軟件基礎設施：託管、上下文、評估全覆蓋在雲端，微軟也在打造完整的智能體軟件基礎設施。 1、Foundry智能體託管服務在雲端，微軟正在把Foundry打造為完整的智能體應用平臺，本月即將全面推出智能體託管服務，提供長期狀態管理、自動會話隔離等功能。他們還與Fireworks AI合作，將後者所有的開放權重模型引入Foundry。 2、Microsoft IQ 智能體時代最大的挑戰已經不再是模型本身，而是如何為模型構建高質量上下文。納德拉認為，未來軟件系統的核心問題是讓智能體在正確時間獲得正確信息。圍繞這一趨勢，微軟發佈了Microsoft IQ，這是一個統一的上下文層，在GitHub Copilot、Microsoft Foundry、Copilot中普遍可用，將智能體構建於世界知識和企業知識中。 Microsoft IQ由四大部分組成：（1）Web IQ：一個與模型無關、MCP原生的網絡搜索棧，可為AI模型和智能體提供即時、可驗證的網絡數據，包含新聞、圖片、視頻等等，返回相關段落的速度是次優選擇的近2.5倍。Web IQ於今天正式發佈。（2）Work IQ：面向工作場景的智能層，捕捉工作在 Microsoft 365、組織系統和外部來源中實際發生的方式，涵蓋人員、郵件、文檔、會議，以及它們之間的關聯。（3）Fabric IQ：在結構化業務數據之上提供了共享的語義基礎。（4）Foundry IQ：將上述能力串聯起來，實現對企業知識與實時互聯網信息的統一檢索與調度。 3、智能體評估框架微軟推出了一套開放的、端到端的信任技術棧，適用於任何框架下的AI智能體體系，並以兩個開源項目為核心支撐：ASSERT（Adaptive Spec-driven Scoring for Evaluation and Regression Testing，自適應規範驅動的評估與迴歸測試評分），用於策略驅動型安全評估；以及智能體控制規範（Agent Control Specification），用於規範在智能體運行閉環中，應在何處、以及如何施加各類控制機制。八、GitHub Copilot上新應用，提供多模型支持在開發者工具方面，微軟推出了全新的GitHub Copilot應用程序，支持“智能體編程會話”（Agentic coding sessions），開發者能同時啟動多個會話來處理不同的問題，並利用技術建立隔離環境，實現多任務平行開發且互不干擾。此外，它提供多模型支持，允許用戶在OpenAI、Anthropic和谷歌等廠商的模型間切換。為了超越傳統聊天界面，微軟引入了Canvas（畫布）概念，讓智能體能建構自定義UI與用戶溝通。針對後端整合，微軟推出了Rayfin SDK，讓智能體能輕鬆連接至“後端即服務”（BaaS）與Microsoft Fabric租戶，解決開發中常見的身份識別、存儲與數據庫架構挑戰。微軟還官宣了與Replit的合作，Rayfin SDK可以幫助Replit中開發的應用快速部署到Micros

原始來源：智東西 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

2 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

15 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

18 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

19 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

22 小時前閱讀分析