微軟Build大會一文看盡:9款自研模型、Windows版龍蝦、“夢中情機”,黃仁勳猛誇
重點摘要
智東西 作者 | 陳駿達 編輯 | 心緣 智東西6月3日報道,今天凌晨,在微軟Build 2026開發者大會上,微軟一口氣發佈了超20項重磅更新,包括9款自研模型、與英偉達合作的全新PC產品、Windows版“龍蝦”,以及超10款智能體應用和開發工具。 英偉達創始人兼CEO黃仁勳從臺北遠程連線,深夜和微軟董事長兼CEO薩蒂亞·納德拉(Satya Nadella)納德拉展開對談。黃仁勳說,AI基礎設施已經進入智能體時代,而微軟與英偉達正在共同定義下一代AI計算平臺。 “如果我們能把算力、內存都最大化,那會造出怎樣一臺開發者的「夢中情機」?” 納德拉用一個問題引出微軟重磅PC新品——搭載英偉達RTX Spark超級芯片的Surface RTX Spark Dev Box桌面工作站,AI算力達1PFLOPS,本地能跑120B參數的大模型。 ▲Surface RTX Spark Dev Box 除了新型PC外,微軟還展示了為多智能體世界而生的兩款新型AI硬件:一款是能塞在胸前的AI可穿戴設備,另一款是AI桌面伴侶,主打以低成本、即插即用、隨時響應的方式來使用智能體。 值得一提的是,在扶持OpenAI七年後,微軟AI超級智能團隊終於發力,連推7款自研大模型:首款旗艦推理模型MAI-Thinking-1性能追平Claude Opus 4.6,圖像模型MAI-Image-2.5盲測分數超過歌的Nano Banana 2。 微軟首款自動駕駛智能體Microsoft Scout也正式登場,基於OpenClaw構建,採用企業級安全架構,可直接操作電腦及日常使用軟件。納德拉將其稱為企業級“龍蝦”。 還有Windows版OpenClaw,現已推出預覽版。微軟與OpenClaw合作,將OpenClaw與微軟MXC結合,幫IT管理員輕鬆做好智能體安全保護。 此外,微軟發佈新一代量子計算芯片Majora
智東西 作者 | 陳駿達 編輯 | 心緣 智東西6月3日報道,今天凌晨,在微軟Build 2026開發者大會上,微軟一口氣發佈了超20項重磅更新,包括9款自研模型、與英偉達合作的全新PC產品、Windows版“龍蝦”,以及超10款智能體應用和開發工具。 英偉達創始人兼CEO黃仁勳從臺北遠程連線,深夜和微軟董事長兼CEO薩蒂亞·納德拉(Satya Nadella)納德拉展開對談。黃仁勳說,AI基礎設施已經進入智能體時代,而微軟與英偉達正在共同定義下一代AI計算平臺。 “如果我們能把算力、內存都最大化,那會造出怎樣一臺開發者的「夢中情機」?” 納德拉用一個問題引出微軟重磅PC新品——搭載英偉達RTX Spark超級芯片的Surface RTX Spark Dev Box桌面工作站,AI算力達1PFLOPS,本地能跑120B參數的大模型。 ▲Surface RTX Spark Dev Box 除了新型PC外,微軟還展示了為多智能體世界而生的兩款新型AI硬件:一款是能塞在胸前的AI可穿戴設備,另一款是AI桌面伴侶,主打以低成本、即插即用、隨時響應的方式來使用智能體。 值得一提的是,在扶持OpenAI七年後,微軟AI超級智能團隊終於發力,連推7款自研大模型:首款旗艦推理模型MAI-Thinking-1性能追平Claude Opus 4.6,圖像模型MAI-Image-2.5盲測分數超過歌的Nano Banana 2。 微軟首款自動駕駛智能體Microsoft Scout也正式登場,基於OpenClaw構建,採用企業級安全架構,可直接操作電腦及日常使用軟件。納德拉將其稱為企業級“龍蝦”。 還有Windows版OpenClaw,現已推出預覽版。微軟與OpenClaw合作,將OpenClaw與微軟MXC結合,幫IT管理員輕鬆做好智能體安全保護。 此外,微軟發佈新一代量子計算芯片Majorana 2,量子比特可靠度是上一代的1000倍,平均壽命為20秒,偶爾甚至超過1分鐘。微軟預計在2029年實現真正可規模化的量子計算機。 一、迷你工作站塞入128GB統一內存,自帶“開發者特調版”Win11 微軟與英偉達的合作是本次Build大會上的重點。微軟本週早些時候推出的Surface Laptop Ultra首發了英偉達RTX Spark超級芯片,預計今年秋天上市。 面向開發者,微軟打造了Surface RTX Spark Dev Box。這是一款桌面工作站產品,使用英偉達的RTX Spark超級芯片,擁有1 Petaflop的AI計算能力、20個CPU核心和128GB統一內存,同樣將於今年秋天推出。 微軟稱,Surface RTX Spark Dev Box可以支持本地運行1200億個參數、100萬上下文的模型,或者對模型進行微調。 散熱對這類高性能桌面設備尤為關鍵。Surface RTX Spark Dev Box採用鋁製機殼,兼作散熱器。 Surface RTX Spark Dev Box自帶面向開發者優化的Windows 11,預配置了所有必備開發工具,比如Visual Studio Code、Windows終端內嵌的GitHub Copilot、WSL、PowerShell 7。 其設置也面向開發的需求進行了調整,沒有新聞推送,沒有彈出的小組件,沒有通知,默認採用深色模式。這一設置可通過GitHub上的Windows Developer Config項目一鍵部署。 ▲面向開發者優化的Windows 11 安全性方面,Surface RTX Spark Dev Box擁有安全核心PC架構、BitLocker加密和Microsoft Defender防護,並面向企業提供了Entra ID和Intune功能,可實現大規模管理。 二、聯手高通、聯發科推出參考設計,智能體硬件要直接殺入工作場景 微軟全球副總裁、應用科學組負責人Steven Bathiche分享了微軟在新型硬件方面的探索——Project Solara,併發布兩款硬件參考設計。 Bathiche認為,下一代計算設備不一定是一臺電腦、一部手機或一副眼鏡,而是多個設備協同組成的系統。用戶的智能體會根據場景需要,在最合適的時間和地點出現,並通過不同形態完成工作。 Project Solara是一個智能體優先的設備平臺,建立在三大基礎之上:首先是面向企業級部署的微軟設備生態系統;其次是智能體驅動的全新交互模型;最後是擴展能力,允許企業接入自己的智能體。 在Build大會上,微軟首次展示了兩類參考設備。 第一類是固定式設備。 這是一款面向辦公桌場景設計的智能體終端,採用聯發科平臺,支持Windows Hello企業身份認證。用戶走近設備即可完成安全登錄,直接訪問自己的智能體服務。 設備會基於用戶的工作上下文持續提供信息和建議。例如提醒當天最重要的待辦事項、協助規劃工作流程,甚至幫助用戶直接將任務委託給智能體執行。 與此同時,這一設備還能夠與Windows PC和Windows 365雲電腦無縫協同,成為現有辦公環境的補充。 相比固定設備,第二種形態更加靈活,是一款類似數字工牌的可穿戴設備原型。 這款設備採用高通驍龍平臺打造,體積小於傳統移動終端。現場演示中,Bathiche通過指紋完成身份驗證後,直接調用個人智能體執行任務。他按下錄製按鈕,設備側邊攝像頭開始採集現場畫面,並向智能體下達指令:整理Build大會現場素材,生成內容併發送給團隊審核。 隨後整個流程由智能體自動完成,包括內容收集、整理、歸檔和分發。 Bathiche強調,這類設備的價值並不在於硬件本身,而在於能夠將智能體能力直接帶到工作發生的地方。 以醫療場景為例,護士佩戴設備後,可以通過語音與智能體實時交互,自動完成病歷記錄、語音轉寫、發言人識別以及護理記錄整理。同樣的能力也適用於零售、製造業、金融服務、法律服務等眾多行業。 這些設備是一類參考設計。企業可以在相同的軟件架構基礎上調整外觀形態、屏幕尺寸、傳感器配置甚至輸入方式,並加載各自的智能體系統,從而快速構建針對特定場景的專用設備。 微軟透露,目前已經有多家企業開始參與相關探索,包括Best Buy、CVS Health、Levi’s、Target等公司都在研究如何將智能體設備引入自身業務流程。 納德拉總結道,Project Solara最重要的意義並不是推出一種新的平臺,而是在重新定義了一套平臺規則,讓開發者和企業能夠自由想象智能體應該存在於何處,以及它們將以什麼樣的形態出現。 三、MAI連發7款自研模型,旗艦推理模型比肩Claude Opus 4.6 本屆Build大會上,微軟的AI研究部門MAI集中發佈了7款新模型,涵蓋旗艦推理模型、編程模型、圖像生成模型、語音識別模型和語音模型等多個類別。 微軟首個推理模型MAI-Thinking-1採用混合專家(MoE)架構,擁有350億激活參數、大約1萬億和256K上下文窗口。 微軟AI CEO Mustafa Suleyman稱,在與行業主流模型的對比測試中,MAI-Thinking-1獲得了更高的人類評測偏好率。在多個推理基準測試中,其表現達到行業領先水平。 尤其是在軟件工程基準SWE-bench Pro上,該模型取得53%的成績,與Claude Opus 4.6處於同一梯隊。 Mustafa特別強調:“MAI-Thinking-1完全從零開始訓練,沒有針對特定基準進行優化,也沒有采用蒸餾技術。”這意味著模型擁有清晰、可追溯且具備商業授權的數據來源,更適合企業級生產環境部署。 圖像模型方面,微軟推出了MAI-Image-2.5及其輕量化版本MAI-Image-2.5-Flash。兩款模型在圖像質量和編輯能力方面實現了突破,MAI-Image-2.5在大模型競技場圖像編輯排行榜中排名第二,超過了多個主流競爭對手。 目前,兩款模型已經集成至PowerPoint,並正在向OneDrive推廣,同時已在Azure Foundry開放使用。 微軟同時發佈了新一代語音轉錄模型MAI-Transcribe-1.5。根據微軟公佈的數據,該模型支持43種語言,在轉錄準確率方面達到行業領先水平,並在多項測試中超過現有旗艦模型。 在語音生成領域,微軟發佈了MAI-Voice 2和MAI-Voice-2-Flash。 MAI-Voice 2支持15種語言,具備更加自然的語調、情感表達以及細粒度控制能力;而Flash版本則重點面向實時語音智能體場景,以更低延遲和更高效率滿足企業需求。 微軟還推出了專門針對編程任務優化的MAI-Code-1-Flash。 儘管僅擁有50億參數,但該模型在SWE-bench Pro測試中取得51%的成績,展現出較高的推理效率。該模型針對VS Code和GitHub Copilot CLI進行了深度優化,能夠以更低成本提供接近大型模型的代碼生成與推理能力。 除了Azure Foundry之外,微軟宣佈將把MAI系列模型同步提供給多個第三方AI生態平臺,包括OpenRouter、Fireworks AI、Baseten等。開發者未來可以直接在這些平臺上獲取模型權重並進行個性化微調。 Mustafa還重點介紹了微軟在模型與芯片協同設計方面的最新進展。 MAI-Thinking-1已針對微軟自研的Maia 200 AI芯片進行了專項優化。MAI-Thinking-1+Maia 200的組合,每瓦性能是英偉達GB200的1.4倍。 微軟計劃將這些優化後的模型部署至即將推出的N1X設備平臺,以進一步提升Windows端側AI體驗。 微軟重點介紹了名為“Frontier Fine-Tuning(前沿微調)”的新能力。微軟認為,未來企業競爭的關鍵不再是使用統一的大模型,而是擁有基於自身數據、工作流程和知識資產訓練出來的專屬模型。 通過強化學習環境(RLE)和定製訓練平臺,企業能夠持續優化模型,使其更加貼合自身業務場景。微軟披露,在內部測試中,經過前沿微調的MAI模型在部分任務上已達到與最新旗艦模型相當的效果,同時實現約10倍的成本效率提升。 四、Windows AI API支持範圍拓展,兩款自研小語言模型將登陸Windows 納德拉稱,邊緣端的算力總量,其實是相當驚人的。如今已有許多AI功能依靠Windows設備的本地AI能力運行,比如Outlook的摘要、PowerPoint超分辨率功能、Adobe的AE、Premiere也都在Windows上利用NPU和GPU進行本地處理。 為了充分挖掘這些計算潛力,微軟宣佈擴大本地AI推理框架Windows ML和Windows AI API(無需自備模型即可使用的內置AI能力接口)的支持範圍。這樣一來,任何開發者都能利用設備上已安裝的GPU,為本地AI構建應用,並在整個系統環境中流暢運行。 同時,微軟還發布了兩個將在Windows本地運行的小語言模型(SLM):一個是更高效的文本模型Aion 1.0 Instruct,支持日常文字處理工作,還集成到了Edge瀏覽器中。 另一個是規劃模型Aion 1.0 Plan。這一模型擁有140億個參數,可以作為本地智能體引擎,幫助開發者構建完全離線的智能體循環,實現意圖識別、工具調用、文件管理和多智能體編排,無需雲端參與即可完成任務執行。 在開發工具方面,微軟推出了一系列更新:無干擾開發環境、內置GitHub Copilot的智能終端、70多個Linux實用工具。 此外,微軟還發布了WSL容器,讓開發者在本地構建和部署時不會被複雜的環境依賴等問題干擾。其中一個WSL配置文件能在Windows上支持Mac用戶熟悉的Starship、Zsh和Homebrew等工具和命令行環境。未來幾個月WSL容器將進行公開預覽。 五、微軟版“龍蝦”來了!支持多智能體協作、權限控制 在企業智能體層面,微軟發佈了Microsoft Scout,這是一款能操作本地設備的智能體,基於OpenClaw框架,適用於Windows和macOS。 Microsoft Scout將本地和雲功能整合到一個桌面應用中,擁有獨立的身份與個性,可以創建、編輯和搜索文檔,能直接加入Teams群組聊天或處理Outlook郵件,並以數字團隊成員的身份與人類協作,幫助企業減少繁瑣工作並提升效率。 這一智能體也可以啟動專門的子智能體,用於並行研究、代碼審查和複雜任務,或是按照用戶的要求自主在後臺運行。 Microsoft Scout內置了用於常見任務的Skill,比如Office操作、網頁開發等。 安全性方面,用戶可以通過詳細的權限系統對Microsoft Scout進行控制,比如啟用或禁用特定功能類別、標記敏感文件目錄等等。 Microsoft Scout是微軟企業級智能體Autopilots中的默認智能體,用戶也可在Autopilots中自行創建更多類型的智能體。 六、為Windows版“龍蝦”的安全保駕護航 與傳統的應用不同,智能體正在採取越來越多自主性的行動。隨著它們成為軟件系統中的持續參與者,新的控制和信任風險問題也出現了。 為解決這一問題,微軟推出了不少新功能和產品。 1、MXC SDK 為了在不限制生產力提升的前提下限制智能體的影響,微軟推出了微軟執行容器(MXC,Microsoft Execution Container)SDK的早期預覽版,這是一個跨平臺、策略驅動的Windows和WSL Agent執行層。 開發者定義了在應用和Agent中需要約束的內容,Windows通過MXC在運行時持續執行這些約束。MXC在隔離原語之間提供了抽象層,因此開發者無需管理底層隔離細節。 MXC目前能夠在實現進程與會話隔離,前者適合編程Agent,後者適合長時間運行的自動化工作流。未來,MXC還計劃加入對微虛擬機、Linux容器隔離的支持。 微軟正與Hermes、Manus、英偉達、OpenAI、OpenClaw等夥伴合作,確保MXC的方案滿足真實開發需求。 該技術現已在Windows平臺上的OpenClaw中得到應用,使多步驟工作流能夠在這些由操作系統強制實施的邊界內執行。面向自主智能體的NVIDIA OpenShell安全運行環境,也是基於MXC構建的,並引入了策略管理、推理路由以及個人身份信息(PII)脫敏功能。 2、OpenClaw Windows套件 大會上的一個亮點是適用於OpenClaw的Windows套件。這套系統能長期自主運行,替用戶管理郵件、跟蹤包裹、處理GitHub任務,甚至管理個人健康數據或自動購買電影票。 微軟與OpenClaw團隊共同開發了OpenClaw Windows Companion App ,採用WinUI 3界面,可實現權限管理和企業級策略控制。現場演示中,OpenClaw拿到了刪除桌面文件的命令,但因為MXC被設置為只讀模式,所有操作全被阻止。 OpenClaw創始人Peter Steinberger感慨地說,如今,企業可以放心地使用OpenClaw了。看著OpenClaw試圖刪除文件卻失敗了,這讓他非常高興,因為6個月前,OpenClaw真的能把那些文件刪掉。 3、Windows 365 for Agents Windows 365 for Agents現已正式發佈,它可以將隔離擴展到本地設備之外,讓智能體在Intune管理的雲PC中運行。 隨著MXC集成未來的加入,Windows 365 for Agents將在單一的SDK和政策模型下,從輕量級本地隔離擴展到更多的硬件類型。 4、Agent 365 針對大規模部署智能體的管理需求,微軟強調了可觀測、可治理與可防護的重要性,並通過今年5月發佈的Agent 365作為智能體的管理控制中心。 微軟將現有的Entra(身份)、Defender(防禦)與Purview(合規)等企業級服務擴展至智能體,確保每個智能體都能以特定身份運行並受到完整保護。 5、MDASH MDASH是微軟打造的多模型智能體安全系統,通過部署超過100個智能體,從數據流、業務邏輯和利用鏈進行推理,來發現可被利用的漏洞,並結合上下文提供修復建議。該系統直接呈現在Defender Portal中。 七、給智能體配齊全套軟件基礎設施:託管、上下文、評估全覆蓋 在雲端,微軟也在打造完整的智能體軟件基礎設施。 1、Foundry智能體託管服務 在雲端,微軟正在把Foundry打造為完整的智能體應用平臺,本月即將全面推出智能體託管服務,提供長期狀態管理、自動會話隔離等功能。 他們還與Fireworks AI合作,將後者所有的開放權重模型引入Foundry。 2、Microsoft IQ 智能體時代最大的挑戰已經不再是模型本身,而是如何為模型構建高質量上下文。納德拉認為,未來軟件系統的核心問題是讓智能體在正確時間獲得正確信息。 圍繞這一趨勢,微軟發佈了Microsoft IQ,這是一個統一的上下文層,在GitHub Copilot、Microsoft Foundry、Copilot中普遍可用,將智能體構建於世界知識和企業知識中。 Microsoft IQ由四大部分組成: (1)Web IQ:一個與模型無關、MCP原生的網絡搜索棧,可為AI模型和智能體提供即時、可驗證的網絡數據,包含新聞、圖片、視頻等等,返回相關段落的速度是次優選擇的近2.5倍。Web IQ於今天正式發佈。 (2)Work IQ:面向工作場景的智能層,捕捉工作在 Microsoft 365、組織系統和外部來源中實際發生的方式,涵蓋人員、郵件、文檔、會議,以及它們之間的關聯。 (3)Fabric IQ:在結構化業務數據之上提供了共享的語義基礎。 (4)Foundry IQ:將上述能力串聯起來,實現對企業知識與實時互聯網信息的統一檢索與調度。 3、智能體評估框架 微軟推出了一套開放的、端到端的信任技術棧,適用於任何框架下的AI智能體體系,並以兩個開源項目為核心支撐:ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自適應規範驅動的評估與迴歸測試評分),用於策略驅動型安全評估;以及智能體控制規範(Agent Control Specification),用於規範在智能體運行閉環中,應在何處、以及如何施加各類控制機制。 八、GitHub Copilot上新應用,提供多模型支持 在開發者工具方面,微軟推出了全新的GitHub Copilot應用程序,支持“智能體編程會話”(Agentic coding sessions),開發者能同時啟動多個會話來處理不同的問題,並利用技術建立隔離環境,實現多任務平行開發且互不干擾。 此外,它提供多模型支持,允許用戶在OpenAI、Anthropic和谷歌等廠商的模型間切換。 為了超越傳統聊天界面,微軟引入了Canvas(畫布)概念,讓智能體能建構自定義UI與用戶溝通。 針對後端整合,微軟推出了Rayfin SDK,讓智能體能輕鬆連接至“後端即服務”(BaaS)與Microsoft Fabric租戶,解決開發中常見的身份識別、存儲與數據庫架構挑戰。 微軟還官宣了與Replit的合作,Rayfin SDK可以幫助Replit中開發的應用快速部署到Micros
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。