微軟加碼 AI 算力:Azure 全面引入 Anthropic Claude 模型,搭載英偉達 GB300 架構

2026年6月30日 04:023200 次瀏覽

重點摘要

6月29日,英偉達宣佈微軟Azure全面上線Anthropic的Claude系列大模型。部署基於最新的GB300 Blackwell Ultra超級芯片,旨在為開發者和企業提供頂級推理能力。此舉再次凸顯算力架構升級對AI應用落地的關鍵作用,也標誌著微軟AI生態建設邁出重要一步。

站內 AI 整理稿

微軟近期宣布在 Azure 平台上全面引入 Anthropic 的 Claude 系列大模型,並基於英偉達最新的 GB300 Blackwell Ultra 超級芯片進行部署。此舉不僅標誌著算力架構的重大升級,更反映出雲端服務商在 AI 領域的軍備競賽已從單純的模型數量轉向底層硬體效能與推理成本的綜合較量。GB300 架構透過更高效率的記憶體頻寬與運算單元配置,使得 Claude 模型在處理複雜語意理解與長文本推理時,能夠提供近乎即時的響應速度,這對於需要高精準度與低延遲的企業級應用場景極為關鍵。

從技術層面來看,Claude 模型以其強調安全性與可解釋性著稱,而 Azure 將其整合進既有服務,等同於為開發者提供了一條無需自行調整硬體資源的捷徑。過去,企業若想使用類似等級的模型,往往需投入大量資金建置自有伺服器,或忍受第三方平台不穩定的延遲。如今透過微軟的雲端基礎設施,開發者能直接調用預先優化的 API,大幅降低導入 AI 的技術門檻,尤其是那些需要處理金融風險分析與醫療病歷摘要的高監管行業。

然而,這項合作更深層的意義在於重塑市場競爭格局。儘管微軟本身是 OpenAI 的主要投資者,但這次納入 Anthropic 的模型,顯示出其不願將 AI 服務的成敗完全押注在單一合作夥伴上。透過 Azure 同時提供多種頂級模型,微軟得以建立一個更具彈性的「模型超市」,讓客戶根據成本、速度與合規需求自由切換。這種策略不僅稀釋了對單一模型供應商的依賴風險,也進一步鞏固了 Azure 作為中立雲端平台的定位。

英偉達在此扮演的角色同樣關鍵。GB300 架構的推出,正是為了解決大規模模型推理時的頻寬瓶頸與能源效率問題。與前代架構相比,Blackwell Ultra 晶片透過更緊密的晶片互聯技術,減少了資料在處理器間傳輸的耗損,使 Claude 這類對語境依賴極深的模型能更流暢地處理超過 10 萬 Token 的上下文。這種硬體與演算法的協同設計,意味著未來 AI 應用的邊界將不再受限於模型參數量,而是取決於算力基礎設施的成熟度。

對於終端使用者而言,這項整合帶來的直接效益在於體驗的一致性。以往,企業在測試不同模型時常常需要面對碎片化的 API 格式與效能變異;如今透過 Azure 的統一資源管理層,開發者可以針對同一任務執行交叉比對,例如同時測試 Claude 與 GPT 系列的輸出品質,並依據結果動態調整部署策略。這種「可比較性」是當前 AI 落地過程中的核心痛點,而微軟與英偉達的聯手正試圖解決這個問題。

未來數季,我們預期將看到更多基於 GB300 架構的客製化服務上線。例如,微軟可能推出針對即時翻譯或自動程式碼生成的專用推理實例,進一步壓低延遲至毫秒等級。這不僅會吸引更多中小型企業嘗試導入 AI 技術,更可能催生出全新的應用場景,如即時互動式數位雙生或自動化供應鏈決策。算力架構的升級不再是枯燥的硬體規格更迭,而是直接反映在應用層的創新速度上。

最後,從宏觀角度來看,微軟、英偉達與 Anthropic 的三方合作,描繪了未來 AI 產業鏈的雛形:模型開發者專注於演算架構與對齊研究,硬體商持續突破算力極限,而雲端平台則扮演整合者與分散風險的角色。這種分工若能持續深化,將有助於避免當前市場過度集中的風險,並促進更多垂直領域的專用模型出現。對於台灣產業而言,這意味著必須加快在 AI 應用層的布局,特別是那些能與雲端原生架構深度結合的製造與服務流程優化,才能在全球算力競賽中取得差異化優勢。

Related

相關文章

軟件沒被AI殺死,但全球市場都捲上天了

AI寫程式能力崛起,但軟體並未被取代,反而在全球市場面臨更加激烈的競爭。軟體開發的門檻降低,促使各國廠商紛紛投入,導致市場「捲」上加「捲」。軟體業者需在效率與創新之間找到新平衡,才能應對這場無止境的挑戰。

剛剛

Token管夠的時代結束了

這篇消息聚焦「Token管夠的時代結束了」。原始導語提到:企業的錢也不是大風颳來的 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛
雷峰網生成式AI

中國信通院牽頭,首個智算運維智能體評測基準正式落地,覆蓋 5 款主流國產芯片

6月29日,在中國信通院人工智能軟硬件協同創新與適配驗證中心、中國人工智能產業發展聯盟、工信部人工智能標準化技術委員會聯合主辦的2026“眾智”大模型開放智算生態協同高級別研討會中,中國信通院副院長魏亮,正式發佈AISHPerf人工智能軟硬件基準體系3.0版本,包含兩項 AI Infra 領域核心評測基準——AISHPerf-智算運維智能體評測基準以及AISHPerf-算子生成智能體評測基準,兩大基準由國內頂尖AI原生基礎設施服務商無問芯穹及清華大學團隊作為重點技術支持方參與建設。前者是首個面向 AI Infra 的運維智能體評測基準,依託百億級真實運維數據構建,核心考核智算運維智能體在真實生產場景中解決實際問題的落地能力。後者則跳出 “模型能否生成可運行 GPU 算子” 的基礎維度,將評測重心錨定在 “模型生成的算子能否在真實量化推理部署中替代現有算子” 的工程可部署性上,更貼合產業實際落地需求。二者從底層算力優化到上層集群運維,共同為智算產業的標準化升級與高質量發展提供了統一的能力參照框架。 AISHPerf(Performance Benchmarks of Artificial Intelligence Software and Hardware)是中國信通院與人工智能大模型及軟硬件評測工業和信息化部重點實驗室,依託人工智能軟硬件協同創新與適配驗證中心(位於國家信創園)聯合構建的人工智能軟硬件基準體系,旨在設置多維度指標,考察端到端方案對模型及應用場景的真實承載能力,系統評估軟硬件各層級間的協同優化水平、兼容適配能力及整體交付效能。在此次發佈的兩項基準中,AISHPerf-智算運維智能體評測基準尤為引人注目,它不僅標誌著我國在智算集群運維智能體領域擁有了首個權威評測體系,更率先將國產芯片集群運維場景納入評測體系、填補了國產智算運維智能體評測領域的空白,為構建自主自治

4 小時前
智東西生成式AI

Hermes新功能上線!比Opus 4.8和GPT-5.5還猛

AI應用風向標(公眾號:ZhidxcomAI) 作者|畢偉豪 編輯|漠影 智東西6月30日報道,現在,Fable 5和Mythos 5等頂尖閉源模型沒法使用,就算能用,單一模型也總有搞不定的問題,那麼,想要高質量輸出結果的用戶該怎麼辦呢? 近日,Hermes Agent上線了MoA(Mixture of Agents)功能,支持用戶自由組合多種模型作為虛擬模型使用,在Nous Research即將發佈的基準測試中,這個混合模型的評分超過了Opus 4.8 和GPT-5.5。 一、Fable 5、Mythos 5被禁,多模型組合成為潮流 Nous Research在官推上說了這樣一句話:“最強大的模型是受限的,只有少數人才能獲得訪問權限。”這句話明晃晃地指向了Fable 5等模型被封禁的事件。 在這種背景下,不難看出,MoA這個混合模型模式的終極目的,是用開源模型的組合達到頂尖閉源模型的水準,就像Hermes Agent聯合創始人Teknium說的,他們正在測試各種開源模型組合,看看是否能用更便宜的模型達到Opus的水平。 這種多模型組合比肩頂尖模型的思路,最近其實有不少實踐的例子,比如前段時間日本AI獨角獸Sakana AI發佈的Sakana Fugu系列編排器模型,會根據任務選擇最佳的模型來處理,和MoA的思路非常相似。 而MoA的技術也在很久之前就已存在了,2024年6月Together AI曾發表過一篇論文《Mixture-of-Agents Enhances Large Language Model Capabilities》,核心是多LLM組合,每一層模型都會參考上一層模型的輸出,再繼續生成自己的回答。同時,論文也將模型分成了兩類,也就是現在Hermes所用的參考模型和聚合模型。 當用戶提出問題時,參考模型會先對問題進行分析判斷,然後給出參考意見,隨後由聚合模型來

5 小時前