Agent Infra之戰打響！騰訊雲重做騰訊雲

2026年6月5日 02:45

重點摘要

站內 AI 整理稿

智東西作者 | 陳駿達編輯 | 漠影 Agent正從技術概念快速走向產業落地。隨著大模型能力持續提升，Agent已經具備任務理解、工具調用、自主規劃和執行能力，並開始進入客服、研發、辦公、運營等真實生產場景。然而，當Agent真正進入生產環境後，一個更深層的問題開始浮現：今天的基礎設施並沒有為Agent時代做好準備。過去十餘年，企業IT基礎設施的設計邏輯始終圍繞人類用戶和傳統應用展開。無論是服務器資源調度、虛擬化架構、容器平臺，還是數據庫，其核心目標都是支撐穩定可預測的軟件服務。面臨Agent這一充滿不可預測性的新型負載形態，基礎設施的計算、存儲、網絡、資源調度以及Runtime系統都面臨前所未有的挑戰。也正因此，行業開始重新審視AI基礎設施的定義。未來企業需要的不僅是更強大的模型，更是一套能夠支撐Agent持續運行、自主協同和大規模擴展的Agent-Ready Infrastructure。越多廠商正在圍繞這一方向展開佈局，Agent時代的競爭，正在從模型層逐步延伸到基礎設施層。面對這一趨勢，騰訊也給出了自己的答案。在今天舉辦的騰訊雲AI產業應用大會上，騰訊系統性展示了面向Agent時代的基礎設施能力佈局，從運行平臺到底層資源體系，試圖為企業構建真正適配AI Agent生產落地的新一代基礎設施底座。一、從雲服務到Agent Runtime，企業級Agent Infra經歷範式重構 Agent工作負載，到底和傳統的應用、服務有什麼區別？騰訊雲存儲總經理馬文霜舉了個例子，當我們要求Agent做一份“新能源車的概念報告”時，Agent可能會進行瀏覽網頁、下載安裝包、編寫代碼、生成文件等等操作，其執行鏈路不確定性較強，還需要獨佔環境。同時，當Agent批量走入生產場景，高併發情況難以避免，給基礎設施帶來較大壓力；憑證管理、數據隔離等技術，則是Agent可靠性和安全性的重要保障。要想真正實現Agent的規模化部署，一套符合其特性的新型基礎設施，不可或缺。為此，騰訊雲已經打造了Agent治理平臺的全新架構設計。騰訊雲資深AI Infra架構師邢陪鄰稱，其核心邏輯在於將Agent視為具備崗位職責、彙報關係與權限邊界的“數字員工”，而非簡單的程序工具。針對企業規模化部署Agent過程中面臨的接入門檻高、組織管理複雜、協作記憶分散、成本難控制、安全審計要求高以及技術框架不統一等問題，騰訊雲構建了覆蓋“多Agent統一接入、多組織統一治理、多場景統一交付”的治理平臺架構。在該架構的基礎設施層中，計算（包括Runtime）、存儲、網絡和安全都扮演著重要角色。其中，Agent Runtime架構是Agent運行的核心技術之一。騰訊雲高級產品經理、CNCF大使周鵬飛認為，Agent基礎設施需要圍繞Agent的特徵，比如高自主性與生命週期的不確定性，來進行定義設計和全面升級。騰訊雲在Agent Runtime中整合了沙箱調度、身份認證、出站訪問管理、全鏈路監控、憑證管理以及Agent Memory等能力，解決傳統微服務架構下資源長期佔用、Agent任務容易中斷等問題。騰訊雲的上述技術讓企業可以實現Agent的快速部署。但在騰訊雲計算高級產品經理、SkilHub主理人戴惠怡認為，用戶真正需要的不只是成功部署，而是Agent能穩定地“幫我做事”。為滿足這一需求，Agent需要專屬雲底座為其提供環境，並依靠Skill生態實現能力擴展。雲底座方面，騰訊雲的Lighthouse輕量應用服務器面向開發者及泛大眾為Agent提供穩定、安全的雲端運行環境，可以支持Agent 7×24小時的持續運行，降低部署和運維成本。面向企業市場，騰訊雲ClawPro與Lighthouse上百萬級的OpenClaw用戶環境同源同構，經過大規模生產驗證，實現了面向企業的Agent管控平臺，同樣實現開箱即用的零門檻。在Skill生態方面，騰訊打造了SkillHub社區，目前該社區已經收錄7.8萬個Skill，上線2個月下載量突破3000萬次。這些Skill將人類經驗、工具調用、業務流程和實踐經驗沉澱為Agent可以理解、複用的能力。該社區對全球和本土Skill資源進行了統一管理、安全審核和分發，讓原本分散在個人和團隊中的Skill資產流通起來，串聯起Skill生產、發現、安裝、複用和組織化管理的完整鏈條。二、讓Agent真正跑起來，需要什麼樣的底座？騰訊雲的Agent Runtime體系包含多項關鍵技術，騰訊的相關技術負責人對其進行了詳細介紹。首先是沙箱技術。Agent需要真正去操作設備、執行代碼、訪問數據，這種能力伴隨著巨大的安全風險，對廣大企業而言，為Agent提供一個隔離、受控的環境，幾乎是必選項。 Agent沙箱的實現方式多種多樣，既有本地也有云端。騰訊雲選擇的路徑是雲端沙箱，這一方案的優勢在於可以實現存算分離、按任務隔離、暫停免費以及秒級喚醒。騰訊雲針對Agent沙箱在真實生產環境中，面臨的冷啟動慢、擴展上限受限以及閒置成本高等問題，提出了一整套工程化優化方案。首先，他們通過內核層優化（如全棧鎖優化）、資源池化、鏡像按需加載與就近緩存，以及基於快照恢復的機制，將傳統超過20秒的冷啟動時間大幅壓縮至60毫秒，實現“即開即用”的運行體驗。在架構層面，騰訊雲去除了對傳統K8s控制面的強依賴，引入無單點依賴設計與多資源池、兩級調度機制，顯著提升系統的併發能力與橫向擴展上限，使平臺能夠支撐百萬級Agent規模的高併發運行。在成本控制方面，系統通過VM快照實現“自動休眠與恢復”機制，在Agent閒置時凍結運行狀態，僅保留極低成本的存儲計費，恢復時可實現毫秒級喚醒，從而有效降低長期運行成本。這一系統支持從單一到大規模Agent的批量管理與全生命週期調度，展現出較強的可擴展性。許多用戶對Agent的期待是“越用越好用”，能“越來越懂我”。但要真正實現這一點，Agent需要一套好用、高性價比的記憶基礎設施，幫助用戶積累智能資產。騰訊雲也關注到了這一問題。在Agent Memory方面，他們基於TencentDB構建了四層記憶架構，將Agent Memory從簡單的數據存儲升級為可治理、可演進的智能資產體系。該架構自底向上分為四層：L0原始對話用於記錄基礎交互內容，L1原子事實負責提取關鍵結構化信息，L2場景模式用於歸納行為與交互規律，L3核心洞察則進一步沉澱為用戶畫像與業務級認知。在此基礎上，通過騰訊雲自研模型驅動的抽取、壓縮與符號化處理機制，騰訊雲提升了記憶的可用性與可解釋性，也大幅優化了系統性能與成本結構。例如，在長期記憶場景中（PersonaMem）準確率由基線的48%提升至76%，整體提升約28.16%。在Token消耗方面，短期記憶壓縮與上下文卸載機制的引入，讓Token整體節約率接近49.9%；同時長任務成功率提升30%，推理加速至2.53倍。該記憶系統支持開源與雲託管雙形態部署，使記憶數據始終保持透明、可遷移與可治理，避免形成數據黑盒。給Agent配齊“虛擬工位”（沙箱）、“工作筆記”（Memory）之後，如何評估、管理並優化其執行效果，對企業而言也十分關鍵。騰訊雲日誌服務高級產品架構師巢豐巖認為，Agent的可觀測性與傳統可觀測性有一定區別。服務在線率、接口相應速度、基礎資源消耗等傳統指標，無法準確反映Agent真正的任務完成度、Token消耗和工具調用的合理性。正因為此，企業在使用Agent時，往往會有一種“黑盒”的感覺。為解決這一黑盒難題，騰訊雲打造了一套面向生產級Agent的全域觀測和分析能力。這套方案可以實現對多種Agent形態的快速接入，還可以對上下文Session、Agent工作鏈路（Trace）、Skills、工具調用等數據進行統一建模，無需人工拼接。同時，在分析層面，這套方案支持對多種指標的全局分析以及單鏈路具體分析，比如token消耗分析、RAG分析、模型性能分析等等。這種觀測與分析能力，可以幫助企業及時定位Agent在執行過程中遇到的問題、出現的高危操作。巢豐巖認為這最終會沉澱為企業的bad case數據集，形成數據飛輪，最終反哺Agent能力的提升。三、存儲與算力同步升級，複雜性留給基礎設施從治理體系，到運行環境，再到記憶系統，騰訊雲已經配齊了Agent走向生產環境所需的核心組件。然而，隨著Agent開始承擔更復雜、更長期的任務，新的問題隨之出現：海量Agent的數據如何存儲？高頻推理帶來的算力成本如何控制？這些問題最終都指向更底層的存儲與算力基礎設施。從技術思路來看，傳統存儲主要圍繞實現方式設計，最終目標是實現一個可靠的存儲系統，而Agent時代的存儲系統的設計思路，應該是讓存儲被智能體高效使用。這是由於過去雲存儲主要服務於應用系統，數據邊界相對固定；而Agent存儲既需要嚴格的數據隔離，也需要支持協同共享、動態擴縮容和長期記憶管理。圍繞這一趨勢，騰訊雲提出將存儲用途與底層實現解耦，並通過統一的Volume抽象層重構存儲體系。騰訊雲將存儲能力標準化為三類：專屬Volume用於單Agent獨佔讀寫，共享 Volume支持多Agent協作，製品Volume則以只讀方式分發數據，保障系統資產安全。在產品層面，騰訊雲提供了AgentBucket和VectorBucket兩項新能力。其中，AgentBucket採用全新的Space架構，提供獨立用戶空間、原生POSIX文件語義及跨租戶去重能力，解決傳統對象存儲Bucket數量受限、隔離依賴業務邏輯等問題，為海量Agent的長期記憶和知識管理提供支撐。另一項VectorBucket則面向RAG場景打造，基於存算分離架構，支持十億級高維向量存儲與毫秒級檢索。相較傳統方案，其存儲成本可降低約90%，同時實現零運維部署，進一步降低企業構建知識型Agent的門檻。此外，騰訊還對MetaInsight多模態數據管理引擎做了升級，它能自動進行特徵提取、目標檢測、OCR識別和多模態對齊，支持Agent進行復雜推理和檢索。在基礎設施層，Agent的出現讓雲廠商的定位發生了變化。如今，要讓Agent跑起來，遠不只是提供一臺機器那麼簡單，其底層涉及多個技術棧的協同。對企業而言，這些工作不僅技術鏈路長，而且高度碎片化，任何一個環節處理不當，都可能導致Agent無法穩定運行，甚至帶來數據洩露或權限失控的風險。面臨這些挑戰，騰訊雲所做的是再往前邁一步，將原本分散且高度專業化的基礎設施能力，轉化為穩定、可複用、可規模化的統一平臺能力。以騰訊雲的ClawPro為例，作為企業級的智能體統一管控臺，它為用戶提供了底層雲服務的全自動化託管。企業管理員只需要在後臺點擊開通，系統就會一鍵智能拉起所有關聯的基礎雲資源，例如雲服務算力、存儲、網絡等，實現算存網一體。 Agent管理、審計、隔離、安全等多維度的功能也被整合，企業用戶不需要懂太多的技術細節，即可將Agent引入自己的業務流程中。對於合規要求更高的政企客戶，騰訊雲還為用戶提供了ClawPro專有云版本，讓企業可以在私有環境中部署Agent，實現對核心數據和模型的自主掌控。騰訊雲的這套產品方案，已經在不少真實場景中獲得了驗證。樂享科技便將基於ClawPro的AI Agent接入家庭機器人，快速補齊機器人的感知和交互能力，提升其在真實家庭場景的可用性。外貿數字化服務商富通天下則將ClawPro集成進自身的私域CRM系統中，連接外貿CRM與AI Agent能力。這些案例都有一個共性：ClawPro將原本分散在底層的基礎設施能力進行了統一封裝與平臺化整合，企業要做的只是結合自身專有知識與業務理解，發揮出這套基礎設施在其自身業務中的價值。結語：騰訊雲重做騰訊雲過去很長一段時間裡，雲計算要解決的關鍵問題是“應用如何運行”，而未來，雲計算面臨的新挑戰，可能會演變為“Agent該如何工作”。僅提供CPU、存儲和網絡的雲服務商，在Agent時代已經很難滿足用戶需求了。如何為數字員工們提供工位、記憶、技能庫、協作和管理系統，是他們需要思考的關鍵問題。從這個角度來看，騰訊雲正在大刀闊斧地重做騰訊雲。他們試圖重新定義雲基礎設施的邊界：雲不再只是承載應用運行的資源池，而是成為Agent誕生、運行、協作、成長和治理的底座。過去雲廠商交付的是計算資源，未來交付的或許是一整套數字勞動力的生產環境。

原始來源：智東西 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

3 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

16 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

19 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

20 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

23 小時前閱讀分析