Agent時代的終端競賽，贏在CPU！

2026年6月11日 11:57

重點摘要

站內 AI 整理稿

智東西作者 | 畢偉豪編輯 | 漠影智東西6月12日報道，這兩年，隨著Claude Code、Codex越來越能打，龍蝦（OpenClaw）、愛馬仕（Hermes）這類開源AI助手接連爆火，“智能體”熱度飆升，Agent時代就此到來。現在，越來越多的人從聊天機器人轉到Agent，開始使用各種工具來完成日常生活中的任務，相比於簡單對話，Agent的Token的消耗量是巨大的。因為現在的Agent可以真正幫人幹活，比如寫軟件、盯股市、做PPT、剪視頻等等，以前聊天機器人回答問題，通常僅需一兩步推理，而現在一個金融Agent，要同時跑行情分析、財報解讀、交易決策等多項任務，一項任務就需要幾十步甚至上百步連續推理，算力需求根本不在一個量級。不久前，英偉達CEO黃仁勳在訪談中做出了這樣的判斷：Agent時代，算力需求將暴漲到生成式AI的1000倍，整個行業會被推著進入全新的競爭階段。算力需求指數級的增長帶來了兩個問題：第一是普通人該如何部署Agent、配置和使用前沿AI工具，第二則是黃仁勳所說的1000倍的算力缺口由誰來填補。前沿Agent安裝部署難度高、配置複雜，而云端模型調用的延遲、Token消耗量、數據隱私安全等問題，正在推高端側推理需求，人們需要一臺真正能降低Agent使用門檻、並且可以在端側執行更多、更復雜任務的主機。一、1000倍算力缺口，AI主機的硬門檻為什麼在CPU 黃仁勳所說的1000倍算力缺口不可能全由雲端填補，AIPC走進市場，將推理更多轉移到端側，正是重要的解法。但以前的AIPC只是把機器當成了能跑大模型的PC，而不是為Agent推理專門設計的計算機。一臺從內到外均為Agent推理而生的AIPC，在這個時代的優勢逐漸凸顯，能在本地使用Agent執行任務，也可以憑藉軟硬件優化提高計算效率，節省Token開支。而一款好的主機，核心在於芯片，對於芯片而言，不論是端側、邊緣還是雲端，CPU的重要性都不言而喻。AMD CEO蘇姿豐曾在採訪中直言，每個Agent運行過程裡都在持續調度CPU，GPU只在調用模型那一步起作用，其餘分配任務、搬運數據、調工具都走CPU。因此，未來Agent執行的任務越複雜，CPU的分量就越重，只有為Agent專門設計的芯片，才能更好滿足Agent爆發帶來的需求。此芯P1就是這樣一顆芯片，在架構層面，它為Agent推理做了定向優化：12核Arm v9.2 CPU，主頻可達3.2GHz，集成10核Arm Immortalis-G720 GPU以及專用NPU，異構總算力達45TOPS，可以為大模型的本地化部署提供開箱即用的算力支撐。作為專為Agent而生的AI主機，聯想AI主機mini搭載此芯P1，這也是此芯和聯想在共同定義“Agentic Compute”新標準過程中的產品，要讓更多人享受到Agent時代的前沿成果。這臺千元級別的主機，體積只有Mac mini的一半，平均功耗僅15W，運行噪音低於30分貝，卻能釋放此芯P1的45TOPS綜合算力，在多個Agent使用場景中表現穩定。二、三大場景開箱即用，千元級主機讓Agent走進生活這臺搭載此芯P1的聯想AI主機mini，預裝了天禧Claw，開箱即用，支持多成員共享，數據隔離、記憶獨立，一個僅有巴掌大小的千元級主機，將使用Agent的門檻直接砍到了底。 Agent確實好用，但部署Agent、接模型API，配置以及使用那些前沿工具，本身就存在門檻，對大多數人來說，“開箱即用”才是接觸Agent最現實的路徑。如何讓Agent走進每個人、每個家庭的生活，是無數廠商思考的問題。聯想AI主機mini依靠天禧Claw，可以實現7×24小時無人值守，全天候服務，並且無需部署和配置，真正實現了Agent開箱即用，門檻接近於零，同時設備支持手機、平板等多端互聯以及多成員獨立使用，隨時隨地都能調用Agent完成任務。在炒股、自媒體創作、家庭共享這些需要Agent需要持續運行、多步推理、同時處理海量信息的場景中，這臺搭載此芯P1的主機表現很穩。三、超長上下文硬扛金融場景，一顆芯片給Agent兜底金融場景中，數據源又雜又多，實時行情流和靜態財報混在一起，還不能丟失信息，這讓Agent的工作負載壓力變得非常大。比如一個散戶通過配置，讓Agent同時盯著股市、財經媒體、大公司官網和社交平臺，說一句“盯著新能源板塊，有變動立刻彈窗發給我”，Agent就得同時消化好幾種不同格式的信息，做深度推理。如果上下文窗口不夠長，Agent在處理半路上很可能自動丟掉前面的關鍵數據，給出建立在殘缺信息上的判斷，這在金融場景中，是相當致命的。搭載此芯P1的聯想AI主機mini，最高支持200K超長上下文，對需要Agent持續盯盤的用戶來說，上下文長度直接等於安全底線，這種超長的上下文窗口，讓聯想AI主機mini在金融場景中非常能打。能滿足金融場景的使用需求，對其他需要長上下文推理的日常場景自然如魚得水。四、端側低成本推理，Token不再花錢如流水，Agent常駐後臺很多自媒體創作者已然成為Agent的重度用戶，搜熱點、列大綱、寫文案、配圖排版等等，每一步背後都有Agent的身影。聊天機器人一次對話通常僅有一到兩輪推理，而Agent完成一個創作任務可能是十幾輪甚至幾十輪連續推理，全程走雲端大模型API的話，一天Token費輕鬆超過一頓外賣，一個月的賬單可能會非常驚人，放在端側推理支出就更加可控。聯想AI主機mini就是這個思路，儘可能把工作搬到本地，從而大幅度降低Token的消耗。搭載此芯P1的聯想AI主機mini支持運行本地輕量模型，可穩定承載13B–35B生產級Agent部署，外加拓展卡可支持7B-122B模型運行，遠超主流7B離線部署邊界，簡單任務可以在本地實現閉環。同時，此芯P1針對Agent場景做了定向優化，首發搭載Ubuntu 26.04和Linux 7.0 kernel，P1的異構算力驅動、NPU調度、內存管理都在這些系統上做了深度適配。其12核Armv9.2 CPU設計可以實現Agent執行任務時的精細化調度，在多任務並行時具有優秀的能效表現，NPU設計也能提高模型的計算效率。在實際測試中，搭載此芯P1的聯想AI主機mini將執行復雜任務的Token消耗量降低了60%，速度提升50%-70%。低成本推理是Agent普及的經濟前提，當推理成本降下來，Agent才可能從偶爾用一下變成日常跑在後臺。五、家庭共享零門檻，藍牙配網、無需鍵鼠 AI硬件翻車最多的地方不是跑分低，是買回家只有一個人會用，空有強大算力，卻不能共享。傳統mini主機的開箱流程是：翻鍵鼠、找網線、插顯示器、進BIOS調試，這種操作過程本身就是一堵牆。而聯想AI主機mini繞開了這堵牆：手機藍牙靠近自動配網，微信小程序掃碼綁定，不用接鍵鼠，不用插網線，並且可以實現多設備連接與多人共享。老人查菜譜、小孩問作業，一臺主機放在電視櫃上，全家人各用各的Agent，對著手機說話就行。這個體驗能立住，靠芯片在底層撐起三條線：多用戶、多任務並行處理靠12核CPU的設計；一個人折騰崩了系統，獨立Recovery分區配合一鍵恢復，全家不受影響；64GB LPDDR5內存低功耗運行，帶寬高達100GB/s，能夠實現24小時待機，兼顧功耗與性能平衡。面向家庭和中小團隊的AI主機，安全信任是另一個硬需求。此芯P1在芯片層充分利用了Arm v9.2的安全特性，包括PACBTI指針認證、MTE內存標籤擴展和Secure EL2硬件虛擬化，多人共用一臺機器跑各自的Agent，數據不串區，保證安全性。 P1還過了Arm SystemReady L6認證，這是數據中心級的硬件合規標準，主流Linux發行版可以開箱直裝。而OTA在線升級，可以讓芯片算力釋放能力隨系統迭代持續提升，買回家的硬件能夠越用越好用。結語：為Agent推理而生的芯片，正在重寫AI硬件的規則 AI主機這個概念喊了兩年，但真正能讓Agent從聊天框裡走出來的硬件，不是塞個大模型進機箱，也不是給PC換個殼貼個AI標籤。芯片得在底層回答這些問題：Agent推理能不能一次處理足夠長的上下文，端側推理能否執行更多更復雜的任務，多任務併發時系統能不能穩住。此芯P1選了Agentic Compute這條路，從芯片架構的第一行代碼開始，就為Agent推理做定向設計，通過“端雲協同，端側常駐”的模式，打造為Agent而生的計算能力。未來，評判一臺AI主機優劣的標準，將從跑分多高，逐漸變成Agent跑得省不省、穩不穩，Agentic Compute時代，AI主機的規則正在重寫。

原始來源：智東西 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

3 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

16 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

19 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

20 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

23 小時前閱讀分析