智東西生成式AI

Agent時代的終端競賽,贏在CPU!

2026年6月11日 11:57

重點摘要

智東西 作者 | 畢偉豪 編輯 | 漠影 智東西6月12日報道,這兩年,隨著Claude Code、Codex越來越能打,龍蝦(OpenClaw)、愛馬仕(Hermes)這類開源AI助手接連爆火,“智能體”熱度飆升,Agent時代就此到來。 現在,越來越多的人從聊天機器人轉到Agent,開始使用各種工具來完成日常生活中的任務,相比於簡單對話,Agent的Token的消耗量是巨大的。 因為現在的Agent可以真正幫人幹活,比如寫軟件、盯股市、做PPT、剪視頻等等,以前聊天機器人回答問題,通常僅需一兩步推理,而現在一個金融Agent,要同時跑行情分析、財報解讀、交易決策等多項任務,一項任務就需要幾十步甚至上百步連續推理,算力需求根本不在一個量級。 不久前,英偉達CEO黃仁勳在訪談中做出了這樣的判斷:Agent時代,算力需求將暴漲到生成式AI的1000倍,整個行業會被推著進入全新的競爭階段。 算力需求指數級的增長帶來了兩個問題:第一是普通人該如何部署Agent、配置和使用前沿AI工具,第二則是黃仁勳所說的1000倍的算力缺口由誰來填補。 前沿Agent安裝部署難度高、配置複雜,而云端模型調用的延遲、Token消耗量、數據隱私安全等問題,正在推高端側推理需求,人們需要一臺真正能降低Agent使用門檻、並且可以在端側執行更多、更復雜任務的主機。 一、1000倍算力缺口,AI主機的硬門檻為什麼在CPU 黃仁勳所說的1000倍算力缺口不可能全由雲端填補,AIPC走進市場,將推理更多轉移到端側,正是重要的解法。但以前的AIPC只是把機器當成了能跑大模型的PC,而不是為Agent推理專門設計的計算機。 一臺從內到外均為Agent推理而生的AIPC,在這個時代的優勢逐漸凸顯,能在本地使用Agent執行任務,也可以憑藉軟硬件優化提高計算效率,節省Token開支。 而一款好的主機,核心在於芯片,對

站內 AI 整理稿

智東西 作者 | 畢偉豪 編輯 | 漠影 智東西6月12日報道,這兩年,隨著Claude Code、Codex越來越能打,龍蝦(OpenClaw)、愛馬仕(Hermes)這類開源AI助手接連爆火,“智能體”熱度飆升,Agent時代就此到來。 現在,越來越多的人從聊天機器人轉到Agent,開始使用各種工具來完成日常生活中的任務,相比於簡單對話,Agent的Token的消耗量是巨大的。 因為現在的Agent可以真正幫人幹活,比如寫軟件、盯股市、做PPT、剪視頻等等,以前聊天機器人回答問題,通常僅需一兩步推理,而現在一個金融Agent,要同時跑行情分析、財報解讀、交易決策等多項任務,一項任務就需要幾十步甚至上百步連續推理,算力需求根本不在一個量級。 不久前,英偉達CEO黃仁勳在訪談中做出了這樣的判斷:Agent時代,算力需求將暴漲到生成式AI的1000倍,整個行業會被推著進入全新的競爭階段。 算力需求指數級的增長帶來了兩個問題:第一是普通人該如何部署Agent、配置和使用前沿AI工具,第二則是黃仁勳所說的1000倍的算力缺口由誰來填補。 前沿Agent安裝部署難度高、配置複雜,而云端模型調用的延遲、Token消耗量、數據隱私安全等問題,正在推高端側推理需求,人們需要一臺真正能降低Agent使用門檻、並且可以在端側執行更多、更復雜任務的主機。 一、1000倍算力缺口,AI主機的硬門檻為什麼在CPU 黃仁勳所說的1000倍算力缺口不可能全由雲端填補,AIPC走進市場,將推理更多轉移到端側,正是重要的解法。但以前的AIPC只是把機器當成了能跑大模型的PC,而不是為Agent推理專門設計的計算機。 一臺從內到外均為Agent推理而生的AIPC,在這個時代的優勢逐漸凸顯,能在本地使用Agent執行任務,也可以憑藉軟硬件優化提高計算效率,節省Token開支。 而一款好的主機,核心在於芯片,對於芯片而言,不論是端側、邊緣還是雲端,CPU的重要性都不言而喻。AMD CEO蘇姿豐曾在採訪中直言,每個Agent運行過程裡都在持續調度CPU,GPU只在調用模型那一步起作用,其餘分配任務、搬運數據、調工具都走CPU。 因此,未來Agent執行的任務越複雜,CPU的分量就越重,只有為Agent專門設計的芯片,才能更好滿足Agent爆發帶來的需求。 此芯P1就是這樣一顆芯片,在架構層面,它為Agent推理做了定向優化:12核Arm v9.2 CPU,主頻可達3.2GHz,集成10核Arm Immortalis-G720 GPU以及專用NPU,異構總算力達45TOPS,可以為大模型的本地化部署提供開箱即用的算力支撐。 作為專為Agent而生的AI主機,聯想AI主機mini搭載此芯P1,這也是此芯和聯想在共同定義“Agentic Compute”新標準過程中的產品,要讓更多人享受到Agent時代的前沿成果。 這臺千元級別的主機,體積只有Mac mini的一半,平均功耗僅15W,運行噪音低於30分貝,卻能釋放此芯P1的45TOPS綜合算力,在多個Agent使用場景中表現穩定。 二、三大場景開箱即用,千元級主機讓Agent走進生活 這臺搭載此芯P1的聯想AI主機mini,預裝了天禧Claw,開箱即用,支持多成員共享,數據隔離、記憶獨立,一個僅有巴掌大小的千元級主機,將使用Agent的門檻直接砍到了底。 Agent確實好用,但部署Agent、接模型API,配置以及使用那些前沿工具,本身就存在門檻,對大多數人來說,“開箱即用”才是接觸Agent最現實的路徑。如何讓Agent走進每個人、每個家庭的生活,是無數廠商思考的問題。 聯想AI主機mini依靠天禧Claw,可以實現7×24小時無人值守,全天候服務,並且無需部署和配置,真正實現了Agent開箱即用,門檻接近於零,同時設備支持手機、平板等多端互聯以及多成員獨立使用,隨時隨地都能調用Agent完成任務。 在炒股、自媒體創作、家庭共享這些需要Agent需要持續運行、多步推理、同時處理海量信息的場景中,這臺搭載此芯P1的主機表現很穩。 三、超長上下文硬扛金融場景,一顆芯片給Agent兜底 金融場景中,數據源又雜又多,實時行情流和靜態財報混在一起,還不能丟失信息,這讓Agent的工作負載壓力變得非常大。 比如一個散戶通過配置,讓Agent同時盯著股市、財經媒體、大公司官網和社交平臺,說一句“盯著新能源板塊,有變動立刻彈窗發給我”,Agent就得同時消化好幾種不同格式的信息,做深度推理。 如果上下文窗口不夠長,Agent在處理半路上很可能自動丟掉前面的關鍵數據,給出建立在殘缺信息上的判斷,這在金融場景中,是相當致命的。 搭載此芯P1的聯想AI主機mini,最高支持200K超長上下文,對需要Agent持續盯盤的用戶來說,上下文長度直接等於安全底線,這種超長的上下文窗口,讓聯想AI主機mini在金融場景中非常能打。 能滿足金融場景的使用需求,對其他需要長上下文推理的日常場景自然如魚得水。 四、端側低成本推理,Token不再花錢如流水,Agent常駐後臺 很多自媒體創作者已然成為Agent的重度用戶,搜熱點、列大綱、寫文案、配圖排版等等,每一步背後都有Agent的身影。 聊天機器人一次對話通常僅有一到兩輪推理,而Agent完成一個創作任務可能是十幾輪甚至幾十輪連續推理,全程走雲端大模型API的話,一天Token費輕鬆超過一頓外賣,一個月的賬單可能會非常驚人,放在端側推理支出就更加可控。 聯想AI主機mini就是這個思路,儘可能把工作搬到本地,從而大幅度降低Token的消耗。 搭載此芯P1的聯想AI主機mini支持運行本地輕量模型,可穩定承載13B–35B生產級Agent部署,外加拓展卡可支持7B-122B模型運行,遠超主流7B離線部署邊界,簡單任務可以在本地實現閉環。 同時,此芯P1針對Agent場景做了定向優化,首發搭載Ubuntu 26.04和Linux 7.0 kernel,P1的異構算力驅動、NPU調度、內存管理都在這些系統上做了深度適配。 其12核Armv9.2 CPU設計可以實現Agent執行任務時的精細化調度,在多任務並行時具有優秀的能效表現,NPU設計也能提高模型的計算效率。 在實際測試中,搭載此芯P1的聯想AI主機mini將執行復雜任務的Token消耗量降低了60%,速度提升50%-70%。 低成本推理是Agent普及的經濟前提,當推理成本降下來,Agent才可能從偶爾用一下變成日常跑在後臺。 五、家庭共享零門檻,藍牙配網、無需鍵鼠 AI硬件翻車最多的地方不是跑分低,是買回家只有一個人會用,空有強大算力,卻不能共享。傳統mini主機的開箱流程是:翻鍵鼠、找網線、插顯示器、進BIOS調試,這種操作過程本身就是一堵牆。 而聯想AI主機mini繞開了這堵牆:手機藍牙靠近自動配網,微信小程序掃碼綁定,不用接鍵鼠,不用插網線,並且可以實現多設備連接與多人共享。 老人查菜譜、小孩問作業,一臺主機放在電視櫃上,全家人各用各的Agent,對著手機說話就行。 這個體驗能立住,靠芯片在底層撐起三條線:多用戶、多任務並行處理靠12核CPU的設計;一個人折騰崩了系統,獨立Recovery分區配合一鍵恢復,全家不受影響;64GB LPDDR5內存低功耗運行,帶寬高達100GB/s,能夠實現24小時待機,兼顧功耗與性能平衡。 面向家庭和中小團隊的AI主機,安全信任是另一個硬需求。此芯P1在芯片層充分利用了Arm v9.2的安全特性,包括PACBTI指針認證、MTE內存標籤擴展和Secure EL2硬件虛擬化,多人共用一臺機器跑各自的Agent,數據不串區,保證安全性。 P1還過了Arm SystemReady L6認證,這是數據中心級的硬件合規標準,主流Linux發行版可以開箱直裝。而OTA在線升級,可以讓芯片算力釋放能力隨系統迭代持續提升,買回家的硬件能夠越用越好用。 結語:為Agent推理而生的芯片,正在重寫AI硬件的規則 AI主機這個概念喊了兩年,但真正能讓Agent從聊天框裡走出來的硬件,不是塞個大模型進機箱,也不是給PC換個殼貼個AI標籤。 芯片得在底層回答這些問題:Agent推理能不能一次處理足夠長的上下文,端側推理能否執行更多更復雜的任務,多任務併發時系統能不能穩住。 此芯P1選了Agentic Compute這條路,從芯片架構的第一行代碼開始,就為Agent推理做定向設計,通過“端雲協同,端側常駐”的模式,打造為Agent而生的計算能力。 未來,評判一臺AI主機優劣的標準,將從跑分多高,逐漸變成Agent跑得省不省、穩不穩,Agentic Compute時代,AI主機的規則正在重寫。

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

3 小時前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

23 小時前

微軟,考慮接入DeepSeek

這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前