訊飛給智慧空間安上“大小腦”,你的房間也有記憶和主動智能了
重點摘要
智東西 作者 | 陳駿達 編輯 | 漠影 2026年,AI Agent正加速湧入數字世界。從年初爆火的OpenClaw,再到後來誕生的Hermes,Agent框架層出不窮。接入大模型後,它們能調用工具、操作軟件、完成複雜任務,一夜之間,數字世界的許多工作和瑣碎事務,似乎有被Agent接管的趨勢。 然而,在物理世界,Agent的滲透程度仍然有限。智慧空間類產品雖已湧現,卻大多停留在“用戶發指令,設備被動響應”的初級階段。設備語義理解能力弱、缺乏記憶與主動服務等痛點,讓“智慧”二字多少有些名不副實。 Agent在數字世界的成功,讓不少國內外廠商開始思考:如何將這種自主執行、長期記憶、主動智能的能力,遷移到更復雜的物理世界,並在酒店、地產、工廠、辦公場所、家庭等場景提供更為智能的交互體驗? 今天,科大訊飛發佈了對未來空間智能的最新理解——Agent架構SpaceMind。這也是全球首個在智慧空間領域落地的Agent平臺。與傳統方案不同,這一架構打通了空間感知、語義理解、記憶學習、智能決策與真實設備執行的全鏈路能力,給智慧空間的未來,提供了一個新的架構設計。 一、接入Agent後反而“降智”?雙路由架構成解題思路 在討論SpaceMind的具體細節前,我們有必要先看清一個行業現狀:當AI能力、Agent能力被引入現有智慧空間產品時,體驗並非總是正向提升。實際上,不少產品反而變得不如以前好用了。 這些問題已經在海外許多產品上集中爆發了,不少用戶抱怨大模型接入智慧空間產品後,原有的流暢體驗沒了。 在海外社交媒體,有用戶反饋大模型參與後,設置一個30秒倒計時需要等待10多秒,開關燈也變得像碰運氣一樣。在他把設備恢復出廠設置後,才重新擁有之前絲滑的天氣預報、播放音樂等體驗。 另一位用戶分享道,以前用智能音箱開盞燈只要不到5秒鐘,大模型被接入後要等個20~40秒,完全毀掉了智能家居的體驗。
智東西 作者 | 陳駿達 編輯 | 漠影 2026年,AI Agent正加速湧入數字世界。從年初爆火的OpenClaw,再到後來誕生的Hermes,Agent框架層出不窮。接入大模型後,它們能調用工具、操作軟件、完成複雜任務,一夜之間,數字世界的許多工作和瑣碎事務,似乎有被Agent接管的趨勢。 然而,在物理世界,Agent的滲透程度仍然有限。智慧空間類產品雖已湧現,卻大多停留在“用戶發指令,設備被動響應”的初級階段。設備語義理解能力弱、缺乏記憶與主動服務等痛點,讓“智慧”二字多少有些名不副實。 Agent在數字世界的成功,讓不少國內外廠商開始思考:如何將這種自主執行、長期記憶、主動智能的能力,遷移到更復雜的物理世界,並在酒店、地產、工廠、辦公場所、家庭等場景提供更為智能的交互體驗? 今天,科大訊飛發佈了對未來空間智能的最新理解——Agent架構SpaceMind。這也是全球首個在智慧空間領域落地的Agent平臺。與傳統方案不同,這一架構打通了空間感知、語義理解、記憶學習、智能決策與真實設備執行的全鏈路能力,給智慧空間的未來,提供了一個新的架構設計。 一、接入Agent後反而“降智”?雙路由架構成解題思路 在討論SpaceMind的具體細節前,我們有必要先看清一個行業現狀:當AI能力、Agent能力被引入現有智慧空間產品時,體驗並非總是正向提升。實際上,不少產品反而變得不如以前好用了。 這些問題已經在海外許多產品上集中爆發了,不少用戶抱怨大模型接入智慧空間產品後,原有的流暢體驗沒了。 在海外社交媒體,有用戶反饋大模型參與後,設置一個30秒倒計時需要等待10多秒,開關燈也變得像碰運氣一樣。在他把設備恢復出廠設置後,才重新擁有之前絲滑的天氣預報、播放音樂等體驗。 另一位用戶分享道,以前用智能音箱開盞燈只要不到5秒鐘,大模型被接入後要等個20~40秒,完全毀掉了智能家居的體驗。 這些用戶的吐槽不無道理。大模型固然強大,但並非所有任務都需要,或者適合它親自出馬。在智慧空間中,許多設備控制類、信息查詢類指令天然要求低延遲、高穩定性,而大模型推理本身存在延遲和不確定性,兩者之間存在著根本性衝突。 科大訊飛也看到了這一問題。SpaceMind對上述問題的解決思路是對指令進行分流。其雙路由架構將控制指令與推理任務分別交由兩條互不干擾的通道處理,分工邏輯類似人類的大腦和小腦。 其中,一級路由(控制通道)主要負責處理設備控制類指令。這些指令不經過大模型,端到端響應僅需700毫秒,其中負責判斷指令的自研家居語義模型耗時不足200毫秒。相比傳統方案,速度提升100%,穩定性提升30%。 現場演示中,我們能看到,在響應諸如開燈、拉窗簾、切換場景等指令時,SpaceMind一般僅需要1秒左右,用戶等待的時間已經基本無感,體驗十分絲滑。 針對更為複雜的任務,比如複雜語義理解、任務規劃、Agent任務等,SpaceMind則提供了二級路由(推理通道),交給大模型深度推理。 從本質上來看,科大訊飛在SpaceMind中所做的,就是將“控制平面”與“推理平面”解耦。這套架構的價值在於,控制類指令不會因為引入大模型而變慢,而在需要大模型出馬的複雜任務中,SpaceMind可以靈活切換,提供更為智能的體驗。 在此基礎上,SpaceMind還採用了雙模型協同模式:雲端部署的自研家居語義模型負責高頻、簡單的指令理解,成本低、延遲小;而推理大模型則專注於長期記憶、日程管理、衝突檢測、主動提醒等複雜任務。兩個模型各司其職,互不干擾。 除了架構創新,多模態感知能力對智慧空間同樣至關重要。因為智慧空間需要實時理解“誰在哪裡、在做什麼、環境如何”,僅靠語音難以獲取完整上下文。 SpaceMind架構已經支持通過毫米波雷達技術實現“無感感知”,把空間信息的狀態也作為輸入,給Agent提供決策信息。 這項技術可以實現精確到5釐米的三維空間定位、呼吸級微動檢測、識別人數、區分人與寵物、判斷靜止/移動/跌倒。更重要的是,毫米波雷達不依賴光線,在煙霧、黑暗、遮擋等環境下依然穩定,還從傳感器源頭解決了隱私問題——雷達無需採集影像,只會獲取空間裡的位置和狀態。 在真實應用場景裡,這套方案可以幫助企業在辦公、酒店等場景實現大幅節能。以一家100個房間的酒店為例,每年可以省下約40萬元的電費。 二、複雜場景語音指令一步到位,真實記憶自學習重塑主動服務 如果說雙路由架構、雙模型架構實現了速度和智能的平衡問題,那麼SpaceMind接下來的任務,就是把真正的Agent能力引入智慧空間。 科大訊飛海外產品部總經理盧堯認為,如今,用戶對智慧空間的期待已經越來越高。智慧空間能否記住用戶偏好、能不能主動提供服務、能不能理解複雜意圖,都是用戶關心的問題。 科大訊飛曾探索能否將OpenClaw框架引入智慧空間,但在研究後他們發現,該框架並不直接適用於智慧空間,但其核心設計理念值得參考。最終,科大訊飛打造的SpaceMind擁有了多智能體協作、長期記憶與主動智能的特性。 多智能體方面,科大訊飛為不同領域的任務打造了專家智能體,每個專家智能體都擁有處理其專精領域所需的知識和技能。 在記憶方面,SpaceMind能夠記住用戶偏好、家庭習慣、房間狀態和長期使用歷史,甚至區分說話人。這一系統還具備自學習能力,可以從日常行為中學習規律,讓空間適應用戶的真實生活習慣。 現場演示中,當不同用戶說出同一句“我想休息一下”時,SpaceMind會根據說話人的個性化需求,自動切換到各自偏好的休息場景。用戶也可以直接告訴SpaceMind記住特定設置,以後就可以便捷調用。 主動智能是SpaceMind區別於傳統智慧空間系統的核心標誌之一。傳統系統只能被動等待指令,而SpaceMind可以在合適的時間主動提醒或執行。 發佈會現場演示的這一能力就十分實用。當用戶要求SpaceMind幫他訂明天晚上7點的晚餐時,SpaceMind會發現與已有的網球課衝突,並主動提醒用戶修改日程。 在SpaceMind這一智慧空間Agent架構中,我們看到了不少與OpenClaw在數字世界中相似的能力,比如能主動理解用戶、記住偏好、個性化地執行任務等等。這些能力是OpenClaw在數字世界能斬獲不少用戶喜愛的關鍵,而SpaceMind要做的就是把這種體驗帶到智慧空間之中。 三、兩級Gateway打通生態,從開發者共創到全球規模化落地 架構再先進、智能再強大,如果無法連接真實世界的設備,SpaceMind終究無法發揮其全部能力。目前,智慧空間領域涉及的產品、廠商、協議種類繁多,從KNX、Zigbee到Matter,從照明、暖通到安防,不同品牌、不同標準之間的設備往往互不兼容。 用戶不可能為了使用SpaceMind而淘汰項目、廠房或家中已有的全部設備,智慧空間廠商也不可能靠一己之力覆蓋所有品類。 SpaceMind選擇用開放生態來解決這一問題。具體來看,科大訊飛為SpaceMind設計了兩級Gateway體系,打通了不同協議、不同品牌設備之間的壁壘。 在基礎網關(Gateway Lite)中,SpaceMind支持接入KNX、Zigbee、Matter、Thread等主流控制協議。用戶無需替換現有設備,就能使用SpaceMind的AI能力。 在包含基礎網關能力的同時,SpaceMind的高級網關(Gateway Pro)新增了多媒體控制能力,同時還將支持Agent現場可編程、本地NAS存儲等高階用戶需求,為未來更復雜的空間智能預留了擴展空間。 這意味著,無論企業和個人用戶使用的是高端的私有化方案,還是開源生態,SpaceMind都能無縫接入。 科大訊飛還為這一生態推出了SpaceMind Marketplace,它可以被理解為智慧空間的“應用商店”。單一用戶的開發能力、想象力終歸是有限的,而通過SpaceMind Marketplace,用戶可以獲取由第三方專家與開發者提供的豐富能力,並在自己的真實空間調用。 為了加速生態繁榮,科大訊飛同期發佈了SpaceMind AI Agent創新應用大賽,面向全球開發者、高校團隊、創業團隊和生態夥伴,鼓勵圍繞家庭智能管家、老人關懷、兒童陪伴、能源管理、安全守護、沉浸式家庭體驗等方向,打造下一代AI Agent應用。這一機制有望進一步釋放社區想象力,也讓智慧空間裡的Agent進一步深入細分場景。 在硬件層面,WallEX是科大訊飛面向海外市場的智慧空間解決方案品牌,承擔著將SpaceMind能力落地的重要角色。目前,WallEX可提供智能控制面板、語音設備、傳感器、照明、窗簾、暖通、安防等全系硬件,並打造 “終端+方案”的一體化產品。 今天,WallEX聯合生態夥伴發佈了KNX藝術面板(與世聰聯名)和NOVA系列氛圍燈,不僅支持WallEX,也支持與CSA、Matter、Alexa、Google Home等生態聯動,實現“燈隨人動”等智能體驗。 從科大訊飛的整體佈局來看,今天打造的SpaceMind負責理解、決策與規劃,而WallEX負責連接設備與場景落地,兩者共同構成完整的智慧空間Agent體系。 結語:中國企業,率先交出智慧空間Agent答卷 如何將新一代AI能力與Agent能力引入家庭、酒店、辦公場所,正成為智慧空間賽道的主戰場。過去,全球智慧空間的競爭更多集中在連接協議、單品生態與入口之爭;而未來,誰能真正把優秀的AI能力和Agent體驗交付給用戶,實現理解用戶、主動服務,誰就有望掌握競爭的關鍵籌碼。 正是在這一方向上,科大訊飛SpaceMind與WallEX的組合邁出了關鍵的第一步。它標誌著中國企業已不再滿足於只輸出模型和產品,而是開始輸出完整的智慧空間Agent系統能力。在全球AI競爭從模型層走向系統層、從虛擬世界走向物理世界的進程中,科大訊飛率先提交了一份來自中國的最新答卷。
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。