智東西生成式AI

智能家居終於“智能”了!有記憶、能認人的“賈維斯”,小米先交卷了

2026年6月19日 01:07

重點摘要

智東西 作者 | 雲鵬 編輯 | 漠影 剛剛,國產版“賈維斯”,真的進家了! 辛苦一天,深夜推開家門,耳邊響起:“加班辛苦了,早點休息,有需要隨時叫我!” 妻子生日當天,一進家門燈光氛圍直接拉滿、電視播放祝福畫面,音箱響起:“親愛的老婆生日快樂!” 當我沉迷世界盃球賽時,耳邊突然響起:“廚房的水燒開了,要儘快關火哦!” 當我在書房伏案加班、長時間緊盯屏幕時,親切的提醒聲道來:“注意坐姿哦,不然又要腰痛啦!” AI大管家不僅懂我的生活作息、知我的健康狀況,還會主動關心我,隨時感知我在各類場景的狀態。 今天,這樣的體驗,已經成為現實。 就在昨天,小米正式發佈並開源了Xiaomi Miloco 2.0,一套面向未來的全屋智能AI開源方案。直觀來看,小米給Agent時代的智能家居裝上了新的“AI大腦”,把超級AI管家帶進了智能家居生態中。 客觀來看,這也是目前業內第一個能夠實現AI主動服務、有家庭記憶的智能家居解決方案。 ▲Xiaomi Miloco 2.0 GitHub首頁 當前,以各類Claw為代表的Agent(智能體)成為AI賽道的核心焦點,其在生產力提效方面作用顯著。然而在“AI進家”這一關鍵場景,仍然缺乏一個關鍵系統,把基於大模型、通用性極強、多模態交互能力極強的各類Claw與智能家居設備生態徹底打通、連接起來,讓Agent可以真正“懂家”。 Xiaomi Miloco 2.0,就是這樣一個核心繫統,可以化作Agent的“眼睛、耳朵、記憶”,各類米家設備作為全模態感知入口,Miloco 2.0通過視覺、聲音、環境感知實現全屋理解,將用戶需求傳達給Agent,真正完成AI在家庭場景提供服務的閉環,而所有用戶數據都保存在端側,原始數據與Agent完全隔離,30天自動清理,隱私安全問題得到妥善解決。 這背後不僅是小米大模型底層能力的升級,更是一套系統級全屋智能AI框架的成熟。

站內 AI 整理稿

智東西 作者 | 雲鵬 編輯 | 漠影 剛剛,國產版“賈維斯”,真的進家了! 辛苦一天,深夜推開家門,耳邊響起:“加班辛苦了,早點休息,有需要隨時叫我!” 妻子生日當天,一進家門燈光氛圍直接拉滿、電視播放祝福畫面,音箱響起:“親愛的老婆生日快樂!” 當我沉迷世界盃球賽時,耳邊突然響起:“廚房的水燒開了,要儘快關火哦!” 當我在書房伏案加班、長時間緊盯屏幕時,親切的提醒聲道來:“注意坐姿哦,不然又要腰痛啦!” AI大管家不僅懂我的生活作息、知我的健康狀況,還會主動關心我,隨時感知我在各類場景的狀態。 今天,這樣的體驗,已經成為現實。 就在昨天,小米正式發佈並開源了Xiaomi Miloco 2.0,一套面向未來的全屋智能AI開源方案。直觀來看,小米給Agent時代的智能家居裝上了新的“AI大腦”,把超級AI管家帶進了智能家居生態中。 客觀來看,這也是目前業內第一個能夠實現AI主動服務、有家庭記憶的智能家居解決方案。 ▲Xiaomi Miloco 2.0 GitHub首頁 當前,以各類Claw為代表的Agent(智能體)成為AI賽道的核心焦點,其在生產力提效方面作用顯著。然而在“AI進家”這一關鍵場景,仍然缺乏一個關鍵系統,把基於大模型、通用性極強、多模態交互能力極強的各類Claw與智能家居設備生態徹底打通、連接起來,讓Agent可以真正“懂家”。 Xiaomi Miloco 2.0,就是這樣一個核心繫統,可以化作Agent的“眼睛、耳朵、記憶”,各類米家設備作為全模態感知入口,Miloco 2.0通過視覺、聲音、環境感知實現全屋理解,將用戶需求傳達給Agent,真正完成AI在家庭場景提供服務的閉環,而所有用戶數據都保存在端側,原始數據與Agent完全隔離,30天自動清理,隱私安全問題得到妥善解決。 這背後不僅是小米大模型底層能力的升級,更是一套系統級全屋智能AI框架的成熟。 全屋智能設備在安全基礎之上擺脫了傳統手動設置規則的束縛,更高效地接入AI生態,更能主動理解、服務人的需求,Xiaomi Miloco 2.0真正成為了一個有記憶、能認人,還能流暢執行復雜任務的AI智能管家,全屋智能在Agent時代的拐點,已經來了。 一、深度拆解Miloco架構:讓Agent真正“懂家”,掐緊隱私安全底線 今天,距離Miloco 1.0正式開源僅僅過去7個月,Miloco 1.0主打端雲協同與跨設備自然語言交互,而Miloco 2.0的開源直接將智能家居的AI生態協同體驗帶到了一個新的高度。 如果說1.0解決了AI與設備的聯動,搭好了框架,那麼2.0則真正實現了全屋智能的“Agent化”。 從架構上來看,端側Miloco 2.0系統與主AI Agent之間實現了高效的協同配合: Miloco部署在本地,利用米家設備作為入口,調用雲端的omni(全模態)感知大模型進行視覺、聲音、環境的全屋理解與身份識別,把感知、處理後的關鍵結構化信息發送給主Agent,隨後主Agent調用雲端大模型模型進行全局任務規劃與決策,規劃出執行步驟後,再向Miloco發起調用,最終Miloco聯動全屋米家智能設備完成AI服務的閉環。 值得一提的是,想要實現這一套看似極為超前的“次世代智能家居AI體驗”,門檻已經大大降低,普通小白用戶也可以很輕鬆的上手體驗,完成部署。 你最少只需要: ·一臺能跑OpenClaw的電腦(跨平臺支持Mac/Windows/Linux); ·一個綁定了家裡米家設備的小米賬號; ·一臺米家攝像頭作為視覺感知入口; ·一個多模態大模型的API Key(當然小米官方推薦的是其自家的MiMo) 目前Miloco 2.0已經接入了Agent圈受眾最為廣泛的OpenClaw,根據官方信息,後續Miloco也會陸續適配更多Claw類產品。 對於用戶來說,Miloco 2.0已經做了大量優化簡化,你只需要給OpenClaw發送指令,它會自動幫你完成環境準備、綁定賬號和模型,全程幾乎不需要更多操作,可以說極大地拉近了AI前沿技術與消費級場景的距離。 雖然部署上大幅簡化,但在用戶最關心的安全方面,Miloco卻一點都沒省: 所有攝像頭、各類傳感器收集的原始數據“用完即棄”,數據完全本地保存,絕不留存雲端,隨時可清空,即便忘記,30天后也會自動清理。用戶還可以給攝像頭設黑名單、給家庭設白名單,可以說數據完全由用戶掌控。 值得一提的是,這些原始數據與OpenClaw完全隔離,Agent能獲取的信息只有Miloco系統判斷完所給出的“發生了什麼”的語義結果。 安全這道“底線”,小米狠狠掐住,不留任何風險。 二、四項核心能力升級,給Agent裝上“眼耳口”,智能家居體驗大不同 說了這麼多理論技術層面的改變,Miloco 2.0在實際家庭場景中,到底有哪些新的技能,到底可以實現怎樣不同的AI體驗,背後的關鍵技術實現邏輯又是怎樣的?當我們深入官方發佈的多個功能演示視頻就會發現,當Agent真正懂家、懂你後,家居場景所迸發出的AI應用價值空間是巨大的。 縱觀此次小米開源的Miloco 2.0,多模態感知、主動智能、持續任務和家庭記憶是其四個最核心的功能升級。 在多模態感知方面,案例視頻中的“水燒開無人時主動提醒”令人印象深刻,米家攝像頭通過視覺看到水壺上的蒸汽,聲音傳感器監測到鍋具的蜂鳴,判斷水已燒開,而此時主人並未在廚房內,因此推斷需要提醒。隨後攝像頭查看到主人正在觀看電視,因此選擇沙發兩側距離人最近的音箱播放音頻提醒,整個流程自然高效、符合邏輯。 生活中類似的場景實際還有很多,例如老人獨自在家中如果不小心跌倒或遇到特殊情況需要幫助、孩子獨自哭泣,系統可以結合攝像頭的視覺識別以及聲音傳感器識別綜合判斷老人、孩子狀態,即時給主人發送提示,或者遠程啟動家中家電給予幫助。未來,這些都可以通過Miloco 2.0的能力實現。 在主動智能方面,當攝像頭感知到主人回家,會結合家庭記憶進行判斷,發現到家時間晚於平均,推測主人可能加班了,因此主動給予慰問。 一大早醒來,AI根據家庭記憶發現今天是你的生日,伴著清晨第一縷陽光給你送上溫馨生日祝福;當AI發現你情緒低落,就會主動詢問是否要為你播放一些輕鬆抒情的常聽曲目,並與你聊天緩解情緒——主動智能讓AI更有溫度。 持續任務也是非常實用的一項升級,在演示視頻中,當系統收到我們的家人生日提醒指令後,就會自動思考,主動編排家中可以用到的設備,比如各類燈、電視、音箱,生成生日驚喜方案,隨後就開始持續“待命”,等待條件觸發。當系統監測到家人歸來,就會調動設備執行編排好的方案。 這種時刻在線、感知觸發的持續任務能力在生活中還大有用武之地: 比如持續監測孩子的坐姿,視覺模型持續對比孩子落座後的骨骼姿態,一旦觸發不良姿態條件就會進行語音或其他形式的提醒干預;系統還可以後臺計時、聯動電視狀態數據,持續監測孩子看電視的時間,並在達到指定觀看時長後進行提醒或關機;系統還可以持續觀察並記錄家中老人的夜間動向,如果老人夜裡長時間沒回房間,系統就會主動提醒用戶。 最後一項核心升級是家庭記憶功能,這也是貫穿許多能力的一項基礎功能升級。 正如演示視頻中所展示的,當攝像頭識別到有人書房落座,就會根據其身份回溯家庭記憶,根據其喜好調整燈光,比如男主人喜歡在閱讀電腦時用明亮暖光,女主人則喜歡在寫筆記時用柔和的中性光。 攝像頭識別到女主人坐姿不佳的時候,也會根據家庭記憶聯想到她腰部不適的病史,並即時提醒注意坐姿,在識別到女主人運動的時候,也會即時提醒她動作幅度要注意,避免腰部過度用力。 這種家庭記憶能力是讓AI真正懂你、能夠提供個性化貼心服務的關鍵技術支撐。根據病歷和藥方提醒老人按時吃藥、根據主人的喜好調節各類家電的參數、根據孩子的年齡推薦適合的學習讀物和學習姿勢,家庭記憶讓AI真的像你的“家人”。 縱觀四大核心功能升級,我們不難發現,這些能力幾乎都是相互交融、共同作用在不同場景中,可以說是實現次世代智能家居體驗的“基石”能力。 從單一視覺升級到多模態感知,系統能同時處理空間內的畫面變化、人物變化、聲音語調、溫度等多維數據,感知更為精準和立體。 從規則驅動到主動智能,系統憑藉大模型強大的常識推理能力,主動觀察用戶場景狀態,基於用戶的日常作息與設備使用習慣,自主進行判斷並主動提供服務。 從單點執行到長期任務,相比傳統的“一句話一執行”,AI真正可以實現隨時在線、多時段持續跟蹤。 從寬泛上下文理解到專屬家庭記憶,AI直接“精準識別家庭成員身份信息”, 將通用常識知識與長期沉澱下來的專屬“家庭檔案”進行結合,針對性匹配其專屬、個性化的智能服務。 總體來看,在Miloco 2.0的加持下,曾經對家庭場景是一片“盲區”的Agent,終於可以藉助新的眼睛、耳朵和各類感知能力,去懂用戶、懂用戶的家,懂用戶在家的一系列複雜狀態和需求,進而提供真正主動有溫度的智能服務。 Agent時代的智能家居體驗,被徹底革新。 三、搶先用AI Agent變革智能家居,下一個十年小米能否繼續領跑賽道? 回望過去十幾年,小米一直是智能家居賽道的生態王者,十年前,米家基於過硬的產品力、極致性價比、遠超行業的統一互聯體驗,定義了智能家居領域的“互聯互通時代”。 而在今天的Agent時代,小米有望重新定義智能家居發展的新範式和方向。從Miloco 1.0到今天的2.0,AI時代、大模型和Agent加持下的智能家居到底要怎麼做、如何跑通,小米已經交出了一份藍本式的答卷。 從攝像頭、傳感器、燈具到家電,米家生態中龐大的硬件資源被重新整合,成為大模型的“眼耳口鼻”,讓Agent可以真正操控物理世界,在家庭場景完成服務閉環。 “懂家”的Miloco與能力強大的Agent結合,AI進家這件事,又向前邁了一大步:Miloco 2.0並不是一次簡單的軟件迭代,而是全屋智能向“系統級Agent”方向進化的一次關鍵技術迭代。 為什麼是小米先做成了這件事?這離不開小米在“AI家”這一方向上的長期堅定投入、技術深耕。 “人車家全生態”是小米當前的核心戰略,“家”自然是其中的核心一環,在這一戰略下,小米在AI領域持續加大投入,2026年預計投入至少160億元,其創始人兼CEO雷軍曾提到,未來三年小米在AI領域將投入600億元。 小米今年4月底開源的MiMo-V2.5系列模型重點提升了Agent能力,在各類基準測試中位居全球開源模型陣營頭部。隨後這一模型家族的語音模型、視覺模型相繼迭代升級,取得出色表現。小米MiMo大模型也是此次Miloco 2.0的智能核心。 毫無疑問,這些紮實的底層模型能力,以及在AI領域的持續大力投入、對家庭這一場景的持續深耕,都是小米此次能夠交出Miloco 2.0這一“劃時代”解決方案的關鍵支撐。 與此同時,我們也看到,小米這家公司做“把Agent與智能家居結合”這件事時,展現出了行業其他廠商難以望其項背的“生態護城河”優勢。 當前小米生態中的AIoT設備連接數量已經接近12億,小米有著全球獨一無二的龐大用戶生態,這樣的IoT基座提供了極其豐富的硬件生態,讓Miloco的成長天然有著最肥沃的土壤。 客觀來說,這是小米在AI領域幾乎“不可複製”的生態護城河。 當十多億設備真正接入AI時,智能家居領域真正的“GPT時刻”,或許就會到來。 結語:Agent加速進家,AI普惠再提速 好的技術離不開生態的加持,小米AI一直積極擁抱開源,此次Miloco 2.0的開源,必然會顯著降低三方硬件廠商和開發者切入全屋Agent的門檻,吸引更多開發者加入到小米Miloco生態中,這也會進一步加速智能家居行業向Agent時代的全面進化。 展望未來,“賈維斯”式的超級AI管家必然會加速走進每一個普通用戶家中,並且是以更親民的價格和更低的部署門檻。“你不用顧家,家會顧你”不再是一句“玩笑話”,而是會成為看得見摸得到、享受得到的現實體驗。

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

2 天前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

3 天前