智能家居終於“智能”了！有記憶、能認人的“賈維斯”，小米先交卷了

2026年6月19日 01:07

重點摘要

站內 AI 整理稿

智東西作者 | 雲鵬編輯 | 漠影剛剛，國產版“賈維斯”，真的進家了！辛苦一天，深夜推開家門，耳邊響起：“加班辛苦了，早點休息，有需要隨時叫我！” 妻子生日當天，一進家門燈光氛圍直接拉滿、電視播放祝福畫面，音箱響起：“親愛的老婆生日快樂！” 當我沉迷世界盃球賽時，耳邊突然響起：“廚房的水燒開了，要儘快關火哦！” 當我在書房伏案加班、長時間緊盯屏幕時，親切的提醒聲道來：“注意坐姿哦，不然又要腰痛啦！” AI大管家不僅懂我的生活作息、知我的健康狀況，還會主動關心我，隨時感知我在各類場景的狀態。今天，這樣的體驗，已經成為現實。就在昨天，小米正式發佈並開源了Xiaomi Miloco 2.0，一套面向未來的全屋智能AI開源方案。直觀來看，小米給Agent時代的智能家居裝上了新的“AI大腦”，把超級AI管家帶進了智能家居生態中。客觀來看，這也是目前業內第一個能夠實現AI主動服務、有家庭記憶的智能家居解決方案。 ▲Xiaomi Miloco 2.0 GitHub首頁當前，以各類Claw為代表的Agent（智能體）成為AI賽道的核心焦點，其在生產力提效方面作用顯著。然而在“AI進家”這一關鍵場景，仍然缺乏一個關鍵系統，把基於大模型、通用性極強、多模態交互能力極強的各類Claw與智能家居設備生態徹底打通、連接起來，讓Agent可以真正“懂家”。 Xiaomi Miloco 2.0，就是這樣一個核心繫統，可以化作Agent的“眼睛、耳朵、記憶”，各類米家設備作為全模態感知入口，Miloco 2.0通過視覺、聲音、環境感知實現全屋理解，將用戶需求傳達給Agent，真正完成AI在家庭場景提供服務的閉環，而所有用戶數據都保存在端側，原始數據與Agent完全隔離，30天自動清理，隱私安全問題得到妥善解決。這背後不僅是小米大模型底層能力的升級，更是一套系統級全屋智能AI框架的成熟。全屋智能設備在安全基礎之上擺脫了傳統手動設置規則的束縛，更高效地接入AI生態，更能主動理解、服務人的需求，Xiaomi Miloco 2.0真正成為了一個有記憶、能認人，還能流暢執行復雜任務的AI智能管家，全屋智能在Agent時代的拐點，已經來了。一、深度拆解Miloco架構：讓Agent真正“懂家”，掐緊隱私安全底線今天，距離Miloco 1.0正式開源僅僅過去7個月，Miloco 1.0主打端雲協同與跨設備自然語言交互，而Miloco 2.0的開源直接將智能家居的AI生態協同體驗帶到了一個新的高度。如果說1.0解決了AI與設備的聯動，搭好了框架，那麼2.0則真正實現了全屋智能的“Agent化”。從架構上來看，端側Miloco 2.0系統與主AI Agent之間實現了高效的協同配合： Miloco部署在本地，利用米家設備作為入口，調用雲端的omni（全模態）感知大模型進行視覺、聲音、環境的全屋理解與身份識別，把感知、處理後的關鍵結構化信息發送給主Agent，隨後主Agent調用雲端大模型模型進行全局任務規劃與決策，規劃出執行步驟後，再向Miloco發起調用，最終Miloco聯動全屋米家智能設備完成AI服務的閉環。值得一提的是，想要實現這一套看似極為超前的“次世代智能家居AI體驗”，門檻已經大大降低，普通小白用戶也可以很輕鬆的上手體驗，完成部署。你最少只需要： ·一臺能跑OpenClaw的電腦（跨平臺支持Mac/Windows/Linux）； ·一個綁定了家裡米家設備的小米賬號； ·一臺米家攝像頭作為視覺感知入口； ·一個多模態大模型的API Key（當然小米官方推薦的是其自家的MiMo）目前Miloco 2.0已經接入了Agent圈受眾最為廣泛的OpenClaw，根據官方信息，後續Miloco也會陸續適配更多Claw類產品。對於用戶來說，Miloco 2.0已經做了大量優化簡化，你只需要給OpenClaw發送指令，它會自動幫你完成環境準備、綁定賬號和模型，全程幾乎不需要更多操作，可以說極大地拉近了AI前沿技術與消費級場景的距離。雖然部署上大幅簡化，但在用戶最關心的安全方面，Miloco卻一點都沒省：所有攝像頭、各類傳感器收集的原始數據“用完即棄”，數據完全本地保存，絕不留存雲端，隨時可清空，即便忘記，30天后也會自動清理。用戶還可以給攝像頭設黑名單、給家庭設白名單，可以說數據完全由用戶掌控。值得一提的是，這些原始數據與OpenClaw完全隔離，Agent能獲取的信息只有Miloco系統判斷完所給出的“發生了什麼”的語義結果。安全這道“底線”，小米狠狠掐住，不留任何風險。二、四項核心能力升級，給Agent裝上“眼耳口”，智能家居體驗大不同說了這麼多理論技術層面的改變，Miloco 2.0在實際家庭場景中，到底有哪些新的技能，到底可以實現怎樣不同的AI體驗，背後的關鍵技術實現邏輯又是怎樣的？當我們深入官方發佈的多個功能演示視頻就會發現，當Agent真正懂家、懂你後，家居場景所迸發出的AI應用價值空間是巨大的。縱觀此次小米開源的Miloco 2.0，多模態感知、主動智能、持續任務和家庭記憶是其四個最核心的功能升級。在多模態感知方面，案例視頻中的“水燒開無人時主動提醒”令人印象深刻，米家攝像頭通過視覺看到水壺上的蒸汽，聲音傳感器監測到鍋具的蜂鳴，判斷水已燒開，而此時主人並未在廚房內，因此推斷需要提醒。隨後攝像頭查看到主人正在觀看電視，因此選擇沙發兩側距離人最近的音箱播放音頻提醒，整個流程自然高效、符合邏輯。生活中類似的場景實際還有很多，例如老人獨自在家中如果不小心跌倒或遇到特殊情況需要幫助、孩子獨自哭泣，系統可以結合攝像頭的視覺識別以及聲音傳感器識別綜合判斷老人、孩子狀態，即時給主人發送提示，或者遠程啟動家中家電給予幫助。未來，這些都可以通過Miloco 2.0的能力實現。在主動智能方面，當攝像頭感知到主人回家，會結合家庭記憶進行判斷，發現到家時間晚於平均，推測主人可能加班了，因此主動給予慰問。一大早醒來，AI根據家庭記憶發現今天是你的生日，伴著清晨第一縷陽光給你送上溫馨生日祝福；當AI發現你情緒低落，就會主動詢問是否要為你播放一些輕鬆抒情的常聽曲目，並與你聊天緩解情緒——主動智能讓AI更有溫度。持續任務也是非常實用的一項升級，在演示視頻中，當系統收到我們的家人生日提醒指令後，就會自動思考，主動編排家中可以用到的設備，比如各類燈、電視、音箱，生成生日驚喜方案，隨後就開始持續“待命”，等待條件觸發。當系統監測到家人歸來，就會調動設備執行編排好的方案。這種時刻在線、感知觸發的持續任務能力在生活中還大有用武之地：比如持續監測孩子的坐姿，視覺模型持續對比孩子落座後的骨骼姿態，一旦觸發不良姿態條件就會進行語音或其他形式的提醒干預；系統還可以後臺計時、聯動電視狀態數據，持續監測孩子看電視的時間，並在達到指定觀看時長後進行提醒或關機；系統還可以持續觀察並記錄家中老人的夜間動向，如果老人夜裡長時間沒回房間，系統就會主動提醒用戶。最後一項核心升級是家庭記憶功能，這也是貫穿許多能力的一項基礎功能升級。正如演示視頻中所展示的，當攝像頭識別到有人書房落座，就會根據其身份回溯家庭記憶，根據其喜好調整燈光，比如男主人喜歡在閱讀電腦時用明亮暖光，女主人則喜歡在寫筆記時用柔和的中性光。攝像頭識別到女主人坐姿不佳的時候，也會根據家庭記憶聯想到她腰部不適的病史，並即時提醒注意坐姿，在識別到女主人運動的時候，也會即時提醒她動作幅度要注意，避免腰部過度用力。這種家庭記憶能力是讓AI真正懂你、能夠提供個性化貼心服務的關鍵技術支撐。根據病歷和藥方提醒老人按時吃藥、根據主人的喜好調節各類家電的參數、根據孩子的年齡推薦適合的學習讀物和學習姿勢，家庭記憶讓AI真的像你的“家人”。縱觀四大核心功能升級，我們不難發現，這些能力幾乎都是相互交融、共同作用在不同場景中，可以說是實現次世代智能家居體驗的“基石”能力。從單一視覺升級到多模態感知，系統能同時處理空間內的畫面變化、人物變化、聲音語調、溫度等多維數據，感知更為精準和立體。從規則驅動到主動智能，系統憑藉大模型強大的常識推理能力，主動觀察用戶場景狀態，基於用戶的日常作息與設備使用習慣，自主進行判斷並主動提供服務。從單點執行到長期任務，相比傳統的“一句話一執行”，AI真正可以實現隨時在線、多時段持續跟蹤。從寬泛上下文理解到專屬家庭記憶，AI直接“精準識別家庭成員身份信息”，將通用常識知識與長期沉澱下來的專屬“家庭檔案”進行結合，針對性匹配其專屬、個性化的智能服務。總體來看，在Miloco 2.0的加持下，曾經對家庭場景是一片“盲區”的Agent，終於可以藉助新的眼睛、耳朵和各類感知能力，去懂用戶、懂用戶的家，懂用戶在家的一系列複雜狀態和需求，進而提供真正主動有溫度的智能服務。 Agent時代的智能家居體驗，被徹底革新。三、搶先用AI Agent變革智能家居，下一個十年小米能否繼續領跑賽道？回望過去十幾年，小米一直是智能家居賽道的生態王者，十年前，米家基於過硬的產品力、極致性價比、遠超行業的統一互聯體驗，定義了智能家居領域的“互聯互通時代”。而在今天的Agent時代，小米有望重新定義智能家居發展的新範式和方向。從Miloco 1.0到今天的2.0，AI時代、大模型和Agent加持下的智能家居到底要怎麼做、如何跑通，小米已經交出了一份藍本式的答卷。從攝像頭、傳感器、燈具到家電，米家生態中龐大的硬件資源被重新整合，成為大模型的“眼耳口鼻”，讓Agent可以真正操控物理世界，在家庭場景完成服務閉環。 “懂家”的Miloco與能力強大的Agent結合，AI進家這件事，又向前邁了一大步：Miloco 2.0並不是一次簡單的軟件迭代，而是全屋智能向“系統級Agent”方向進化的一次關鍵技術迭代。為什麼是小米先做成了這件事？這離不開小米在“AI家”這一方向上的長期堅定投入、技術深耕。 “人車家全生態”是小米當前的核心戰略，“家”自然是其中的核心一環，在這一戰略下，小米在AI領域持續加大投入，2026年預計投入至少160億元，其創始人兼CEO雷軍曾提到，未來三年小米在AI領域將投入600億元。小米今年4月底開源的MiMo-V2.5系列模型重點提升了Agent能力，在各類基準測試中位居全球開源模型陣營頭部。隨後這一模型家族的語音模型、視覺模型相繼迭代升級，取得出色表現。小米MiMo大模型也是此次Miloco 2.0的智能核心。毫無疑問，這些紮實的底層模型能力，以及在AI領域的持續大力投入、對家庭這一場景的持續深耕，都是小米此次能夠交出Miloco 2.0這一“劃時代”解決方案的關鍵支撐。與此同時，我們也看到，小米這家公司做“把Agent與智能家居結合”這件事時，展現出了行業其他廠商難以望其項背的“生態護城河”優勢。當前小米生態中的AIoT設備連接數量已經接近12億，小米有著全球獨一無二的龐大用戶生態，這樣的IoT基座提供了極其豐富的硬件生態，讓Miloco的成長天然有著最肥沃的土壤。客觀來說，這是小米在AI領域幾乎“不可複製”的生態護城河。當十多億設備真正接入AI時，智能家居領域真正的“GPT時刻”，或許就會到來。結語：Agent加速進家，AI普惠再提速好的技術離不開生態的加持，小米AI一直積極擁抱開源，此次Miloco 2.0的開源，必然會顯著降低三方硬件廠商和開發者切入全屋Agent的門檻，吸引更多開發者加入到小米Miloco生態中，這也會進一步加速智能家居行業向Agent時代的全面進化。展望未來，“賈維斯”式的超級AI管家必然會加速走進每一個普通用戶家中，並且是以更親民的價格和更低的部署門檻。“你不用顧家，家會顧你”不再是一句“玩笑話”，而是會成為看得見摸得到、享受得到的現實體驗。

原始來源：智東西 ↗

查看原始來源

IT之家生成式AI

Anthropic 恰烏裡稱有信心“未來幾天”重新開放 Mythos 及 Fable 5 AI 模型

韓國中央日報於 6 月 19 日發佈博文，報道稱在韓國首爾舉辦的新聞發佈會上，Anthropic 國際董事總經理克里斯 · 恰烏裡（Chris Ciauri）表示，公司有信心“未來幾天內”向美國之外地區重新開放 Claude Mythos 以及 Claude Fable 5 模型。

1 天前閱讀分析

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

2 天前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

2 天前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

2 天前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

2 天前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

3 天前閱讀分析

相關文章

Anthropic 恰烏裡稱有信心“未來幾天”重新開放 Mythos 及 Fable 5 AI 模型

Edge AI Daily 早報（6月19日）

今天起，Claude Design要把設計師和程序員變成同一種人了

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元