理想把具身智能講透了！現場拆解6大AI功能，芯片、模型、智駕和座艙全覆蓋

2026年6月15日 11:40

重點摘要

站內 AI 整理稿

智東西作者｜ Janson 編輯｜志豪理想淘汰老模型，智艙、智駕紛紛亮出AI具身智能新解法。智東西6月15日消息，就在剛剛的理想汽車軟件與具身智能發佈會上，理想汽車把自己壓箱底的AI底牌都掏出來了。理想還把這套能力體系具象化成了一個“機器人”形象，將Livis打造成一套從感知、計算、決策到執行全部打通的具身智能系統。具體來看馬赫VLA大模型是具身智能的大腦，3D ViT感知模型是眼睛，馬赫M100芯片是心臟，星環OS是神經系統，全線控底盤則是手腳。單芯片1280TOPS的馬赫M100 Ultra、對標特斯拉FSD V14的馬赫VLA，以及李想提出的“安全和效率要超越人類”，構成了這場活動最有話題度的幾個關鍵詞。 ▲李想在發佈會現場理想汽車創始人、CEO李想認為，過去行業通常把智能汽車定義為軟件定義硬件、聯網在線、可持續升級，但這些本質上仍是規則驅動，並不等於真正智能。真正的具身智能汽車，要從功能安全進化到保護人類安全，從調用功能進化到獨立完成任務，從行動緩慢進化到效率高於人類。在這場活動上，理想汽車圍繞座艙、語言智能、機器智能、自研芯片和產品體驗，給出了其對“具身智能汽車”的完整解釋。一、公開王炸自研芯片細節單顆算力1280TOPS 本次發佈會中，最硬核的產品當屬單顆算力1280TOPS的理想自研芯片馬赫M100 Ultra了。 ▲李想手持馬赫M100 Ultra 理想汽車CTO謝炎把馬赫M100 Ultra放在了整個計算機架構變遷中解釋。過去通用計算時代有兩大紅利：摩爾定律帶來的晶體管密度提升，以及登納德縮放定律帶來的功耗控制和主頻提升。 ▲通用計算時代兩大紅利但2004年前後，芯片製程進入65nm後，漏電問題開始顯著出現，登納德縮放定律失效。 2010年後，摩爾定律也開始放緩，每一代製程帶來的性能提升不再輕鬆翻倍。與此同時，AI推理算力需求快速增長。傳統馮·諾依曼架構以順序指令驅動計算，雖然適合通用計算，但會用大量晶體管處理緩存、調度、分支預測等管理開銷。 ▲AI時代的計算變遷在AI計算任務中，傳統架構的效率瓶頸會被進一步放大。對此，理想的答案是數據流架構。謝炎說，AI計算天然是並行的，數據是張量，關係是確定的，流動路徑是清晰的。 ▲馬赫芯片數據流架構它更像一張數據依賴圖，而不是一條指令隊列。因此，馬赫M100不再讓中央指令隊列主導計算，而是讓數據流動驅動計算發生。 ▲馬赫M100 Ultra主要參數硬件參數上，馬赫M100 Ultra採用5nm車規級工藝，單芯片算力1280TOPS。更關鍵的是，因為數據流架構設計，馬赫M100的實際算力利用率超過82%。 ▲馬赫M100芯片架構芯片內部，理想將超過一半晶圓面積給到神經網絡處理器。芯片NPU部分由56個計算單元和1個數據處理模塊構成，採用“網格總線+數據環形總線”的雙互聯架構。網格總線提供高帶寬點對點通路，數據環形總線提供確定性的廣播通路，使數據在陣列中流動到哪裡，就在哪裡觸發計算。 CPU部分，馬赫M100 Ultra採用24核心Arm Cortex-A78AE，主頻2.3GHz，負責安全系統控制等任務。內存系統則採用8路LPDDR5X子系統，片外內存帶寬達到273GB/s，為大模型和多模態推理提供高速數據通道。 ▲馬赫M100對比Thor-U 在性能對比中，理想將馬赫M100與智駕領域主流芯片Thor-U進行對標，測試項目包括CNN-Based骨幹網絡、UniAD以及理想MindVLA核心模型，馬赫M100在相關測試中表現出彩。與此同時，馬赫M100也不是單一輔助駕駛芯片，它已經跑通車上所有智能化場景，包括語言大模型、Agent、多模態感知和具身智能任務。 ▲馬赫M100可以適用於更多AI場景此外，安全是理想自研芯片的另一個重點。車端芯片被攻擊，威脅的不只是隱私，而可能是生命安全。因此，理想把密鑰保護、設備身份、可信啟動鏈和關鍵權限管控前置到芯片設計中，再通過全棧自研軟件統一調度，讓芯片、編譯器、操作系統、AI算法和域控制器在同一套可信基礎上協同運行。 ▲理想的全鏈路防禦體系隨著馬赫M100量產部署，理想稱其已經實現芯片、編譯器、操作系統、AI算法和域控制器的全棧自研。換句話說，理想已經把智能汽車最核心的硬件、軟件和運行邏輯都握在自己手裡，從而得到了全鏈路的安全控制。二、重構自動駕駛模型 “感知、預測、規劃”走向統一模型有了優秀的硬件，軟件架構也需要同步優化。在理想的技術框架裡，具身智能的大腦由兩部分組成：語言智能和機器智能。 ▲理想汽車解讀具身智能大腦語言智能負責理解指令、邏輯推理和任務規劃；機器智能負責看懂物理世界，並把決策轉化為動作。機器智能部分，理想汽車基座模型負責人詹錕提到，自己在美國連續深度體驗兩週特斯拉FSD V14.3後壓力很大。隨後，詹錕直接宣佈了一個相當激進的目標——計劃在第四季度對齊特斯拉FSD V14能力。針對模型能力，理想汽車發佈了全新的馬赫VLA大模型，並從多個角度進行了解讀。 ▲馬赫VLA 首先是安全方面，截至6月14日，理想輔助駕駛系統累計規避安全風險17273307次，其中重大避險55671次。理想把過去幾年的安全演進梳理為一條時間線。 ▲理想汽車安全演進時間線 2022年，激光雷達首次落地主動安全體系；2023年，AEB完成全速度段覆蓋；2024年，行業首發AES，同時實現360度低速全方位防禦；2025年，AES進一步升級，支持多車連續避讓和防禦躲避被撞；2026年，新增懸空障礙物識別，夜間極速剎停上限提升至130km/h。效率層面，新一代馬赫VLA系統反應耗時為0.28秒，快於普通人0.45秒的平均反應時間。在120km/h車速下，這0.17秒差距相當於多出約6米有效安全距離。 ▲馬赫VLA響應速度這一反應速度背後，是從光子到車輪的全鏈路優化。通過新一代馬赫VLA架構，系統視覺輸入時延降低47%，模型推理時延降低43%，底盤響應降低38%，操作系統調度降低28%，整體端到端時延降低40%。 ▲馬赫VLA減少全鏈路時延這也解釋了理想為什麼反覆強調“芯片快+軟件快+底盤快”，而不是隻講單個模型能力。能力層面，馬赫VLA的核心變化是架構統一。傳統輔助駕駛系統中，感知、預測、規劃往往分別工作，容易出現“看見了但決策不對”“識別沒問題但規劃離譜”的情況。 ▲馬赫VLA採用一個統一框架理想這次將其升級為原生多模態MoE模型，讓看見、理解、思考和行動在同一個框架內對齊。算力和訓練規模也同步放大。雙馬赫M100讓車端算力達到2560TOPS；模仿學習數據規模提升50%；強化學習數據量提升15倍，強化學習訓練算力提升5倍；模型參數量提升10倍，每秒Token計算量提升15倍。 ▲馬赫VLA能力提升在視覺能力上，理想對行業追逐高線數激光雷達的趨勢提出了不同看法。一定程度上，激光雷達線數再高，也無法識別紅綠燈顏色、讀懂施工路牌文字，或理解穿黃馬甲保安的手勢。 ▲理想的3D ViT能力理想的3D ViT能力則試圖快速重建三維世界，使系統從“看見障礙物”進化到“理解場景”。按照規劃，理想將在第三季度為AD Max推送全新馬赫VLA，並在第四季度對齊特斯拉FSD V14能力。 ▲四季度將對齊特斯拉FSD V14 三、語言智能淘汰老模型針對雲、端分別發佈新模型語言智能方面，理想淘汰了此前模型，發佈馬赫Mind-Pro和馬赫Mind-Edge。馬赫Mind-Pro面向雲端Agent能力，覆蓋車輛控制、智慧出行、辦公、問答、娛樂等車載場景。 ▲馬赫Mind-Pro跑分馬赫Mind-Pro在IFEval指令跟隨、LongBench-v2超長文本理解、AIME26高階數學推理、BFCL-v4工具調用等基準測試中進入行業第一梯隊。在Agent專項領域，Claw系列榜單等實景測試中，綜合性能超過多數主流Agent模型。相比跑分，更值得關注的是效率指標。理想稱，馬赫Mind-Pro通過Token壓縮技術，在任務完成率不下降的前提下，整體Token平均消耗降低38%，工具調用冗餘輪次降低47%，模型TPS峰值達到208token/s。 ▲馬赫Mind-4-Pro對比某模型的優勢對於車載Agent來說，這些數字意味著同樣一個任務可以用更少Token、更少調用輪次和更低時延完成，而不只是跑分好看。訓練體系上，理想為馬赫Mind-Pro搭建了數百套真實業務沙箱環境，高精度模擬工具調用流程，並採用混合強化學習訓練體系，包括關鍵單步強化學習、場內多步強化學習和在線環境強化學習。這套訓練體系主要解決了複雜場景決策不準，以及模型落地到真實車載業務時適配性差的問題。馬赫Mind-Edge則是端側原生智能體模型，它不是雲端大模型的裁剪版，而是從底層面向車載場景設計。 ▲馬赫Mind-Edge 馬赫Mind-Edge採用多模態流式時序建模，可以連續理解車內動態物理世界，並具備因果推理和自主決策能力。車輛的全天候主動感知、人車交互、自主控車、多模態問答都可以在車端本地完成，數據不上傳。四、解構新一代座艙首發驍龍座艙8797 Elite 軟硬件能力可以說是汽車的基座，最終還需要通過座艙來展現。理想汽車新一代座艙的核心是全景寬幅屏。理想方面稱，團隊曾嘗試過16:9、中等寬幅和更高比例的屏幕方案，但16:9顯得侷促，更高的屏幕又會侵佔駕駛視線，最終形成了現在的全景寬幅佈局。主駕區域顯示寬度達到上一代雙連屏的約1.5倍，地圖、車速、續航、車輛控制和媒體控制都被放在更靠近駕駛員的位置；進入泊車場景時，環境感知畫面會自動放大，其他應用則自適應縮小。硬件上，理想SS HW 4.0座艙架構首發搭載驍龍座艙8797 Elite。 ▲理想SS HW 4.0平臺新一代座艙硬件性能已經從追平手機進入到超越主流手機的階段，支持行業首個全景屏90Hz高刷新率，並配合180Hz觸控採樣率和自研底層系統，實現更快的觸控響應。軟件體驗層面，理想重構了圖標、頁面動效、控件回彈、實時動態高斯模糊和光影反饋。副駕娛樂場景下，屏幕可以一鍵進入主副駕1:1分屏。停車觀影時，汽車主駕內容會收起，視頻內容沉浸式鋪開，顯示寬度相比此前雙屏提升約1.7倍。此外，影音仍是理想座艙的重要入口。 ▲理想L9 Livis配備9.6.3環繞全景聲音響系統理想披露，車主在78%的旅程中都會使用媒體功能。新一代L9 Livis配備9.3.6環繞全景聲音響系統，並通過前後排獨立聲區、頭枕音響和空間音頻算法，強化多座位的沉浸體驗。 ▲理想汽車將支持CarPlay 同時，理想還將對CarPlay提供支持，並與HUD、方向盤控制聯動。Apple Music將結合車內全景聲系統，提供更完整的空間音頻體驗。五、李想現場研判：智能汽車不能只停留在“功能驅動” 李想在發佈會上提出了一個判斷：今天的智能手機和智能汽車，其實都還不是真正智能。它們雖然能夠聯網、升級，也可以由軟件定義硬件。但這套系統本質上仍然是功能驅動系統，不是一個能理解目標、判斷環境並獨立行動的智能體。 ▲李想稱目前的智能汽車並不智能他把智能汽車的進化拆成三個維度：安全、能力和效率。在安全上，傳統智能汽車通常滿足的是功能安全。系統遇到複雜、極端或未見過的場景時，可以選擇退出並把控制權交還給駕駛員。但在真實道路中，危險恰恰可能發生在接管瞬間。李想認為，具身智能汽車的安全邏輯不能只是“系統免責”，而應當以保護人為核心。 ▲李想解讀具身智能汽車三要素在能力上，傳統智能汽車更多是在調用功能，或在特定條件下執行輔助駕駛。但具身智能需要獨立完成任務，能夠像人一樣理解場景，例如自主倒車、靠邊停車、識別保安手勢、理解施工繞行、完成接人和停車等連續任務。在效率上，李想指出，用戶在趕時間、進入衚衕、通過窄路或面對複雜道路時，經常會選擇自己開，而不是使用輔助駕駛。這樣的原因也很直接，現有系統的效率和反應速度還不夠高。理想給具身智能汽車設定的目標，是比人更安全、比人更能完成任務，也比人更高效。在產品定義上，李想給出了一個相對清晰的答案。 ▲具身智能產品本質具身智能汽車不是某個單點功能，而是一輛電動車、一位職業司機、一臺AI計算機和一個生活助手的融合。電動車提供身體和移動能力，職業司機負責可靠完成出行任務，AI計算機提供模型和算力，生活助手則理解用戶需求並調度服務。現場演示中，理想不僅通過長指令展示了車輛控制能力，還展示了複雜任務規劃能力。第一個複雜任務是接機和洗塵宴安排。 ▲車機安排複雜場景用戶告訴理想同學：朋友乘坐CA1314航班來北京，且是素食主義者，需要先接機，再去望京找餐廳吃洗塵宴。這就意味著系統需要理解航班號、判斷到達機場和時間，再結合飲食偏好尋找餐廳並規劃路線。現場演示中，理想同學給出了精準的規劃。第二個任務是燕京八景路線規劃。用戶要求先去金臺夕照，最後去居庸疊翠。 ▲車機安排燕京八景遊覽系統不僅搜索各景點位置，還根據開放狀態和時間限制進行篩選，最終沒有機械地把八個點全部塞進路線，而是生成了現實中更可執行的遊覽方案。第三個任務更接近日常家庭場景：用戶需要按照指定順序接上分散在藍色港灣、望京、中關村、馬泉營等地的家人，最後去三里屯給孩子過生日。 ▲車機進行復雜任務安排這個任務難點在於人物介紹順序和實際接人順序並不一致，系統需要記住每個人的位置、身份和接送順序，並最終生成多點導航路線。現場演示中，系統成功輸出了一條約86.5公里的路線。 ▲車機最終輸出的路線更有“具身智能”特徵的是車內場景控制。面對“哄二排孩子睡覺”的場景，理想同學不只是播放搖籃曲，而是同時降低音量、調節空調、改變燈光，並調用主動懸架，讓車輛呈現類似搖籃的律動。 ▲全主動懸架化身搖籃此外，理想還展示了車輛在雷達被遮擋時自主靠邊停車並提示用戶處理；自動前往理想自動充電站充電，並在充電完成後挪出車位。面對高難度停車位時通過VLA尋找更高效的代泊方案；在園區停車時，車輛還能與停車管理人員交流，理解指引後前往合適車位。六、新功能計劃三次OTA 7月、9月、12月逐步釋放能力發佈會最後，李想預告了今年三個關鍵OTA節點。 ▲今年三個關鍵OTA節點 7月OTA的主題是效率提升。此次更新，輔助駕駛效率將整體提升30%，並覆蓋限寬墩、限高杆等場景。現場展示的出行導遊Agent技能上線，車友對講機功能上線，兩天一度電的哨兵模式上線。此外，還將上線利用主動懸架硬件能力實現的便捷換胎功能。 ▲7月OTA功能 9月OTA將重點補齊更像人類司機的能力，包括窄路倒車、會車倒車讓行、複雜路面通過，以及智能地鎖和車庫門控制。 Agent也將進一步連接電腦和手機，調用辦公、社交軟件信息，CarPlay和Apple Music無損音質也會在這一階段推出。 ▲9月OTA功能 12月OTA則是理想最有野心的一步：讓Livis的安全和效率超越人類。按照發佈會說法，系統將在用戶誤觸方向盤導致輔助駕駛退出時繼續保護安全。當用戶緊急打方向但角度不足以避險時，Livis會主動介入，尋找更安全的軌跡。面對交警疏導交通，系統也可以理解指揮並有序通行。此外，理想汽車還將繼續釋放馬赫M100潛力，將最快反應速度提升到0.2秒，比普通人快56%。結語：理想全面佈局具身智能這場發佈會的重點，不只是理想做了一塊更大的屏幕、一套更強的輔助駕駛系統，或一顆更高算力的芯片。可以說，理想試圖把座艙、模型、芯片、操作系統、輔助駕駛、車內交互和生活服務，統一到“具身智能汽車”這個故事裡。不難看出，理想已經不滿足於繼續講“移動的家”這個故事。它希望汽車從一個可升級的交通工具，變成一個能夠理解環境、理解人、並主動完成任務的智能體。用李想的話說，過去十年理想創造了一個移動的家，接下來要給車和家賦予生命。

原始來源：智東西 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

3 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

16 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

19 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

20 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

23 小時前閱讀分析