理想把具身智能講透了!現場拆解6大AI功能,芯片、模型、智駕和座艙全覆蓋
重點摘要
智東西 作者 | Janson 編輯 | 志豪 理想淘汰老模型,智艙、智駕紛紛亮出AI具身智能新解法。 智東西6月15日消息,就在剛剛的理想汽車軟件與具身智能發佈會上,理想汽車把自己壓箱底的AI底牌都掏出來了。 理想還把這套能力體系具象化成了一個“機器人”形象,將Livis打造成一套從感知、計算、決策到執行全部打通的具身智能系統。 具體來看馬赫VLA大模型是具身智能的大腦,3D ViT感知模型是眼睛,馬赫M100芯片是心臟,星環OS是神經系統,全線控底盤則是手腳。 單芯片1280TOPS的馬赫M100 Ultra、對標特斯拉FSD V14的馬赫VLA,以及李想提出的“安全和效率要超越人類”,構成了這場活動最有話題度的幾個關鍵詞。 ▲李想在發佈會現場 理想汽車創始人、CEO李想認為,過去行業通常把智能汽車定義為軟件定義硬件、聯網在線、可持續升級,但這些本質上仍是規則驅動,並不等於真正智能。 真正的具身智能汽車,要從功能安全進化到保護人類安全,從調用功能進化到獨立完成任務,從行動緩慢進化到效率高於人類。 在這場活動上,理想汽車圍繞座艙、語言智能、機器智能、自研芯片和產品體驗,給出了其對“具身智能汽車”的完整解釋。 一、公開王炸自研芯片細節 單顆算力1280TOPS 本次發佈會中,最硬核的產品當屬單顆算力1280TOPS的理想自研芯片馬赫M100 Ultra了。 ▲李想手持馬赫M100 Ultra 理想汽車CTO謝炎把馬赫M100 Ultra放在了整個計算機架構變遷中解釋。 過去通用計算時代有兩大紅利:摩爾定律帶來的晶體管密度提升,以及登納德縮放定律帶來的功耗控制和主頻提升。 ▲通用計算時代兩大紅利 但2004年前後,芯片製程進入65nm後,漏電問題開始顯著出現,登納德縮放定律失效。 2010年後,摩爾定律也開始放緩,每一代製程帶來的性能提升不再輕鬆翻倍。 與此同時,AI推理算力
智東西 作者 | Janson 編輯 | 志豪 理想淘汰老模型,智艙、智駕紛紛亮出AI具身智能新解法。 智東西6月15日消息,就在剛剛的理想汽車軟件與具身智能發佈會上,理想汽車把自己壓箱底的AI底牌都掏出來了。 理想還把這套能力體系具象化成了一個“機器人”形象,將Livis打造成一套從感知、計算、決策到執行全部打通的具身智能系統。 具體來看馬赫VLA大模型是具身智能的大腦,3D ViT感知模型是眼睛,馬赫M100芯片是心臟,星環OS是神經系統,全線控底盤則是手腳。 單芯片1280TOPS的馬赫M100 Ultra、對標特斯拉FSD V14的馬赫VLA,以及李想提出的“安全和效率要超越人類”,構成了這場活動最有話題度的幾個關鍵詞。 ▲李想在發佈會現場 理想汽車創始人、CEO李想認為,過去行業通常把智能汽車定義為軟件定義硬件、聯網在線、可持續升級,但這些本質上仍是規則驅動,並不等於真正智能。 真正的具身智能汽車,要從功能安全進化到保護人類安全,從調用功能進化到獨立完成任務,從行動緩慢進化到效率高於人類。 在這場活動上,理想汽車圍繞座艙、語言智能、機器智能、自研芯片和產品體驗,給出了其對“具身智能汽車”的完整解釋。 一、公開王炸自研芯片細節 單顆算力1280TOPS 本次發佈會中,最硬核的產品當屬單顆算力1280TOPS的理想自研芯片馬赫M100 Ultra了。 ▲李想手持馬赫M100 Ultra 理想汽車CTO謝炎把馬赫M100 Ultra放在了整個計算機架構變遷中解釋。 過去通用計算時代有兩大紅利:摩爾定律帶來的晶體管密度提升,以及登納德縮放定律帶來的功耗控制和主頻提升。 ▲通用計算時代兩大紅利 但2004年前後,芯片製程進入65nm後,漏電問題開始顯著出現,登納德縮放定律失效。 2010年後,摩爾定律也開始放緩,每一代製程帶來的性能提升不再輕鬆翻倍。 與此同時,AI推理算力需求快速增長。傳統馮·諾依曼架構以順序指令驅動計算,雖然適合通用計算,但會用大量晶體管處理緩存、調度、分支預測等管理開銷。 ▲AI時代的計算變遷 在AI計算任務中,傳統架構的效率瓶頸會被進一步放大。 對此,理想的答案是數據流架構。 謝炎說,AI計算天然是並行的,數據是張量,關係是確定的,流動路徑是清晰的。 ▲馬赫芯片數據流架構 它更像一張數據依賴圖,而不是一條指令隊列。因此,馬赫M100不再讓中央指令隊列主導計算,而是讓數據流動驅動計算發生。 ▲馬赫M100 Ultra主要參數 硬件參數上,馬赫M100 Ultra採用5nm車規級工藝,單芯片算力1280TOPS。更關鍵的是,因為數據流架構設計,馬赫M100的實際算力利用率超過82%。 ▲馬赫M100芯片架構 芯片內部,理想將超過一半晶圓面積給到神經網絡處理器。 芯片NPU部分由56個計算單元和1個數據處理模塊構成,採用“網格總線+數據環形總線”的雙互聯架構。 網格總線提供高帶寬點對點通路,數據環形總線提供確定性的廣播通路,使數據在陣列中流動到哪裡,就在哪裡觸發計算。 CPU部分,馬赫M100 Ultra採用24核心Arm Cortex-A78AE,主頻2.3GHz,負責安全系統控制等任務。 內存系統則採用8路LPDDR5X子系統,片外內存帶寬達到273GB/s,為大模型和多模態推理提供高速數據通道。 ▲馬赫M100對比Thor-U 在性能對比中,理想將馬赫M100與智駕領域主流芯片Thor-U進行對標,測試項目包括CNN-Based骨幹網絡、UniAD以及理想MindVLA核心模型,馬赫M100在相關測試中表現出彩。 與此同時,馬赫M100也不是單一輔助駕駛芯片,它已經跑通車上所有智能化場景,包括語言大模型、Agent、多模態感知和具身智能任務。 ▲馬赫M100可以適用於更多AI場景 此外,安全是理想自研芯片的另一個重點。 車端芯片被攻擊,威脅的不只是隱私,而可能是生命安全。 因此,理想把密鑰保護、設備身份、可信啟動鏈和關鍵權限管控前置到芯片設計中,再通過全棧自研軟件統一調度,讓芯片、編譯器、操作系統、AI算法和域控制器在同一套可信基礎上協同運行。 ▲理想的全鏈路防禦體系 隨著馬赫M100量產部署,理想稱其已經實現芯片、編譯器、操作系統、AI算法和域控制器的全棧自研。 換句話說,理想已經把智能汽車最核心的硬件、軟件和運行邏輯都握在自己手裡,從而得到了全鏈路的安全控制。 二、重構自動駕駛模型 “感知、預測、規劃”走向統一模型 有了優秀的硬件,軟件架構也需要同步優化。 在理想的技術框架裡,具身智能的大腦由兩部分組成:語言智能和機器智能。 ▲理想汽車解讀具身智能大腦 語言智能負責理解指令、邏輯推理和任務規劃;機器智能負責看懂物理世界,並把決策轉化為動作。 機器智能部分,理想汽車基座模型負責人詹錕提到,自己在美國連續深度體驗兩週特斯拉FSD V14.3後壓力很大。 隨後,詹錕直接宣佈了一個相當激進的目標——計劃在第四季度對齊特斯拉FSD V14能力。 針對模型能力,理想汽車發佈了全新的馬赫VLA大模型,並從多個角度進行了解讀。 ▲馬赫VLA 首先是安全方面,截至6月14日,理想輔助駕駛系統累計規避安全風險17273307次,其中重大避險55671次。 理想把過去幾年的安全演進梳理為一條時間線。 ▲理想汽車安全演進時間線 2022年,激光雷達首次落地主動安全體系;2023年,AEB完成全速度段覆蓋;2024年,行業首發AES,同時實現360度低速全方位防禦;2025年,AES進一步升級,支持多車連續避讓和防禦躲避被撞;2026年,新增懸空障礙物識別,夜間極速剎停上限提升至130km/h。 效率層面,新一代馬赫VLA系統反應耗時為0.28秒,快於普通人0.45秒的平均反應時間。 在120km/h車速下,這0.17秒差距相當於多出約6米有效安全距離。 ▲馬赫VLA響應速度 這一反應速度背後,是從光子到車輪的全鏈路優化。 通過新一代馬赫VLA架構,系統視覺輸入時延降低47%,模型推理時延降低43%,底盤響應降低38%,操作系統調度降低28%,整體端到端時延降低40%。 ▲馬赫VLA減少全鏈路時延 這也解釋了理想為什麼反覆強調“芯片快+軟件快+底盤快”,而不是隻講單個模型能力。 能力層面,馬赫VLA的核心變化是架構統一。 傳統輔助駕駛系統中,感知、預測、規劃往往分別工作,容易出現“看見了但決策不對”“識別沒問題但規劃離譜”的情況。 ▲馬赫VLA採用一個統一框架 理想這次將其升級為原生多模態MoE模型,讓看見、理解、思考和行動在同一個框架內對齊。 算力和訓練規模也同步放大。 雙馬赫M100讓車端算力達到2560TOPS;模仿學習數據規模提升50%;強化學習數據量提升15倍,強化學習訓練算力提升5倍;模型參數量提升10倍,每秒Token計算量提升15倍。 ▲馬赫VLA能力提升 在視覺能力上,理想對行業追逐高線數激光雷達的趨勢提出了不同看法。 一定程度上,激光雷達線數再高,也無法識別紅綠燈顏色、讀懂施工路牌文字,或理解穿黃馬甲保安的手勢。 ▲理想的3D ViT能力 理想的3D ViT能力則試圖快速重建三維世界,使系統從“看見障礙物”進化到“理解場景”。 按照規劃,理想將在第三季度為AD Max推送全新馬赫VLA,並在第四季度對齊特斯拉FSD V14能力。 ▲四季度將對齊特斯拉FSD V14 三、語言智能淘汰老模型 針對雲、端分別發佈新模型 語言智能方面,理想淘汰了此前模型,發佈馬赫Mind-Pro和馬赫Mind-Edge。 馬赫Mind-Pro面向雲端Agent能力,覆蓋車輛控制、智慧出行、辦公、問答、娛樂等車載場景。 ▲馬赫Mind-Pro跑分 馬赫Mind-Pro在IFEval指令跟隨、LongBench-v2超長文本理解、AIME26高階數學推理、BFCL-v4工具調用等基準測試中進入行業第一梯隊。 在Agent專項領域,Claw系列榜單等實景測試中,綜合性能超過多數主流Agent模型。 相比跑分,更值得關注的是效率指標。 理想稱,馬赫Mind-Pro通過Token壓縮技術,在任務完成率不下降的前提下,整體Token平均消耗降低38%,工具調用冗餘輪次降低47%,模型TPS峰值達到208token/s。 ▲馬赫Mind-4-Pro對比某模型的優勢 對於車載Agent來說,這些數字意味著同樣一個任務可以用更少Token、更少調用輪次和更低時延完成,而不只是跑分好看。 訓練體系上,理想為馬赫Mind-Pro搭建了數百套真實業務沙箱環境,高精度模擬工具調用流程,並採用混合強化學習訓練體系,包括關鍵單步強化學習、場內多步強化學習和在線環境強化學習。 這套訓練體系主要解決了複雜場景決策不準,以及模型落地到真實車載業務時適配性差的問題。 馬赫Mind-Edge則是端側原生智能體模型,它不是雲端大模型的裁剪版,而是從底層面向車載場景設計。 ▲馬赫Mind-Edge 馬赫Mind-Edge採用多模態流式時序建模,可以連續理解車內動態物理世界,並具備因果推理和自主決策能力。 車輛的全天候主動感知、人車交互、自主控車、多模態問答都可以在車端本地完成,數據不上傳。 四、解構新一代座艙 首發驍龍座艙8797 Elite 軟硬件能力可以說是汽車的基座,最終還需要通過座艙來展現。 理想汽車新一代座艙的核心是全景寬幅屏。 理想方面稱,團隊曾嘗試過16:9、中等寬幅和更高比例的屏幕方案,但16:9顯得侷促,更高的屏幕又會侵佔駕駛視線,最終形成了現在的全景寬幅佈局。 主駕區域顯示寬度達到上一代雙連屏的約1.5倍,地圖、車速、續航、車輛控制和媒體控制都被放在更靠近駕駛員的位置;進入泊車場景時,環境感知畫面會自動放大,其他應用則自適應縮小。 硬件上,理想SS HW 4.0座艙架構首發搭載驍龍座艙8797 Elite。 ▲理想SS HW 4.0平臺 新一代座艙硬件性能已經從追平手機進入到超越主流手機的階段,支持行業首個全景屏90Hz高刷新率,並配合180Hz觸控採樣率和自研底層系統,實現更快的觸控響應。 軟件體驗層面,理想重構了圖標、頁面動效、控件回彈、實時動態高斯模糊和光影反饋。副駕娛樂場景下,屏幕可以一鍵進入主副駕1:1分屏。 停車觀影時,汽車主駕內容會收起,視頻內容沉浸式鋪開,顯示寬度相比此前雙屏提升約1.7倍。 此外,影音仍是理想座艙的重要入口。 ▲理想L9 Livis配備9.6.3環繞全景聲音響系統 理想披露,車主在78%的旅程中都會使用媒體功能。新一代L9 Livis配備9.3.6環繞全景聲音響系統,並通過前後排獨立聲區、頭枕音響和空間音頻算法,強化多座位的沉浸體驗。 ▲理想汽車將支持CarPlay 同時,理想還將對CarPlay提供支持,並與HUD、方向盤控制聯動。Apple Music將結合車內全景聲系統,提供更完整的空間音頻體驗。 五、李想現場研判:智能汽車不能只停留在“功能驅動” 李想在發佈會上提出了一個判斷:今天的智能手機和智能汽車,其實都還不是真正智能。它們雖然能夠聯網、升級,也可以由軟件定義硬件。 但這套系統本質上仍然是功能驅動系統,不是一個能理解目標、判斷環境並獨立行動的智能體。 ▲李想稱目前的智能汽車並不智能 他把智能汽車的進化拆成三個維度:安全、能力和效率。 在安全上,傳統智能汽車通常滿足的是功能安全。系統遇到複雜、極端或未見過的場景時,可以選擇退出並把控制權交還給駕駛員。 但在真實道路中,危險恰恰可能發生在接管瞬間。李想認為,具身智能汽車的安全邏輯不能只是“系統免責”,而應當以保護人為核心。 ▲李想解讀具身智能汽車三要素 在能力上,傳統智能汽車更多是在調用功能,或在特定條件下執行輔助駕駛。 但具身智能需要獨立完成任務,能夠像人一樣理解場景,例如自主倒車、靠邊停車、識別保安手勢、理解施工繞行、完成接人和停車等連續任務。 在效率上,李想指出,用戶在趕時間、進入衚衕、通過窄路或面對複雜道路時,經常會選擇自己開,而不是使用輔助駕駛。 這樣的原因也很直接,現有系統的效率和反應速度還不夠高。理想給具身智能汽車設定的目標,是比人更安全、比人更能完成任務,也比人更高效。 在產品定義上,李想給出了一個相對清晰的答案。 ▲具身智能產品本質 具身智能汽車不是某個單點功能,而是一輛電動車、一位職業司機、一臺AI計算機和一個生活助手的融合。 電動車提供身體和移動能力,職業司機負責可靠完成出行任務,AI計算機提供模型和算力,生活助手則理解用戶需求並調度服務。 現場演示中,理想不僅通過長指令展示了車輛控制能力,還展示了複雜任務規劃能力。 第一個複雜任務是接機和洗塵宴安排。 ▲車機安排複雜場景 用戶告訴理想同學:朋友乘坐CA1314航班來北京,且是素食主義者,需要先接機,再去望京找餐廳吃洗塵宴。 這就意味著系統需要理解航班號、判斷到達機場和時間,再結合飲食偏好尋找餐廳並規劃路線。 現場演示中,理想同學給出了精準的規劃。 第二個任務是燕京八景路線規劃。用戶要求先去金臺夕照,最後去居庸疊翠。 ▲車機安排燕京八景遊覽 系統不僅搜索各景點位置,還根據開放狀態和時間限制進行篩選,最終沒有機械地把八個點全部塞進路線,而是生成了現實中更可執行的遊覽方案。 第三個任務更接近日常家庭場景:用戶需要按照指定順序接上分散在藍色港灣、望京、中關村、馬泉營等地的家人,最後去三里屯給孩子過生日。 ▲車機進行復雜任務安排 這個任務難點在於人物介紹順序和實際接人順序並不一致,系統需要記住每個人的位置、身份和接送順序,並最終生成多點導航路線。 現場演示中,系統成功輸出了一條約86.5公里的路線。 ▲車機最終輸出的路線 更有“具身智能”特徵的是車內場景控制。 面對“哄二排孩子睡覺”的場景,理想同學不只是播放搖籃曲,而是同時降低音量、調節空調、改變燈光,並調用主動懸架,讓車輛呈現類似搖籃的律動。 ▲全主動懸架化身搖籃 此外,理想還展示了車輛在雷達被遮擋時自主靠邊停車並提示用戶處理;自動前往理想自動充電站充電,並在充電完成後挪出車位。 面對高難度停車位時通過VLA尋找更高效的代泊方案;在園區停車時,車輛還能與停車管理人員交流,理解指引後前往合適車位。 六、新功能計劃三次OTA 7月、9月、12月逐步釋放能力 發佈會最後,李想預告了今年三個關鍵OTA節點。 ▲今年三個關鍵OTA節點 7月OTA的主題是效率提升。 此次更新,輔助駕駛效率將整體提升30%,並覆蓋限寬墩、限高杆等場景。 現場展示的出行導遊Agent技能上線,車友對講機功能上線,兩天一度電的哨兵模式上線。 此外,還將上線利用主動懸架硬件能力實現的便捷換胎功能。 ▲7月OTA功能 9月OTA將重點補齊更像人類司機的能力,包括窄路倒車、會車倒車讓行、複雜路面通過,以及智能地鎖和車庫門控制。 Agent也將進一步連接電腦和手機,調用辦公、社交軟件信息,CarPlay和Apple Music無損音質也會在這一階段推出。 ▲9月OTA功能 12月OTA則是理想最有野心的一步:讓Livis的安全和效率超越人類。 按照發佈會說法,系統將在用戶誤觸方向盤導致輔助駕駛退出時繼續保護安全。 當用戶緊急打方向但角度不足以避險時,Livis會主動介入,尋找更安全的軌跡。 面對交警疏導交通,系統也可以理解指揮並有序通行。 此外,理想汽車還將繼續釋放馬赫M100潛力,將最快反應速度提升到0.2秒,比普通人快56%。 結語:理想全面佈局具身智能 這場發佈會的重點,不只是理想做了一塊更大的屏幕、一套更強的輔助駕駛系統,或一顆更高算力的芯片。 可以說,理想試圖把座艙、模型、芯片、操作系統、輔助駕駛、車內交互和生活服務,統一到“具身智能汽車”這個故事裡。 不難看出,理想已經不滿足於繼續講“移動的家”這個故事。 它希望汽車從一個可升級的交通工具,變成一個能夠理解環境、理解人、並主動完成任務的智能體。 用李想的話說,過去十年理想創造了一個移動的家,接下來要給車和家賦予生命。
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。