全球首個:高德發佈 3D 原生城市世界模型 ABot-Earth0.5,單圖 10 分鐘重建 3D 城市

重點摘要
該模型已建成覆蓋 190 多個國家的全球最廣 3D 地圖,輸出素材可直接導入主流遊戲引擎。其製圖成本僅為傳統 1%,效率提升約千倍,有望為具身智能、低空經濟及應急救援提供基礎支撐。#高德地圖# #3D 建模#
### 全球首個 3D 原生城市世界模型:高德 ABot-Earth0.5 亮相
中國地圖服務商高德近日宣布推出全球首個 3D 原生城市世界模型「ABot-Earth0.5」,這項技術突破讓 3D 城市重建變得前所未有地快速與低成本。根據官方說明,該模型僅需單張圖片,就能在 10 分鐘內自動生成完整的 3D 城市場景,大幅降低了過去需要大量人力與時間的傳統建模門檻。
### 重點整理:世界最廣 3D 地圖與驚人效率
ABot-Earth0.5 目前已建成覆蓋全球超過 190 個國家的 3D 地圖,堪稱現有覆蓋範圍最廣的 3D 城市模型。更重要的是,它輸出的 3D 素材可直接匯入主流遊戲引擎(如 Unity、Unreal Engine),讓開發者無需額外轉檔。在成本與效率上,高德宣稱製圖成本僅為傳統方法的百分之一,效率則提升約千倍,這意味著過去需要數月甚至數年才能完成的城市級建模,如今可在極短時間內完成。
### 背景脈絡:從導航地圖到原生 3D 世界模型
傳統 3D 城市建模往往依賴雷射掃描、空拍影像與人工逐棟建築修模,不僅耗時昂貴,也難以快速更新。高德身為中國領先的導航地圖服務商,長期累積大量地理資訊與街景數據,加上近年 AI 生成技術的成熟,使其有能力開發出「原生 3D」模型——也就是從零開始直接生成 3D 結構,而非從 2D 照片後製轉換。這項技術的出現,象徵地圖產業正從平面導航邁向立體數位孿生時代。
### 可能影響(一):為具身智能、低空經濟與應急救援鋪路
ABot-Earth0.5 的推出,對多個新興領域具有基礎支撐作用。在具身智能(embodied intelligence)領域,如機器人與自動駕駛車輛,需要精確的 3D 環境數據以進行路徑規劃與物件辨識;低空經濟中的無人機送貨、城市空中交通(UAM)也需要三維城市模型來設計航線;而應急救援團隊則可藉此快速建立災區 3D 地圖,提升搜救效率。這些場景以往因建模成本過高而難以大規模落地,如今成本驟降,有望加速相關技術普及。
### 可能影響(二):遊戲與元宇宙產業的潛在變革
由於輸出素材可直接導入遊戲引擎,ABot-Earth0.5 也為遊戲開發、虛擬實境(VR)與元宇宙內容創作帶來新機會。過去重現真實城市場景需要大量美術資源與繁瑣的模型製作,現在開發者只需一張照片就能生成可用的 3D 地圖,大幅降低開放世界遊戲的開發成本。對於智慧城市數位孿生、建築設計可視化等應用,同樣能提供即時且經濟的解決方案。
### 讀者可關注的後續發展
目前 ABot-Earth0.5 仍處於早期版本,後續值得關注的面向包括:何時開放給開發者或企業試用?是否提供 API 介接服務?模型能否支援即時更新(例如隨著地面建築變化而動態調整)?以及高德是否會進一步推出更高精度或針對特定區域的版本。此外,這項技術可能引發地圖服務商之間的競爭,例如 Google Maps 或 Apple Maps 是否會跟進類似方案。對於台灣的遊戲、無人機與智慧城市業者而言,這是觀察新工具如何降低跨域整合門檻的重要契機,後續可留意相關合作與應用案例的浮現。
Related
相關文章

ABot-Earth0.5登頂Hugging Face論文三榜第一,獲國際圖形學權威陳寶權好評
這篇消息聚焦「ABot-Earth0.5登頂Hugging Face論文三榜第一,獲國際圖形學權威陳寶權好評」。原始導語提到:能夠直接導入Unity、Unreal Engine等主流引擎進行交互開發 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

AMD:RX 7000 顯卡上基於 INT8 的 FSR 超分辨率 4.1 質量齊平 FP8 版本
AMD 宣布 RX 7000 系列顯卡採用 INT8 指令集的 FSR 超解析度 4.1 版本,畫質可與 FP8 版本並駕齊驅。至於 RDNA 2 架構的 RX 6000 系列,因需仰賴傳統流處理器運算,技術支援推出時間將會延後。

劍橋大學等提出面向對地觀測任務的像素級基礎模型,在多項任務中精度達SOTA
這篇消息聚焦「劍橋大學等提出面向對地觀測任務的像素級基礎模型,在多項任務中精度達SOTA」。原始導語提到:在低標註與稀疏數據下展現優勢 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
亞馬遜深耕視覺搜索:AI 重塑網購導航與拼貼式購物體驗
亞馬遜近期升級其購物應用,強化視覺搜索和智能交互能力,幫助消費者在海量商品中高效鎖定目標。這得益於對視覺識別技術的持續投入,2024年推出的Amazon Lens功能允許用戶通過圖片搜索,並結合文本進一步精準篩選商品。

深度估計準確率衝上0.9,Meta提出VLM³,論證視覺模型天生會學3D,以Qwen3-VL-4B為基礎實現多任務的統一建模
這篇消息聚焦「深度估計準確率衝上0.9,Meta提出VLM³,論證視覺模型天生會學3D,以Qwen3-VL-4B為基礎實現多任務的統一建模」。原始導語提到:在多項任務中媲美甚至超越專家視覺模型 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

廢片也能變大片,北大開源首個「美學照片重構」模型
北京大學提出「美學照片重構」任務,並開源相關數據集與 AesFormer 模型,讓一般廢片也能轉變為具美感的圖片。此模型專注於提升照片的視覺吸引力,為影像處理領域帶來創新。