雷峰網生成式AI

VAST 斬獲近2億美元A輪系列融資,同步推出世界模型,頂級財投和產業資本鼎力入局

2026年6月1日 09:24

重點摘要

近日,全球領先的通用人工智能公司VAST宣佈完成A+及A++兩輪融資,合計近2億美元。本輪融資由渶策資本、國壽長三角科創基金領投,深圳市人工智能終端產業基金(產業方為全球頭部終端廠商榮耀)、知名產業戰投、上海半導體產投等產業投資方,深創投、元生資本、沃賦創投與方廣資本等一線財務資本聯合投資,投資方匯聚頭部市場化基金、國資平臺與產業龍頭戰投,形成多元賦能體系;同時,春華創投、靖亞資本、BV百度風投、東方嘉富等老股東亦持續超額追投。這是 VAST 繼今年 3 月融資後,時隔兩月再度獲得資本加持。 與此同時,VAST 揭曉了全新的世界模型項目——Project Eden。區別於業內“動作條件視頻生成”與“靜態 3D 場景生成”等常規路徑,Project Eden 創造性地將底層狀態推演與視覺呈現進行了原生解耦。這一突破使它成為全球首個允許對世界狀態進行自主維護與確定性控制的世界模型,並自然解鎖了環境長程持久、場景自由複用、多人併發交互等顛覆性能力。Project Eden 旨在成為下一代低門檻交互式內容創作的底層引擎,同時能夠為具身智能等智能體提供具備高邏輯一致性的訓練與評測環境。本輪資金將主要用於 AI 3D 大模型、通用世界模型的頂尖人才引進、核心算法迭代與數據沉澱,同時加速全球市場佈局與產業生態構建。此次融資,既是資本市場對 VAST 技術路線與商業化成果的認可,也凸顯出產業界對通用世界模型長期價值的充分肯定。01 Project Eden,一個環境永續、多人互動的世界模型大語言模型負責預測下一個單詞,視頻模型專注渲染下一幀畫面,而世界模型的核心使命,是推演世界的下一個狀態,即基於現有環境與用戶動作,模擬世界隨之產生的全部變化。這也決定了,一套合格的通用世界模型,必須同時解決兩大核心命題,第一是定義世界當下的客觀狀態(State),第二是驅動世界持續自主演化(Transit

站內 AI 整理稿

近日,全球領先的通用人工智能公司VAST宣佈完成A+及A++兩輪融資,合計近2億美元。本輪融資由渶策資本、國壽長三角科創基金領投,深圳市人工智能終端產業基金(產業方為全球頭部終端廠商榮耀)、知名產業戰投、上海半導體產投等產業投資方,深創投、元生資本、沃賦創投與方廣資本等一線財務資本聯合投資,投資方匯聚頭部市場化基金、國資平臺與產業龍頭戰投,形成多元賦能體系;同時,春華創投、靖亞資本、BV百度風投、東方嘉富等老股東亦持續超額追投。這是 VAST 繼今年 3 月融資後,時隔兩月再度獲得資本加持。 與此同時,VAST 揭曉了全新的世界模型項目——Project Eden。區別於業內“動作條件視頻生成”與“靜態 3D 場景生成”等常規路徑,Project Eden 創造性地將底層狀態推演與視覺呈現進行了原生解耦。這一突破使它成為全球首個允許對世界狀態進行自主維護與確定性控制的世界模型,並自然解鎖了環境長程持久、場景自由複用、多人併發交互等顛覆性能力。Project Eden 旨在成為下一代低門檻交互式內容創作的底層引擎,同時能夠為具身智能等智能體提供具備高邏輯一致性的訓練與評測環境。本輪資金將主要用於 AI 3D 大模型、通用世界模型的頂尖人才引進、核心算法迭代與數據沉澱,同時加速全球市場佈局與產業生態構建。此次融資,既是資本市場對 VAST 技術路線與商業化成果的認可,也凸顯出產業界對通用世界模型長期價值的充分肯定。01 Project Eden,一個環境永續、多人互動的世界模型大語言模型負責預測下一個單詞,視頻模型專注渲染下一幀畫面,而世界模型的核心使命,是推演世界的下一個狀態,即基於現有環境與用戶動作,模擬世界隨之產生的全部變化。這也決定了,一套合格的通用世界模型,必須同時解決兩大核心命題,第一是定義世界當下的客觀狀態(State),第二是驅動世界持續自主演化(Transition)。對 VAST 而言,我們所有技術佈局的終極目標始終如一:讓每個人都能親手創造、自由探索無數個可交互的世界。想要實現這一目標,我們必須攻克幾大底層難題:環境長程記憶、多人與智能體併發交互、在工程上能夠低成本且可規模化落地。目前業內主流的兩條技術路線,現階段無法同時滿足用戶創造世界、並在其中持續交互的完整需求。第一種是動作條件視頻生成:該方案僅根據有限空間的輸入動作在像素層面做短時畫面預測,將世界狀態隱性壓縮至有限幀畫面內。一旦物體脫離相機視野,模型只能憑空推演重構,無法實現長時序狀態留存,也難以支撐多人在同一世界中的協同共存;第二種是靜態 3D 場景生成:這類方案能夠搭建可供遊覽的三維空間,但剝離了時間維度與物理運行邏輯,不存在狀態迭代機制,無法支撐動態交互。基於此,VAST的通用世界模型研究項目 Project Eden,創新性採用三層解耦式技術架構,跳出像素生成的固有桎梏:底層為結構化狀態層:搭建可長期演化的 3D 底層基座,統一維護場景幾何結構、物體身份屬性與全局事件邏輯,全權承載世界的客觀狀態與自主推演;中間為條件接口層:作為狀態與渲染的轉換樞紐,依據不同相機視角,將完整的底層 3D 狀態,轉化為適配生成任務的語義、幾何條件約束。所有視角渲染均同源同一底層世界,從根源上保障跨鏡頭、跨視角的物理一致性;上層為生成式渲染層:依託底層客觀狀態與中間層約束條件,按需實時渲染精細化視覺畫面,補足動態細節,面向用戶輸出直觀的沉浸式體驗。依託狀態推演與視覺渲染的原生解耦架構,Project Eden 在全球範圍內率先將世界狀態轉化為可長效留存、反覆編輯、多人共享的獨立運行體,因此自然解鎖了傳統方案無法兼顧的三大核心能力:1. 環境長程持久:世界狀態獨立於相機視角並永久存儲,不受畫面切換、用戶離場影響。依託底層狀態查詢保障時空一致性,支持用戶在場景內長時間連續漫遊,徹底解決物體消失、場景畸變等行業問題;2. 場景自由複用:支持對世界底層狀態進行讀寫與動態干預,用戶在場景內的所有行為都會被真實留存。例如用戶對場景物體做出破壞、改造等操作後,後續進入該場景的其他用戶,均可看到完全一致的變更結果。無需重複生成場景,實現全域狀態延續與高效複用;3. 多人交互併發:狀態演化與渲染流程相互解耦,單一底層世界可同時承載大量真人用戶與 AI 智能體多併發在線交互。區別於傳統方案算力隨視角 / 人數指數增長的弊端,本架構算力成本可控,不僅支撐大規模社交互動、大型在線內容生態搭建,更是集群式具身智能訓練、多智能體協同研究的關鍵底座,商業與科研價值突出。Project Eden 的定位為下一代交互式內容創作的底層引擎,同時也是適配具身智能訓練的高質量仿真基座,可全方位覆蓋互動內容與科研兩大核心場景:面向互動內容,提供環境生成和交互邏輯構建的一站式能力,既支持大眾創作者以自然語言、簡易動作一鍵創作可多人共享的互動世界,亦服務遊戲、影視、VR/AR、數字孿生等行業的內容生產與互動體驗落地;面向科研領域,提供具備完整物理規則、長時序一致性、可自由干預的仿真環境,賦能具身智能的大規模訓練與多智能體性能評測。我們確立了更加務實、可規模化的行業研究範式:拒絕將世界模型降級為視頻生成任務,以可演化結構化狀態為底座,以生成式模型驅動高保真視覺呈現,路徑貼合技術本質,更易規模化落地。VAST對通用世界模型的探索仍在持續迭代:一方面強化高複雜度場景推演能力,豐富物理動態效果,拓寬自由視角邊界,細化物體交互顆粒度;另一方面搭建專屬狀態轉移模型,實現底層世界根據智能體交互行為自主更新閉環,並持續優化實時渲染性能、降低落地成本,讓世界模型惠及更多創作者與開發者。想要了解更多技術細節與最新研發動態,歡迎訪問:tripo3d.ai/research/project-eden02 不斷刷新 3D 大模型 SOTA,與行業拉開代際差距過去三年,VAST 在 AI 3D 領域持續穩居算法 SOTA。VAST 自研的 Tripo 系列 3D 大模型,每一次迭代均成為全球行業標杆。2026 年 3 月正式上線的 Tripo H3.1、Tripo P1.0 模型(NEXUS, SIGGRAPH 2026)持續保持行業斷層式領先:前者以雕塑級幾何細節刷新了 AI 3D 的精度天花板;後者是全球唯一能夠在數秒內輸出生產級網格的 3D 大模型,較市面其他方案提速百倍,技術路徑代際領先。模型層的持續突破,讓 VAST 具備了將 3D 資產從“可看”推向“可用、可交互、可演化”的底層條件。VAST 的算法迭代還在加速。近期,我們在 Tripo Studio 上線了兩項新的算法突破:8K 貼圖:每一個細節都經得起審視 Tripo 8K 貼圖是業內首款原生 8K AI 貼圖算法。新的 AI 貼圖精度已然突破人眼分辨極限,讓 3D 資產實現全距離無損呈現:近距離特寫無破綻,極致放大仍然清晰。依託該算法,3A 渲染畫質與電影級細節,均可由 AI 原生呈現。長久以來,8K 貼圖一直是高端 3D 資產的專屬配置。資深貼圖師手工繪製需 3 至 5 天,實地掃描材質並投射至模型也耗時 2 至 3 天,且對設備、場地要求嚴苛,單張成本高達 500-2000 美元,僅頭部項目能夠負擔。VAST 將整套製作流程壓縮至 2 分鐘以內,單張邊際成本近乎為零。獨立創作者與小型工作室得以輕鬆獲得影視、3A 級別的貼圖畫質;對於大型團隊,高清貼圖的產能瓶頸被徹底釋放,可隨取隨用。技術層面,該功能採用原生多通道同步生成,全維度材質均達到 8K 分辨率,畫面纖毫畢現,放大後細節依舊完整。產出資產可直接接入 Unreal、Unity、Blender 等專業工作管線,無需二次修復。Segmentation V2:更精準、更可控的智能部件拆分 2025 年 5 月,VAST 在 Tripo Studio Beta 上線了業內首個智能部件拆分功能,AI 3D 資產自此可以在生成後自動分件、直接進入下游管線。Tripo Studio 廣泛服務於遊戲、3D 打印、工業設計、虛擬現實等各行各業,但不同場景對拆分顆粒度的要求差異顯著。用戶使用歷史版本時,往往需要再次耗費精力手動調整,拉低整體制作效率。時隔一年,我們推出迭代版本智能部件分割 V2,依託升級後的多模態 3D 結構理解模型與部件命名映射機制,打造精度更高、操控性更強的 3D 資產拆分能力。升級後的 V2 可以實現在執行 3D 拆分之前,會先生成 2D 預拆分圖供用戶預覽,讓結果清晰可見;同時引入三檔顆粒度控制,對應不同下游場景對裝配粒度的真實需求:• 低 Low(3–6個部件):面向 3D 打印、概念展示等以主體結構為主的場景;• 中 Medium(6–15個部件):對應遊戲開發與影視製作管線中常見的裝配件粒度;• 高 High(15+個部件):面向精細模組、機械結構、可拆卸玩具等高度細分的資產。對於 3D 打印行業而言,結合同期上線的快速補全(Quick Cap)功能,“生成—分件—補全—打印”的全流程被進一步壓縮。引領前沿研究,共建開源生態在 VAST,開源不是技術外溢的附屬選擇。3D 作為人機共通的空間語言,其底層基礎設施,理應在公開協作中搭建。2024 年 3 月,VAST 攜手 Stability AI 聯合開源 TripoSR,率先將單圖 3D 生成速度壓縮至 0.5 秒級別,該模型迅速成為全球創作者的主流選擇。2025 年 3 月,我們推出第二季開源計劃,陸續釋放 TripoSG、TripoSF、UniRig、HoloPart 等八大項目,覆蓋從基礎模型到功能組件的全核心鏈路。多款成果已接入 Blender、ComfyUI 等主流創作工具,其中 UniRig 穩坐全球3D 自動綁骨開源方案的標杆位置。如今,VAST 第三季開源計劃正式收官。本季我們聚焦動態互動內容,深挖表徵形式與落地場景的全新可能:• 與清華大學聯合開源 TripoSplat(DeG, SIGGRAPH 2026):革新 3D 高斯密度控制邏輯,採用可學習概率採樣機制,讓模型自主完成算力動態調配,使3D 內容不再侷限於靜態解析度,而是能根據設備、應用場景靈活適配的 “動態分辨率”;TripoSplat在光效表現、透明材質上有得天獨厚的優勢• 與香港大學聯合開源 AniGen(SIGGRAPH 2026):單圖一鍵生成可動畫 3D 資產,在統一模型內完成幾何、紋理、骨架與蒙皮生成,讓 3D 內容實現生成即可動態交互;• 與清華大學聯合開源 SkinTokens:業界首次將蒙皮權重轉化為 Token 形式,在同一自迴歸框架下完成骨骼與蒙皮聯合生成,推動 AI 自動綁骨能力達到動畫、遊戲行業工業級標準;• LegoACE(SIGGRAPH Asia 2025):支持文本、圖像雙輸入,逐塊自迴歸生成可物理拼裝的樂高模型。歷經三年深耕,VAST 搭建了完整的 AI 3D 與世界模型開源算法生態體系,累計對外開源項目超 30 個,覆蓋從基礎表徵到生成管線的完整技術棧。持續向全球研究者與開發者開放核心技術,讓前沿技術真正服務每一位創作者。欲瞭解更多研究項目、洽談學術合作或有志加入,歡迎訪問:tripo3d.ai/research持續降低創造世界的門檻,讓更多人擁有對互動內容的選擇權與體驗權,是 VAST 三年來所有技術、產品、生態與商業決策的出發點。《創世記》裡,人類因偷食禁果被逐出伊甸園。整個西方文明敘事的開端,是一次人類的好奇心被懲罰——在創世之初,求知本身就要付出代價。Project Eden 想要改寫這個開端:世界可以擁有成千上萬座花園,朝著無需批准的方向恣意生長,結出無數種果實,等待所有人採摘和品嚐。阿根廷作家博爾赫斯在小說《小徑分岔的花園》中,同樣描繪過一座時間迷宮:時間不斷分岔,所有人生與世界的可能性在其中並行共存。VAST 正在為擁有無數分岔的花園培育土壤、播撒種子,這座花園沒有圍牆。VAST 是一家全球領先的通用人工智能公司,致力於通過 AI 3D 大模型及世界模型的前沿算法研究和應用落地,引領普惠的創造平權,使全球每個用戶都能創作、體驗、交互高質量的空間內容。公司已打造“自研 3D 基礎模型及世界模型 + 一站式原生工作臺 + 生態應用”的端到端的產品矩陣,同時依託頂尖的算法團隊和海量的高質量空間資產,讓 AI 真正走向空間理解、物理推演與現實生產。VAST 的模型和產品已廣泛服務全球個人及企業級用戶,持續拓展智能製造、互聯網科技、具身智能、互動文娛、情緒消費等各個關鍵領域,深度賦能千行百業,成為推動新質生產力落地的重要力量。(雷峰網雷峰網雷峰網)

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

3 小時前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

23 小時前

微軟,考慮接入DeepSeek

這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 天前