智東西生成式AI

估值95億!黃仁勳投了一家世界模型創企

2026年6月18日 09:22

重點摘要

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,據英國《金融時報》昨日報道,美國AI獨角獸、世界模型創企Odyssey獲得3.1億美元(約合人民幣20.96億元)融資,本輪融資落地後,該公司投後估值將達14.5億美元(約合人民幣98.05億元)。 其投資方包括亞馬遜、英偉達、AMD風投、風投公司Natural Capital、美國中央情報局(CIA)出資成立的風險投資機構In-Q-Tel、谷歌DeepMind首席科學家Jeff Dean以及硅谷投資人Elad Gil等。 此外,AWS將成為Odyssey的首選雲服務商。Odyssey會針對AWS Trainium芯片優化自身模型,同時部署亞馬遜最新芯片產品。 世界模型訓練與持續推理對算力需求巨大,若僅由Odyssey獨自承擔硬件與雲服務開銷,成本壓力十分沉重。而此次Odyssey與芯片廠商建立合作,將幫助其分擔訓練和運行世界模型所需的高昂成本。 一、推出多種類型世界模型,配套自研PROWL算法修復仿真缺陷 Odyssey成立於2023年,該公司專門訓練基於物理規則與物體交互邏輯的世界模型,以此突破純語言模型的侷限性。而Odyssey最出圈的核心能力,是可根據文本提示詞生成細節豐富、可交互的視頻內容。 目前,Odyssey已推出多款面向不同應用場景的世界模型,包括該公司迄今為止最大、最強大的通用世界模型Odyssey-2 Max、世界上首個實時多模態世界模型Starchild-1、以及多智能體世界模型Agora-1等。 具體而言,Odyssey-2 Max主打單人長時序交互式視頻仿真。使用該款模型模擬生成的案例如下圖所示。可以看到,該模型對杯子在真實世界的旋轉做到了幾乎完美的預判,生成的物理精度也處於較高水平。 傳統世界模型大多僅能學習、生成畫面,無法配套輸出音頻,而Odyssey推出的Starchild-1能

站內 AI 整理稿

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,據英國《金融時報》昨日報道,美國AI獨角獸、世界模型創企Odyssey獲得3.1億美元(約合人民幣20.96億元)融資,本輪融資落地後,該公司投後估值將達14.5億美元(約合人民幣98.05億元)。 其投資方包括亞馬遜、英偉達、AMD風投、風投公司Natural Capital、美國中央情報局(CIA)出資成立的風險投資機構In-Q-Tel、谷歌DeepMind首席科學家Jeff Dean以及硅谷投資人Elad Gil等。 此外,AWS將成為Odyssey的首選雲服務商。Odyssey會針對AWS Trainium芯片優化自身模型,同時部署亞馬遜最新芯片產品。 世界模型訓練與持續推理對算力需求巨大,若僅由Odyssey獨自承擔硬件與雲服務開銷,成本壓力十分沉重。而此次Odyssey與芯片廠商建立合作,將幫助其分擔訓練和運行世界模型所需的高昂成本。 一、推出多種類型世界模型,配套自研PROWL算法修復仿真缺陷 Odyssey成立於2023年,該公司專門訓練基於物理規則與物體交互邏輯的世界模型,以此突破純語言模型的侷限性。而Odyssey最出圈的核心能力,是可根據文本提示詞生成細節豐富、可交互的視頻內容。 目前,Odyssey已推出多款面向不同應用場景的世界模型,包括該公司迄今為止最大、最強大的通用世界模型Odyssey-2 Max、世界上首個實時多模態世界模型Starchild-1、以及多智能體世界模型Agora-1等。 具體而言,Odyssey-2 Max主打單人長時序交互式視頻仿真。使用該款模型模擬生成的案例如下圖所示。可以看到,該模型對杯子在真實世界的旋轉做到了幾乎完美的預判,生成的物理精度也處於較高水平。 傳統世界模型大多僅能學習、生成畫面,無法配套輸出音頻,而Odyssey推出的Starchild-1能以自迴歸方式實時同步生成音畫內容,並持續響應用戶流式輸入。 Agora-1則相當於一套通過學習訓練而成的遊戲引擎。該模型最多支持4名玩家在同一套生成式虛擬世界中實時互動。它根據每位玩家的動作推演交互行為,統一維護全局共享的世界狀態,並同步向所有玩家推送實時生成的畫面像素。 藉助Agora-1,Odyssey首次實現了多智能體協同世界仿真。下圖展示了由Agora-1驅動的共享死亡競賽模擬場景。 當前,即使是頂尖的世界模型,在像素細節、物理模擬層面仍會存在瑕疵,也無法始終嚴格按照輸入動作完成推演。 為解決上述痛點,Odyssey研發出PROWL算法,這是一套基於強化學習的對抗性測試框架,用於讓智能體主動發現世界模型中的系統性缺陷,同時引導智能體高效挖掘模型的潛在問題,識別傳統手段難以捕獲的缺陷。 PROWL通過強化學習智能體挖掘缺陷樣本訓練世界模型,優化後的模型再反哺智能體提升尋錯效率,二者形成閉環反饋,持續轉化缺陷為訓練樣本,迭代優化模型精度。 綜合來看,影視與遊戲行業長期存在的傳統CG三維場景、多人交互關卡製作週期漫長、人力成本居高不下的難題,使用Odyssey推出的世界模型則可以幫助客戶一鍵生成可交互虛擬場景,質量可觀的同時還能縮短內容生產週期、降低成本。 此外,隨著這類模型規模擴大、模擬質量提升,其落地場景將覆蓋科學研究、機器人、國防及醫療等更多領域。例如,用戶可以利用這類模型搭建交互式虛擬實訓場景,用於工廠技工、機器人運維的工業實操培訓。 ▲世界模型用於員工的實操培訓場景(圖源:Odyssey) 在機器人領域,這類世界模型通過學習人類操控行為,使機器人在實際操作前對複雜任務進行模擬預演,涵蓋抓取、導航和操控等動作,從而賦能具備通用環境操作能力的智能機器人,服務於數十億用戶。 ▲世界模型用於機器人領域的實操培訓場景(圖源:Odyssey) 二、聯合創始人曾是自動駕駛從業者,團隊部分成員來自DeepMind、蘋果 Odyssey的聯合創始人分別是是自動駕駛企業Voyage聯合創始人兼前CEO、通用汽車旗下自動駕駛公司Cruise前產品副總裁Oliver Cameron與自動駕駛公司Wayve前技術副總裁Jeff Hawke。 Cameron本科畢業於英國謝菲爾德哈萊姆大學,擁有理學學士學位。 他展示過一項演示案例:僅依靠像素、動作與音效作為輸入提示,Odyssey的模型就能復刻出1997年任天堂遊戲《GoldenEye》的多人聯機版,且無需針對該遊戲專屬物理規則做專項訓練。 Cameron稱:“Odyssey的模型能夠更完整地認知真實世界,包括物理規律、肢體動作、動態變化等。世間所有語言難以完整描述的事物,它都能理解。” 他還透露,Odyssey的開發工具運行在英偉達H200和B200芯片之上,每人每小時的使用成本約為2至4美元。不過這一費用並不包含其模型訓練成本。 ▲Oliver Cameron的學歷(圖源:領英) 聯合創立Odyssey前,Cameron曾創立私密社交App初創公司Everyme,並出任該公司CEO。2013年,在Everyme的業務主體Origami Labs被eFamily收購、該業務團隊成員被谷歌旗下Nest收編後,Cameron加入了美國硅谷在線教育機構Udacity擔任該公司工程副總裁。 從Udacity離職後,他聯合創辦了Voyage。2021年,Voyage被Cruise收購,他隨之出任Cruise的產品副總裁,任職2年有餘。 ▲Oliver Cameron的履歷(圖源:領英) Odyssey的另一位創始人Hawke擁有新西蘭奧克蘭大學理學學士和榮譽工程學士雙學位,其碩士畢業於美國佐治亞理工學院。之後,他去往英國牛津大學攻讀工程科學方向的博士,讀於牛津機器人研究所應用AI實驗室。 ▲Jeff Hawke的學歷(圖源:領英) 正式投身技術研發前,Hawke曾在美國波士頓諮詢公司(BCG)擔任高級諮詢顧問。1年後,他加入Wayve擔任創始研究員與技術副總裁,主導搭建了該公司大量核心業務體系與技術模塊。 ▲Jeff Hawke的履歷(圖源:領英) Odyssey現有55名員工,分佈於英國倫敦、蘇黎世與帕洛阿爾託三地。該公司團隊成員多數來自大型AI實驗室與自動駕駛初創企業,這些企業包括DeepMind、Meta、蘋果、自動駕駛公司Waymo以及特斯拉等。 ▲Odyssey團隊成員來源(圖源:Odyssey) 結語:巨頭扎堆投資世界模型,生態協同將決定長期競爭力 Odyssey的融資陣容包括雲廠商、芯片大廠以及頂級AI科學家,這一豪華投資陣容,也一定程度上反映出當下AI資本正集體看好物理仿真世界模型這條技術路線。 本輪融資除了為Odyssey補充研發與商業化落地資金外,AWS等廠商提供的底層算力基礎設施,也將幫助該企業緩解承擔高額模型訓練成本的壓力。 隨著模型訓練和推理成本持續攀升,模型公司與雲計算、芯片廠商之間的協同正在變得更加緊密。對於世界模型賽道而言,未來的競爭或許不僅取決於模型能力本身,也將取決於產業生態的構建速度。 來源:英國《金融時報》、Odyssey官網

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

3 小時前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

23 小時前

微軟,考慮接入DeepSeek

這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前