雷峰網生成式AI

獨家解讀丨時隔五年,OpenAI為何非要吃機器人這口「回頭草」?

2026年6月5日 05:46

重點摘要

時隔五年,山姆·奧特曼為何重返機器人?這是他在X上官宣這則消息後,業內最大的疑問。是擔心股價破發,開始拼命畫餅講故事了?還是Anthropic萬億估值壓頂下,OpenAI不得不尋求更大差異化?亦或是說,物理世界的 AGI 臨界點真的已到來?聚光燈正在移位。2026年的AI科技舞臺上,OpenAI 早已告別了獨佔鰲頭的絕對主角時代。隨著馬斯克SpaceX、OpenAI、Anthropic 三家超級巨頭相繼步入美股 IPO 的敲鐘倒計時,一場殘酷的估值絞殺戰已然打響。SpaceX已突破1.75萬億美元,Anthropic估值也已超過OpenAI,以9650億距萬億一步之遙,這也讓卡在兩大巨頭夾縫之間的OpenAI的處境變得前所未有的尷尬。在這一敏感節點,奧特曼選擇重新撿起當年親手砍掉的機器人業務,究竟在賭什麼?01是“股價敘事”還是競爭所迫?“為什麼重返機器人?因為容易融資。”某國內頭部AI Lab研究員周立明對雷峰網表示。在她看來,OpenAI馬上要上市了,但Agent和大語言模型的蛋糕分得差不多了,OpenAI繼續講大模型和Agent是拼不過谷歌和Anthropic的,它需要講機器人,否則有可能破發。“雖然機器人行業現在日子也不好過,一直不太落地,但架不住總有錢源源不斷地往這個領域流,就眼下來說,機器人還是最吸金的話題之一。”事實上,自今年上半年Anthropic的ARR開始陡峭增長、季度營收和估值雙雙反超OpenAI起,OpenAI股價破發的觀點就開始流傳於華爾街。畢竟,不同於2022年底一騎絕塵的勢頭,眼下的OpenAI面臨不小的友商壓力。在自變量機器人創始人王潛看來,OpenAI重返機器人業務,一方面 Open AI 一直將物理智能視為AGI不可或缺的一環,另一方面的核心的驅動力是:與Anthropic的激烈競爭促使它不得不尋求更多差異化。王潛坦言:“機器人始終是Op

站內 AI 整理稿

時隔五年,山姆·奧特曼為何重返機器人?這是他在X上官宣這則消息後,業內最大的疑問。是擔心股價破發,開始拼命畫餅講故事了?還是Anthropic萬億估值壓頂下,OpenAI不得不尋求更大差異化?亦或是說,物理世界的 AGI 臨界點真的已到來?聚光燈正在移位。2026年的AI科技舞臺上,OpenAI 早已告別了獨佔鰲頭的絕對主角時代。隨著馬斯克SpaceX、OpenAI、Anthropic 三家超級巨頭相繼步入美股 IPO 的敲鐘倒計時,一場殘酷的估值絞殺戰已然打響。SpaceX已突破1.75萬億美元,Anthropic估值也已超過OpenAI,以9650億距萬億一步之遙,這也讓卡在兩大巨頭夾縫之間的OpenAI的處境變得前所未有的尷尬。在這一敏感節點,奧特曼選擇重新撿起當年親手砍掉的機器人業務,究竟在賭什麼?01是“股價敘事”還是競爭所迫?“為什麼重返機器人?因為容易融資。”某國內頭部AI Lab研究員周立明對雷峰網表示。在她看來,OpenAI馬上要上市了,但Agent和大語言模型的蛋糕分得差不多了,OpenAI繼續講大模型和Agent是拼不過谷歌和Anthropic的,它需要講機器人,否則有可能破發。“雖然機器人行業現在日子也不好過,一直不太落地,但架不住總有錢源源不斷地往這個領域流,就眼下來說,機器人還是最吸金的話題之一。”事實上,自今年上半年Anthropic的ARR開始陡峭增長、季度營收和估值雙雙反超OpenAI起,OpenAI股價破發的觀點就開始流傳於華爾街。畢竟,不同於2022年底一騎絕塵的勢頭,眼下的OpenAI面臨不小的友商壓力。在自變量機器人創始人王潛看來,OpenAI重返機器人業務,一方面 Open AI 一直將物理智能視為AGI不可或缺的一環,另一方面的核心的驅動力是:與Anthropic的激烈競爭促使它不得不尋求更多差異化。王潛坦言:“機器人始終是OpenAI通往AGI整體藍圖中的重要組成部分。 OpenAI最早期就涉足過機器人領域,可以說他們一直將物理智能視為AGI不可或缺的一環。”“但是目前來看,OpenAI與Anthropic的競爭非常激烈,甚至可以說OpenAI目前在下風,兩家公司的戰略路徑有所不同——Anthropic更傾向於高度聚焦的策略,而OpenAI則傾向於在多個方向上佈局。”“在這種背景下,OpenAI選擇重返機器人賽道,一方面是因為他們認為這是一個潛力巨大的市場,另一方面也是希望發揮自身在多模態方面的積累,形成差異化競爭優勢。”“畢竟Anthropic此前較少涉足多模態領域,對OpenAI來說這是可以重點發力的方向。”不過,OpenAI面臨的壓力遠不止戰略層面。某國內機器人感知方案商技術負責人徐棟從最緊迫、也最現實的商業變現焦慮上,給OpenAI算了一筆賬。“OpenAI這麼揮金如土的公司,靠每個月收20美金的會員費,這個賬肯定是算不過來的。它需要一個新的盈利點。”“目前,全球不少軟件巨頭都在嘗試做硬件,背後思路是一致的:下個AI時代,會有AI硬件的爆發。單純賣軟件或單純賣硬件,不如軟硬件一體這個閉環飛輪。”更多不同見解,可添加作者微信 xf123a 交流。事實上,從技術演進路徑來看,大模型廠商進軍物理AI目前正在成為一種趨勢。某具身智能獨角獸算法負責人張強告訴雷峰網,OpenAI在語言模型(LLM)和多模態視覺語言模型(VLM)領域已經有了深厚的積累,現在往視覺-語言-動作模型(VLA,即控制機器人的物理智能)升級,技術跨越是比較順理成章的。“相比其他純做硬件的公司,OpenAI有之前的模型和底座技術打底,複用性很高,起點更有優勢。”02奧特曼的“世界模擬器”,能打嗎?奧特曼在此次宣佈重返機器人時,給出了一個官方理由。他透露,重組機器人團隊的底氣來自於內部一個秘密沉澱了很久的項目:Worldsim,世界模擬器。所謂世界模擬器,通俗來說就是,在虛擬的數字空間裡,像素級地還原、仿真、甚至預判真實物理世界的法則。2021年,OpenAI關停機器人實驗室時給出了很多理由,比如訓練數據不夠,強化學習迭代太慢等,其中,核心瓶頸,是“物理時間的不可加速性”。簡單來說就是,軟件算法可以在電腦裡一秒鐘跑一萬次,但實體的機器在現實中必須遵循物理世界的時間表。在現實中,機械臂揮動一次就是需要一秒鐘。想要訓練一億次,硬件早就磨損燒燬了。而這次,有了世界模擬器,這一難題有望被解開。據官方介紹,這次率隊的是Aditya Ramesh,DALL-E的靈魂人物,Sora視頻生成模型的核心開發者,同時也是OpenAI的研究副總裁。從這項人事任命上,可以看出OpenAI世界模擬器技術的底層邏輯,大概率與Sora一脈相承。而Sora 證明了OpenAI 的模型不僅僅是在屏幕上“生成畫面”,而是其內部已經具備了模擬現實的能力,能夠理解重力、碰撞、流體力學等現實世界運行的物理規律。耐人尋味的是,就在兩個月前,2026年3月,OpenAI剛剛關停了Sora的消費級應用。OpenAI總裁Greg Brockman在播客中解釋了這個決策:Sora和GPT推理模型屬於技術樹的兩個不同分支,算力有限時無法同時推進。在一些業內人看來,砍掉Sora的消費級應用,或許是為了把資源集中到一條更有前途的賽道上:機器人賽道。一位機器人仿真工程師趙傑告訴雷峰網,通過Worldsim世界模擬器,OpenAI可以在虛擬的超級計算機裡,構建一個高度還原真實世界的數字孿生空間。在這裡,機器人的虛擬化身可以同時開啟數千萬個併發線程,在幾小時內進行幾十億次的動作跨越與錯誤嘗試。當它在虛擬世界裡被訓練得足夠聰明後,研究人員只需要把這套“腦回路”打包,一次性寫入實體的機械軀殼中,以往機器人“訓練慢、成本高”的困境,就可以得到緩解。“世界模型,是實現物理智能與具身智能大模型的關鍵技術。如果OpenAI真的在偏算法大模型這一塊補齊了技術,確實會讓他們更有信心切入機器人賽道。”水木清華校友基金投資人陳程卓表示。“不過,奧特曼的世界模型大概率是基於Sora延伸的生成式技術方案,不一定是最優解。楊立昆所主張的 JEPA(聯合嵌入預測架構)預測式世界模型,在技術邏輯上或許更具可行性。”03原本的盟友,變成了對手事實上,在過去幾年裡,OpenAI其實一直通過“外掛”的方式,曲線佈局機器人。2023年,他們領投了挪威機器人公司1X Technologies。2024年,又聯合微軟、英偉達向Figure AI砸了6.75億美元,讓Figure 01接入GPT當“大腦”。但到了2025年2月,Figure創始人兼CEO Brett Adcock在X上突然宣佈:終止與OpenAI的合作。理由是Figure在“完全自主研發的端到端機器人AI上取得了重大突破”,Figure不想再用OpenAI的通用大模型了,要自己做垂直整合。創始人Adcock當時放話,要在30天內發佈“從未在人形機器人上見過的東西”。三個月後,Figure推出了自研的Helix 02模型,實現了全身自主運動控制,能直接基於像素輸入控制機器人的全身動作。這對OpenAI來說,無異於一次背刺。“外部合作的方式,不可控性確實會大一些。但更重要的是,現在機器人的ChatGPT時刻尚未到來,這也預示著未來會有一個大的歷史機遇,OpenAI可能是想押這個寶。”前述投資人陳程卓表示。事實上,OpenAI的不少老對手,今年也在瘋狂加碼硬件,走“軟硬件閉環”路線。對於這一路線的更多洞見,可添加作者微信 xf123a 交流。Google DeepMind在2026年4月發佈了Gemini Robotics-ER 1.6,一個專注於“具身推理”的AI模型,讓機器人真正學會“看懂”物理世界。英偉達在2026年6月1日,也就是OpenAI官宣的同一天,推出了Isaac GR00T參考人形機器人,與Unitree Robotics戰略合作,搭載Jetson Thor計算模塊。跑得最快的還有馬斯克。2026年1月,特斯拉確認Fremont工廠已有超過1000臺Optimus Gen 3機器人在生產線上實際操作。其德州Giga工廠的千萬級機器人工廠已經開始建設,目標2026年量產10萬到30萬臺,單價壓到2萬到3萬美元。大廠包抄之下,陳程卓認為:“想要發展物理AI,需要走軟硬件閉環的路線,因為目前的數據、算法與機器人本體耦合度極高,拋開硬件,單獨發展物理智能大模型在技術上幾乎不可能。為了加快迭代,重返機器人賽道是一個必要的策略。”OpenAI如果再沒有自己的核心硬件和控制系統,未來可能會在物理AI時代被邊緣化。04機器人蓋數據中心,是否靠譜?有意思的是,奧特曼在此次官宣中也提到了 OpenAI Robotics 的短期目標。這支新組建的 OpenAI Robotics 團隊,其第一階段的核心任務,既不是進入千家萬戶做家務,也不是去醫院照顧老人,而是:被派往全美各地的無人荒漠和工業重區,去支持和協助熟練工人建造下一代超級數據中心、核電站與高壓電網。這個設定看似形成了一個用機器人蓋機房、再用算力反哺GPT-6等大模型演進的閉環。但在不少業內一線專家和投資人眼裡,這個目標卻充滿了爭議。自變量創始人王潛對此表示:“說實話,我認為這個目標目前更多是一個願景性的表述,實際落地的可能性還需要觀察。”“建設數據中心本身是一項複雜度非常高的工程,如果機器人真的能勝任數據中心建設,那理論上它應該也具備了應對絕大多數複雜場景的能力,這本身就是一個極高的技術門檻。”“所以我傾向於認為,這更多是為了展示機器人業務的潛在價值和應用前景,而非嚴格意義上的短期可交付目標。”前述投資人陳程卓的評價則更加尖銳和直接。“如果是讓機器人做點日常運維監測,沒問題,但深度參與,短期不可行,從技術成熟度、投資回報率等方面均不支持該場景落地。”“這個場景類似建築工地,雜亂無序環境差且快速變化,場景過於特殊,對於通往智能AGI的價值相對較小,過程中積累的行業數據和算法,可泛化性弱,有其他更值得投入的垂直場景。”不得不說,此刻的OpenAI和奧特曼無疑是焦慮的。在IPO交卷之際,一邊是Anthropic和SpaceX在商業化上的步步緊逼與估值反超,一邊是英偉達、特斯拉在硬科技賽道的包抄,留給OpenAI打響反擊戰的時間已經不多了。本文作者長期追蹤海外AI巨頭動態、前沿技術和幕後故事,歡迎添加作者微信 xf123a 互通有無。

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

2 小時前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

22 小時前

微軟,考慮接入DeepSeek

這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前