他山科技聯合圖靈獎得主薩頓共建“機器人幼兒園”,具身智能從“模仿時代”邁向“經驗時代”

2026年7月1日 06:18

重點摘要

雷峰網獲悉,6月29日,“觸碰真實·自主進化——機器人幼兒園啟幕大會”在北京首鋼園隆重舉行。本次大會由他山科技與OpenMind Global Research共同發起,由北京具身智能研究院聯合主辦。大會上,由他山科技與2024年圖靈獎得主、Openmind 全球研究院首席科學家理查德·薩頓(Richard Sutton)教授團隊聯合共建的“機器人幼兒園”正式揭牌。這是強化學習理論在具身智能領域的首個實體落點,標誌著機器人從被動模仿的“數據時代”,正式邁向交互試錯的“經驗時代”。一、一個讓機器人充滿好奇、安全試錯的幼兒園他山科技董事長孫滕諶在歡迎辭中指出,全球人工智能產業正向“實體生產力”轉型,行業亟須一套全新的技術範式。“機器人幼兒園”創新性地以觸覺感知為核心突破口,旨在打通強化學習實踐全流程能力閉環,讓機器人在自主觸碰、持續試錯中積累經驗、迭代進化。緊接著,被譽為“強化學習之父”的傳奇人物薩頓教授系統性地闡述了機器人幼兒園的核心理念。“在過去70多年,AI一直存在,AI過去的發展一直存在著一種探索,通過試錯讓機器人持續學習。”薩頓教授援引艾倫·圖靈在1950年論文中的洞見:“與其開發一個類似人類一樣思考的程序來模擬成年人的思維,不如嘗試開發一個模擬兒童思維的程序,讓他不斷地成長,學會思考。”他指出,過去幾十年雖有嘗試,但受限於脆弱的硬件,機器人難以獲得紮根現實的廣泛經驗。當前硬件已取得巨大進步且成本降低,傳統從人類示例中訓練出的機器人行為“不夠強大”,薩頓教授認為,真正的答案是:機器人必須通過交互學習,通過試錯在整個部署的生命週期中實現持續學習,像嬰兒一樣,從經驗的積累、成長當中逐漸地一步步學習。他強調,與他山科技共建的機器人幼兒園實際上是基於這樣強大的理念,讓機器人在沒有人類示例的情況下能夠在線學習,“這也是人工智能的一個夢想。”隨後,作為機器人幼兒園的聯合發起者,他

站內 AI 整理稿

雷峰網獲悉,6月29日,“觸碰真實·自主進化——機器人幼兒園啟幕大會”在北京首鋼園隆重舉行。本次大會由他山科技與OpenMind Global Research共同發起,由北京具身智能研究院聯合主辦。大會上,由他山科技與2024年圖靈獎得主、Openmind 全球研究院首席科學家理查德·薩頓(Richard Sutton)教授團隊聯合共建的“機器人幼兒園”正式揭牌。這是強化學習理論在具身智能領域的首個實體落點,標誌著機器人從被動模仿的“數據時代”,正式邁向交互試錯的“經驗時代”。一、一個讓機器人充滿好奇、安全試錯的幼兒園他山科技董事長孫滕諶在歡迎辭中指出,全球人工智能產業正向“實體生產力”轉型,行業亟須一套全新的技術範式。“機器人幼兒園”創新性地以觸覺感知為核心突破口,旨在打通強化學習實踐全流程能力閉環,讓機器人在自主觸碰、持續試錯中積累經驗、迭代進化。緊接著,被譽為“強化學習之父”的傳奇人物薩頓教授系統性地闡述了機器人幼兒園的核心理念。“在過去70多年,AI一直存在,AI過去的發展一直存在著一種探索,通過試錯讓機器人持續學習。”薩頓教授援引艾倫·圖靈在1950年論文中的洞見:“與其開發一個類似人類一樣思考的程序來模擬成年人的思維,不如嘗試開發一個模擬兒童思維的程序,讓他不斷地成長,學會思考。”他指出,過去幾十年雖有嘗試,但受限於脆弱的硬件,機器人難以獲得紮根現實的廣泛經驗。當前硬件已取得巨大進步且成本降低,傳統從人類示例中訓練出的機器人行為“不夠強大”,薩頓教授認為,真正的答案是:機器人必須通過交互學習,通過試錯在整個部署的生命週期中實現持續學習,像嬰兒一樣,從經驗的積累、成長當中逐漸地一步步學習。他強調,與他山科技共建的機器人幼兒園實際上是基於這樣強大的理念,讓機器人在沒有人類示例的情況下能夠在線學習,“這也是人工智能的一個夢想。”隨後,作為機器人幼兒園的聯合發起者,他山科技CEO馬揚從產業角度出發,剖析“為什麼要建幼兒園”。他指出,機器人需要的不是孤立的數據而是在交互中持續產生並不斷更新的經驗。觸覺是人類和機器人與客觀世界產生交互的唯一通道,只有通過觸覺才能真正接觸物體,改變目標。他山科技從2017年成立起就聚焦於此,目前,他山科技已有數十萬個觸覺指尖應用於全球不同的人形機器人。“幼兒園”是自主探索真正萌發的階段,也是孩子開始逐步脫離保護、與物理世界直接交互的階段。為此,他山科技將為機器人幼兒園提供四個核心條件:允許犯錯的機會、安全的探索環境、持續的真實交互、及時而明確的反饋。最後,馬揚發出倡議,歡迎所有具身智能從業者一起來做機器人的啟蒙者,“我們有足夠的耐心,也足夠謙虛,因為我們覺得這不只是對具身智能的啟蒙時代,也是人類和具身智能一起去迎接碳基和硅基生命共存的啟蒙時代。”二、一個開放生態的硬核底座主題演講後,在全場倒數聲中,嘉賓共同按下啟動光柱,“機器人幼兒園”正式揭牌,標誌著具身智能從被動模仿正式邁向主動探索的新里程。揭牌只是序章,將這一平臺真正轉化為驅動產業進化的引擎,需要更多同行者攜手入場。隨後,“機器人幼兒園首批聯合共建生態夥伴”啟動儀式舉行。加速進化、雲跡科技、因時機器人、他山科技、Openmind全球研究院、北京市唯實具身智能研究院、北京人形機器人創新中心、節卡機器人、紫東太初等企業與機構代表同臺,共同啟動生態共建計劃。他山科技集結從核心零部件到整機、從算法框架到場景應用的多元力量,合力為機器人打造一個開放、安全、鼓勵試錯與自主進化的創新生態。技術縱深層面,他山科技研發副總裁侯廣東與Openmind研究員Dr. Kris De Asis提供了硬核註解。侯廣東指出,他山科技與薩頓教授正在探索“真實系統上長程持續學習”的新範式,而在機器人的啟蒙階段,“嬰兒最重要的第一感知很可能是觸覺”,它將成為“主動探索的基石”。他山科技計劃利用觸覺定義機器人“疼痛”機制,並驅動機器人內在探索動機。Dr. Kris De Asis則提出了“為學習而設計”的突破性理念。他分享:“每當我提到我們應該直接在機器人身上學習的時候,我經常聽到一個反對的意見,就是機器人會磨損並且出現故障。”Dr. Kris認為,這是實時學習的一個問題,但也是實時學習的閃光點。因為機器人會將這個情況視為一個新的現實,是必須經歷的環境。而且機器人會根據所有的這些磨損以及損壞的情況來學習執行任務。三、一次關於成長與價值的對話在以“機器人啟蒙時代,具身智能如何實現‘自主進化’”為主題的圓桌討論中,圓桌主持人中國信息通信研究院人工智能研究所具身智能與機器人部副主任張蔚敏開宗明義指出,薩頓教授提出的AI從“數據時代”走向“經驗時代”,本質上是在重新定義“智能如何生長”。薩頓教授分享了機器人幼兒園的合作淵源:“我們選擇他山,是因為他們對觸覺的專注,以及與我們共同相信經驗學習的力量。”他坦言,他山科技在觸覺感知上的深耕,尤其是對試錯學習理念的共鳴與快速行動,是雙方共建機器人幼兒園的核心原因。他山科技董事長孫滕諶闡釋了觸覺與強化學習的深度融合:“觸覺為強化學習提供了安全試錯的屏障和感知的時序精度。”電容式觸覺的接近覺能力讓機器人在碰撞前即可預警規避,大幅降低試錯成本;動態觸覺技術將時間分辨率提升至微秒級,疊加類腦芯片對“脈衝-時序差分”算法的天然支持,為機器人的自主學習築牢硬件基礎。北京人形機器人創新中心CEO熊友軍從生態建設切入:“開放的生態比單點突破更重要,我們需要產學研用分層協同。”他倡議,具身智能行業亟需學術研發、他山科技為代表的核心零部件和場景應用三類夥伴,通過開放共享的分層協作機制,加速智能進化與產業落地。軟銀中國管理合夥人宋安瀾則從投資視角判斷:“過去有教育培訓、技術培訓,AI時代是機器人的經驗培訓。”他認為,機器人幼兒園這一全球首創的學習範式,將在幾年內產生顯著的經濟效應。第二場圓桌則圍繞“從幼兒園到真實世界:機器人如何‘養活’自己”的討論中展開,中信證券投資黃耀庭以“100萬”的數字作為引子,直言“我更重視的不是出貨100萬臺,而是機器人到底能否幹活”,強調產業重心應迴歸學習方法與能力的持續進化。Openmind全球研究院-高級研究員Dr. Kris De Asis回應數據孤島難題:“開源項目不止於算法和數據集,更應包括開放的機電一體化設計”,倡導硬件、模型同步開源以加速創新共享。首鋼基金總經理張檬指出落地的關鍵瓶頸:機器人企業需“從解決小問題開始,才能理解整個工業流程的串聯”,只有真正紮根場景、甘做累活,才能跨越從實驗室到訂單的鴻溝。節卡機器人副總裁許雄將數萬臺部署經驗濃縮為一句話:“安全與交互性,是讓機器人走出物理圍欄的關鍵”,唯有突破可靠性門檻,人機協作才能走入開放的真實世界。因時機器人聯合創始人/ CTO陳希則描繪了手與算法共生驅動的未來:“靈巧手不單是執行器,更是多模態感知的數據收集器”,耐用性與多維感知能力是下一步迭代的核心。雲跡科技首席發展官CDO謝雲鵬回應商業化平衡問題,給出的方法論是“瞄準一個小的點,飽和攻擊,最終讓它變成剛需”,通過深耕配送場景,在邊用邊學中讓非剛需成為客戶離不開的標配。四、一場稀缺的大師課受他山科技邀請,薩頓教授專程面向國內具身智能行業進行了一整天的閉門授課。課程圍繞“智能如何自主進化”這一根本命題,從理念框架、工程範式、核心挑戰、算法引擎到最新演進路徑,層層遞進,系統性闡述了從數據驅動走向經驗驅動的強化學習思想體系。在薩頓教授的分享中,他特別強調了三個關鍵點,除了技術理念和機器人幼兒園,還有一個重要的關鍵點是“堅韌”——保持謙遜、善良、樂觀。這一價值觀也與他山科技長期堅持的企業精神不謀而合。薩頓教授展示了智能體如何通過試錯自主學習簡單操作任務的過程。在問答環節,來自高校、企業實驗室和產業一線的研究者們爭相舉手,薩頓教授一一耐心作答。這場大師課不僅是一次知識的傳遞,更被在場很多人視為一次難得的研究範式啟迪。在他山科技的推動下,這樣高密度、重交流的學術活動,將成為具身智能啟蒙的重要思想策源地。機器人的成長還有很長的路要走,所有同行者都需要心懷這份堅韌,長期耕耘。

Related

相關文章

OpenAI 砍了個寂寞

這篇消息聚焦「OpenAI 砍了個寂寞」。原始導語提到:成本砍一半,硬件股全線新高 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

亞馬遜雲科技斥資10億美元建AI前沿部署工程部門,派駐工程師進駐客戶企業

亞馬遜雲科技初期將向該新部門投入10億美元,但這筆資金代表的是亞馬遜內部的資源投入,而非合資企業或傳統意義上的對外投資。據TechCrunch報道,該部門計劃組建一支數千人規模的工程師團隊,以5至6人的小組形式進駐客戶公司,每次駐場週期約為45天。“授人以漁”的派駐模式亞馬遜雲科技前沿AI工程與服務副總裁弗朗西斯卡·瓦斯克斯在宣佈該組織的博文中強調,新部門的工作遠不止於為客戶構建和維護所需系統。

剛剛

豆包,開始學智譜

這篇消息聚焦「豆包,開始學智譜」。原始導語提到:AI商業化集體toB。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

“10年後職場只剩兩類人”——李飛飛並沒有說過

這篇消息聚焦「“10年後職場只剩兩類人”——李飛飛並沒有說過」。原始導語提到:AI時代,沒有特長或者主動性的人,發展空間會被收窄。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛