智源大會連甩1個大腦3個大模型4個智能體，圖靈獎得主：2050機器智能將主宰世界

2026年6月12日 06:12

重點摘要

站內 AI 整理稿

智東西作者 | 王涵編輯 | 雲鵬智東西6月12日報道，今天，在智源大會2026上，智源研究院分享併發布了近一年以來的多項研究成果，包括基座大模型、智能體和基礎軟硬件生態三部分。基座大模型方面，智源分享了原生多模態大模型悟界Emu3.5、AI藥物發現模型悟界·OpenComplex 2.5等的研究進展，並在會上發佈了神經科學模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神經科學領域數據集，以及全球最大的AI-Ready神經科學數據平臺BrainToken。智能體方面，智源進一步介紹了其具身大腦悟界·RoboBrain Orca v0，發佈了四款智能體產品，包括面向心臟疾病的輔助診斷智能體、面向科學發現的自主研究智能體、智源大會專屬聽會智能體、有害蛋白識別智能體。在基礎軟硬件生態方面，智源發佈眾智FlagOS 2.1，該系統能夠適配18家芯片廠商的32款芯片。在大會開幕演講中，美國工程院院士、2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出：當前依賴反饋控制的方法效果不佳，他主張形式化方法才是未來，即先明確形式化規範、再編寫程序、最後數學證明程序符合規範，他樂觀認為未來AI將成為完成這些證明的工具，大幅提升可靠性。演講尾聲，Diffie給出驚人預測：到2050年，機器智能將超越人類，成為世界運行的主宰。圖靈獎得主、馬薩諸塞大學阿默斯特分校榮譽退休教授Andrew Barto，將強化學習歸結為“控制、搜索與聯想記憶”的三位一體，指出“機器學習最初就是強化學習”。他強調強化學習與神經網絡研究從一開始便緊密交織，深度強化學習結合大腦獎勵系統的最新成果將指引下一輪方向。最後他警示：獎勵信號設計可能帶來“反常實例化”風險。在播客環節，中國工程院院士、阿里雲創始人王堅與智源研究院理事長黃鐵軍展開對話，圍繞中國大模型的發展路徑展開，重點討論了從追趕驗證到路線選擇、體系構建與範式創新的轉型，如何突破互聯網文本數據的天花板和算力短缺的極限，以及如何從“跟隨國際主流範式”轉向“形成自身問題意識”、實現原創範式躍遷。在智源研究院院長王仲遠主持的圓桌對話中，小米羅福莉、清華朱軍、清華劉知遠、南洋理工安波四位專家進行了近50分鐘的深度交流。羅福莉認為引發熱議的Claude Fable 5本質仍是預訓練、數據與強化學習持續推進的自然結果；朱軍指出新版模型Token消耗下降是正確方向；劉知遠分析Anthropic的成功源於找準代碼這一專業領域，並強調智能革命在於用AI替代機械重複的腦力勞動；安波則提出AI自進化不能依賴封閉環境。一、“悟界”登《Nature》，發佈全球最大最全的神經科學數據集智源研究院院長王仲遠分享了近一年來智源研究院的相關研究進展。基座大模型方面，智源研發的原生多模態大模型悟界Emu3.5，在去年10月30日就已經正式發佈並且開源。今年1月份，悟界·Emu正式登上《Nature》正刊，也是國內多模態大模型方向的第一篇。悟界·Emu3.5通過Next-Token Prediction這一實現方式，實現了文本、圖像、視頻的統一學習，實現了多模態理解任務和多模態生成任務的統一學習。智源將Next-Token Prediction擴展到了神經科學領域，研發出了悟界·Brainμ1.0，該模型能夠將腦信號與其它模態互相轉化，可以將腦信號轉成文字、圖像、聲音，同時可以反過來轉換。同時，智源發佈了全球最大最全的AI-Ready神經科學領域數據集，以及全球最大的AI-Ready神經科學數據平臺BrainToken。此外，智源還發布了悟界·OpenComplex 2.5，是可泛化物理支持的下一代AI驅動藥物發現模型。通過單一的流程，該模型覆蓋了製藥的四大關鍵步驟，包括口袋識別、反向篩選、結構預測、形成力預測。OpenComplex 2.5在多個benchmark上的核心指標，超過了傳統的物理方法和其他的AI模型。二、提出世界模型四類技術路線，自研世界模型即將開源世界模型方面，智源將當下世界模型的技術路線分為四類： 1、第一類是語言為中心的世界模型，包括VIMA等。 2、第二類是以像素為中心的視覺模型，如Sora。 3、第三類是以三維結構為中心的視覺模型，代表是李飛飛團隊成果。 4、第四類是以視覺表徵為中心的世界模型，像是楊立昆團隊成果。王仲遠分享稱，智源認為，以上四類技術路線距離真正的世界模型還存在一定差距。智源正在研發當中的世界基座模型——悟界·Physis v0.1。該模型具有AI底層典型四大核心能力：物理一致性、動作靈活性、長程可推演、通用泛化性。其通過為理前的空間建模，能夠真正實現全模態的輸入，以及下一步物理狀態的預測。該模型目前還在訓練中，將在未來幾個月開源。三、發佈具身大腦，推出四款智能體具身智能方面，王仲遠透露，智源最新研發的具身大腦悟界·RoboBrain Orca v0，是以下一個物理狀態預測為核心的具身大腦。它通過融合大量的多模態交互數據，強化了世界模型在具身上的表徵，提升下游少量樣本泛化能力，目前已與50餘家企業進行了合作。智能體方面，王仲遠在現場發佈了四款智能體產品，包括： 1、面向心臟疾病的輔助診斷智能體：BAAI Cardiac Agent 該智能體是智源智源與安貞醫院共同研發的，能夠有效識別和處理心臟磁共振的多模態數據，提升醫生的診斷效率。其心臟疾病診斷的精確度，能夠達到安貞醫院頂尖心血管醫生的診斷水平。 2、面向科學發現的自主研究智能體：AREX 該智能體能夠覆蓋科學研究的幾個關鍵環節，包括信息調研、方案設計、實驗探究、報告撰寫。其背後所依賴的基座模型由智源自主研發。在權威的基準測試上，不僅能夠顯著超越同等參數的開源模型，更能夠比肩萬億參數級別的旗艦模型。 3、本屆智源大會專屬的聽會智能體：SoulAgent 該智能體可以幫助參會者實現智源大會一站式參會體驗，同時也能夠與先期入駐的智源大會的專家進行AI問答。 4、面向有害蛋白獲取的風險發現智能體智源首次通過紅隊實驗的方法驗證：智能體能夠輔助篩查並獲取有害的蛋白，進而合成蛋白，將在近期公佈相關的測試報告。四、FlagOS更新至2.1版本，適配32款芯片在基礎軟硬件生態方面，王仲遠介紹，智源研究院聯合開源社區打造的眾智FlagOS 現已更新至 2.1 版本。該系統適配18家芯片廠商的32款芯片，是目前全球適配芯片品類最多的計算系統。 FlagOS內置算子超600個且數量仍在持續擴充，不僅為18家芯片廠商提供統一AI編譯器、為12家廠商提供通用技術支持，還同時完成國際標準與國家標準立項。目前該系統可支撐90%以上主流開源模型部署，近期已完成DeepSeek、千問、MiniMax、MiniCPM、混元等多款熱門模型的無縫適配。結語：AI技術發展，已經迎來拐點本屆智源大會釋放出多項行業動向。首先，AI研究方向日趨多元，行業不再單純追逐模型參數規模，逐步向腦科學、藥物研發、心臟疾病診斷等實體應用領域深耕。其次，基礎軟硬件生態落地提速，眾智FlagOS已實現對32款芯片的適配，底層技術佈局初見成效。此外，兩位圖靈獎得主與國內專家在分享中形成共識：隨著AI技術持續演進，僅依靠算力與數據堆砌已難實現長遠發展，技術路線規劃、安全體系搭建以及人機協同關係等核心議題，亟待全行業深入探索與正視。

原始來源：智東西 ↗

查看原始來源

鈦媒體生成式AI

Edge AI Daily 早報（6月19日）

AI Engineer World's Fair 2026規模再創新高，標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整：楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性，Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處，展現生態擴張野心。監管壓力加劇，意大利依據DMA調查蘋果iCloud，巴西開放iOS側載佣金降至5%，蘋果圍牆花園持續崩塌。

2 小時前閱讀分析

36氪生成式AI

今天起，Claude Design要把設計師和程序員變成同一種人了

猝不及防！Anthropic深夜甩出Claude Design大更新，設計系統一鍵導入，代碼雙向同步，9大平臺一鍵導出。Anthropic設計師親自下場錄屏：AI跑了八輪自查，才敢把設計稿給你看。

15 小時前閱讀分析

IT之家生成式AI

OpenAI 成為 Rust 基金會白金會員，合計贊助 60 萬美元

OpenAI 正式成為 Rust 基金會白金會員，將提供總計 60 萬美元資金，用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

18 小時前閱讀分析

IT之家生成式AI

Claude Design 上線首周用戶破百萬，和 Claude Code 共享 AI 配額

Anthropic 今天（6 月 18 日）發佈公告，在宣佈 Claude Design 上線首周用戶規模突破 100 萬後，進一步強化和 Claude Code 的雙向聯動，實現從設計到編程的無縫工作流。

19 小時前閱讀分析

智東西生成式AI

谷歌時隔6年再發智能音箱，Gemini上桌，售價不到700元

智東西編譯 | 劉煜編輯 | 陳駿達智東西6月18日消息，谷歌昨日宣佈，其首款搭載居家版Gemini語音助手的智能音箱（Google Home Speaker）已開啟預售，將於當地時間6月25日正式上市，售價為99.99美元（約合人民幣677.03元）。在此之前，谷歌已有6年沒有推出過獨立智能音箱產品。谷歌這款智能音箱外觀近似球形，風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱（圖源：谷歌官網）使用音箱時，用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini，就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外，用戶只要按照日常說話習慣下達命令，Gemini便能理解用戶意圖，相比之前大大提升溝通效率。一、加強短時對話記憶，會員可與Gemini不限次數對話谷歌此次推出的全新音箱升級諸多功能。其中，音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色，用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令，即使指令未能說對、說完整，用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力，落地到實際生活場景中比較實用。例如，用戶問：“我支持的足球隊下場比賽天氣如何？”Gemini收到指令後，會自動查詢賽事時間、舉辦地點，同時匹配相應時段天氣，再給出答覆。同時，Gemini加強了短時對話記憶，能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件，該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景（圖源：谷歌官網）不僅如此，Gemini搭配的連續對話功能，能讓應答後的音箱麥克風保持短暫收音，用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言，包括

22 小時前閱讀分析

36氪生成式AI

微軟，考慮接入DeepSeek

這篇消息聚焦「微軟，考慮接入DeepSeek」。原始導語提到：Copilot Cowork轉為按量計費。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前閱讀分析

相關文章