智東西生成式AI

智源大會連甩1個大腦3個大模型4個智能體,圖靈獎得主:2050機器智能將主宰世界

2026年6月12日 06:12

重點摘要

智東西 作者 | 王涵 編輯 | 雲鵬 智東西6月12日報道,今天,在智源大會2026上,智源研究院分享併發布了近一年以來的多項研究成果,包括基座大模型、智能體和基礎軟硬件生態三部分。 基座大模型方面,智源分享了原生多模態大模型悟界Emu3.5、AI藥物發現模型悟界·OpenComplex 2.5等的研究進展,並在會上發佈了神經科學模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神經科學領域數據集,以及全球最大的AI-Ready神經科學數據平臺BrainToken。 智能體方面,智源進一步介紹了其具身大腦悟界·RoboBrain Orca v0,發佈了四款智能體產品,包括面向心臟疾病的輔助診斷智能體、面向科學發現的自主研究智能體、智源大會專屬聽會智能體、有害蛋白識別智能體。在基礎軟硬件生態方面,智源發佈眾智FlagOS 2.1,該系統能夠適配18家芯片廠商的32款芯片。 在大會開幕演講中,美國工程院院士、2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出:當前依賴反饋控制的方法效果不佳,他主張形式化方法才是未來,即先明確形式化規範、再編寫程序、最後數學證明程序符合規範,他樂觀認為未來AI將成為完成這些證明的工具,大幅提升可靠性。演講尾聲,Diffie給出驚人預測:到2050年,機器智能將超越人類,成為世界運行的主宰。 圖靈獎得主、馬薩諸塞大學阿默斯特分校榮譽退休教授Andrew Barto,將強化學習歸結為“控制、搜索與聯想記憶”的三位一體,指出“機器學習最初就是強化學習”。他強調強化學習與神經網絡研究從一開始便緊密交織,深度強化學習結合大腦獎勵系統的最新成果將指引下一輪方向。最後他警示:獎勵信號設計可能帶來“反常實例化”風險。 在播客環節,中國工程院院士、阿里雲創始人王堅與智源研究院理事長黃鐵軍展開對話,圍繞中國大模型的發展路徑展開,重點討

站內 AI 整理稿

智東西 作者 | 王涵 編輯 | 雲鵬 智東西6月12日報道,今天,在智源大會2026上,智源研究院分享併發布了近一年以來的多項研究成果,包括基座大模型、智能體和基礎軟硬件生態三部分。 基座大模型方面,智源分享了原生多模態大模型悟界Emu3.5、AI藥物發現模型悟界·OpenComplex 2.5等的研究進展,並在會上發佈了神經科學模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神經科學領域數據集,以及全球最大的AI-Ready神經科學數據平臺BrainToken。 智能體方面,智源進一步介紹了其具身大腦悟界·RoboBrain Orca v0,發佈了四款智能體產品,包括面向心臟疾病的輔助診斷智能體、面向科學發現的自主研究智能體、智源大會專屬聽會智能體、有害蛋白識別智能體。在基礎軟硬件生態方面,智源發佈眾智FlagOS 2.1,該系統能夠適配18家芯片廠商的32款芯片。 在大會開幕演講中,美國工程院院士、2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出:當前依賴反饋控制的方法效果不佳,他主張形式化方法才是未來,即先明確形式化規範、再編寫程序、最後數學證明程序符合規範,他樂觀認為未來AI將成為完成這些證明的工具,大幅提升可靠性。演講尾聲,Diffie給出驚人預測:到2050年,機器智能將超越人類,成為世界運行的主宰。 圖靈獎得主、馬薩諸塞大學阿默斯特分校榮譽退休教授Andrew Barto,將強化學習歸結為“控制、搜索與聯想記憶”的三位一體,指出“機器學習最初就是強化學習”。他強調強化學習與神經網絡研究從一開始便緊密交織,深度強化學習結合大腦獎勵系統的最新成果將指引下一輪方向。最後他警示:獎勵信號設計可能帶來“反常實例化”風險。 在播客環節,中國工程院院士、阿里雲創始人王堅與智源研究院理事長黃鐵軍展開對話,圍繞中國大模型的發展路徑展開,重點討論了從追趕驗證到路線選擇、體系構建與範式創新的轉型,如何突破互聯網文本數據的天花板和算力短缺的極限,以及如何從“跟隨國際主流範式”轉向“形成自身問題意識”、實現原創範式躍遷。 在智源研究院院長王仲遠主持的圓桌對話中,小米羅福莉、清華朱軍、清華劉知遠、南洋理工安波四位專家進行了近50分鐘的深度交流。 羅福莉認為引發熱議的Claude Fable 5本質仍是預訓練、數據與強化學習持續推進的自然結果;朱軍指出新版模型Token消耗下降是正確方向;劉知遠分析Anthropic的成功源於找準代碼這一專業領域,並強調智能革命在於用AI替代機械重複的腦力勞動;安波則提出AI自進化不能依賴封閉環境。 一、“悟界”登《Nature》,發佈全球最大最全的神經科學數據集 智源研究院院長王仲遠分享了近一年來智源研究院的相關研究進展。 基座大模型方面,智源研發的原生多模態大模型悟界Emu3.5,在去年10月30日就已經正式發佈並且開源。今年1月份,悟界·Emu正式登上《Nature》正刊,也是國內多模態大模型方向的第一篇。 悟界·Emu3.5通過Next-Token Prediction這一實現方式,實現了文本、圖像、視頻的統一學習,實現了多模態理解任務和多模態生成任務的統一學習。 智源將Next-Token Prediction擴展到了神經科學領域,研發出了悟界·Brainμ1.0,該模型能夠將腦信號與其它模態互相轉化,可以將腦信號轉成文字、圖像、聲音,同時可以反過來轉換。 同時,智源發佈了全球最大最全的AI-Ready神經科學領域數據集,以及全球最大的AI-Ready神經科學數據平臺BrainToken。 此外,智源還發布了悟界·OpenComplex 2.5,是可泛化物理支持的下一代AI驅動藥物發現模型。通過單一的流程,該模型覆蓋了製藥的四大關鍵步驟,包括口袋識別、反向篩選、結構預測、形成力預測。OpenComplex 2.5在多個benchmark上的核心指標,超過了傳統的物理方法和其他的AI模型。 二、提出世界模型四類技術路線,自研世界模型即將開源 世界模型方面,智源將當下世界模型的技術路線分為四類: 1、第一類是語言為中心的世界模型,包括VIMA等。 2、第二類是以像素為中心的視覺模型,如Sora。 3、第三類是以三維結構為中心的視覺模型,代表是李飛飛團隊成果。 4、第四類是以視覺表徵為中心的世界模型,像是楊立昆團隊成果。 王仲遠分享稱,智源認為,以上四類技術路線距離真正的世界模型還存在一定差距。智源正在研發當中的世界基座模型——悟界·Physis v0.1。該模型具有AI底層典型四大核心能力:物理一致性、動作靈活性、長程可推演、通用泛化性。其通過為理前的空間建模,能夠真正實現全模態的輸入,以及下一步物理狀態的預測。 該模型目前還在訓練中,將在未來幾個月開源。 三、發佈具身大腦,推出四款智能體 具身智能方面,王仲遠透露,智源最新研發的具身大腦悟界·RoboBrain Orca v0,是以下一個物理狀態預測為核心的具身大腦。它通過融合大量的多模態交互數據,強化了世界模型在具身上的表徵,提升下游少量樣本泛化能力,目前已與50餘家企業進行了合作。 智能體方面,王仲遠在現場發佈了四款智能體產品,包括: 1、面向心臟疾病的輔助診斷智能體:BAAI Cardiac Agent 該智能體是智源智源與安貞醫院共同研發的,能夠有效識別和處理心臟磁共振的多模態數據,提升醫生的診斷效率。其心臟疾病診斷的精確度,能夠達到安貞醫院頂尖心血管醫生的診斷水平。 2、面向科學發現的自主研究智能體:AREX 該智能體能夠覆蓋科學研究的幾個關鍵環節,包括信息調研、方案設計、實驗探究、報告撰寫。其背後所依賴的基座模型由智源自主研發。在權威的基準測試上,不僅能夠顯著超越同等參數的開源模型,更能夠比肩萬億參數級別的旗艦模型。 3、本屆智源大會專屬的聽會智能體:SoulAgent 該智能體可以幫助參會者實現智源大會一站式參會體驗,同時也能夠與先期入駐的智源大會的專家進行AI問答。 4、面向有害蛋白獲取的風險發現智能體 智源首次通過紅隊實驗的方法驗證:智能體能夠輔助篩查並獲取有害的蛋白,進而合成蛋白,將在近期公佈相關的測試報告。 四、FlagOS更新至2.1版本,適配32款芯片 在基礎軟硬件生態方面,王仲遠介紹,智源研究院聯合開源社區打造的眾智FlagOS 現已更新至 2.1 版本。該系統適配18家芯片廠商的32款芯片,是目前全球適配芯片品類最多的計算系統。 FlagOS內置算子超600個且數量仍在持續擴充,不僅為18家芯片廠商提供統一AI編譯器、為12家廠商提供通用技術支持,還同時完成國際標準與國家標準立項。 目前該系統可支撐90%以上主流開源模型部署,近期已完成DeepSeek、千問、MiniMax、MiniCPM、混元等多款熱門模型的無縫適配。 結語:AI技術發展,已經迎來拐點 本屆智源大會釋放出多項行業動向。 首先,AI研究方向日趨多元,行業不再單純追逐模型參數規模,逐步向腦科學、藥物研發、心臟疾病診斷等實體應用領域深耕。其次,基礎軟硬件生態落地提速,眾智FlagOS已實現對32款芯片的適配,底層技術佈局初見成效。 此外,兩位圖靈獎得主與國內專家在分享中形成共識:隨著AI技術持續演進,僅依靠算力與數據堆砌已難實現長遠發展,技術路線規劃、安全體系搭建以及人機協同關係等核心議題,亟待全行業深入探索與正視。

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

2 小時前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

22 小時前

微軟,考慮接入DeepSeek

這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前