從諾獎項目到生成式藥物設計,Latent Labs 創始人 Simon Kohl:AI 正在讓生物學進入「可編程時代」 | CVPR 2026
重點摘要
作者|吳思夢編輯|岑峰 2026年6月3日,計算機視覺與模式識別頂級會議(CVPR)在美國丹佛舉行。在大會特邀演講環節,前 DeepMind 蛋白質設計團隊核心成員、2024年諾貝爾化學獎獲獎項目 AlphaFold 核心研究員,Latent Labs 創始人兼 CEO Simon Kohl 發表了題為“Programmable Biology:Generative AI for Molecular Design”的精彩演講。圍繞當今藥物發現領域最核心的痛點:一種新藥從研發到上市平均耗時超過10年、花費超20億美元,但九成候選藥物最終失敗。而Simon Kohl認為,這一切的根源在於“我們從錯誤的分子出發”。為此,他提出了一條從“結構預測”到“條件生成”再到“自主智能體”的技術躍遷路線。演講以AlphaFold 2為起點,回顧了蛋白質結構預測突破如何催生生成式藥物設計;隨後展示了Latent Labs的兩代基礎模型——Latent—X1(通用蛋白結合物設計)與Latent—X2(零樣本抗體設計)——如何在溼實驗室中實現媲美甚至超越傳統萬億級篩選的命中率和親和力;最終發佈了全球首個實驗室驗證的抗體設計智能體Latent—Y,僅需一條自然語言提示,即可自主完成從靶點分析到分子設計的全流程。總結而言,從AlphaFold 2解決“序列到結構”的預測問題,到生成式AI實現“靶點到藥物”的條件設計,再到智能體接管“端到端”的自主設計閉環——計算藥物設計正以指數級速度演進,Simon Kohl斷言:生物學終將成為可編程的工程學科。 以下是Simon Kohl在CVPR 2026大會上發表的演講精編稿,雷峰網·AI科技評論基於原英文演講內容進行了不改原意的翻譯編輯: 《Programmable Biology : Generative AI for Molecular Design》主講
作者|吳思夢編輯|岑峰 2026年6月3日,計算機視覺與模式識別頂級會議(CVPR)在美國丹佛舉行。在大會特邀演講環節,前 DeepMind 蛋白質設計團隊核心成員、2024年諾貝爾化學獎獲獎項目 AlphaFold 核心研究員,Latent Labs 創始人兼 CEO Simon Kohl 發表了題為“Programmable Biology:Generative AI for Molecular Design”的精彩演講。圍繞當今藥物發現領域最核心的痛點:一種新藥從研發到上市平均耗時超過10年、花費超20億美元,但九成候選藥物最終失敗。而Simon Kohl認為,這一切的根源在於“我們從錯誤的分子出發”。為此,他提出了一條從“結構預測”到“條件生成”再到“自主智能體”的技術躍遷路線。演講以AlphaFold 2為起點,回顧了蛋白質結構預測突破如何催生生成式藥物設計;隨後展示了Latent Labs的兩代基礎模型——Latent—X1(通用蛋白結合物設計)與Latent—X2(零樣本抗體設計)——如何在溼實驗室中實現媲美甚至超越傳統萬億級篩選的命中率和親和力;最終發佈了全球首個實驗室驗證的抗體設計智能體Latent—Y,僅需一條自然語言提示,即可自主完成從靶點分析到分子設計的全流程。總結而言,從AlphaFold 2解決“序列到結構”的預測問題,到生成式AI實現“靶點到藥物”的條件設計,再到智能體接管“端到端”的自主設計閉環——計算藥物設計正以指數級速度演進,Simon Kohl斷言:生物學終將成為可編程的工程學科。 以下是Simon Kohl在CVPR 2026大會上發表的演講精編稿,雷峰網·AI科技評論基於原英文演講內容進行了不改原意的翻譯編輯: 《Programmable Biology : Generative AI for Molecular Design》主講人:Simon Kohl,Latent Labs 創始人兼 CEO 藥物發現的困境:10年、20億、九成失敗在進入正題之前,我想讓大家先對“藥物如何起效”建立共識。藥物的作用機制,一言以蔽之,就是結合,並且通常是阻斷。比如司美格魯肽(Semaglutide),它是一個合成肽類藥物,通過結合並激活GLP-1受體來治療二型糖尿病和肥胖症;再比如Caplacizumab,這是一種源自羊駝的納米抗體,通過阻斷血小板間相互作用來治療凝血障礙;還有曲妥珠單抗(Trastuzumab),一種人源化抗體片段,通過阻斷HER2受體來治療乳腺癌和胃癌。它們的共同點都是:結合並阻斷靶點。那麼,今天的藥物是如何被發現的呢?典型流程通常超過10年。首先,你得找到一個初始篩選材料(Starting Material)——而在今天,行業內主要有三種主流方式。第一種是體內免疫法(In vivo immunization)。大型藥企真的在經營著龐大的羊駝和鯊魚農場,試圖從這些動物的免疫反應中篩選出抗體。但問題是,羊駝並不是人類;這些分子充其量只能算是一個起點——它們不僅不可控,而且不夠精準。第二種是超大規模庫篩選(Massive library screening)。這種方法說白了,就是把成百上千億的化合物“像扔意大利麵一樣往牆上砸,看哪個能粘住”。這種方式雖然不需要動物,但篩選出來的分子通常親和力很弱,而且成本極高、極其耗時。第三種是B細胞挖掘(B-cell mining),也就是直接從疾病倖存者的血液中提取天然成熟的抗體。雖然這些是人類自帶的抗體、親和力極強,但這種方法高度依賴供體,根本無法實現規模化擴展,同時還面臨著錯綜複雜的倫理和准入門檻。獲得起點後,還要在動物模型中證明安全性(約3年),再經過臨床I期(安全性)、II期(劑量)、III期(大規模驗證),最終能獲得FDA批准的藥物,十中無一。這就是當前藥物發現的漏斗——超慢、超貴(20億美元+)、90%失敗。而我認為,這一切的根源在於我們從錯誤的分子出發。這正是我們在Latent Labs想要改變的——從頭設計藥物,讓它們有更高的概率通過臨床試驗,更便宜、更快。想象一個世界:針對任何疾病靶點,我們只需將靶點輸入生成式模型,模型就能即時產出可用的藥物分子。這需要高特異性結合、可製造性、低多反應性等一系列屬性。這就是我們的願景。 計算藥物設計的五年加速:從AlphaFold 2到智能體回顧計算藥物設計領域過去五年的進展,我認為我們取得了巨大的進步,在某種程度上堪比大語言模型的能力躍升。2020年,AlphaFold 2橫空出世,解決了蛋白質結構預測問題——這是整個領域的“種子突破”。此後幾年,RFdiffusion和ProteinMPNN等首批蛋白質設計生成模型問世,目標是生成自然界不存在的、在實驗室中能工作的蛋白質。2024年,AlphaFold 3發佈,新增了蛋白質相互作用建模能力,這恰恰是藥物設計所需的核心能力。隨後,DeepMind發佈了AlphaProteo(蛋白質結合物設計),Latent Labs推出了Latent—X1。而在過去12個月中,抗體設計領域迎來了一系列突破——抗體設計被稱為這一領域的“聖盃”,比一般結合物設計難得多,且直接面向製藥行業最核心的藥物類別。Latent Labs的Latent— X2、Chai Discovery的Chai-2、Nabla Bio的JAM等模型相繼問世。最近,Latent Labs發佈了全球首個實驗室驗證的抗體設計智能體Latent—Y。我要強調的是:僅僅五六年間,我們就從“一切都在實驗室做”躍遷到了“智能體在跑抗體設計”——這是指數級的加速。 蛋白質:比圖像更脆弱的分子機器在深入模型之前,讓我先給一個蛋白質的入門介紹。蛋白質是生命必需的分子機器,由氨基酸鏈摺疊成三維結構。從計算機科學的角度看,蛋白質是一條由20個字母(氨基酸)組成的字符串,每個字母對應特定的原子集合和生物化學性質。關鍵在於:結構決定功能。而且蛋白質有一個非常特殊的性質——即使只有一個氨基酸突變,蛋白質也可能完全喪失功能。對CVPR的聽眾來說,一個精準的類比是:就像一個像素的錯誤就能毀掉一張圖片——當然,人類視覺是魯棒的,改變一個像素圖片依然連貫,但蛋白質不是這樣。我以雞蛋清蛋白為例:如果將其核心位置的賴氨酸突變為丙氨酸——僅僅是“一個字母的切換”——整個蛋白就會解體,失去結構和功能,變成無序蛋白。這種突變也是癌症的常見誘因。所以你完全不能弄錯哪怕一個氨基酸。這就引出了蛋白質摺疊問題:1972年,Anfinsen在諾貝爾化學獎獲獎演講中提出了“熱力學假說”——序列完全決定結構。此後,人們一直在試圖計算解決這個問題。AlphaFold 2正是這個50年難題的解答。 AlphaFold 2 在 CASP14 盲測中展現出了驚人的準確度,其在所有靶標上的 GDT_TS 中位數達到了 92.4,Cα 原子的 RMSD 中位數僅為 0.96 Å。相比之下,第二名的方法中位數誤差高達 2.8 Å,差距極其懸殊。學術界普遍認定它解決了單鏈蛋白質結構預測問題,其預測精度已與實驗結果不相上下。這一突破也直接推動了 2024 年諾貝爾化學獎授予 Hassabis、Jumper 和 Baker。 AlphaFold 2的架構精髓:從進化信號到三維結構AlphaFold 2有三個核心輸入:多序列比對(MSA)、配對錶徵和結構模板。其中MSA最為關鍵,進化過程中共同突變的殘基往往在三維空間中接觸,由此可從進化信號推斷空間關係。配對錶徵則提供了一個“草稿板”,讓模型顯式建模殘基對之間的交互——消融實驗證明這是極其關鍵的。結構模板則不那麼重要,模型在無模板時表現幾乎同樣好。從這些輸入出發,模型構建兩條表徵軌道:MSA表徵棧和配對錶徵棧,通過我們稱之為EvoFormer的創新架構讓兩者交互。EvoFormer基於注意力機制,但融入了大量領域知識的歸納偏置。比如我們嵌入了尊重三角不等式的三角更新,在配對錶徵的交互中注入幾何先驗。最後,通過另一個網絡將表徵映射到三維空間。在AlphaFold 2中,這是用旋轉和平移來參數化的,進一步注入了幾何歸納偏置(儘管後來的 AlphaFold 3 發現這一步並非必需)。AlphaFold 2 的成功還得益於其他創新機制,比如將模型末端的表徵重新反饋回起點的迭代循環機制(Recycling),以及對下游應用至關重要的置信度預測(包括逐殘基的 pLDDT 和殘基對的 PAE 指標)。整個架構集成了大約 10 到 15 個核心創意,其中每一個都足以單獨支撐一篇優秀的論文。AlphaFold 2 的突破還帶來了一個更深遠的影響。正如計算機視覺領域中 ImageNet 催生了 AlexNet,進而演進出 Inception Score 和 FID 來加速生成模型迭代一樣,在結構生物學中,PDB 數據集、CASP 評估以及作為“預測器(Oracle)”的 AlphaFold 2,共同構建起了“數據集 → 評估 → 預測器 → 生成器”的產業飛輪。這些預測器不僅讓我們能在算法上快速迭代,更能幫助我們從海量設計中進行篩選和排序,準確挑出最值得進入溼實驗室驗證的候選分子。 從預測到創造:Latent—X1與條件生成範式AlphaFold 2是“看”蛋白質的結構,但我們要“造”蛋白質。藥物設計可以表述為一個條件生成任務:給定靶點的序列和結構,生成一個與之高特異性結合的分子。這種結合必須精確到原子層面,無論是氫鍵還是疏水相互作用都必須恰到好處。在 Latent Labs,我們將靶點表示為原子座標點雲,並以此為條件,利用去噪擴散模型從高斯噪聲中開始生成結合物,這便是 Latent—X1 的工作原理。在去噪軌跡中,你可以清晰地觀察到模型如何從一團混沌中逐步“雕刻”出精確的結合物結構。我們完整的“設計-驗證”流程如下:給定靶點→指定結合位點(殘基級精確)→用Latent—X1生成結合物→用AlphaFold 2/3類模型交叉驗證。其中,在交叉驗證環節,我們會重點觀察預測結構與設計是否一致,並評估其置信度。溼實驗室驗證環節至關重要。在 Latent Labs 位於舊金山的實驗室中,我們在人類細胞系(如腎細胞)上表達設計出的分子,並用綠色熒光進行標記,同時移入帶有橙色染料的靶點。一旦橙色信號被成功固定在細胞上,即宣告結合成功。鑑於單個氨基酸的偏差就可能讓所有心血付諸東流,溼實驗驗證是把好最後一關的鐵律。作為一款基礎模型,Latent—X1 並未針對特定的生物藥模態進行刻意優化,這反而賦予了它在多場景下的優異表現。在納米抗體(Nanobody)設計中,它成功命中了所有靶標,親和力達到了納摩爾甚至皮摩爾級別;在迷你結合蛋白(Mini-binder,包含 80-120 個氨基酸)的設計上,它同樣全數命中基準靶標,親和力挺進皮摩爾級,這已極其接近“藥物級”的結合力。發佈時的對比數據也證實,Latent—X1 在親和力和命中率上均明顯超越了同期的其他模型。Latent—X2:零樣本設計藥物級抗體2024年12月,我們發佈了Latent—X2。其核心突破在於零樣本設計藥物級抗體。抗體是當今獲批藥物中最大的生物藥類別,且仍在擴張。我們證實,Latent—X2 可以從頭針對從未見過的靶點設計抗體,並且在納米抗體、單域抗體等多種抗體格式上均能保持高親和力。在藥物相似性(Drug-likeness)方面,Latent—X2同樣令人振奮。好的藥物分子需要熱穩定性高(熔點高)、單體性好(不自聚集,便於高密度儲存和運輸)、產量高(製造成本低)、多反應性低(無脫靶效應)、疏水性低(不易聚集)。傳統上,這些屬性的優化是一個“打地鼠”遊戲:當你按下其中一個指標時,另一個指標就會隨之惡化。然而,由 Latent—X2 設計的分子中,有 47% 的候選物無需經歷任何迭代優化,就能同時跨過所有關鍵指標的閾值,其整體水準已非常接近市面上現有的治療性抗體。更令人震撼的是環肽設計的對比實驗。我們在PHD2和KRAS兩個靶點上,將Latent—X2僅10個設計與萬億級隨機篩選庫的結果對比:在PHD2上,10個設計的結合力比萬億級篩選的最優結果強兩個數量級。而在歷史上被公認為“不可成藥”的 KRAS 靶標上,這 10 個設計同樣拿到了與萬億級篩選分庭抗禮的結合物。在效率上,AI 計算僅耗時 1 天,後續實驗室驗證花費 4 周;而傳統篩選則需要耗費 3 到 6 個月的時間,併吞噬大量的人力和試劑成本。我們還在與外部合作伙伴進行離子通道抑制項目。離子通道是介導神經元離子流的膜蛋白孔道,對鎮痛藥物具有重要意義,一直被認為是極具挑戰性的靶標。如今,Latent—X2 設計的環肽已成功阻斷了人類 NAV1.7 鈉離子通道,成為了“用 AI 計算精度替代傳統蠻力篩選”的經典範例。Latent—Y:全球首個實驗室驗證的抗體設計智能體在Latent X系列模型的基礎上,我們更進了一步,創建了智能體系統Latent—Y,這是全球首個實驗室驗證的抗體設計智能體,也是藥物設計團隊的“力量倍增器”。在此我為大家演示它的具體工作流。我們在提示框中輸入一句簡單的指令:“生成阻斷人 IL-6 的納米抗體。”接下來,智能體便開始獨立接管後續流程: 整個過程中,智能體可以並行執行多個步驟,真正實現了研發效能的成倍放大。實驗室驗證結果令人信服。僅憑類似“用納米抗體阻斷PRLR受體相互作用”的提示,無需任何迭代,就在實驗室中獲得了非常緊密的結合。我們還對其進行了更有挑戰性的壓力測試:直接將一篇發表在 《Science》 或 《Nature》 上的論文 PDF 餵給智能體,讓它自主識別文中描述的生物學功能並設計對應的納米抗體。在針對 20 篇論文的測試中,面對人 Transferrin 受體 1(一種血腦屏障靶標)的設計任務,智能體產出的 40 個候選物中有 11 個在實驗室中成功實現了結合。 開放問題與未來展望不可否認,該領域目前依然存在諸多有待攻克的開放性問題。首當其衝是蛋白質動力學。目前我們的模型本質上是靜態建模,但蛋白質在自然界中是動態的柔性物體,這對酶催化等功能至關重要。分子動力學(MD)領域長期存在,但傳統力場泛化性差,機器學習力場正在帶來希望。問題一方面是力場精度,另一方面是計算量。也許Jensen和NVIDIA會幫我們解決這個問題。第二是無法可靠預測人體藥物響應。目前還不清楚需要什麼才能解決這個問題,至少需要收集更多數據。第三是系統性毒性預測,同樣是數據瓶頸:人體交互網絡如此龐大,目前遠未被充分理解,純理論推導不可能,必須先收集足夠的機器學習就緒數據。展望未來 5 到 10 年,我相信以下趨勢將自然發生:最終,當所有這些技術進步匯聚在一起時,人類將擁有攻克所有疾病的武器。這聽起來是一個極其樂觀的論斷,但我堅信這只是時間問題,而不是“能否實現”的問題。我們正站在歷史的拐點上:生物學終將成為一門可編程的工程學科。 Q&A 問答環節 聽眾A: 既然輸入是需要結合的靶點,那靶點本身的發現呢?這會不會成為新的瓶頸?Simon Kohl:非常好的問題。靶點識別(Target ID)本身幾乎就是一個獨立的研究領域。老實說,我們並不缺靶點。但確實很多疾病會從更好的靶點中受益。我認為像我們這樣的模型也能在這方面提供幫助——比如我之前提到的“研究試劑”方向,就是幫助更好地理解靶點生物學,確定疾病通路中該阻斷哪些交互。這雖然是我今天描述內容的下游,但同樣令人興奮。 聽眾B: 在溼實驗室工作中,你們是否在構建細胞成像數據集,試圖跳過某些層級直接基於靶點建模細胞結構?Simon Kohl:這非常有趣。目前這個領域整體是數據瓶頸——我們從PDB等數據集中已經“榨乾”了很多。我認為當前到臨床的差距,恰恰需要更多類似你描述的數據集。問題是如何以高度可擴展的方式做到這一點,產出對機器學習友好的標準化的數據。這個領域並不缺數據,但數據是異構的、分散的、太小的、未同質化的。這類努力我們非常期待看到進展。 聽眾C: Latent—Y智能體目前停在溼實驗環節,你們是否在推進自動化驗證閉環?Simon Kohl:是的,這正是一個自改進的思路。目前已有實驗服務商提供API接口到他們的實驗室,將這個API給智能體,我認為非常令人興奮。當然有很多複雜性——沒有一個實驗室能覆蓋所有空間,實驗室也不像理想中那樣模塊化。但對更常見的工作流,這是非常可行的,我們已經在探索。 聽眾D: 你展示了迷你結合蛋白和肽段的設計。你認為這些更簡單的分子能否替代抗體藥物?Simon Kohl:我認為有可能。抗體通常需要靜脈注射——它們無法通過我們的消化道生化環境,會被切碎。這就是為什麼小分子仍有吸引力——可以口服進入血流。環肽因此特別值得關注。一旦我們能建模人體藥物響應,我認為沒有理由不能設計出非免疫原性、無毒性的迷你結合蛋白或肽段。但目前,人類蛋白支架提供了更好的起點,這是抗體如此流行的根本原因。 聽眾E: 生成式AI能否幫助預測體外毒性?Simon Kohl:這還是一個數據問題。人體交互網絡太龐大了,遠未被充分理解,純理論推導今天不可能。如果我們有足夠的數據來構建預測器,那就可以。某種程度上這是“無聊的回答”,但確實需要先更多地探測系統,然後才能構建可泛化的預測器。 聽眾F: 蛋白質動力學是一個開放挑戰,你初步的想法是什麼?Simon Kohl:分子動力學(MD)是長期存在的領域,但經典力場泛化性差。人們現在在構建機器學習力場來改善這一點,已經展現出很大前景——部分原因正是經典力場的脆弱性。但問題有兩方面:一是力場精度,二是計算量。目前要在足夠的時間尺度或原子尺度上建模幾乎不可能,但這並不意味著不會被解決——只是今天仍然困難。 聽眾G: 從硅到溼實驗室的過渡中,你們如何從數百萬設計中選擇最好的?Simon Kohl:兩方面。首先,生成模型本身必須足夠好——如果未過濾的成功率太低,任何篩選器都救不了。其次,我們使用結構預測模型進行交叉驗證——將設計摺疊後看結構是否與設計一致,結合置信度指標和特定閾值。這使得我們在實驗室中每個靶標最多隻需測試不到100個設計。這隻有當生成器和評分器都很強時才可能。 聽眾H: 該領域的數據稀缺是否意味著需要長期依賴專業化架構?還是說會達到一個拐點,通用數據可以讓基礎模型繞過專業化設計?Simon Kohl:領域內確實在向更大數據集和合成數據方向推進。也許不太為人所知的是,即使在AlphaFold 2中,合成數據(即自蒸餾自預測數據)與實驗室數據的比例也是3:1——我們用了更多的自我預測蒸餾數據來調優模型。關於專業化架構,確實在消減——即使在我們的工作中,今天使用的歸納偏置也少得多。隨著數據增加,等變性等約束可以被更通用的系統替代。 聽眾I: 對於分佈外採樣問題,你認為應該如何應對?是否存在根本性限制?Simon Kohl:老實說,這沒有我最初擔心的那麼嚴重。目前一些模型已經在相當分佈外的情況下工作得不錯——比如有些模型會產生自然界中不存在的、表面高度帶電的蛋白質,但它們竟然表達得還不錯。當然它們的藥物設計屬性可能不好。我認為有幫助的是:生成模型提供了一個很好的先驗,而評分器進一步裁剪尾部。這是我的直覺——分佈外不是巨大的問題。>> 點擊關注CVPR專題專區,獲取年度綜述、深度論文解讀與行業趨勢全盤點 <<
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。