王堅九問九答:六年前我們看的是游泳池,如今中美面朝同一片大海
重點摘要
智東西 作者 | 李水青、楊京麗 編輯 | 雲鵬 智東西6月12日報道,今日,2026智源大會在中關村國際創新中心舉辦,中國工程院院士、阿里雲創始人王堅,智源研究院理事長黃鐵軍在現場播客對話上分享了一系列前沿判斷和新穎觀點。 如何比別人更早看到未來?王堅認為,我們需要給自己超出現有框架的思考方式。“我們在講人工智能(AI)時,也被這個詞限定了。”他認為,我們應該像前面圖靈獎得主Whitfield Diffie所說的一樣,在動物智能、人類智能以及機器智能這一更大的框架下去思考AI敘事。 ▲中國工程院院士、阿里雲創始人王堅 人類會不會被機器智能統治?他的觀點非常鮮明:“我堅定不相信AI會替代人。狗的鼻子比人靈敏很多,但我們從來不覺得這對人有什麼威脅。” 王堅認為,我們今天講所有大模型的問題,其實原來都是來形容人的。我是一個無藥可救的樂觀主義者,所以我一直相信人類自己創造的問題,人類一定會解決的。 談及中國AI的敘事,黃鐵軍對年輕從業者提出建議:要有自己的想法,更要在該下決心時下決心,不適合拿交作業、一定成功的心態面對不確定性。王堅則補充:今天中國和美國看到的是同一片大海,六年前我們可能還困在游泳池裡,如今早已面朝同一片天地,這場遠行遠未到頭。 ▲智源研究院理事長黃鐵軍 當被問及人與 AI 的關係,黃鐵軍稱人類與AI會像父母與孩子般共存融合,人類會借AI拓展人類邊界。王堅認為人類天然畏懼新技術,AI 影響未必能超越火在歷史上的作用,他以早年大眾畏懼紙筆類比當下 AI,並提出“一定要讓token變得‘不值錢’”,讓其如紙張般廉價。 王堅、黃鐵軍與主持人衛詩婕的對話全文紀要如下,智東西做了不改變原意的編輯: 1、作為雲計算之父,您在雲計算、城市大腦、AI基建、太空計算這些關鍵節點上總比別人先看到未來,這一切是基於怎樣的一套底層的思維模型? 王堅:其實沒有。今天上午聽了兩位圖靈獎得主發
智東西 作者 | 李水青、楊京麗 編輯 | 雲鵬 智東西6月12日報道,今日,2026智源大會在中關村國際創新中心舉辦,中國工程院院士、阿里雲創始人王堅,智源研究院理事長黃鐵軍在現場播客對話上分享了一系列前沿判斷和新穎觀點。 如何比別人更早看到未來?王堅認為,我們需要給自己超出現有框架的思考方式。“我們在講人工智能(AI)時,也被這個詞限定了。”他認為,我們應該像前面圖靈獎得主Whitfield Diffie所說的一樣,在動物智能、人類智能以及機器智能這一更大的框架下去思考AI敘事。 ▲中國工程院院士、阿里雲創始人王堅 人類會不會被機器智能統治?他的觀點非常鮮明:“我堅定不相信AI會替代人。狗的鼻子比人靈敏很多,但我們從來不覺得這對人有什麼威脅。” 王堅認為,我們今天講所有大模型的問題,其實原來都是來形容人的。我是一個無藥可救的樂觀主義者,所以我一直相信人類自己創造的問題,人類一定會解決的。 談及中國AI的敘事,黃鐵軍對年輕從業者提出建議:要有自己的想法,更要在該下決心時下決心,不適合拿交作業、一定成功的心態面對不確定性。王堅則補充:今天中國和美國看到的是同一片大海,六年前我們可能還困在游泳池裡,如今早已面朝同一片天地,這場遠行遠未到頭。 ▲智源研究院理事長黃鐵軍 當被問及人與 AI 的關係,黃鐵軍稱人類與AI會像父母與孩子般共存融合,人類會借AI拓展人類邊界。王堅認為人類天然畏懼新技術,AI 影響未必能超越火在歷史上的作用,他以早年大眾畏懼紙筆類比當下 AI,並提出“一定要讓token變得‘不值錢’”,讓其如紙張般廉價。 王堅、黃鐵軍與主持人衛詩婕的對話全文紀要如下,智東西做了不改變原意的編輯: 1、作為雲計算之父,您在雲計算、城市大腦、AI基建、太空計算這些關鍵節點上總比別人先看到未來,這一切是基於怎樣的一套底層的思維模型? 王堅:其實沒有。今天上午聽了兩位圖靈獎得主發言,我還是很感觸的。特別是第二位Andrew Barto,他在講強化學習的時候提到了一位心理學家叫桑代克,大概是80年代初我們學心理學課本的時候學的。所以大家可以設想一下,很多時候今天已經很難講有一個想法,是你先想過還是說另外一個人先想過。所以這實際上變成一個問題:你想了之後有沒有告訴大家,更困難的是說你有沒有勇氣可以去嘗試一下,到最後就是當覺得沒有希望的時候,你能不能非常有毅力地往前多走一步。 2、您回答的非常宏觀,我要拆解一下。您寫的書裡提到事情底層是有一些共通性的,我很好奇您分析問題的底層方法論? 王堅:其實也很難講思維方式。前面第一位教授Whitfield Diffie的發言也令我很觸動。他提到,我們都在講AI,裡面蠻挑戰的一件事情是因為有這個詞,我們就會自覺不自覺地搭了這麼一個框架。就像我經常會講,這個會場決定了我們怎麼開會、你能說什麼、你有什麼方式講,所以很少有人真正去想這件事情。 所以其實現在我們在講AI的時候,有意無意地被AI這幾個字被限制住了。所以今天早上為什麼Whitfield Diffie教授在講這個事情,也觸動我的神經。大家去看一下,我大概2017年在貴陽也講了他今天講的幾乎一模一樣的東西,就是為什麼會有這個Animal intelligence(動物智能)和Human intelligence(人類智能),以及Machine intelligence(機器智能)?所以我覺得任何一件事情,你還是要給自己一個可以超出現有框架的思考框架。 所以對我來講,思考今天面臨的挑戰,我是一定會在Animal intelligence、Human intelligence跟Machine intelligence的框架下來想這件事情。所以我堅定地不相信,今天大家都講的AI會替代人。 原因也很簡單,我經常會說狗的鼻子比人要靈敏很多,可是我們從來沒有覺得有什麼傷害。所以當你有這樣一個框架的時候,其實還是幫你多想了很多問題。所以我想每個人都應當建立一套獨立的思考框架,可能會比較好一點。 3、您提到我們要有相信的事情,同時讓別人相信也很重要。當年阿里雲每年10億,連續10年投入,獲得全力資源支持很重要。如何讓大家相信你的相信? 王堅:一些東西在傳播中會變得不準確。但是有一件事還是肯定的,我們暫且不用資源這個略顯庸俗的詞。我認為一個人做事需要別人幫助,但做事不要太機會主義。 我做過一個活動叫“2050”,就是完全讓今天不出名的、沒有資源的人來參與,但他們到這個活動來不是來找資源的。其實我們有一個很簡單的想法,當你想做一件事情,當你講一件事情的時候,其實在某種意義上講,別人認為正不正確、怎麼感受,在一定意義上是不重要的。重要的不是在臺上講的人說服了下面的人相信他,而是這個年輕人在臺上講了他對世界的看法、他要做一件事情的決心,最後臺下的人信不信就變得不重要了。他自己在臺上講過這句話,他就會信了。 所以我覺得很重要的事情是,你一定要說你自己相信的事情,要說你自己會去做的事情。我相信,如果這樣的話,就一定會有人支持你。如果任何人是一個前提,就是說如果我想要做一個事情,沒有人支持我我就不會做了,那基本上會覺得沒有人會支持你。 4、黃院長,智源可以說是中國AI界的黃埔軍校,也是我們大家的未來的持續不斷AI創新的搖籃,請您講一講中國AI敘事是基於一種怎樣的相信? 黃鐵軍:智源很幸運,一個是成立在2018年這個很恰當的時間,很幸運北京市給了我們很自由的體制和長期穩定支持;而且我們很幸運的在這個恰當的時間點上做了一件正確的事,就是2020年上百人一起來攻關大模型。 在那之前,國內外已經有不少專家研究和取得進展,但真的把真金白銀幾千萬、幾個億投下去,是要決心的。所以我在恰當的時間就動手了,而且五個月推出1代大模型,然後接著過三個月第2代就已經追趕上了,所以我覺的時代給了我們一個機會。 但是我也想再多說兩句,這件事也是人類的一個漸進的過程。大模型實際上經過了幾十年的積累,先別說神經網絡,就是next token prediction(預測下一個詞元),也是 2000年就被提出來了。當然那時候作為技術演進,提出者自己也不確定效果好不好,但這個方法探索出來了,後來很多技術匯聚在一起,才有了這麼一次大的爆發。 所以我想,中國現在處在一個科技創新爆發的時間點,這裡邊有很多很多的因素。但是最重要的是兩個方面。第一你得有自己的想法,要不然那你只能隨波逐流;第二個就是該下決心的時候下決心,我們不能拿那種交作業、一定成功的思路來看待這件事,科技的不確定性永遠存在,所以要有想法,要該決定的時候就決定。 5、從追趕到定義自己的故事,中國的AI敘事是什麼樣的? 王堅:其實剛才鐵軍講那個智源的事情,我補充一下。我覺得智源還是蠻具有開創性的。我一直覺得那個時候以這樣的規模、決心來做AI,在當時還是非常不容易的。所以讓我想起一個詞,就是我們以前經常講一個東西,叫火箭科學,我們強調這個東西有多麼紮實,但是沒有比火箭更加危險、更不確定性的。 今天上午一個談話,主持人問說做安全是不是有它的確定性,結果嘉賓的回答就是實在很難說有什麼確定性,對不對?所以我想做AI這件事情,從智源開始,這也是我特別佩服的地方。 這跟以前我們做研究不太一樣。以前做研究就是要拿點經費然後做一做,基本上做好了你就告訴全世界,做不好了沒有人知道。但是現在做模型的時候,它其實跟以前不一樣。因為哪怕不要說整個模型,哪怕你就是中間的一個環節,比如你做了三個月、五月訓練,其實如果這個結果不好,他花掉的錢就相當於炸了一枚火箭,大概一個億、兩個億。可是今天,大家知道你要好好訓練一輪的話,到最後你花掉的電費,花掉的算力費大概也是在這個量級上。 所以回到這個地方,就是中國AI敘事和美國的差別,其實沒有那麼簡單,我也不好說。因為裡面有個前提:基礎研究就是全世界的,大概沒有基礎研究不是全世界的。所以你無論從哪裡看到的論文,看到的書上的東西,基本上沒有說你看不到的,應該大家都看得到。所以從這個角度講的話,它就是全世界的。回到中國跟美國的AI敘事,大家來問我們跟他們差距多大?我是不太願意用這種方式來描述我們之間的關係。 用我自己的話來講,因為在過去這些年大家的努力,我一直說至少中國美國在這個領域看到是同一片大海。如果六七年以前,我擔心的就是我們看到是個游泳池,別人看到大海,儘管遠處看看都是藍藍的,那你走近看才知道不是同一個天地。那基本上我今天還是可以說我們大家看到的是同一片天地。至於誰離得近一點遠一點,可能是一個技術性的問題了。那這這場市場發展或者這麼一個里程的話,我覺得遠不是幾天就可以走到頭。所以我們還有很長的路可以來往前走。 6、我們中國有機會提出自己的智能問題、技術路徑和創新範式嗎? 黃鐵軍:我覺得,我跟剛才王老師的意見一樣,目前,中美在大模型為代表的這個工程實現上,確實是都做的很好,但是這個問題,不能解讀為一個國家或者兩個國家的問題,它是人類整個很多思想,很多一點一滴的一個積累的過程。很簡單,你看今天兩位圖靈獎獲得者,他們也不是說就在我們通常關注的著名的大學或者機構,Hinton、Sutton都在加拿大。當然我相信這個全球這麼多學者,這麼多研究人員,實際上是在一個巨大的相互作用的社區,社群在起作用。 所以從未來,就剛才說敘事,其實我覺得,咱們中國在做,全世界也在做,其實幾十年來一直是一個大邏輯。閉幕上的時候我還會講,我今年特意選了一個題目叫,悟道一以貫之。這個當然不是我的悟道,這是孔子說的話,實際上這個道路本身就一直是那樣子。這個道路是什麼樣子? 你想想做智能,其實就兩件事,一個就是今天我們大家天天說的數據驅動,如果再說的廣一點就是功能驅動。今天,剛才兩位圖靈獎得主都講到過,你收集到這些東西,然後去訓練。然後形成一個模仿人的,或者是生物智能的一個東西。 另外一個就是結構基礎,就是那你用個什麼樣的生理和物理基礎?我們人當然我們的人的身體,我們的大腦,現在機器有Transformer,也有正在這個改進的,甚至於革命的架構,所以就這倆東西在在不斷的這個演進提升。我相信,我們中國的學者,應該在這些兩大方面都會做出越來越多的貢獻,具體例子我就不說了哈,時間有限,以前也做了一定不少貢獻,我相信未來會做更多的貢獻。 所以總而言之,就是AI,或者大家說,AGI是個人類的大敘事,我們也可以說宇宙智能進化的一個大方向。我希望,我們作為研究者也好,開發者也好,企業也好,能夠在這樣的一個進程中,都有自己的貢獻,留下自己的一個星星,都能匯聚成一個巨大的宇宙。 王堅:好,其實你問了個挺好的問題,我覺得鐵軍沒有很好的回答你。你講到關於智能的理解的這件事情。其實intelligence這個詞還是蠻有意思的,大家知道翻回中文的話。當然大家都知道,就翻成了智能。但是另外一個,還有一個比較更直接的翻譯,就是翻成情報,所以CIA就是這個intelligence,這個詞還是蠻特別的。我為什麼說,問了個很好問題? 大家都知道我是心理學背景。其實從人的角度來理解這個intelligence是什麼,其實到今天還是遠遠是個未知數。所以剛才為什麼會講這個animal intelligence、human intelligence和machine intelligence。其實關於animal intelligence這件事情,今天研究還是個謎。Human intelligence就更加深奧了。所以,三個謎搞在一起,其實還是個很複雜的事情。 所以我想這是一個很長時間可以探索的一個問題,這裡面的空間遠遠超出我們今天可以看到的實現,因為我們今天看到的東西,都是今天可以實現的東西。那到底現在這個狀況,給大家創造出一個什麼機會出來了?特別是對年輕的學者。我還是覺得應該用鐵軍自己說的話,我其實當時聽到他的發言,我也學了很多,儘管我也想過,但從來沒有這樣表達出來。他講過,但是後來,好像他自己也沒講清楚,我用鐵軍的話再說一下這個事情。 你們有可能在座有人聽見過,他講過一件很有意思的事情,他就講這個飛機是在沒有大家徹底理解空氣動力學的情況下飛起來了,你講過這個話。其實這裡面就關注到我們今天非常關鍵的問題,就是說,關於我們對這個世界本質的理解,跟我們要做的事情,它一定是交錯的來上升的。 只有當一個學科或一個領域承受到一定程度的時候,好像我們今天就可以離開這樣的迭代來發展。我個人覺得就AI也好,叫機器智能也好,今天基本上還是在一個我們對它的認識在加深,有工程的迭代,這樣的交互的情況下來做。所以嚴格意義上講,飛機飛起來以後,12年,才成立航空系,對不對? 黃鐵軍:30多年。 王堅:30多年,是吧?所以大家可以想想,飛機飛起來以後,30多年才成立了它的航空系的。所以從這個角度,如果假定我們今天講AI是一個大的變革的話,我們可能真的還遠沒有到能夠成立真正意義上的AI系的時候,所以這個對年輕人是極其有誘惑力的。 也就是說這個世界,不要說有沒有問題解決,這個世界的開始都是非常早期的,所以基本上就是一個世界開始的混沌期,這是我對這個事情的理解。那鐵軍講的航空的例子,我覺得更好來佐證這件事情。 所以絕對有機會提出自己的智能問題。不是絕對有機會,就是不提出都是你的過錯。 7、今年陶哲軒和DeepMind的Agent智能體AlphaEvolve合體破解了一個塵封50多年的世界級數學難題Erdős,王堅教授,您認為AI是不是已經開始推動人類智能的邊界了?您看到新範式了嗎? 王堅:其實這個對我個人印象還是非常深的。也就是說,當我們今天的大語言模型出來以後,或者這樣的一個架構出來以後,當然在語言上我們是首先看到的,是吧?儘管當時就是為了做機器翻譯做出來的,但是這就想到了最早,大概在84年、85年的時候,當時就是達特茅斯開會的那10個人之一,就Herbert Simon到我們系裡來講課,講AI。所以那個時候其實都是在講邏輯的問題。反正你看那個時候所有AI的問題,都是那些編出來的問題,所以它叫toy problem,就是說玩具性的問題,無論是機器視覺也好。 所以,到了今天,你就會發現一個質的變化,先不說從理論上、工程上,你就會發現一個非常質的變化,也就是說大家要解決的問題,再也不會是個toy problem,都是可能對人理解都是非常困難,這是一個非常非常質的變化,至少在我看來。這些問題都已經超出我們的想象,這是第一個。 第二個,從今天發展,大家可以看到,很有意思的一件事,就是跟數據有關係,因為過去大語言模型所有的數據其實本質上都是文本,無論你從互聯網上來也好。那麼中間你看有一個非常有意思的事情,就是我們今天非常熟悉的,也變成一個潮流的vibe coding。在中間,就有出來一個東西叫代碼,那大家知道代碼這個,大家如果最早寫過代碼,你知道代碼最簡單的就是開始寫的時候,在Linux上寫代碼的時候,你就用一個文本編輯器就好了。 就是沒有比文本編輯器再簡單的編輯,所以從這個角度它還是文本。但是在這個領域有人說過一句話的,就是不要把代碼當作文本,就don’t treat code as a text。 所以,從這個邏輯上,代碼就不是文本,所以它為什麼在那個領域,包括我們今天看到這個改變了我們程序員工作的方式,事實上,AI往前走了一大步,它真的在某種意義上,能夠區分出來什麼是我們講的語言的文本,什麼是我們寫代碼的文本。今天這個智源發佈,談到了像生命科學蛋白質這些事情嘛,再往下就是什麼是真正的科學意義上的數據,這是完全不同的。所以我一直有時候覺得AI開始理解科學了,結果他們用的是不是科學論文裡邊的文本的話,我覺得這個是有它的非常大的侷限性的,直到你能夠理解真正意義上的科學的數據,這也就是智源今天在講生命的裡邊做的個東西。但是,碰巧我們就理解了,也是碰巧今天有機會我們可以去理解真正意義上的科學的數據了。所以當你能夠真正理解科學的數據得時候,科學一定會改變,所以它會徹底改變我們過去科學研究的一個方法。 我們過去科學研究怎麼來做的?就是一個科學家,或者一組科學家,他們自己去收集數據,完了自己理解數據,事實上只理解了一遍,最後寫成論文發表,這個數據就從此放在那。所以,你看整個的邏輯就是一小部分人,甚至只有一個人,對一個非常困難收集起來的數據理解過一次,這個故事就結束了。所以,有AI就會發現,其實我們有的科學數據可以被不同的人、用不同的方式、在更大的規模上理解了,所以我想它對科學的影響是非常長遠。 如果從歷史上你看有兩件事情,很有意思的一件事情,因為我們講數據的時候,有時候特別會講我們要去收集一些新的數據。但你看AlphaFold,你看這個AlphaFold其實沒有去新收集新的數據,它用的都是以前沉澱下來的數據,但是這個在科學發展歷史上不是孤立的。伽利略也從來沒有去收集過數據,他用的數據都是別人這個收集起來的。 所以,我想我們到了這個時代,就是所有科學的數據都會因為AI的出現,會被重新理解一遍。這個時候,這個變化你大概可以想想會有多大。所以我想首當其衝一定是科學研究本身,就像當能理解代碼的時候,首先受到衝擊的就是程序員本身,我覺得這個邏輯是一致的。 8、當Agent可以改變世界的時候,我們怎麼去界定它的危機?怎麼把它控制在一個可控範圍內,確保它對人類有益? 黃鐵軍:我覺得,就是剛才講的控制、確保這些詞,大概都不現實,這個是一個互動,一個很複雜的事件。但是我們確實要考慮,共存。智能體也是智能體,智能,我們也是智能。我們每個人可能將來都自己都會有很多智能體,大家去互動。在這樣的一個多智能體,包括人,機器智能體,包括物理智能體,具身在內的一個複雜的世界裡邊,總要有一個界面和共識。否則的話,咱人類世界也一樣的。世界應該是什麼?我大概兩三年之前寫過,也是個採訪,我覺得就是理性世界。因為我們說智能體是黑箱。剛才說你不可理解,它只會告訴我們答案,它也不告訴我們怎麼想到的。 其實人類也一樣,每個人人腦也是一個黑箱。那你到底跟一個人交流的時候,你到底是隻相信他告訴你結論?你還是要跟他探討一下,為什麼你這麼想。為什麼你給我醫生給我個建議背後有什麼。我們肯定是關心這個問題。所以將來也是一樣的哈,智能體,現在首先它能給出一個不錯的答案,很好。 但是接著,我相信大家就會挖背後的為什麼了,會討論,只有我們像醫療這種安全重要的領域,包括剛才蛋白質有害蛋白這些東西的時候,一定是要最後有一個明確結論,咱才能變成行動,變成後續的之前的,大概都是一個開放討論。大家可以腦風暴,互相思考,人跟智能體之間,我相信應該是這樣的一個過程。所以一方面,我覺得不能完全確保他的這個控制,但是,我覺著我們能夠共同找出一條路來共存,來理性的發展下去。 王堅:其實這個問題的結論,我覺得我跟鐵軍是100%一樣的。但是為了表明我這個說100%不是為了自己偷懶,不表達自己的觀點,我還是說一下。真的跟鐵軍,我沒跟鐵軍對過這個問題,但真的跟他100%一樣,我還是想說一下,用我的方法來表達一下。 其實大家可以設想一下,比如說當大語言模型出來的時候,大家會批評一個東西嘛。批評他說當時就說,他有幻覺。有hallucination。大家可能,但是很少人想過,hallucination這個詞,本來就是來形容人的。也就是說我們今天講所有大模型的問題,你把它找出來看一看,其實原來都是來形容人的。 所以,人就是有這個問題的。有時候人的幻覺可能比我們想象的要嚴重的,要嚴重的多。我為什麼這麼看?反正這個大家理解,我是一個無藥可救的樂觀主
Related
相關文章

Edge AI Daily 早報(6月19日)
AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

今天起,Claude Design要把設計師和程序員變成同一種人了
猝不及防!Anthropic深夜甩出Claude Design大更新,設計系統一鍵導入,代碼雙向同步,9大平臺一鍵導出。Anthropic設計師親自下場錄屏:AI跑了八輪自查,才敢把設計稿給你看。

OpenAI 成為 Rust 基金會白金會員,合計贊助 60 萬美元
OpenAI 正式成為 Rust 基金會白金會員,將提供總計 60 萬美元資金,用於支持 Rust 開源項目維護者及 Rust 創新實驗室等計劃。這標誌著 AI 巨頭對安全、高效系統編程語言的重視。 #OpenAI #Rust #開源

Claude Design 上線首周用戶破百萬,和 Claude Code 共享 AI 配額
Anthropic 今天(6 月 18 日)發佈公告,在宣佈 Claude Design 上線首周用戶規模突破 100 萬後,進一步強化和 Claude Code 的雙向聯動,實現從設計到編程的無縫工作流。
谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元
智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

微軟,考慮接入DeepSeek
這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。