谷歌測試Gemini桌面版新功能:推系統級聽寫與光標追蹤
重點摘要
谷歌面向部分用戶測試 macOS 客戶端重大語音升級,推出三大核心功能:系統級語音聽寫,支持全局快捷鍵在任何應用中實現語音轉文字輸入;“魔法指針”,讓 Gemini 實時追蹤光標懸停內容,確保視覺與邏輯同步;以及多設備連接菜單,暗示未來跨桌面協同。此次還重新設計了 Gemini Live 界面。
### 谷歌測試 Gemini 桌面版新功能:系統級聽寫、光標追蹤與跨裝置協作雛形
谷歌近期針對 macOS 客戶端展開一項重大語音升級測試,為旗下 AI 助手 Gemini 注入三大核心功能:系統級語音聽寫、即時光標追蹤的「魔法指針」,以及多設備連接選單。同時,Gemini Live 的介面也迎來重新設計。這項更新預示著谷歌正將 AI 助手從單純的對話工具,推向更深層的系統層級整合,特別是對依賴語音輸入與多工切換的專業用戶而言,可能帶來效率上的顯著改變。
#### 重點整理:三大功能與介面翻新
首先,**系統級語音聽寫**是本次升級的最大亮點。不同於過去只能在 Gemini 應用內進行語音輸入,新功能支援全局快捷鍵,讓用戶在任何 macOS 應用程式中(例如文字編輯器、郵件、筆記軟體)直接透過語音轉寫文字。這項設計大幅降低了語音輸入的跨應用門檻,對於需要頻繁打字又希望減少鍵盤負擔的使用者,可望成為日常生產力的輔助工具。
其次,**「魔法指針」**功能則讓 Gemini 能即時追蹤鼠標光標懸停的內容。當用戶將光標移到某段文字、圖片或程式碼區塊時,Gemini 會自動識別該區域的資訊,並根據上下文提供即時建議或動作。例如在瀏覽網頁時,光標停在一個陌生詞彙上,Gemini 可立即顯示解釋;停在日期上,則可能觸發行事曆事件建立。這項技術確保了視覺與邏輯的同步,減少用戶手動選取與切換視窗的步驟。
第三,**多設備連接菜單**暗示了未來跨桌面協同的可能性。雖然測試階段尚未揭露具體功能細節,但此項目的出現代表谷歌正在考慮讓 Gemini 在不同裝置(如 Mac 與其他 ChromeOS 或 Android 設備)之間維持連續性的對話與任務流。此外,Gemini Live 的介面也經過重新設計,可能強調更直覺的操作按鈕或更流暢的對話體驗。
#### 背景脈絡:谷歌 AI 助手從行動端走向桌面深度整合
近年來,各大科技巨頭紛紛將 AI 助手從手機語音助理升級為桌面級生產力工具。微軟的 Copilot 已整合進 Windows 與 Office 生態,而蘋果的 Siri 也在 macOS 上逐步強化系統控制能力。谷歌過去在行動端累積了豐富的語音辨識與自然語言處理經驗,但桌面版 Gemini 過去相對保守。這次針對 macOS 客戶端的測試,顯然是為了填補桌面端的深度整合缺口,尤其著重於「無縫的跨應用互動」——用戶無需離開當前工作軟體,就能透過語音或光標觸發 AI 輔助。
值得注意的是,系統級語音聽寫與光標追蹤兩項功能,對隱私與權限管理提出了更高要求。谷歌在測試階段可能已在 macOS 的輔助功能框架下取得必要的 API 權限,但正式推出後,用戶仍需評估語音資料是否會上傳至雲端處理,以及光標追蹤是否觸礁到敏感內容(如密碼欄位)。這部分或許會成為未來用戶討論的焦點。
#### 可能影響:提升多工效率,但也考驗生態相容性
從生產力角度來看,系統級聽寫與光標追蹤若能穩定運作,將能大幅減少用戶在鍵盤與滑鼠之間來回切換的次數。例如,撰寫報告時可一邊用語音輸入草稿,一邊用光標懸停在數據來源上,讓 Gemini 即時驗證數字或補充說明。對於內容創作者、程式設計師或需要大量閱讀的研究人員,這類非侵入式的 AI 輔助可能比對話式聊天機器人更符合實際工作流程。
然而,這項更新目前僅限於 macOS 客戶端測試,且可能只對特定用戶開放。谷歌若要擴展到 Windows 平台,需重新適應不同作業系統的輔助功能規範。此外,多設備連接菜單雖然令人期待,但實際能否順利支援跨品牌裝置(例如 Mac 與 Android 手機)仍需觀察。若最終僅侷限於 ChromeOS 與 Android 生態,對 macOS 用戶的吸引力可能打折扣。
#### 讀者可關注的後續
目前這項功能仍處於測試階段,尚未公布正式上線時程。讀者可以留意以下幾個面向:
1. **正式版推出範圍**:谷歌很可能在下一波 Chromium 瀏覽器或 Gemini 應用更新中納入這些功能,屆時是否僅限 Mac 用戶,或同步支援 Windows,將影響普及程度。
2. **隱私與安全設定**:由於系統級聽寫與光標追蹤涉及系統權限,建議用戶關注谷歌是否提供明確的資料處理政策,以及是否允許使用者關閉特定功能以保護隱私。
3. **多裝置協作的實用性**:若多設備連接菜單能在不同作業系統之間實現任務接力(例如在 Mac 上開始的語音指令,在 Android 手機上繼續執行),將是跨平台體驗的一大突破。
4. **語言支援與台灣在地化**:目前測試的
Related
相關文章

往 Codex 裡塞塊無限畫布,AI 改圖終於能指哪打哪了
這篇消息聚焦「往 Codex 裡塞塊無限畫布,AI 改圖終於能指哪打哪了」。原始導語提到:Codex 正在變成打工人的 AI「工作臺」 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

實測專業版豆包,68塊值不值?
這篇消息聚焦「實測專業版豆包,68塊值不值?」。原始導語提到:豆包也想賺錢了。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

高通帶來 Dragonfly 數據中心產品組合:HBC 架構、C1000 CPU、AI300 推理加速器
HBC 將芯片分為主 SoC 和 HBC 堆棧,均位於標準 2D 有機基板上。HBC 堆棧由底部近內存加速器單元和上方 TSV LPDDR DRAM Die 組成。
蘋果 iOS 27 更新:Siri 迎來“雙模”時代,ChatGPT 自由切換
蘋果 iOS 27 更新為 Siri 推出獨立應用,採用聊天機器人界面,支援文字輸入、圖片及文檔上傳,並可保存對話歷史。這項升級突破傳統語音交互限制,實現更流暢的多任務協作。
騰訊Marvis馬維斯iOS版正式上線,實現全平臺覆蓋與桌面級遠控
騰訊系統級AI助手Marvis iOS版上架App Store,補全移動端拼圖。至此,安卓、Windows、macOS及iOS全端覆蓋,通過多端賬號互通強化跨設備協同。其核心優勢是打破系統壁壘,支持安卓與Mac、iOS與Windows等異構生態互聯,實現跨端無縫銜接。
Figma 發佈重大更新:新增原生代碼層、動畫支持與 Weavy 工作流生成功能
Figma首次將代碼層引入畫布,同步推出運動、著色器與自定義AI插件,旨在消除設計與工程壁壘,實現協作關鍵突破。過去一年已上線AI原型工具Figma Make,並整合Claude Code及Codex,深化代碼集成。