基於Gemini 1.5長上下文能力，谷歌對話式醫療系統AMIE在100例多次就診場景中達到全科醫師的推理水平

2026年6月22日 19:05

重點摘要

谷歌基於 Gemini 1.5 的長上下文能力，開發出對話式醫療系統 AMIE。該系統在一百例多次就診場景的測試中，其臨床推理能力已達到全科醫師的水平。此外，AMIE 在虛擬客觀結構化臨床考試（OSCE）中也展現出與全科醫師相當的表現。

站內 AI 整理稿

### 基於Gemini 1.5長上下文能力，谷歌對話式醫療系統AMIE在100例多次就診場景中達到全科醫師的推理水平

谷歌旗下的人工智慧研究團隊近日公布了一項重要進展：其開發的對話式醫療系統AMIE，在模擬多次就診的臨床場景中，展現了與全科醫師相當的推理能力。這套系統之所以能達到如此表現，關鍵在於底層採用了Gemini 1.5模型的長上下文技術——它能同時處理跨越多輪、時間跨度較大的患者病史與診斷紀錄，讓AI在複雜醫療對話中保持連貫的邏輯推演。

AMIE的全稱是「Articulate Medical Intelligence Explorer」，最初是谷歌針對診斷對話所設計的實驗性系統。與傳統問答式醫療AI不同，AMIE模擬的是醫生與患者之間來回溝通、逐步蒐集線索的過程，包括追問症狀細節、釐清用藥歷史、排除混淆因素等。這次測試特別設計了100例虛擬病患多次就診的情境——例如患者因為同一症狀反覆回診，或是慢性病在不同時間點出現變化——這對AI的記憶與推理整合能力是極大考驗。

在醫療教育領域，OSCE（客觀結構化臨床考試）是評估醫學生臨床推理能力的標準方法。受試者需在模擬場景中面對標準化病人，完成問診、檢查、診斷與治療建議。谷歌研究團隊讓AMIE參與了這場虛擬OSCE，結果顯示它在臨床推理的關鍵指標——包括病史收集、鑑別診斷生成、診斷合理性——都與受過訓練的全科醫師水準相當。值得注意的是，由於Gemini 1.5能一次處理超過百萬個token的內容，AMIE可以完整回顧病患在多次就診中的全部對話紀錄，不會因上下文長度限制而遺漏關鍵線索。

這項進展的潛在影響不可小覷。首先，它展示了生成式AI在「連續性醫療照護」中的應用潛力——許多慢性病患者需要長期追蹤，若能由AI輔助醫師梳理整個病程，將大幅減少誤診與遺漏。其次，在醫療資源相對稀缺的偏鄉或基層診所，AMIE這類系統可扮演「第二意見」角色，協助非專科醫師做出更精準的判斷。但同時也引發了監管與安全層面的討論：AI的推理過程是否可解釋？若因建議錯誤導致患者受害，責任歸屬為何？這些都需要進一步的法規框架來釐清。

讀者接下來可以關注幾個發展方向：一是谷歌是否會將AMIE推進真實臨床試驗，與人類醫師在實際門診環境中進行對比；二是各國醫療監管機構（如美國FDA、台灣衛福部）對於這類「對話式診斷AI」的審查標準何時出爐；三是隱私保護機制——當系統需要處理完整的多次就診紀錄時，如何確保病歷資料不被濫用或外洩。此外，Gemini 1.5的長上下文能力能否進一步拓展到急診、重症等時間壓力極高的場景，也是值得觀察的技術指標。

總體而言，谷歌AMIE的這項成果是醫療AI從「單次問答」邁向「連貫推理」的重要里程碑。它並非意在取代醫師，而是試圖成為醫療團隊中更聰明的夥伴——能記住每位病患的過去，並在複雜的臨床迷宮中，協助人類醫生找出最合理的診斷路徑。不過，從實驗室到診間，還有技術驗證、法規合規與社會信任等關卡需要一一跨越。

原始來源：36氪 ↗

查看原始來源

AIBase醫療AI

Midjourney跨界大動作：佈局人體掃描，打造“Spa”式健康體驗

Midjourney跨界進軍醫療影像，提出創新身體掃描方案：在環形艙內配置50萬枚沙粒大小超聲傳感器，多角度採集數據，一分鐘內生成高精度三維人體影像。此舉將數字生成技術延伸至醫學領域，有望革新快速檢測體驗。

10 小時前5500閱讀分析

量子位醫療AI

AI看病成為醫患新包袱？補上「多輪追問」，通用AI才邁得過醫療關

這篇消息聚焦「AI看病成為醫患新包袱？補上「多輪追問」，通用AI才邁得過醫療關」。原始導語提到：M4是大腦，百小醫是身體從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

3 天前閱讀分析

AIBase醫療AI

從生成圖像到醫療影像，Midjourney 推出全身超聲掃描儀

Midjourney跨界醫療，發佈首款硬件超聲全身掃描儀，利用環形傳感器獲取接近核磁共振級體內三維圖像。計劃2027年底前在舊金山開設配套體檢水療中心，部署約10臺設備，並與Butterfly Network合作開發。

4 天前5300閱讀分析

量子位醫療AI

困住醫療AI的死循環，終於有國產玩家跑通了

醫療AI長期陷入「缺乏高品質數據→模型不可靠→醫院不願開放數據」的死循環，導致多數團隊無法規模化落地。如今，一家國產廠商在關鍵醫療測評中超越GPT-5.5，透過貼近臨床需求的模型設計、多模態架構及隱私計算技術，有望打破僵局。這項突破不僅可能減輕醫師負擔、加速AI成為日常工具，也顯示中美在醫療垂直領域的技術差距正在縮小。

4 天前閱讀分析