醫療AI新高地：百川智能發佈M4 模型，實現“真人醫生”式主動問診

2026年6月23日 02:306500 次瀏覽

重點摘要

百川智能與清華髮布醫療大模型Baichuan-M4，在HealthBench及其Hard、Professional三項評測中奪冠，性能超越GPT-5.5。其核心突破在於交互模式革新，結合強大推理與臨床知識，探索醫療垂直領域應用。

站內 AI 整理稿

### 重點整理：Baichuan-M4 如何改寫醫療 AI 樣貌

百川智能與清華大學共同發布的 Baichuan-M4 醫療大模型，近期在 HealthBench 及其 Hard、Professional 兩個進階評測項目中拿下冠軍，表現甚至超越目前業界主流的通用大模型基準。不同於過往僅被動回答問題的醫療 AI，M4 最引人注目的突破在於「主動問診」的互動模式——它能像真人醫師一樣，根據病患描述的症狀進行推論、反問細節，進一步導向更精準的判斷，這項能力也讓它被視為醫療垂直領域的 AI 新高地。

### 背景脈絡：從「聊天機器人」到「臨床推理助手」的演化

過去，醫療領域導入大語言模型時，經常面臨「回答看似合理但缺乏醫療邏輯」的窘境，尤其在問診環節，AI 往往只針對單一句子給出答案，無法像醫師透過問診流程逐步釐清病情。百川智能與清華團隊正是看準這個痛點，將模型訓練聚焦於臨床思維鏈與專業知識庫的結合，讓 M4 具備類似「病史採集—鑑別診斷—建議處置」的推理能力。這項技術路徑讓醫療 AI 從單純的「資訊檢索工具」，躍升為能參與診斷流程的「輔助決策夥伴」。

### 可能影響：基層診所與遠距醫療將率先受惠

M4 的主動問診功能，對台灣目前分級醫療與遠距會診的發展尤其具有參考價值。當病患先在基層診所或居家使用 AI 問診系統時，M4 可以引導其補充關鍵症狀、用藥史與生活習慣，大幅減少因資訊不足而誤判的風險。對於人口老化、偏鄉醫療資源稀缺的地區，這類模型也能扮演「第一線智能分診」的角色，協助非專科醫師快速鎖定轉診方向。

### 產業競局：百川選擇垂直領域，挑戰通用模型霸權

值得注意的是，M4 在評測中勝過 GPT-5.5 這類通用大模型，顯示「專科化」策略正在改變 AI 競爭格局。過去業界普遍認為通用模型只要參數夠大、資料夠多，就能應付所有場景；但百川與清華的案例證明，針對醫療領域的臨床知識萃取與互動邏輯設計，反而能堆疊出更高實用性的競爭門檻。這也讓更多開發者重新思考：在醫療、法律、金融等高度專業領域，垂直專用模型或許比一味追求參數規模更有效率。

### 讀者可關注的後

原始來源：AIBase ↗

查看原始來源

36氪醫療AI

AI醫療賽道擠滿互聯網大廠

互聯網大廠如百度、阿里、騰訊等全面布局AI醫療賽道，運用大語言模型與生成式AI，目標是滲透臨床決策、藥物研發及醫院管理，試圖解決過去十年線上醫療平台盈利與信任的困境。然而，數據隱私、合規問題及AI診斷的責任歸屬仍為主要挑戰，且醫療AI能否順利落地取決於監管標準、產品效果及可持續的商業模式。

8 小時前閱讀分析

36氪醫療AI

基於Gemini 1.5長上下文能力，谷歌對話式醫療系統AMIE在100例多次就診場景中達到全科醫師的推理水平

谷歌基於 Gemini 1.5 的長上下文能力，開發出對話式醫療系統 AMIE。該系統在一百例多次就診場景的測試中，其臨床推理能力已達到全科醫師的水平。此外，AMIE 在虛擬客觀結構化臨床考試（OSCE）中也展現出與全科醫師相當的表現。

10 小時前閱讀分析

AIBase醫療AI

Midjourney跨界大動作：佈局人體掃描，打造“Spa”式健康體驗

Midjourney跨界進軍醫療影像，提出創新身體掃描方案：在環形艙內配置50萬枚沙粒大小超聲傳感器，多角度採集數據，一分鐘內生成高精度三維人體影像。此舉將數字生成技術延伸至醫學領域，有望革新快速檢測體驗。

1 天前5500閱讀分析

量子位醫療AI

AI看病成為醫患新包袱？補上「多輪追問」，通用AI才邁得過醫療關

這篇消息聚焦「AI看病成為醫患新包袱？補上「多輪追問」，通用AI才邁得過醫療關」。原始導語提到：M4是大腦，百小醫是身體從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

4 天前閱讀分析

AIBase醫療AI

從生成圖像到醫療影像，Midjourney 推出全身超聲掃描儀

Midjourney跨界醫療，發佈首款硬件超聲全身掃描儀，利用環形傳感器獲取接近核磁共振級體內三維圖像。計劃2027年底前在舊金山開設配套體檢水療中心，部署約10臺設備，並與Butterfly Network合作開發。

4 天前5300閱讀分析

量子位醫療AI

困住醫療AI的死循環，終於有國產玩家跑通了

醫療AI長期陷入「缺乏高品質數據→模型不可靠→醫院不願開放數據」的死循環，導致多數團隊無法規模化落地。如今，一家國產廠商在關鍵醫療測評中超越GPT-5.5，透過貼近臨床需求的模型設計、多模態架構及隱私計算技術，有望打破僵局。這項突破不僅可能減輕醫師負擔、加速AI成為日常工具，也顯示中美在醫療垂直領域的技術差距正在縮小。

5 天前閱讀分析

相關文章