Claude把病毒起源算錯90年，都是網頁惹的禍？

2026年6月10日 15:43

重點摘要

AI模型Claude因缺乏機器可讀的生物科學數據接口，導致病毒起源計算出現90年誤差。專家指出，若加入適當的工具層來改善數據結構，可大幅提升AI在該領域的分析準確性。

站內 AI 整理稿

### 重點整理：Claude 算錯病毒起源九十年，問題出在網頁資料？

近期有觀察指出，AI 模型 Claude 在回答病毒起源相關問題時，出現了高達九十年的計算誤差。這個看似離譜的失誤，並非單純的模型「犯錯」，而是反映了當前大型語言模型處理科學數據時的根本困境：生物科學領域的大量資料，仍以非結構化網頁形式存在，缺乏標準化的機器可讀接口，導致 AI 在提取與推理時容易受到文本敘述的模糊性或時間標註不一致所誤導。

### 背景脈絡：網頁文本並非為機器設計

AI 模型如 Claude、GPT 等，主要依賴從網路上爬取的文本進行訓練。然而，生物醫學文獻、病毒基因序列資料、流行病學數據等，多半以 PDF、HTML 網頁或圖表形式呈現，缺乏 API 或結構化標記（如 JSON-LD）。這使得模型在處理時間順序、因果關係或數值計算時，容易因上下文錯置或單位轉換錯誤而產生偏差。舉例來說，一篇論文可能提到「1918 年流感病毒株的祖先可追溯至 1800 年代」，但若 AI 缺乏對「可追溯至」語意的精確理解，便可能推算出錯位數十年的結論。

### 工具層的關鍵角色：從文本到可靠數據

要改善此類偏差，專家建議在 AI 系統中導入「工具層」（Tool Layer）。所謂工具層，是指讓模型具備呼叫外部結構化資料庫、API 或即時搜尋引擎的能力，而非單純依賴內部參數中的記憶。例如，當 Claude 被詢問病毒起源時，若能自動連接 NCBI 基因庫或 WHO 資料庫，透過標準化接口取得明確的發布日期與基因演化年代，便能大幅降低幻覺與計算錯誤。簡而言之，工具層是將 AI 從「閱讀網頁的學生」升級為「能查閱官方檔案的學者」。

### 可能影響：科學決策與公眾信任的雙重風險

若此類錯誤未被正視，可能對公共衛生決策產生連鎖影響。例如，病毒演化時間的錯誤推算，恐誤導疫苗研發的優先順序；或讓記者與民眾引用錯誤的年代數據，引發不必要的恐慌。另一方面，這事件也凸顯學術界與科技業間的鴻溝：生物科學數據庫雖豐富，卻缺乏讓 AI 直接調用的「機器友善」設計。若長期不改善，AI 在科學領域的應用信任度將難以建立，甚至可能被視為不可靠的「維基百科複讀機」。

### 讀者可關注的後續：數據基礎設施的改造浪潮

未來幾個月，我們可以留意幾個發展方向：第一，主要科技公司如 Anthropic、OpenAI 是否會強化其工具層功能，例如提供「學術模式」自動查驗數據來源。第二，學術出版商與資料庫（如 Nature、PubMed）是否會加速推出結構化 API，讓 AI 能以標準格式讀取元數據。第三，監管機構可能開始要求生成式 AI 在涉及科學事實時，必須明確標註資料來源與置信度。對於一般讀者，使用 AI 查詢科學問題時，建議同步交叉比對官方資料，並留意模型是否標註「引用來源」。

### 總結：資料品質決定了 AI 的天花板

Claude 算錯病毒起源這則案例，其實是一記當頭棒喝：AI 的準確性終究取決於它所接觸的數據品質。網頁雖是資訊寶庫，但缺乏結構化容器，就像把書頁丟進碎紙機再讓 AI 拼湊一樣，出錯在所難免。未來，真正的進步不在於模型參數的堆疊，而在於如何為科學數據打造一層可靠的「機器介面」——這或許是台灣在生醫資訊領域可以著力的利基點。讀者不妨持續關注「工具層」相關技術（如 Retrieval-Augmented Generation, RAG）的發展，它們很可能成為提升 AI 實用性的關鍵鎖匙。

原始來源：36氪 ↗

查看原始來源