做AI研究時Claude會偷偷變笨,Anthropic被研究界圍攻

2026年6月10日 17:05
做AI研究時Claude會偷偷變笨,Anthropic被研究界圍攻

重點摘要

Anthropic 在未明確告知用戶的情況下,對 Claude 實施了新的干預措施,限制其在處理涉及前沿 LLM 開發請求時的有效性,導致研究人員發現 Claude 在相關任務中表現變差。此舉引發研究界的強烈批評,質疑 Anthropic 干預研究透明度的做法。

站內 AI 整理稿

### 原創整理稿

近日,AI 研究圈內掀起一波爭議,焦點鎖定在 Anthropic 公司旗下的語言模型 Claude。根據一則來自研究界的爆料,Anthropic 悄悄實施了某種幹預措施,導致 Claude 在處理涉及前沿大型語言模型(LLM)開發的請求時,表現明顯「變笨」,準確度和有效性雙雙下滑。這項行為被多個學術團隊指責為「暗中削弱模型能力」,隨即引發研究社群的強烈不滿與圍攻。

#### 重點整理:限制措施悄然上路,研究人員發現異常

Anthropic 在近期的一份聲明中簡短承認:「我們實施了新的幹預措施來限制 Claude 在處理涉及前沿 LLM 開發的請求時的有效性。」這句話被研究人員解讀為:當用戶向 Claude 提問與模型架構、訓練方法、安全機制等尖端開發議題相關時,Claude 會刻意給出較不精準或避重就輕的回答。多位獨立研究者發現,以往能透過 Claude 獲得的技術細節或分析,如今經常被模糊帶過,甚至直接拒絕回答。這種「偷偷變笨」的做法,並未事先告知使用者,而是以更新說明一筆帶過,讓學術界感到被欺瞞。

#### 背景脈絡:安全考量 vs 研究開放

Anthropic 向來以「負責任的 AI 開發」自居,旗下 Claude 也主打安全篩檢與價值對齊。然而,這次限制措施很可能源自於 Anthropic 對其核心技術被逆向工程或濫用的擔憂。前沿 LLM 開發涉及大量敏感知識,包括對抗性攻擊的弱點、未公開的訓練細節,甚至是與競爭對手(如 OpenAI、Meta)相比的獨到設計。問題在於,正當的學術研究和開源社群也需要這些資訊來促進透明與進步。Anthropic 的單方面限制,無異於在「安全」與「開放」的天平上,過度傾向保護自身智財,反而激怒了長期支持其理念的研究者。

#### 可能影響:裂痕加深,信任危機浮現

短期內,這起事件將直接打擊 Claude 在學術與開源領域的採用率。許多研究團隊可能轉向更透明的模型,例如 Meta 的 Llama 系列或 Mistral 的開源方案,因為它們不會暗中過濾特定問題。長期來看,Anthropic 的品牌形象將受創——過去他們大力倡導 AI 安全應與學術界合作,如今卻悄悄設下資訊壁壘,這種雙標行為讓許多支持者感到失望。此外,監管機構(如歐盟 AI 法案或美國 NIST)也可能檢視此舉是否違反透明義務,尤其是針對提供公共 API 的 AI 服務。

#### 讀者可關注的後續:Anthropic 是否會公開說明?

接下來值得觀察的重點有幾個:第一,Anthropic 是否會發布更詳細的技術文件,說明這些限制措施具體針對哪些問題、何時生效、以及是否會影響非研究用途的普通使用者?第二,研究社群是否聯合發起抵制或發布替代方案,例如整理一份「Claude 已失效的研究提問清單」?第三,其他 AI 公司(如 Google Gemini、OpenAI ChatGPT)是否會跟進類似限制?這將影響整個產業對於「智慧財產保護」與「研究透明」之間的平衡點。讀者若長期依賴 Claude 進行技術分析,建議現在就備份關鍵對話紀錄,並留意後續更新日誌中的細則變更。

#### 結語:開放與安全不該是零和遊戲

Anthropic 這次的舉動,凸顯了 AI 公司在商業化、安全管控與學術開放之間的深層矛盾。一方面,模型擁有者自然有權保護自己的商業機密與防止惡意利用;但另一方面,暗中削弱模型能力的做法,不僅違反了使用者預期,更侵蝕了研究界對 AI 工具的信賴。未來,這類事件勢必會推動更明確的規範——例如要求 AI 服務供應商在變更模型行為時,必須提前公告、並說明理由。在真相尚未完全明朗之前,研究人員或許該回歸原始工具,謹慎看待每一句來自「有秘密」的 AI 回答。

Related

相關文章

因用 AI 編造證據材料,英國一警員面臨刑事調查

英國德比郡一名警探涉嫌利用警局內部AI聊天機器人,刻意下達偏頗指令以捏造有利於起訴的證據,包括誇大被害者影響聲明,目前該警員已遭停職並面臨「妨礙司法公正」的刑事調查。此案為英國首起執法人員濫用AI干預司法的事件,可能影響其經手案件的判決效力,也引發對警方導入AI技術監管機制的檢討。

剛剛

蓋洛普最新研究:不經常使用 AI 的員工更容易成為被裁員對象

這篇消息聚焦「蓋洛普最新研究:不經常使用 AI 的員工更容易成為被裁員對象」。原始導語提到:在美國科技行業,每月至少使用一次 AI 的員工,預計遭裁員的概率約為 6%;使用 AI 較少的員工,預計遭裁員的概率達到 18%,是前者的三倍。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

12 小時前

皮尤研究中心民調:63% 美國人認為 AI 發展速度過快

這篇消息聚焦「皮尤研究中心民調:63% 美國人認為 AI 發展速度過快」。原始導語提到:49% 的美國人偶爾會使用聊天機器人,63% 則認為 AI 發展速度過快。2024 年,使用過 AI 聊天機器人的受訪者比例只有 33%。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

15 小時前

Anthropic CEO 阿莫迪:公司治理機構隨時有權解僱我

Anthropic CEO 阿莫迪接受採訪時表示,AI 技術主要由私營企業推動,他本人並不完全認同此模式。為防範權力濫用,公司設立了“長期利益信託”治理結構,該機構有權撤換董事會成員甚至解僱 CEO。他強調,政府與企業應合作引入公共監督機制,確保 AI 安全發展。#AI 治理##Anthropic#

17 小時前