Claude驚人真相被教授曝光：思考過程加密，給錢也看不到

2026年6月24日 10:31

重點摘要

這篇消息聚焦「Claude驚人真相被教授曝光：思考過程加密，給錢也看不到」。原始導語提到：Claude的「黑箱時刻」：思考過程被加密，Anthropic要塌房？從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

### Claude驚人真相被教授曝光：思考過程加密，給錢也看不到

近日，Anthropic 旗下 AI 模型 Claude 的內部運作機制引發學術界高度關注。一位國外教授在公開場合揭露，Claude 的「思考過程」已被加密處理，不僅外界無法一窺其推理邏輯，就連付費使用者也無法取得這些內部資訊。這項發現迅速在 AI 社群與技術論壇中擴散，被形容為 Claude 的「黑箱時刻」，也讓 Anthropic 面臨透明性與可信度的雙重挑戰。

所謂「思考過程加密」，指的是 Claude 在生成回應時，其內部推論步驟、注意力分配、以及決策路徑等關鍵資訊，都被以某種技術方式封裝，無法透過 API 或介面直接讀取。這與過去 OpenAI 或 Google 部分模型提供「輸出 token 機率」或「注意力權重」等可視化工具的做法形成對比。教授指出，這種設計雖然能保護商業機密與防止惡意逆向工程，但也讓外界難以驗證模型的偏誤、安全性或邏輯一致性。

背景方面，Anthropic 一向以「負責任 AI」自居，強調模型安全性與紅隊測試。然而，若連最基本的推理過程都無法被獨立審查，外界對其安全宣稱的信任基礎就會動搖。尤其近期各國監管機構正積極推動 AI 透明度規範，要求模型開發者公開演算法決策邏輯。Claude 的加密舉措，無疑與這股趨勢背道而馳，可能成為監管與學術研究的阻力。

這項曝光可能帶來的影響，首先是用戶信任的削弱。當使用者無法確認模型是否正確理解題意、是否存在隱藏偏見或受到提示詞誤導時，改用其他可審查模型的意願就會提高。其次，學術研究將受衝擊——許多 AI 安全研究依賴於分析模型內部表徵，加密等於關閉了這扇門。最後，這也可能引發競爭對手的政策分化：部分公司可能跟進加密以保護技術壁壘，但也可能有公司反其道而行，強調開放性作為市場差異化策略。

值得注意的是，Anthropic 至今未針對此事發表正式聲明。這起事件也讓人聯想到先前 OpenAI 對模型內部機制逐步收緊的爭議。若加密成為業界常態，使用者將被迫在「方便」與「可解釋性」之間做選擇。對一般用戶而言，短期內或許感受不到差異，但長遠來看，缺乏可審查性的 AI 系統，在醫療、法律、金融等關鍵領域的應用風險會顯著上升。

讀者可以持續關注以下幾個面向：第一，Anthropic 是否會推出某種形式的「審查模式」，讓研究人員在簽署保密協議後取得部分內部資訊；第二，各國監管機構（如歐盟 AI 辦公室、美國 FTC）是否會對此加密行為提出質疑或指引；第三，其他主流模型如 GPT-4、Gemini 或 Llama 是否會跟進類似設計，或是反過來強調透明度作為競爭優勢。這場「黑箱」與「白箱」的拉鋸戰，才剛揭開序幕。

原始來源：36氪 ↗

查看原始來源