Claude驚人真相被教授曝光:思考過程加密,給錢也看不到

2026年6月24日 10:31
Claude驚人真相被教授曝光:思考過程加密,給錢也看不到

重點摘要

這篇消息聚焦「Claude驚人真相被教授曝光:思考過程加密,給錢也看不到」。原始導語提到:Claude的「黑箱時刻」:思考過程被加密,Anthropic要塌房? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

### Claude驚人真相被教授曝光:思考過程加密,給錢也看不到

近日,Anthropic 旗下 AI 模型 Claude 的內部運作機制引發學術界高度關注。一位國外教授在公開場合揭露,Claude 的「思考過程」已被加密處理,不僅外界無法一窺其推理邏輯,就連付費使用者也無法取得這些內部資訊。這項發現迅速在 AI 社群與技術論壇中擴散,被形容為 Claude 的「黑箱時刻」,也讓 Anthropic 面臨透明性與可信度的雙重挑戰。

所謂「思考過程加密」,指的是 Claude 在生成回應時,其內部推論步驟、注意力分配、以及決策路徑等關鍵資訊,都被以某種技術方式封裝,無法透過 API 或介面直接讀取。這與過去 OpenAI 或 Google 部分模型提供「輸出 token 機率」或「注意力權重」等可視化工具的做法形成對比。教授指出,這種設計雖然能保護商業機密與防止惡意逆向工程,但也讓外界難以驗證模型的偏誤、安全性或邏輯一致性。

背景方面,Anthropic 一向以「負責任 AI」自居,強調模型安全性與紅隊測試。然而,若連最基本的推理過程都無法被獨立審查,外界對其安全宣稱的信任基礎就會動搖。尤其近期各國監管機構正積極推動 AI 透明度規範,要求模型開發者公開演算法決策邏輯。Claude 的加密舉措,無疑與這股趨勢背道而馳,可能成為監管與學術研究的阻力。

這項曝光可能帶來的影響,首先是用戶信任的削弱。當使用者無法確認模型是否正確理解題意、是否存在隱藏偏見或受到提示詞誤導時,改用其他可審查模型的意願就會提高。其次,學術研究將受衝擊——許多 AI 安全研究依賴於分析模型內部表徵,加密等於關閉了這扇門。最後,這也可能引發競爭對手的政策分化:部分公司可能跟進加密以保護技術壁壘,但也可能有公司反其道而行,強調開放性作為市場差異化策略。

值得注意的是,Anthropic 至今未針對此事發表正式聲明。這起事件也讓人聯想到先前 OpenAI 對模型內部機制逐步收緊的爭議。若加密成為業界常態,使用者將被迫在「方便」與「可解釋性」之間做選擇。對一般用戶而言,短期內或許感受不到差異,但長遠來看,缺乏可審查性的 AI 系統,在醫療、法律、金融等關鍵領域的應用風險會顯著上升。

讀者可以持續關注以下幾個面向:第一,Anthropic 是否會推出某種形式的「審查模式」,讓研究人員在簽署保密協議後取得部分內部資訊;第二,各國監管機構(如歐盟 AI 辦公室、美國 FTC)是否會對此加密行為提出質疑或指引;第三,其他主流模型如 GPT-4、Gemini 或 Llama 是否會跟進類似設計,或是反過來強調透明度作為競爭優勢。這場「黑箱」與「白箱」的拉鋸戰,才剛揭開序幕。

Related

相關文章

從預測到幹預,Aether AI為什麼押注因果世界模型?

這篇消息聚焦「從預測到幹預,Aether AI為什麼押注因果世界模型?」。原始導語提到:因果,可能是機器人走進現實世界的門票。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

大模型終於說不出髒話了,有毒子詞剪枝ToxPrune,預訓練+推理雙重防線

這篇消息聚焦「大模型終於說不出髒話了,有毒子詞剪枝ToxPrune,預訓練+推理雙重防線」。原始導語提到:不用訓練,不改權重,只動詞表就能給大模型“消毒”?港中文/FaceMind團隊做到了。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

清華系“盯上”世界模型

這篇消息聚焦「清華系“盯上”世界模型」。原始導語提到:為什麼總是清華? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛