網友反饋 Claude Fable 5 重上架版“降智”,嚴苛 AI 護欄致頻繁回退 Opus 4.8

重點摘要
科技媒體 bleepingcomputer 昨日(7 月 3 日)發佈博文,報道稱 Anthropic 本月重新上架 Claude Fable 5 最強模型,除了額度限制外,多名用戶反饋存在“降智”情況,且更頻繁回退到 Opus 4.8 模型。
Anthropic 本月重新上架最強模型 Claude Fable 5,不過不少用戶實際使用後發現,這款新模型似乎出現「降智」狀況,並且更頻繁地回退到舊版 Opus 4.8 模型。科技媒體《BleepingComputer》昨日(7 月 3 日)報導指出,除了本身的額度限制外,多名用戶在同一時間反映類似體驗,認為新版的 AI 護欄過於嚴格,導致模型回應品質不如預期。目前 Anthropic 尚未對這些反饋做出正式回應。
Related
相關文章
Mistral AI Releases Leanstral 1.5: An Apache-2.0 Lean 4 Code Agent Model Solving 587 of 672 PutnamBench Problems
Mistral AI 正式釋出 Leanstral 1.5,這是一款專為 Lean 4 證明助手打造的程式碼代理模型,採用 Apache 2.0 開源授權。該模型使用混合專家架構,總參數 119B,每次激活 6.5B,支援 256K 上下文長度與多模態輸入。在基準測試中,Leanstral 1.5 在 miniF2F 上達到 100% 準確率,解決了 PutnamBench 672 題中的 587 題,並在 FATE-H、FATE-X 及 FLTEval 上創下新紀錄,以不到七分之一的成本超越 Opus 4.6。

Claude Fable 5,名存實亡
assistant: 根據提供的內容,這似乎是一則關於AI模型服務的報導或評論。摘要如下:Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。</think>Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。
廣告治理迎來“視覺進化”:巨量引擎發佈 Mamoda 2.5 版本,實現視頻全形態覆蓋
巨量引擎發佈自研廣告治理大模型Mamoda 2.5,實現內容安全風控技術升級。該模型從1.0僅能識別基礎違規文本起步,經持續迭代,能力邊界不斷擴展,為數字化廣告生態的違規內容高效精準識別與治理提供更強支撐。
AI基礎設施的下一個千億市場,為何藏在網絡裡?
過去六年,國產GPU公司一路站上AI風口,估值不斷刷新,DPU卻被忽略了。這並不符合產業現實。2020年英偉達完成收購Mellanox後,就已經明確了“GPU+CPU+DPU”的三芯戰略。過去幾年,英偉達也持續強化網絡能力,黃仁勳在2026年CES展示“六芯組合”時,其中四款都與網絡相關。一個越來越清晰的趨勢開始浮出水面:AI基礎設施的瓶頸,正在從算力本身轉向網絡與調度。
克勞德模型推理成本熱議
克勞德模型推理成本熱議。 評測平臺發現 Opus 的性價比再次顯現。它在長任務中 ��� 性能和使用價格雙優。新模型 Sonnet 5 步驟繁多導致成本飆升。用戶可 訪問討論專區 獲取對比詳情。專家 (:з選) 更加推薦開發者選用經典版本。
Google Health API 有了 CLI:ghealth 是專為 Fitbit 資料設計的開源工具
Google Health API 是 Fitbit Web API 的官方後繼者,它鎖定 Google Health API v4,並讓開發者遷移至 Google OAuth 2.0。現在,一款名為 ghealth 的開源 CLI 命令列工具將該 API 包裝起來,適用於終端機與 AI 代理。該工具是單一的 Go 二進位檔,採用 Apache 2.0 授權。它將 40 種經過驗證的資料類型以結構化 JSON 形式呈現,讓你能將睡眠、心率與步數資料直接導入代理的上下文。什麼是 ghealth?ghealth 是 Google Health API v4 的包裝工具。你可以透過 go build -o ghealth . 從原始碼建置,產出一個自包含的二進位檔。該工具明確以代理為優先,每個指令都會回傳形狀穩定的簡化 JSON。此外,它還提供確定性錯誤碼、--dry-run 旗標與 --raw 旗標。