最近社群持續反映 Claude 表現退步，Anthropic 於 23 日公開事後報告，表示根源不在模型本身， […] 〈Anthropic 承認 Claude「真的變笨」：三個工程配置失誤，已重置所有訂閱額度當補償〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。最近社群持續反映 Claude 表現退步，Anthropic 於 23 日公開事後報告，表示根源不在模型本身， […] 〈Anthropic 承認 Claude「真的變笨」：三個工程配置失誤，已重置所有訂閱額度當補償〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

Anthropic 承認 Claude「真的變笨」：三個工程配置失誤，已重置所有訂閱額度當補償

來源：Blocktempo ZH

2026/04/24 10:41

閱讀時長 8 分鐘

如需對本內容提供反饋或相關疑問，請通過郵箱 [email protected] 聯絡我們。

最近社群持續反映 Claude 表現退步，Anthropic 於 23 日公開事後報告，表示根源不在模型本身，而是三個產品層的工程失誤，三者疊加讓全球使用者感受到明顯的品質下滑。（前情提要：Anthropic 最新估值衝上「8000 億美元」兩個月翻倍，最快 10 月 IPO）（背景補充：鞭打 Claude code 加速的 badclaude 開源專案，被 Anthropic 寄侵權通知信了）你是否也有感覺，最近 Claude 真的「變笨了？」。有人說它推理變淺、有人說它開始出現幻覺、有人說它耗用 token 的速度變快但品質下滑，甚至出現了一個新詞 AI shrinkflation（AI 縮水）。借用消費品「份量變少但價格不變」的概念，描述模型在同等成本下輸出品質悄悄縮水的現象。 BridgeMind 的測試數字更直白：Claude Opus 4.6 的準確率從 83.3% 跌至 68.3%，排名從第 2 位滑落至第 10 位。AMD AI 部門資深總監 Stella Laurenzo 在 GitHub 上分析了 6,852 份 Claude Code 工作階段紀錄與逾 23 萬次工具呼叫，也發現模型推理深度明顯下滑，傾向選擇「最簡單的修法」而非「正確的解法」。對此，Anthropic 4 月 23 日正式公開事後報告，承認問題確實存在，但表示根源不在模型訓練，而在三個產品層的工程配置。三個具體失誤：系統層的蝴蝶效應 Anthropic 確認了三個獨立的產品層變更，疊加造成這波品質衰退：第一，推理力道（reasoning effort）降級（3 月 4 日）。Anthropic 將 Claude Code 的預設推理力道從「高」調降為「中」。所謂推理力道，是模型每次回答前「想多深」的配置，設定愈高，模型花在內部推導的時間愈長，但介面看起來也更像「卡住了」。為瞭解決 UI 延遲的觀感問題，Anthropic 選擇降低預設值，卻沒有充分評估對複雜任務的衝擊。第二，快取邏輯漏洞（caching bug）（3 月 26 日）。工程師設計了一套最佳化邏輯，讓模型在閒置超過一小時後清除舊的思考歷程，以節省快取空間。但實作上有一個關鍵錯誤：清除動作不是在閒置後執行一次，而是在每一輪後續對話中持續觸發。結果是模型不斷喪失「短期記憶」，在長對話中反覆出現遺忘與重複的狀況。第三，系統提示冗餘限制（3 月 16 日）。Anthropic 在後臺系統提示中加入指令，要求模型將工具呼叫之間的文字壓縮在 25 字以內、最終回覆壓縮在 100 字以內。這個原本用於減少 Opus 4.7 冗餘輸出的措施，卻誤觸到 Opus 4.6，導致程式碼品質評估下滑 3%。這三個變更的共同點是：它們都發生在 Harness（模型執行環境，包裹模型的一層工程外殼，決定 system prompt、快取邏輯等）層，而非模型訓練本身，卻足以讓全球使用者感受到明顯的落差。修復措施與未來防護 Anthropic 已在 v2.1.116 版本中修復快取漏洞，並還原推理力道與冗餘限制設定。為防止類似事件重演，Anthropic 宣布四項措施：一，更多內部員工將使用與公開版完全一致的 Claude Code 二，每次系統提示變更都將執行消融測試（ablation，逐一關閉某個變數、測試其對結果的獨立影響）三，新增審計工具讓 prompt 變更更易追蹤四，重置所有訂閱使用者的使用限額，作為補償。「AI 縮水」揭示一個更深的信任問題使用者之所以將這波衰退命名為「AI shrinkflation」，背後有一個結構性困境：模型是黑盒，普通使用者，甚至專業開發者都無法區分「模型本身退化」與「工程配置失誤」，兩者對體驗的影響完全相同，卻有著截然不同的成因與修復路徑。 Anthropic 起初否認「刻意削弱」模型的說法，表示 API 與推理層均未受影響。但使用者的不滿持續累積，高知名度使用者的公開審計資料讓這場爭議愈難迴避。這種「官方說沒問題、資料說有問題」的落差，是這次事件真正傷害信任的地方，而不只是模型效能本身。事實與感知之間的鴻溝，未來需要更多透明度來填補。相關報導 Anthropic 最新估值衝上「8000 億美元」兩個月翻倍，最快 10 月 IPO 鞭打 Claude code 加速的 badclaude 開源專案，被 Anthropic 寄侵權通知信了美國安局偷用 Anthropic Mythos：五角大廈一手封殺、一手放行的兩面手法 Anthropic 訂閱 Claude Code 封殺龍蝦 OpenClaw！往後第三方工具僅能付費額度 Anthropic 推出視覺設計神器「Claude Design」！一句話秒做簡報、企劃書、App 原型〈Anthropic 承認 Claude「真的變笨」：三個工程配置失誤，已重置所有訂閱額度當補償〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

$200,000 U 狂歡獎池不容錯過

解鎖驚喜盲盒、12% 加息券及 $200 新用戶好禮！

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。