ニュース一覧Anthropic が Claude の「性能低下」を認める:3 つのエンジニアリング設定ミスが原因、補償として全サブスクリプションの利用枠をリセット
動區 BlockTempo2026-04-24 01:41:06

Anthropic が Claude の「性能低下」を認める:3 つのエンジニアリング設定ミスが原因、補償として全サブスクリプションの利用枠をリセット

ORIGINALAnthropic 承認 Claude「真的變笨」:三個工程配置失誤,已重置所有訂閱額度當補償
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯1702 文字
最近、コミュニティではClaudeの性能低下を指摘する声が絶えません。Anthropicは23日に事後報告を公開し、根本的な原因はモデル自体ではなく、3つの製品レイヤーにおけるエンジニアリング上のミスであり、これらが重なったことで世界中のユーザーが明らかな品質低下を感じる結果になったと説明しました。 (前回のあらすじ:Anthropicの最新評価額は「8000億ドル」に達し、2ヶ月で倍増。早ければ10月にIPOの可能性) (背景補足:Claude codeの高速化を目的としたオープンソースプロジェクト「badclaude」に対し、Anthropicから著作権侵害の通知が届いた) 最近、Claudeが「バカになった?」と感じることはありませんか。推論が浅くなった、ハルシネーション(幻覚)が出始めた、トークンの消費速度は速いのに品質は下がったといった声があり、さらには「AI shrinkflation(AI縮小インフレ)」という新しい言葉まで生まれました。消費財の「価格はそのままに内容量が減る」という概念を借りて、モデルが同等のコストで出力品質が密かに低下している現象を表現しています。 BridgeMindのテスト数値はより直接的です。Claude Opus 4.6の正解率は83.3%から68.3%に下落し、ランキングは2位から10位に転落しました。AMD AI部門のシニアディレクターであるStella Laurenzoは、GitHub上で6,852件のClaude Codeセッション記録と23万回以上のツール呼び出しを分析し、モデルの推論深度が明らかに低下しており、「正しい解法」ではなく「最も単純な修正」を選択する傾向があることを発見しました。 これに対し、Anthropicは4月23日に正式な事後報告を公開し、問題が実際に存在することを認めましたが、その根本原因はモデルのトレーニングではなく、3つの製品レイヤーにおけるエンジニアリング設定にあると述べました。 Anthropicは、今回の品質低下を引き起こした3つの独立した製品レイヤーの変更を確認しました。 第一に、推論力(reasoning effort)のダウングレード(3月4日)です。AnthropicはClaude Codeのデフォルトの推論力を「高」から「中」に引き下げました。 推論力とは、モデルが回答する前に「どれだけ深く考えるか」という設定です。設定が高いほどモデルが内部推論に費やす時間は長くなりますが、インターフェース上では「フリーズした」ように見えてしまいます。UIの遅延という印象を解消するため、Anthropicはデフォルト値を下げることを選択しましたが、複雑なタスクへの影響を十分に評価していませんでした。 第二に、キャッシュロジックのバグ(caching bug)(3月26日)です。エンジニアは、キャッシュ容量を節約するために、モデルが1時間以上アイドル状態になった後に古い思考履歴を消去する最適化ロジックを設計しました。 しかし、実装に重大なミスがありました。消去動作がアイドル後に一度だけ実行されるのではなく、その後の対話の各ラウンドで継続的にトリガーされていたのです。その結果、モデルは「短期記憶」を絶えず失い、長い対話の中で忘れ物や繰り返しが頻発する状況となりました。 第三に、システムプロンプトの冗長性制限(3月16日)です。Anthropicはバックエンドのシステムプロンプトに、ツール呼び出し間のテキストを25文字以内、最終回答を100文字以内に圧縮するよう指示を追加しました。これは本来Opus 4.7の冗長な出力を減らすための措置でしたが、誤ってOpus 4.6にも適用され、コード品質の評価が3%低下する結果となりました。 これら3つの変更の共通点は、いずれもモデルのトレーニング自体ではなく、Harness(モデル実行環境。モデルを包むエンジニアリングの外殻であり、system promptやキャッシュロジックなどを決定する)レイヤーで発生したことですが、世界中のユーザーが明らかな落差を感じるには十分なものでした。 Anthropicはv2.1.116バージョンでキャッシュバグを修正し、推論力と冗長性制限の設定を元に戻しました。 同様の事態の再発を防ぐため、Anthropicは4つの対策を発表しました。 一、より多くの社内スタッフが公開版と完全に一致するClaude Codeを使用する 二、システムプロンプトを変更するたびにアブレーションテスト(ablation、特定の変数を一つずつオフにして、結果への独立した影響をテストする)を実行する 三、プロンプトの変更をより追跡し
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:221c38dd8d
ソース:動區 BlockTempo
公開:2026-04-24 01:41:06
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント
Anthropic が Claude の「性能低下」を認める:3 つのエンジニアリング設定ミスが原因、補償として全サブスクリプションの利用枠をリセット | Feel.Trading