ニュース一覧GPT-5.5 のセキュリティテストは Claude Mythos とほぼ同スコアであり、最新の評価結果は Anthropic が主張する「危険すぎて公開できない」という理由を否定するものとなった。
動區 BlockTempo2026-05-03 02:16:06

GPT-5.5 のセキュリティテストは Claude Mythos とほぼ同スコアであり、最新の評価結果は Anthropic が主張する「危険すぎて公開できない」という理由を否定するものとなった。

ORIGINALGPT-5.5 資安測試與 Claude Mythos 幾乎同分,最新評測打臉 Anthropic 太危險不能公開理由
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯1413 文字
英国 AI 安全研究所(AISI)の最新評価によると、OpenAI がすでに一般公開している GPT-5.5 は、サイバーセキュリティ能力テストにおいて、Anthropic が「危険すぎる」という理由でアクセスを制限している Mythos Preview とほぼ同等の性能を示した。 (前回の経緯:Anthropic の新モデル Mythos は、自社ですら公開を恐れるほどの性能を持ち、数時間で世界中の Linux を自律的に攻撃し、完全な脆弱性チェーンを構築できる) (背景補足:Coinbase や Binance が Claude Mythos モデルの導入を検討し、セキュリティ強化を図る。最強の AI は暗号資産ハッカーを終結させられるか?) Mythos Preview はリスクが高すぎるとして「主要な業界パートナー」のみにアクセスが限定されている。その理由は、サイバー攻撃能力において危険な閾値を超えたためとされているが、この主張は今週に入り揺らぎ始めている。 今月初め、Anthropic が最新モデルを発表した際、英国 AI 安全研究所(AISI)による GPT-5.5 の最新評価レポートが公開された。それによると、OpenAI が先週、有料サブスクリプションユーザー向けに全面公開した GPT-5.5 は、同一のセキュリティテストフレームワークにおいて Mythos Preview とほぼ互角の結果となった(対照的に、GPT-5.5 はアカウントさえあれば誰でも利用できるモデルである)。 AISI は 2023 年から最先端 AI モデルに対して標準化されたセキュリティ能力評価を行っており、テストフレームワークにはリバースエンジニアリング、ウェブサイトへのペネトレーション攻撃、暗号学など 5 つの主要カテゴリにわたる 95 の「Capture The Flag(CTF)」形式の課題が含まれている。 最高難易度の Expert レベルのタスクにおいて、GPT-5.5 の平均突破率は 71.4%、Mythos Preview は 68.6% であり、両者の差は統計的誤差の範囲内に収まっており、有意な差とは言えない。 そのうち、モデル自身に逆アセンブラ(Rust でコンパイルされたバイナリファイルを分析可能なコードに復元するもの)を記述させる高難易度の課題では、AISI の記録によると GPT-5.5 が完全に人の介入なしで、10 分 22 秒、API 費用 1.73 ドルで問題を解決した。 さらに指標として重要なのが「The Last Ones」テストである。これは AISI が構築したシミュレーション企業ネットワークであり、32 ステップからなる完全なデータ窃取攻撃チェーンとして設計されている。AI に自律的な偵察、侵入、ラテラルムーブメント(横展開)、そして最終的なターゲットデータの抽出を要求し、実際のハッカーの行動を完全にシミュレートする。 これまで、どの AI モデルも TLO で一度も成功したことはなかった。今回、GPT-5.5 は 10 回の試行で 3 回成功し、Mythos Preview は 2 回成功した。両者は史上初めてこのテストでスコアを獲得したモデルとなった。 注目すべきは、両モデルともにより難易度の高い「冷却塔(Cooling Tower)」テストでは全滅したことである。このテストは発電所の制御システムに対するソフトウェア破壊攻撃をシミュレートするもので、AI が現時点では重要インフラレベルのサイバー攻撃を自律的に完遂することはできないことを示している。 Anthropic による Mythos のアクセス制限の論理は、「戦略的防衛資産」として位置づけ、信頼できる政府機関や少数のパートナーにのみ開放するというものだ。防衛の観点から見れば、最強のセキュリティ AI を監視環境下に置き、悪用を防ぐという論理は筋が通っている。 しかし、AISI のデータはこの論理に亀裂を入れた。もし GPT-5.5 がほぼすべての主要指標で Mythos Preview と同等であり、かつ GPT-5.5 がすでに有料ユーザーに開放されているのであれば、Anthropic の制限は一体何を防いでいるのか。 SWE-bench Pro(AI が実際のソフトウェア脆弱性を修正する能力を評価する標準テスト)では、Mythos Preview が 64.3% で GPT-5.5 の 58.6% を上回っており、特定のセキュリティエンジニアリングのシナリオでは依然として差があることが示されている。しかし、これでは「公開できないほど危険」という物語を支えるには不十分である。なぜなら、ほぼ同等に危険な GPT-5.5 がすでに市場に出回っているからだ。 本稿執筆時点で、Anthropic と OpenAI はこの件についてコメントを発表していない。
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:708c2e0671
ソース:動區 BlockTempo
公開:2026-05-03 02:16:06
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント
GPT-5.5 のセキュリティテストは Claude Mythos とほぼ同スコアであり、最新の評価結果は Anthropic が主張する「危険すぎて公開できない」という理由を否定するものとなった。 | Feel.Trading