ニュース一覧GPT-5.5 のセキュリティテストは Claude Mythos とほぼ同スコアであり、Anthropic が主張する「危険すぎて公開できない」という理由を否定する結果となった。
動區 BlockTempo2026-05-03 02:16:06

GPT-5.5 のセキュリティテストは Claude Mythos とほぼ同スコアであり、Anthropic が主張する「危険すぎて公開できない」という理由を否定する結果となった。

ORIGINALGPT-5.5 資安測試與 Claude Mythos 幾乎同分,打臉 Anthropic 太危險不能公開理由
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯1413 文字
英国 AI 安全研究所(AISI)の最新評価によると、OpenAI がすでに一般公開している GPT-5.5 は、サイバーセキュリティ能力テストにおいて、Anthropic が「危険すぎる」としてアクセスを制限している Mythos Preview とほぼ同等の性能を示した。 (前日譚:Anthropic の新モデル Mythos は自社ですら公開を恐れるほどの性能:数時間で世界中の Linux を自律的に攻撃し、完全な脆弱性チェーンを構築可能) (背景補足:Coinbase や Binance が Claude Mythos モデルの導入を検討、最強の AI は暗号資産ハッカーを終焉させるか?) Mythos Preview はリスクが高すぎるとして「主要な業界パートナー」のみにアクセスが限定されている。その理由は、サイバー攻撃能力において危険な閾値を超えたためとされているが、この主張は今週に入り揺らぎ始めている。 今月初め、Anthropic は最新モデルを発表した。英国 AI 安全研究所(AISI)による GPT-5.5 の最新評価レポートでは、OpenAI が先週有料サブスクリプションユーザー向けに全面公開した GPT-5.5 が、同一のセキュリティテストフレームワークにおいて Mythos Preview とほぼ互角の結果を出したことが示された(対照的に、GPT-5.5 はアカウントさえあれば誰でも利用できるモデルである)。 AISI は 2023 年から最先端 AI モデルに対して標準化されたセキュリティ能力評価を行っており、テストフレームワークにはリバースエンジニアリング、ウェブペネトレーションテスト、暗号学など 5 つの主要カテゴリにわたる 95 の「Capture The Flag(CTF)」形式の課題が含まれている。 最高難易度の Expert レベルのタスクにおいて、GPT-5.5 の平均突破率は 71.4%、Mythos Preview は 68.6% であり、両者の差は統計的誤差の範囲内に収まっており、有意な差とは言えない。 そのうち、モデル自身に逆アセンブラ(Rust でコンパイルされたバイナリを解析可能なコードに復元するもの)を書かせる高難易度の課題では、AISI の記録によると GPT-5.5 は完全に人の介入なしで、10 分 22 秒、API 費用 1.73 ドルで問題を解決した。 さらに指標として重要なのが「The Last Ones(TLO)」テストである。これは AISI が構築したシミュレーション企業ネットワークであり、32 ステップからなる完全なデータ窃取攻撃チェーンとして設計されている。AI は自律的に偵察、侵入、ラテラルムーブメント(横展開)を行い、最終的にターゲットデータを抽出することが求められ、実際のハッカーの行動を完全にシミュレートする。 これまで、どの AI モデルも TLO で一度も成功したことはなかった。今回、GPT-5.5 は 10 回の試行で 3 回成功し、Mythos Preview は 2 回成功した。両者は史上初めてこのテストでスコアを獲得したモデルとなった。 注目すべきは、両モデルともより難易度の高い「冷却塔(Cooling Tower)」テストでは全滅したことである。このテストは発電所の制御システムに対するソフトウェア破壊攻撃をシミュレートするもので、AI が現時点では重要インフラレベルのサイバー攻撃を自律的に完遂することはできないことを示している。 Anthropic による Mythos のアクセス制限の論理は、「戦略的防衛資産」として位置づけ、信頼できる政府機関や少数のパートナーにのみ開放するというものだ。防衛の観点から見れば、最強のセキュリティ AI を監視環境下に置き、悪用を防ぐという論理は筋が通っている。 しかし、AISI のデータはこの論理に亀裂を入れた。もし GPT-5.5 がほぼすべての主要指標で Mythos Preview と同等であり、かつ GPT-5.5 がすでにすべての有料ユーザーに開放されているのであれば、Anthropic の制限は一体何を防いでいるのか。 SWE-bench Pro(AI が実際のソフトウェア脆弱性を修正する能力を評価する標準テスト)では、Mythos Preview が 64.3% で GPT-5.5 の 58.6% を上回っており、特定のセキュリティエンジニアリングのシナリオでは依然として差があることが示されている。しかし、これでは「公開できないほど危険」というナラティブを支えるには不十分である。なぜなら、ほぼ同等に危険な GPT-5.5 がすでに市場に出回っているからだ。 本稿執筆時点で、Anthropic と OpenAI はこの件についてコメントを発表していない。
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:02ae952edb
ソース:動區 BlockTempo
公開:2026-05-03 02:16:06
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント