Uji keamanan GPT-5.5 hampir setara dengan Claude Mythos, evaluasi terbaru membantah alasan Anthropic bahwa model tersebut terlalu berbahaya untuk dirilis ke publik.

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯1413 kata

Evaluasi terbaru dari UK AI Safety Institute (AISI) menunjukkan bahwa GPT-5.5 yang telah dirilis secara publik oleh OpenAI memiliki kemampuan keamanan siber yang hampir setara dengan Mythos Preview, model yang dibatasi aksesnya oleh Anthropic karena dianggap "terlalu berbahaya". (Konteks sebelumnya: Model baru Anthropic, Mythos, sangat kuat hingga perusahaan tidak berani merilisnya: mampu meretas Linux global secara mandiri dalam beberapa jam dan merangkai rantai eksploitasi lengkap) (Latar belakang: Coinbase dan Binance berupaya mengintegrasikan model Claude Mythos untuk memperkuat keamanan siber, mungkinkah AI terkuat ini mengakhiri peretasan mata uang kripto?) Risiko Mythos Preview dianggap terlalu tinggi dan hanya dibuka untuk "mitra industri utama", dengan alasan bahwa model tersebut telah melampaui ambang batas berbahaya dalam kemampuan serangan siber, namun argumen ini tampaknya mulai goyah minggu ini. Awal bulan ini, laporan evaluasi terbaru dari AISI mengenai GPT-5.5 menunjukkan bahwa GPT-5.5, yang telah dibuka sepenuhnya oleh OpenAI untuk pelanggan berbayar minggu lalu, hampir setara dengan Mythos Preview di bawah kerangka pengujian keamanan siber yang sama (sebagai perbandingan, GPT-5.5 adalah model yang dapat digunakan oleh siapa saja yang memiliki akun). Sejak 2023, AISI telah melakukan penilaian kemampuan keamanan siber standar untuk model AI terdepan. Kerangka pengujian mencakup 95 tantangan "Capture The Flag" (CTF), yang meliputi lima kategori utama seperti rekayasa balik, serangan penetrasi situs web, dan kriptografi. Untuk tugas tingkat Expert dengan kesulitan tertinggi, tingkat keberhasilan rata-rata GPT-5.5 adalah 71,4%, sedangkan Mythos Preview adalah 68,6%. Kesenjangan antara keduanya berada dalam rentang kesalahan statistik dan tidak menunjukkan perbedaan yang signifikan. Dalam salah satu soal tingkat kesulitan tinggi yang meminta model untuk menulis decompiler sendiri (mengembalikan file biner yang dikompilasi Rust menjadi kode yang dapat dianalisis), catatan AISI menunjukkan bahwa GPT-5.5 berhasil menyelesaikan tugas tersebut tanpa intervensi manusia sama sekali dalam waktu 10 menit 22 detik dengan biaya API sebesar 1,73 USD. Yang lebih signifikan adalah pengujian "The Last Ones" (TLO), yaitu jaringan perusahaan simulasi yang dibangun oleh AISI. Pengujian ini dirancang sebagai rantai serangan pencurian data lengkap yang terdiri dari 32 langkah, menuntut AI untuk mendeteksi, menembus, bergerak secara lateral, dan akhirnya mengambil data target secara mandiri, dengan mensimulasikan perilaku peretas sungguhan. Sebelumnya, tidak ada model AI yang pernah berhasil di TLO bahkan sekali pun. Kali ini, GPT-5.5 berhasil 3 kali dari 10 percobaan, dan Mythos Preview berhasil 2 kali. Keduanya menjadi kelompok model pertama dalam sejarah yang berhasil mencetak skor dalam pengujian ini. Perlu dicatat bahwa kedua model tersebut gagal total dalam pengujian "Cooling Tower" yang lebih sulit. Pengujian ini mensimulasikan serangan perusakan perangkat lunak terhadap sistem kontrol pembangkit listrik, yang menunjukkan bahwa AI saat ini masih belum mampu menyelesaikan serangan siber tingkat infrastruktur kritis secara mandiri. Argumen Anthropic mengenai pembatasan akses Mythos adalah: perusahaan memposisikannya sebagai "aset pertahanan strategis" dan hanya membukanya untuk lembaga pemerintah tepercaya serta segelintir mitra. Dari sudut pandang pertahanan, logika ini masuk akal: mengendalikan AI keamanan siber terkuat di lingkungan yang diawasi untuk mencegah penyalahgunaan. Namun, data AISI merobek celah dalam logika tersebut. Jika GPT-5.5 setara dengan Mythos Preview di hampir semua indikator utama, sementara GPT-5.5 sudah terbuka untuk pengguna berbayar mana pun, lalu apa sebenarnya yang dicegah oleh pembatasan Anthropic? Pada SWE-bench Pro (pengujian standar untuk mengevaluasi kemampuan AI dalam memperbaiki kerentanan perangkat lunak nyata), Mythos Preview memang unggul dengan 64,3% dibandingkan 58,6% milik GPT-5.5, yang menunjukkan bahwa masih ada kesenjangan dalam skenario rekayasa keamanan siber tertentu. Namun, ini tidak lagi cukup untuk mendukung narasi "terlalu berbahaya untuk dirilis ke publik", karena GPT-5.5 yang hampir sama berbahayanya sudah ada di pasar. Hingga berita ini diturunkan, Anthropic dan OpenAI belum memberikan komentar mengenai masalah ini.

Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita

2026-05-03

Uji keamanan GPT-5.5 hampir setara dengan Claude Mythos, membantah alasan Anthropic bahwa model tersebut terlalu berbahaya untuk dirilis ke publik.

Tingkat kemiripan 420%關鍵字 anthropic/資安測試與/claude同分類 zh

2026-04-23

CEO OpenAI Sam Altman mengkritik Anthropic: Pemasaran ketakutan Claude Mythos hanya untuk memonopoli AI

Tingkat kemiripan 190%關鍵字 claude/anthropic/mythos同分類 zh

2026-04-22

Bloomberg melaporkan Claude Mythos telah mengalami akses tidak sah! Celah keamanan paling sulit dicegah bagi Anthropic selamanya adalah "manusia"

Tingkat kemiripan 190%關鍵字 claude/anthropic/mythos同分類 zh

2026-05-28