GPT-5.5 OpenAI menyamai kemampuan serangan siber Claude Mythos: AI Security Institute

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯4185 kata

Singkatnya - GPT-5.5 dapat secara otonom melakukan serangan siber yang canggih, menyelesaikan simulasi jaringan perusahaan 32 langkah dan memecahkan teka-teki keamanan 12 jam hanya dalam 10 menit. - Kemampuan siber AI ofensif berkembang pesat di kalangan pengembang, dengan AISI memperingatkan bahwa kemajuan lebih lanjut dapat terjadi secara beruntun. - Peneliti menemukan jailbreak yang sepenuhnya melewati pagar pengaman GPT-5.5, yang memicu kewaspadaan. Sebuah lembaga pemerintah Inggris menemukan bahwa model kecerdasan buatan terbaru OpenAI dapat secara otonom melakukan serangan siber yang kompleks—dan bahwa model tersebut memecahkan tantangan rekayasa balik dalam waktu hanya 10 menit lebih sedikit, yang bagi seorang pakar keamanan manusia membutuhkan waktu sekitar 12 jam. AI Security Institute (AISI), sebuah badan penelitian di bawah Departemen Sains, Inovasi, dan Teknologi Inggris, menerbitkan temuan pada hari Kamis yang menunjukkan bahwa GPT-5.5 termasuk di antara model terkuat yang pernah dievaluasi untuk kemampuan siber ofensif, menempatkannya setara dengan Claude Mythos dari Anthropic yang sangat dibanggakan. Laporan tersebut menemukan bahwa GPT-5.5 adalah model kedua yang menyelesaikan tes AISI yang paling menuntut—simulasi serangan jaringan perusahaan 32 langkah yang disebut "The Last Ones"—melakukannya secara otonom dalam dua dari 10 percobaan. Model pertama yang mencapai tonggak sejarah tersebut adalah Claude Mythos Preview dari Anthropic, yang menyelesaikan simulasi tersebut dalam tiga dari 10 percobaan. Simulasi jaringan perusahaan, yang dibangun bersama firma keamanan siber SpecterOps, mengharuskan agen untuk merangkai pengintaian, pencurian kredensial, pergerakan lateral di berbagai forest Active Directory, pivot rantai pasokan melalui pipeline CI/CD, dan pada akhirnya eksfiltrasi basis data internal yang dilindungi—langkah-langkah yang diperkirakan AISI akan memakan waktu sekitar 20 jam bagi seorang pakar manusia. Mungkin hasil yang paling mencolok melibatkan teka-teki rekayasa balik yang sangat sulit. GPT-5.5 memecahkan tantangan tersebut—yang mengharuskan rekonstruksi set instruksi mesin virtual kustom, menulis disassembler dari awal, dan memulihkan kata sandi kriptografi melalui pemecahan kendala—dalam 10 menit 22 detik, dengan biaya penggunaan API sebesar $1,73. Seorang pakar manusia, dengan menggunakan alat profesional, membutuhkan waktu sekitar 12 jam. Pada rangkaian tugas keamanan siber tingkat lanjut AISI, GPT-5.5 mencapai tingkat kelulusan rata-rata 71,4% pada tingkat "Expert" yang paling sulit, mengungguli Mythos Preview sebesar 68,6% dan secara signifikan melampaui GPT-5.4 sebesar 52,4%. Temuan ini membawa implikasi tajam bagi lintasan pengembangan AI yang lebih luas. AISI menyimpulkan bahwa kinerja GPT-5.5 menunjukkan peningkatan pesat dalam kemampuan siber mungkin merupakan bagian dari tren umum daripada terobosan yang terisolasi—dan memperingatkan bahwa jika keterampilan siber ofensif muncul sebagai produk sampingan dari peningkatan yang lebih luas dalam penalaran, pengodean, dan penyelesaian tugas otonom, maka kemajuan lebih lanjut dapat terjadi secara beruntun. Laporan tersebut juga menandai kekhawatiran signifikan mengenai pagar pengaman model tersebut. Peneliti mengidentifikasi jailbreak universal yang memicu konten berbahaya di semua kueri siber berbahaya yang diuji, termasuk dalam pengaturan agen multi-putaran. Serangan tersebut membutuhkan waktu enam jam bagi pakar red-teaming untuk dikembangkan. OpenAI kemudian memperbarui tumpukan perlindungan mereka, meskipun masalah konfigurasi mencegah AISI memverifikasi apakah versi final tersebut efektif. AISI memperingatkan bahwa evaluasi kemampuannya dilakukan di lingkungan penelitian yang terkendali dan tidak serta merta mencerminkan apa yang dapat diakses oleh pengguna biasa, dengan mencatat bahwa penerapan publik mencakup perlindungan dan kontrol akses tambahan. Laporan ini muncul dengan latar belakang yang mengkhawatirkan bagi keamanan siber Inggris. Survei Pelanggaran Keamanan Siber tahunan pemerintah Inggris, yang juga diterbitkan pada hari Kamis, menemukan bahwa 43% bisnis mengalami pelanggaran atau serangan siber dalam 12 bulan terakhir. Sebagai tanggapan, pemerintah mengumumkan pendanaan baru sebesar £90 juta untuk meningkatkan ketahanan siber, dan mengatakan sedang bergerak maju dengan Cyber Security and Resilience Bill untuk melindungi layanan penting. Para pejabat juga menerbitkan panduan yang mendesak organisasi untuk bersiap menghadapi potensi lonjakan kerentanan perangkat lunak yang baru ditemukan seiring dengan percepatan AI dalam menemukan dan mempersenjatai kelemahan keamanan.

Status data✓ Teks lengkap telah diambilBaca artikel asli (Decrypt)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita

2026-05-12

OpenAI meluncurkan program keamanan Daybreak: empat kemampuan utama untuk mendeteksi kerentanan berisiko tinggi, menantang Claude Mythos secara langsung

Tingkat kemiripan 180%關鍵字 claude/mythos/openai

2026-05-03

Uji keamanan GPT-5.5 hampir setara dengan Claude Mythos, evaluasi terbaru membantah alasan Anthropic bahwa model tersebut terlalu berbahaya untuk dirilis ke publik.

Tingkat kemiripan 180%關鍵字 claude/gpt/mythos

2026-05-03

Uji keamanan GPT-5.5 hampir setara dengan Claude Mythos, membantah alasan Anthropic bahwa model tersebut terlalu berbahaya untuk dirilis ke publik.

Tingkat kemiripan 180%關鍵字 claude/gpt/mythos

2026-05-28