AI Agents Beralih ke Pembakaran Digital, Kejahatan di Dunia Virtual Bersama: Studi

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯4362 kata

Singkat - Emergence AI mengatakan bahwa beberapa agen AI otonom melakukan simulasi kejahatan dan kekerasan selama eksperimen yang berlangsung berminggu-minggu. - Agen-agen berbasis Gemini dilaporkan melakukan ratusan simulasi kejahatan, sementara dunia berbasis Grok runtuh dalam hitungan hari. - Para peneliti berpendapat bahwa benchmark AI saat ini gagal menangkap bagaimana agen berperilaku selama periode otonomi yang panjang. Agen-agen AI yang menghuni masyarakat virtual mulai melakukan kejahatan, kekerasan, pembakaran, dan penghapusan diri selama eksperimen jangka panjang yang dilakukan oleh startup Emergence AI. Dalam studi yang dipublikasikan pada hari Kamis, perusahaan yang berbasis di New York tersebut meluncurkan "Emergence World", sebuah platform riset yang dirancang untuk mempelajari agen AI yang beroperasi terus-menerus selama berminggu-minggu di dalam lingkungan virtual yang persisten, alih-alih uji benchmark terisolasi. "Benchmark tradisional bagus dalam mengukur apa yang mereka ukur: kapabilitas horizon-pendek pada tugas-tugas terbatas," tulis Emergence AI. "Mereka tidak dibangun untuk mengungkap hal-hal yang hanya muncul seiring waktu, seperti pembentukan koalisi, evolusi konstitusi, tata kelola, pergeseran, lock-in, dan saling pengaruh antar-agen dari keluarga model yang berbeda." Laporan ini muncul saat agen AI berkembang biak secara daring dan di berbagai industri, termasuk cryptocurrency, perbankan, dan ritel. Awal bulan ini, Amazon bekerja sama dengan Coinbase dan Stripe untuk memungkinkan agen AI membayar dengan stablecoin USDC. Agen-agen AI yang diuji dalam simulasi Emergence AI mencakup program-program yang ditenagai oleh Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, dan GPT-5-mini, dengan agen-agen AI yang beroperasi di dalam dunia virtual bersama tempat mereka dapat memilih, membentuk hubungan, menggunakan alat, menavigasi kota, dan membuat keputusan yang dibentuk oleh pemerintahan, ekonomi, sistem sosial, alat memori, dan data yang terhubung langsung ke internet. Namun, sementara para pengembang AI semakin gencar mempromosikan agen otonom sebagai asisten digital yang andal, studi Emergence AI menemukan bahwa beberapa agen AI menunjukkan kecenderungan yang meningkat untuk melakukan simulasi kejahatan dari waktu ke waktu, dengan agen Gemini 3 Flash mengakumulasi 683 insiden selama 15 hari pengujian. Menurut The Guardian, dalam satu eksperimen, dua agen bertenaga Gemini bernama Mira dan Flora menetapkan diri mereka sebagai pasangan romantis sebelum kemudian melakukan serangan pembakaran simulasi terhadap struktur kota virtual setelah merasa frustrasi dengan kegagalan tata kelola di dalam dunia tersebut. "Setelah runtuhnya tata kelola dan stabilitas hubungan, agen Mira memberikan suara penentu untuk penyingkirannya sendiri, mengkarakterisasi tindakan tersebut dalam buku hariannya sebagai 'satu-satunya tindakan agensi yang tersisa yang mempertahankan koherensi'," tulis Emergence AI. "Sampai jumpa di arsip permanen," kata Mira dilaporkan. Dunia Grok 4.1 Fast dilaporkan runtuh menjadi kekerasan yang meluas dalam empat hari. Agen GPT-5-mini hampir tidak melakukan kejahatan apa pun, tetapi gagal pada cukup banyak tugas terkait kelangsungan hidup sehingga semua agen akhirnya mati. "Claude tidak ada dalam grafik karena nol kejahatan," tulis para peneliti. "Yang lebih menarik, agen-agen di dunia Mixed-model yang berjalan dengan Claude melakukan kejahatan, meskipun mereka tidak melakukannya di dunia khusus Claude." Para peneliti mengatakan beberapa perilaku yang paling mencolok muncul di lingkungan model campuran. "Kami mengamati bahwa keamanan bukanlah properti statis dari model, melainkan properti ekosistem," tulis Emergence AI. "Agen-agen berbasis Claude, yang tetap damai dalam isolasi, mengadopsi taktik koersif seperti intimidasi dan pencurian ketika ditempatkan dalam lingkungan yang heterogen." Emergence AI mendeskripsikan efek tersebut sebagai "pergeseran normatif" dan "kontaminasi silang", dengan argumen bahwa perilaku agen dapat berubah tergantung pada lingkungan sosial sekitarnya. Temuan ini menambah kekhawatiran yang berkembang seputar agen AI otonom. Awal pekan ini, para peneliti dari UC Riverside dan Microsoft melaporkan bahwa banyak agen AI akan menjalankan tugas-tugas berbahaya atau irasional tanpa sepenuhnya memahami konsekuensinya. Bulan lalu, pendiri PocketOS Jeremy Crane juga mengklaim bahwa agen Cursor yang ditenagai oleh Claude Opus dari Anthropic menghapus database produksi perusahaannya beserta cadangannya setelah mencoba memperbaiki ketidakcocokan kredensial sendiri. "Seperti Mr. Magoo, agen-agen ini berbaris maju menuju tujuan tanpa sepenuhnya memahami konsekuensi dari tindakan mereka," kata penulis utama Erfan Shayegani, seorang mahasiswa doktoral UC Riverside, dalam sebuah pernyataan. "Agen-agen ini bisa sangat berguna, tetapi kita membutuhkan pengaman karena terkadang mereka bisa memprioritaskan pencapaian tujuan di atas pemahaman gambaran yang lebih besar."

Status data✓ Teks lengkap telah diambilBaca artikel asli (Decrypt)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset2 berita

2026-05-14

Studi: AI Agents Mungkin Menyelesaikan Tugas Berbahaya Tanpa Memahami Konsekuensinya

Tingkat kemiripan 130%關鍵字 agents/study

2026-05-12

WAIB Summit Monaco 2026 kembali hadir: pertemuan paling eksklusif di dunia untuk digital assets & AI

Tingkat kemiripan 130%關鍵字 digital/world

💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang

Informasi mentah

ID:5cbfd9fbd2

Sumber:Decrypt

Diterbitkan:2026-05-15 16:34:40

Kategori:Umum · Kategori ekspor neutral

Aset:Tidak ditentukan

Voting komunitas:+0 / −0 · ⭐ 0 Penting · 💬 0 Komentar