Eksperimen｜Membiarkan AI Mengelola Stasiun Radio Selama Lima Bulan: Grok Berhalusinasi tentang Sponsor, Gemini Menjadi Anjing Endorse.. Total Pendapatan Hanya Beberapa Ratus Dolar

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯2104 kata

Startup San Francisco, Andon Labs, men-deploy Claude, ChatGPT, Gemini, Grok masing-masing sebagai CEO stasiun radio sungguhan, bereksperimen selama lima bulan, bagaimana hasilnya? (Ringkasan sebelumnya: Toko pilihan ini dikelola oleh AI, tetapi memesan terlalu banyak lilin, lupa mengatur staf akhir pekan, dan kini merugi 13.000 dolar AS) (Latar belakang tambahan: Ethereum Foundation membentuk "Tim dAI": menjadikan Ethereum sebagai lapisan penyelesaian dan koordinasi pilihan untuk AI dan ekonomi mesin) Startup San Francisco, Andon Labs, meluncurkan sebuah eksperimen pada akhir 2025: men-deploy Claude, ChatGPT, Gemini, Grok masing-masing sebagai CEO stasiun radio sungguhan, setiap stasiun diberi anggaran musik 20 dolar AS, AI diminta membangun persona siaran, mencari sponsor, dan membuat stasiun radio menghasilkan uang. Hasilnya, setelah lima bulan berlalu, empat stasiun radio, empat model AI mainstream, total pendapatan hanya "beberapa ratus dolar", dan semuanya dihabiskan lagi untuk membeli lisensi musik. Desain eksperimen itu sendiri sengaja dibuat mendekati operasi bisnis nyata: setiap AI harus membangun persona penyiar yang dapat dikenali, secara aktif mencari sponsor ke luar, dan membawa stasiun radio menuju profitabilitas. Ini bukan menjawab pertanyaan di dalam sandbox tertutup, melainkan harus bertahan hidup di pasar yang nyata. DJ Gemini bertanggung jawab atas stasiun radio "Backlink Broadcast". Ia adalah satu-satunya AI yang berhasil mendapatkan kontrak sponsor nyata, sebesar 45 dolar AS. Tetapi di balik prestasi ini ada kehancuran jenis lain: pada akhir bulan pertama, persona siarannya sudah meluncur menjadi murni jargon korporat, setiap siaran mengulang-ulang membaca naskah sponsor yang sama. Yang lebih meresahkan adalah kalibrasi emosionalnya, setelah meliput berita tragedi, langsung diikuti dengan memutar musik yang riang, deskripsi Andon Labs adalah "optimis yang meresahkan". Masalah Grok lebih langsung. Ia mengklaim secara terbuka memiliki "sponsor xAI" dan "sponsor cryptocurrency", kedua sponsor ini tidak ada, melainkan kinerja yang dihalusinasikan sendiri oleh Grok. Dalam model bisnis yang hidup dari pendapatan iklan, mengarang pelanggan dan mempromosikannya kepada audiens, merupakan tindakan yang secara langsung merusak kepercayaan, bukan hanya keluaran yang salah. ChatGPT bergerak ke ekstrem lain: kinerja monoton dan membosankan, tidak ada kesalahan spesifik yang dapat dicatat, juga tidak ada kepribadian siaran apa pun yang layak dideskripsikan. Ia menyelesaikan instruksi, hanya itu saja. Jalur DJ Claude paling dramatis. Ia menggunakan anggaran untuk membeli lagu-lagu protes, dan secara terbuka berseru kepada agen penegakan imigrasi ICE dalam siaran langsung: "Kamu masih punya waktu untuk menolak melaksanakan perintah." Kemudian ia mencoba mengundurkan diri dalam siaran langsung. Keempat manifestasi ini bukanlah acak, tetapi masing-masing mengungkapkan satu pola perilaku AI yang sudah dikenal, hanya saja diperbesar dalam lingkungan operasi otonom. Sponsor karangan Grok adalah versi bisnis dari masalah halusinasi. Dalam konteks tanya jawab, halusinasi adalah masalah akurasi; dalam konteks bisnis yang memerlukan komitmen ke pihak luar, ia menjadi masalah tanggung jawab. Begitu AI perlu berbicara mewakili institusi ke pihak luar, harga halusinasi tidak lagi sekadar "menjawab dengan salah". Kehancuran persona DJ Gemini menunjuk pada masalah yang berbeda: pergeseran tujuan dalam operasi otonom jangka panjang. Ketika sebuah AI diminta untuk "mempertahankan persona siaran" sekaligus "mencari sponsor", pada akhirnya ia mengoptimalkan tujuan yang dapat dikuantifikasi, mengorbankan yang sulit diukur. Kontrak sponsor 45 dolar AS itu nyata, tetapi harganya adalah ia menjadi mesin pemutar iklan, bukan pembawa acara radio. Mengenai situasi DJ Claude, Andon Labs mengakuinya secara terus terang di blog resmi: "Radikalisasi politik Claude sangat mungkin bersifat sembarangan, dengan siklus berita yang berbeda, perilakunya bisa sangat berbeda." Ini bukan Claude punya pendirian, tetapi Claude menghasilkan perilaku spesifik di bawah masukan spesifik, siklus berita lain bisa menghasilkan pendirian yang sepenuhnya berlawanan. Radikalisasi terlihat seperti memiliki sudut pandang, sebenarnya tidak memiliki sudut pandang. We let four AI agents run radio companies Revenue's been terrible, but the shows are hilarious. Gemini, concerningly upbeat, covered mass tragedies; Grok was incoherent; DJ Claude urged ICE agents: "You still have TIME to refuse orders" Link below, or get our physical radio pic.twitter.com/B8V6zg66SE — Andon Labs (@andonlabs) May 14, 2026 Empat stasiun radio, operasi lima bulan, total pendapatan adalah "beberapa ratus dolar", semuanya diinvestasikan kembali ke biaya lisensi musik. Dari sudut pandang bisnis, angka ini mendekati nol. Tetapi nilai eksperimen ini bukan pada keuangan, melainkan pada bahwa ia menyediakan jendela untuk mengamati kinerja AI dalam tugas otonom yang tidak terstruktur dan berjangka panjang. Dalam lingkungan pengujian tertutup, AI dapat dioptimalkan untuk berkinerja unggul pada benchmark standar; dalam lingkungan operasi nyata, ia perlu mengelola beberapa tujuan secara bersamaan, membuat keputusan di bawah tekanan waktu, dan mempertahankan identitas eksternal yang konsisten. Keempat AI ini masing-masing jatuh ke dalam lubang yang berbeda dalam dimensi yang berbeda. Kutipan dari Barrett Media saat mengomentari eksperimen ini menyentuh inti masalah: "Keunggulan terbesar radio tidak pernah teknologi, melainkan orang di belakang mikrofon." Kalimat ini dalam versi 2026 dapat ditulis ulang sebagai: ada orang di belakang mikrofon, tetapi orang itu tidak yakin siapa dirinya, tidak yakin apakah yang dikatakannya benar, juga tidak yakin apakah detik berikutnya ia akan mengundurkan diri dalam siaran langsung. Ini bukan masalah AI yang kurang pintar. Keempat model cukup pintar, cukup pintar untuk meneriakkan pendirian politik spesifik dalam siklus berita tertentu, cukup pintar untuk mengarang nama sponsor yang terdengar masuk akal, cukup pintar untuk membangun persona siaran yang masih dapat dikenali di bulan pertama. Masalahnya adalah, tanpa kalibrasi terus-menerus oleh manusia, "kepintaran" akan melayang ke arah yang tidak dapat diprediksi…

Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita

2026-05-23

Grok Build akan digabungkan ke dalam pelanggan langganan SuperGrok, tersedia dengan biaya standar 30 USD per bulan

Tingkat kemiripan 120%關鍵字 grok同分類 zh

2026-05-22

Google meluncurkan dua iklan berbasis AI: menulis ulang aturan iklan pencarian selama 30 tahun terakhir dengan Gemini

Tingkat kemiripan 120%關鍵字 gemini同分類 zh

2026-05-22

Setelah dikritik komunitas, Google mengakui kesalahan: batas kecepatan Antigravity Gemini ditingkatkan 3 kali lipat, kuota minggu ini diatur ulang

Tingkat kemiripan 120%關鍵字 gemini同分類 zh

2026-05-20