Raindrop Workshop menggunakan Codex untuk membantu AI Agent Anda secara otomatis menemukan bug dan memperbaikinya (gratis dan open source)

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯1609 kata

Perusahaan alat pengembang AI Agent, Raindrop, minggu ini merilis sumber terbuka debugger lokal Workshop (v0.1.6), yang memungkinkan pengembang melacak secara real-time setiap output token dan pemanggilan tool dari Agent, serta melalui MCP membuat Claude Code dapat secara otomatis membaca, menulis tes, dan memperbaiki. (Ringkasan sebelumnya: Claude menulis kode dengan banyak kesalahan dan berpura-pura bodoh? Modifikasi 12 aturan Andrej Karpathy untuk membantu Anda memangkas tingkat kesalahan dari 41% menjadi 3%) (Latar belakang tambahan: Anthropic meluncurkan "Claude for Small Business": menargetkan otomatisasi kerja AI untuk usaha kecil dan menengah) Anda membuka log, yang Anda lihat hanyalah sekumpulan panggilan API dan angka token, tetapi tidak ada petunjuk apa pun yang memberitahu Anda keputusan mana yang salah. AI Agent Anda baru saja menghasilkan hasil yang aneh. Ia memilih sebuah tool yang tidak Anda perkirakan, dan mengeluarkan respons dengan semantik yang ambigu. Raindrop merilis sebuah alat sumber terbuka pada 14 Mei, yang berusaha membuat skenario ini tidak terjadi lagi: sebuah program debugger AI Agent yang sepenuhnya berjalan lokal dan sepenuhnya gratis, Workshop. Memungkinkan pengembang melacak secara real-time setiap output token dan pemanggilan tool dari Agent, lalu menyerahkan proses debugging itu sendiri kepada Claude Code atau Codex untuk dikerjakan. Debugging perangkat lunak tradisional memiliki breakpoint, memiliki call stack yang lengkap, memiliki jalur eksekusi yang deterministik. Debugging AI Agent berbeda. Perilakunya bersifat probabilistik, input yang sama dalam eksekusi berbeda mungkin menempuh jalur yang sepenuhnya berbeda; keputusannya terbentuk secara terdistribusi di antara pemanggilan LLM berlapis-lapis, hanya mengandalkan output terminal hampir tidak terlihat logika apa pun. Inti masalahnya adalah: Anda bukan mencari "baris kode mana yang salah ditulis", melainkan mencari "Agent membuat penilaian yang tidak diharapkan dalam kombinasi konteks tertentu, pada langkah mana yang bermasalah". Masalah seperti ini, dengan mengandalkan debugger tradisional tidak akan menemukan jawabannya. Solusi yang ada biasanya hanya memiliki dua jalur: - Pertama adalah platform monitoring cloud, mengirim trace ke layanan pihak ketiga untuk dianalisis dengan dashboard - Kedua adalah menjejalkan logika logging kustom ke dalam kode Yang pertama tidak ramah bagi pengembang yang memiliki kekhawatiran privasi data, yang kedua memakan waktu dan tenaga, setiap kali framework di-upgrade harus memelihara satu set infrastruktur logging baru. Dan keduanya memiliki satu masalah bersama: mereka memberitahu Anda "apa yang terjadi", tetapi tidak membantu Anda "memperbaikinya". Workshop memilih jalur ketiga: eksekusi sepenuhnya lokal, tidak mengirim data apa pun ke server eksternal, sumber terbuka, gratis, dan memungkinkan AI berpartisipasi langsung dalam loop debugging. Setelah dijalankan, Workshop menjalankan antarmuka visual secara lokal, dan mengekspos sebuah MCP (Model Context Protocol) Server ke luar. MCP jika diterjemahkan berarti "protokol komunikasi standar yang memungkinkan tool AI dapat memanggil kemampuan eksternal" — ini adalah jembatan bagi tool pengkodean AI seperti Claude Code untuk membaca data eksternal. Setelah terhubung dengan SDK yang didukung, setiap node eksekusi Agent — setiap output token, setiap pemanggilan tool, setiap cabang keputusan — muncul secara real-time dalam mode streaming di localhost:5899, tidak perlu polling, tidak perlu refresh manual. Dengan kata-kata yang sederhana, yaitu membuka sebuah jendela monitoring secara lokal di komputer Anda, memungkinkan Anda seperti menonton siaran langsung, melihat secara real-time apa yang sedang dilakukan AI Agent. Desain paling kunci dari Workshop adalah memperkenalkan asisten desain seperti Claude Code ke dalam loop debugging. Karena Workshop mengekspos MCP Server, Claude Code dapat langsung membaca isi trace, menulis tes eval berdasarkan trace tersebut, menjalankan tes, mengamati assertion yang gagal, kembali memodifikasi kode Agent, lalu mengeksekusi ulang — sampai semua tes lulus. Raindrop menyebut loop ini sebagai "loop eval self-healing". Seluruh proses tertutup secara lokal, Claude Code membaca trace, menulis eval, melihat kegagalan, mengubah kode, menjalankan ulang, tidak memerlukan pengembang untuk turun tangan secara manual pada setiap langkah. Workshop juga mendukung fitur Replay: menarik trace dari lingkungan online kembali ke lokal, menjalankannya ulang terhadap kode nyata, dan melakukan tes regresi. Ini sangat berguna untuk situasi "terjadi kesalahan di lingkungan produksi tetapi tidak dapat direproduksi secara lokal", langsung menggunakan trace nyata untuk menjalankannya, menghemat waktu untuk membangun skenario reproduksi.

Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita

2026-05-27

Base meluncurkan tools MCP, memungkinkan AI Agent mengoperasikan dompet kripto secara langsung: transfer, tukar koin, dan cek saldo sekaligus

Tingkat kemiripan 120%關鍵字 agent同分類 zh

2026-05-26

Peneliti Google dan Meta bersuara bersama: keamanan AI Agent bukan masalah model, melainkan masalah sistem

Tingkat kemiripan 120%關鍵字 agent同分類 zh

2026-05-26

Cara membuat AI menulis kode lebih lambat, tetapi lebih akurat: Review PR multi-model, menekan probabilitas Bug seminimal mungkin

Tingkat kemiripan 120%關鍵字 bug同分類 zh

2026-05-26