Raindrop Workshop sử dụng Codex giúp AI Agent của bạn tự động tìm bug và sửa lỗi (miễn phí mã nguồn mở)

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1609 từ

Công ty công cụ phát triển AI Agent Raindrop tuần này đã mã nguồn mở trình gỡ lỗi cục bộ Workshop (v0.1.6), cho phép các nhà phát triển theo dõi theo thời gian thực từng token đầu ra và lệnh gọi công cụ của Agent, đồng thời thông qua MCP cho phép Claude Code tự động đọc, viết kiểm thử và sửa lỗi. (Tóm tắt trước: Claude viết code mắc lỗi điên cuồng giả vờ ngây ngô? Cải tiến 12 quy tắc của Andrej Karpathy giúp bạn giảm tỷ lệ lỗi từ 41% xuống còn 3%) (Bổ sung bối cảnh: Anthropic ra mắt "Claude for Small Business": Nhắm vào tự động hóa AI cho doanh nghiệp vừa và nhỏ) Bạn mở nhật ký, thấy một đống lệnh gọi API và các con số token, nhưng không có bất kỳ manh mối nào cho biết quyết định nào đã đi sai. AI Agent của bạn vừa cho ra một kết quả kỳ lạ. Nó chọn một công cụ mà bạn không hề mong đợi, đưa ra một phản hồi với ngữ nghĩa mơ hồ. Vào ngày 14 tháng 5, Raindrop đã phát hành một công cụ mã nguồn mở nhằm cố gắng ngăn chặn tình huống này xảy ra lần nữa: một trình gỡ lỗi AI Agent hoàn toàn cục bộ, hoàn toàn miễn phí mang tên Workshop. Cho phép các nhà phát triển theo dõi theo thời gian thực từng token đầu ra và lệnh gọi công cụ của Agent, sau đó giao việc gỡ lỗi đó cho Claude Code hoặc Codex thực hiện. Việc gỡ lỗi phần mềm truyền thống có điểm dừng (breakpoint), có ngăn xếp lệnh gọi đầy đủ, có đường dẫn thực thi xác định. Việc gỡ lỗi AI Agent thì khác. Hành vi của nó mang tính xác suất, cùng một đầu vào có thể đi theo những con đường hoàn toàn khác nhau trong các lần thực thi khác nhau; các quyết định của nó được hình thành phân tán giữa nhiều lớp lệnh gọi LLM, chỉ dựa vào đầu ra của terminal thì hầu như không thể thấy được bất kỳ logic nào. Bản chất của vấn đề là: bạn không phải đang tìm "dòng code nào đã viết sai", mà đang tìm "Agent đã đưa ra một phán đoán ngoài dự kiến trong một tổ hợp ngữ cảnh cụ thể nào đó, vấn đề xảy ra ở bước nào". Loại vấn đề này, debugger truyền thống không thể tìm ra câu trả lời. Các giải pháp hiện có thường chỉ có hai con đường: - Một là nền tảng giám sát đám mây, gửi trace tới dịch vụ bên thứ ba và phân tích bằng bảng điều khiển - Hai là nhồi đầy logic logging tùy chỉnh vào trong code Cách thứ nhất không thân thiện với các nhà phát triển có lo ngại về quyền riêng tư dữ liệu, cách thứ hai tốn thời gian và công sức, mỗi lần nâng cấp framework lại phải bảo trì một bộ cơ sở hạ tầng logging mới. Hơn nữa, cả hai đều có một vấn đề chung: chúng nói cho bạn biết "điều gì đã xảy ra", nhưng không giúp bạn "sửa nó". Workshop đã chọn con đường thứ ba: thực thi hoàn toàn cục bộ, không gửi bất kỳ dữ liệu nào ra máy chủ bên ngoài, mã nguồn mở, miễn phí, cho phép AI trực tiếp tham gia vào vòng lặp gỡ lỗi. Sau khi khởi động, Workshop chạy một giao diện trực quan hóa ở cục bộ, và phơi bày ra bên ngoài một MCP (Model Context Protocol) Server. MCP dịch ra nghĩa là "giao thức truyền thông tiêu chuẩn cho phép các công cụ AI gọi các năng lực bên ngoài" — nó là cầu nối để các công cụ mã hóa AI như Claude Code đọc dữ liệu bên ngoài. Một khi tích hợp với SDK được hỗ trợ, mỗi nút thực thi của Agent — mỗi token đầu ra, mỗi lệnh gọi công cụ, mỗi nhánh quyết định — đều xuất hiện theo thời gian thực dưới dạng luồng (stream) tại localhost:5899, không cần polling, không cần làm mới thủ công. Nói thẳng ra, là mở một cửa sổ giám sát cục bộ trên máy tính của bạn, cho phép bạn như đang xem livestream, thấy theo thời gian thực AI Agent đang làm gì. Thiết kế then chốt nhất của Workshop là đưa các trợ lý thiết kế như Claude Code vào vòng lặp gỡ lỗi. Vì Workshop phơi bày MCP Server, Claude Code có thể trực tiếp đọc nội dung trace, dựa trên những trace này viết bài kiểm thử eval, chạy các bài kiểm thử đó, quan sát các assertion thất bại, quay lại sửa code của Agent, rồi thực thi lại — cho đến khi tất cả các bài kiểm thử đều vượt qua. Raindrop gọi vòng lặp này là "vòng lặp eval tự sửa chữa". Toàn bộ quá trình khép kín tại cục bộ, Claude Code đọc trace, viết eval, xem lỗi, sửa code, chạy lại, không cần nhà phát triển can thiệp thủ công vào từng bước. Workshop còn hỗ trợ chức năng Replay: kéo trace từ môi trường online về cục bộ, thực thi lại trên code thực tế để làm kiểm thử hồi quy. Điều này đặc biệt hữu ích cho các tình huống "lỗi xảy ra ở môi trường production nhưng không thể tái hiện ở cục bộ", trực tiếp lấy trace thực tế để chạy, tiết kiệm thời gian xây dựng kịch bản tái hiện.

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-20

Hermes Agent đã tích hợp công cụ CLI chính thức của X! xAI phát hành hướng dẫn cài đặt

Độ tương đồng 120%關鍵字 agent同分類 zh

2026-05-18

Bài phát biểu của Bộ trưởng Ngoại giao Singapore: Tôi đã cài đặt "AI Agent" và không dám tắt! Các quan chức chưa từng sử dụng AI Agent thì làm sao dám bàn về quản trị quốc gia?

Độ tương đồng 120%關鍵字 agent同分類 zh

2026-05-18

Bản cập nhật lớn Hermes Agent » Thêm lệnh proxy để chuyển đổi đăng ký 3 dịch vụ AI thành API cục bộ

Độ tương đồng 120%關鍵字 agent同分類 zh

2026-05-16