Raindrop Workshop가 Codex로 당신의 AI Agent의 버그를 자동으로 찾아 수정해 드립니다 (무료 오픈소스)

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯1609 자

AI Agent 개발자 도구 회사 Raindrop이 이번 주 로컬 디버거 Workshop(v0.1.6)을 오픈소스로 공개해, 개발자가 Agent의 모든 token 출력과 도구 호출을 실시간으로 추적할 수 있게 했으며, MCP를 통해 Claude Code가 자동으로 읽고, 테스트를 작성하고, 수정할 수 있도록 했다. (이전 내용: Claude가 코딩하면서 미친 듯이 실수하고 시치미를 뗀다? Andrej Karpathy의 12가지 규칙을 개조해 오류율을 41%에서 3%로 줄이는 방법) (배경 보충: Anthropic, "Claude for Small Business" 출시: 중소기업 AI 자동화 업무를 겨냥) 로그를 열어보면, 잔뜩 쌓인 API 호출과 token 숫자만 보일 뿐, 어느 결정에서 잘못된 길로 갔는지 알려주는 단서는 어디에도 없다. 당신의 AI Agent가 방금 이상한 결과를 내놓았다. 예상하지 않았던 도구를 선택했고, 의미가 모호한 응답을 출력했다. Raindrop은 5월 14일, 이러한 상황이 더 이상 일어나지 않도록 시도하는 오픈소스 도구를 발표했다: 완전히 로컬, 완전히 무료인 AI Agent 디버거 Workshop. 개발자가 Agent의 모든 token 출력과 도구 호출을 실시간으로 추적할 수 있게 하고, 디버깅 자체는 Claude Code나 Codex에게 맡길 수 있도록 한다. 전통적인 소프트웨어 디버깅에는 중단점이 있고, 완전한 호출 스택이 있으며, 결정론적인 실행 경로가 있다. AI Agent의 디버깅은 다르다. 그 행동은 확률적이며, 동일한 입력이라도 서로 다른 실행에서 완전히 다른 경로를 갈 수 있다. 그 결정은 여러 계층의 LLM 호출 사이에 분산되어 형성되며, 단순히 터미널 출력만으로는 어떤 논리도 거의 보이지 않는다. 문제의 본질은: 당신이 찾고 있는 것은 "어느 줄의 코드가 잘못 작성되었는가"가 아니라, "Agent가 어떤 특정한 컨텍스트 조합에서 예상 밖의 판단을 내렸는데, 어느 단계에서 문제가 발생했는가"이다. 이런 문제는 전통적인 debugger로는 답을 찾을 수 없다. 기존 해결책은 보통 두 가지 길뿐이다: - 하나는 클라우드 모니터링 플랫폼으로, trace를 제3자 서비스로 보내 대시보드로 분석하는 것 - 다른 하나는 코드 안에 커스텀 logging 로직을 잔뜩 채워 넣는 것 전자는 데이터 프라이버시에 우려가 있는 개발자에게 친화적이지 않고, 후자는 시간과 노력이 많이 들며 프레임워크가 업그레이드될 때마다 새로운 logging 인프라를 유지보수해야 한다. 게다가 두 방식 모두 공통된 문제가 있다: 그것들은 당신에게 "무엇이 일어났는지"는 알려주지만, "그것을 고치는 것"은 도와주지 않는다. Workshop은 세 번째 길을 선택했다: 완전히 로컬에서 실행되며, 어떠한 데이터도 외부 서버로 전송하지 않고, 오픈소스이며, 무료이고, AI가 직접 디버깅 루프에 참여하도록 한다. 실행 후, Workshop은 로컬에서 시각화 인터페이스를 실행하고, 외부로 MCP(Model Context Protocol) Server를 노출한다. MCP를 풀어 말하면 "AI 도구가 외부 능력을 호출할 수 있게 하는 표준 통신 프로토콜"이다 — 그것은 Claude Code 등 AI 코딩 도구가 외부 데이터를 읽는 다리이다. 지원되는 SDK에 접속하기만 하면, Agent의 모든 실행 노드 — 모든 token 출력, 모든 도구 호출, 모든 결정 분기 — 가 스트리밍 방식으로 실시간으로 localhost:5899에 나타나며, polling도 필요 없고, 수동으로 새로고침할 필요도 없다. 직설적으로 말하면, 당신의 컴퓨터 로컬에 모니터링 창을 하나 열어 두고, 마치 라이브 방송을 보는 것처럼 AI Agent가 무엇을 하고 있는지 실시간으로 볼 수 있게 하는 것이다. Workshop의 가장 핵심적인 설계는, Claude Code 같은 코딩 어시스턴트를 디버깅 루프에 끌어들이는 것이다. Workshop이 MCP Server를 노출하기 때문에, Claude Code는 trace 내용을 직접 읽어 들이고, 이 trace들을 바탕으로 eval 테스트를 작성하며, 테스트를 실행시키고, 실패한 assertion을 관찰하며, 돌아가서 Agent의 코드를 수정하고, 다시 실행한다 — 모든 테스트가 통과할 때까지. Raindrop은 이 루프를 "자가 수복 eval 루프"라고 부른다. 전체 과정이 로컬에서 폐쇄 루프를 이루며, Claude Code가 trace를 읽고, eval을 작성하고, 실패를 보고, 코드를 고치고, 다시 실행하며, 개발자가 모든 단계에 수동으로 개입할 필요가 없다. Workshop은 또한 Replay 기능을 지원한다: 온라인 환경의 trace를 로컬로 가져와, 실제 코드에 대해 다시 실행하여 회귀 테스트를 수행한다. 이는 "프로덕션 환경에서는 오류가 나지만 로컬에서는 재현되지 않는" 상황에 특히 유용하며, 실제 trace를 직접 가져다 실행함으로써 재현 시나리오를 구성하는 시간을 절약해 준다.

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)

🔍과거 유사 사건· 키워드 + 종목 매칭6 건

2026-05-18

싱가포르 외교부 장관 연설》「가재(샤오룽샤)」를 설치하고 끌 엄두를 못 냈다! AI Agent를 써본 적 없는 관료가 감히 국가 통치를 논할 수 있는가?

유사도 120%關鍵字 agent同分類 zh

2026-05-18

Hermes Agent 대규모 업데이트》proxy 명령어 추가로 3개 AI 구독을 로컬 API로 전환

유사도 120%關鍵字 agent同分類 zh

2026-05-16

OpenAI 제품 전선 통합! Greg Brockman이 ChatGPT, Codex 및 개발자 API를 동시에 총괄

유사도 120%關鍵字 codex同分類 zh

2026-05-15