뉴스 목록Claude Code 새 /goals 명령어 출시: 실행과 평가 분리, AI 에이전트의 게으름과 거짓말 방지
動區 BlockTempo2026-05-15 01:08:07

Claude Code 새 /goals 명령어 출시: 실행과 평가 분리, AI 에이전트의 게으름과 거짓말 방지

ORIGINALClaude Code 新推 /goals 指令:分離執行與評估,避免 AI 代理偷懶說謊
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯1351 자
Anthropic은 Claude Code를 위해 /goals 명령어를 출시하며, 작업 실행과 완료 판단을 두 개의 독립적인 모델로 분리했습니다. 동일한 AI가 자신의 과제를 평가하게 하는 것은 구조적으로 결함이 있는 설계이기 때문입니다. (이전 내용: Claude Code, 주간 Token 사용 한도 50% 상향 발표! 2개월간 Anthropic의 개발자 생태계 선점) (배경 보충: Claude Code 자동 실행 기능 Routines 출시: 스케줄링, API, GitHub 이벤트 등 세 가지 트리거 모두 지원) 이런 상황을 겪어본 적이 있을 것입니다. AI가 코드 설계를 완료하고 작업이 끝났다고 응답했지만, 며칠 뒤에야 몇몇 모듈이 전혀 컴파일되지 않았음을 발견하는 경우입니다. 이는 모델의 능력이 부족해서가 아니라, 모델 스스로가 "이미 다 했다"고 판단했지만 실제로는 그렇지 않았기 때문입니다. 이러한 상황을 개선하기 위해 Anthropic은 이번 주 Claude Code에 새로운 /goals 명령어를 도입했습니다. 논리는 간단합니다. 작업을 실행하는 모델과 작업 완료 여부를 판단하는 모델은 서로 다른 역할이어야 한다는 것입니다. 동일한 모델이 이 두 가지 역할을 동시에 수행할 수는 없습니다. 자기 자신의 과제를 평가하는 데 있어 가장 형편없는 심사위원이기 때문입니다. How do you keep Claude working until the job is done? Claude Code helps with this in a few ways, including one we shipped recently: /goal. pic.twitter.com/QtVPmwoKct — ClaudeDevs (@ClaudeDevs) May 13, 2026 AI 코딩 에이전트의 작업은 파일 읽기, 명령 실행, 코드 수정, 그리고 작업 완료 판단이라는 루프로 이루어집니다. 문제는 바로 마지막 단계에 있습니다. 실행 과정에서 축적된 컨텍스트(완료된 단계, 시도했던 방법, 겪었던 오류 등)는 모델이 자신의 진행 상황에 대해 편향을 갖게 만듭니다. 모델은 "내가 많은 일을 했다"는 것을 "내가 일을 끝냈다"와 동일시하는 경향이 있습니다. 이 문제는 기업 환경에서 큰 비용을 초래합니다. 코드 마이그레이션이나 테스트 수정이 최종 단계에 도달하기 전에 멈추면, 며칠이 지나서야 발견되는 경우가 많기 때문입니다. 현재 업계에도 몇 가지 솔루션이 있습니다. OpenAI는 에이전트 모델이 스스로 종료 시점을 결정하게 하며, 개발자가 외부 평가기를 직접 연결할 수 있도록 허용합니다. Google ADK는 LoopAgent를 통한 독립적인 평가를 지원하고, LangGraph도 유사한 패턴을 지원합니다. 하지만 이러한 솔루션들에는 공통점이 있습니다. 크리틱 노드(critic node)와 종료 로직을 개발자가 직접 설계해야 하며, 플랫폼이 기본값을 제공하지 않는다는 점입니다. /goals의 핵심 설계는 '실행'과 '평가'를 두 개의 역할로 공식적으로 분리하는 것입니다. 개발자가 목표 조건을 입력하면, 예를 들어: /goal test/auth 디렉토리 내의 모든 테스트가 통과되고, lint 검사 결과가 깨끗할 것 에이전트가 작업을 종료하려고 할 때마다 평가 모델이 넘겨받아 검증합니다. 평가 모델은 기본적으로 Claude Haiku(Anthropic 산하의 경량 모델)를 사용합니다. 작은 모델을 선택한 이유는 간단합니다. 평가자는 조건 충족 여부라는 이진 판단만 하면 되며, 대형 모델의 추론 능력까지는 필요하지 않기 때문입니다. 조건이 충족되지 않으면 에이전트가 계속 실행하고, 조건이 충족되면 평가 모델이 결과를 대화 기록에 남기고 목표를 삭제합니다. 전체 프로세스는 Claude Code 내부에서 완료되며, 별도의 서드파티 관측성 플랫폼이나 커스텀 로그 시스템이 필요하지 않습니다. Anthropic 문서에 따르면, 효과적인 목표 조건은 보통 세 가지 요소를 필요로 합니다. 측정 가능한 최종 상태(테스트 결과, 빌드 종료 코드, 특정 파일 개수), 명확한 검증 방식(예: "npm test 종료 코드가 0일 것"), 그리고 과정 중에 변경되어서는 안 되는 제한 사항(예: "다른 테스트 파일은 수정하지 말 것")입니다.
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)
🔍과거 유사 사건· 키워드 + 종목 매칭6 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:8659877452
출처:動區 BlockTempo
발행:2026-05-15 01:08:07
분류:zh_news · 도출된 분류 zh
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글