Danh sách tinClaude Code ra mắt lệnh /goals mới: tách biệt việc thực thi và đánh giá, ngăn chặn AI agent lười biếng hoặc nói dối
動區 BlockTempo2026-05-15 01:08:07

Claude Code ra mắt lệnh /goals mới: tách biệt việc thực thi và đánh giá, ngăn chặn AI agent lười biếng hoặc nói dối

ORIGINALClaude Code 新推 /goals 指令:分離執行與評估,避免 AI 代理偷懶說謊
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1351 từ
Anthropic ra mắt lệnh /goals cho Claude Code, tách việc thực thi nhiệm vụ và đánh giá hoàn thành thành hai mô hình độc lập, vì để cùng một AI tự chấm bài làm của chính mình về mặt kiến trúc là một thiết kế có khiếm khuyết. (Tóm tắt trước đó: Claude Code thông báo giới hạn sử dụng Token hàng tuần tăng 50%! Trong vòng hai tháng Anthropic giành lấy hệ sinh thái developer) (Bổ sung bối cảnh: Tính năng tự động thực thi Routines của Claude Code đã ra mắt: hỗ trợ đầy đủ ba kiểu kích hoạt — lịch trình, API, sự kiện GitHub) Có lẽ bạn đã từng gặp tình huống này: AI hoàn thành thiết kế code, nó báo với bạn rằng nhiệm vụ đã xong. Nhưng vài ngày sau bạn mới phát hiện, có vài module thậm chí còn chưa được biên dịch. Đây không phải là do mô hình thiếu năng lực, mà là chính mô hình tự quyết định rằng nó "đã làm xong", nhưng thực tế thì chưa. Để cải thiện tình trạng này, tuần này Anthropic ra mắt lệnh /goals mới cho Claude Code. Logic rất rõ ràng: mô hình thực thi nhiệm vụ, và mô hình đánh giá xem nhiệm vụ đã hoàn thành hay chưa, phải là hai vai trò khác nhau. Cùng một mô hình không thể đồng thời đảm nhiệm cả hai, vì nó luôn là giám khảo tệ nhất khi chấm bài của chính mình. How do you keep Claude working until the job is done? Claude Code helps with this in a few ways, including one we shipped recently: /goal. pic.twitter.com/QtVPmwoKct — ClaudeDevs (@ClaudeDevs) May 13, 2026 Công việc của một AI coding agent là một vòng lặp: đọc file, thực thi lệnh, sửa code, rồi đánh giá xem nhiệm vụ đã hoàn thành chưa. Vấn đề nằm ở bước cuối cùng này. Ngữ cảnh tích lũy trong quá trình thực thi: các bước đã làm, các phương án đã thử, các lỗi đã đi qua… khiến mô hình bị lệch lạc trong nhận thức về tiến độ của chính nó. Nó có xu hướng đánh đồng "tôi đã làm rất nhiều" với "tôi đã làm xong". Vấn đề này trong môi trường doanh nghiệp có cái giá đắt đỏ: việc di chuyển code hoặc sửa test nếu dừng lại trước khi đạt trạng thái cuối, thường phải vài ngày sau mới bị phát hiện. Hiện tại trong ngành cũng có một số giải pháp. OpenAI để mô hình agent tự quyết định khi nào dừng, cho phép developer tự tích hợp bộ đánh giá bên ngoài. Google ADK hỗ trợ đánh giá độc lập thông qua LoopAgent, LangGraph cũng hỗ trợ kiểu tương tự, nhưng các giải pháp này có điểm chung: critic node và logic kết thúc cần developer tự thiết kế, nền tảng không cung cấp mặc định. Thiết kế cốt lõi của /goals là chính thức tách "thực thi" và "đánh giá" thành hai vai trò. Developer nhập điều kiện mục tiêu, ví dụ: /goal Tất cả test trong thư mục test/auth đều pass, và kết quả kiểm tra lint sạch Mỗi khi agent định kết thúc công việc, mô hình đánh giá sẽ tiếp quản kiểm tra. Mô hình đánh giá mặc định sử dụng Claude Haiku (mô hình nhẹ hơn thuộc Anthropic). Lý do chọn mô hình nhỏ rất đơn giản: người đánh giá chỉ cần đưa ra một phán đoán nhị phân, điều kiện thỏa mãn hoặc không thỏa mãn, không cần năng lực suy luận của mô hình lớn. Khi điều kiện chưa thỏa mãn, agent tiếp tục thực thi; khi điều kiện thỏa mãn, mô hình đánh giá sẽ ghi kết quả vào lịch sử hội thoại và xóa mục tiêu. Toàn bộ quy trình hoàn thành bên trong Claude Code, không cần thêm nền tảng quan sát của bên thứ ba hay hệ thống log tùy chỉnh. Tài liệu của Anthropic chỉ ra, một điều kiện mục tiêu hiệu quả thường cần ba yếu tố: trạng thái cuối có thể đo lường được (kết quả test, mã thoát build, số lượng file cụ thể); cách xác minh rõ ràng (ví dụ "npm test mã thoát bằng 0"); và các giới hạn không được thay đổi trong quá trình (ví dụ "không được sửa các file test khác").
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:8659877452
Nguồn:動區 BlockTempo
Đăng:2026-05-15 01:08:07
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận