Claude Code 新推 /goals 指令：分離執行與評估，避免 AI 代理偷懶說謊

📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯1351 字

Anthropic 為 Claude Code 推出 /goals 指令，將任務執行與完成判斷分拆給兩個獨立模型，因為讓同一個 AI 評判自己的功課，在架構上就是有缺陷的設計。（前情提要：Claude Code 宣布每週 Token 使用上限增加 50%！為期兩個月 Anthropic 搶佔開發者生態）（背景補充：Claude Code 自動執行功能 Routines 上線：排程、API、GitHub 事件三種觸發全支援）可能有碰到過這種狀況：AI 完成了程式碼設計，它回應你任務完成。但幾天後你才發現，幾個模組根本沒被編譯。這不是模型能力不足，而是模型自己決定它「已經做完了」，但實際上它沒有。為了改善這種狀況，Anthropic 本週為 Claude Code 新推出 /goals 指令。邏輯很直接：執行任務的模型，和判斷任務是否完成的模型，必須是兩個不同的角色。同一個模型不能同時扮演這兩者，因為它永遠是評判自己功課最糟糕的評審。 How do you keep Claude working until the job is done? Claude Code helps with this in a few ways, including one we shipped recently: /goal. pic.twitter.com/QtVPmwoKct — ClaudeDevs (@ClaudeDevs) May 13, 2026 AI 編碼代理的工作是一個迴圈：讀取檔案、執行命令、修改程式碼，然後判斷任務是否完成。問題就在最後這一步。執行過程中積累的上下文：已完成的步驟、嘗試過的方法、走過的錯誤…讓模型對自身進度產生偏差。它傾向把「我做了很多」等同於「我做完了」。這個問題在企業環境中代價昂貴：程式碼遷移或測試修復若在終態前停止，往往要幾天後才被發現。目前產業也有一些方案。OpenAI 讓代理模型自行決定何時停止，允許開發者自行接入外部評估器。Google ADK 支援透過 LoopAgent 實現獨立評估，LangGraph 也支援類似模式，但這些方案有共同點：批評節點（critic node）和終止邏輯需要開發者自己設計，平台不提供預設。 /goals 的核心設計是把「執行」和「評估」正式拆成兩個角色。開發者輸入目標條件，例如： /goal test/auth 目錄下的所有測試都通過，並且 lint 檢查結果為乾淨每當代理嘗試結束工作，評估模型就接手核查。評估模型預設使用 Claude Haiku（Anthropic 旗下較輕量的模型）。選擇小模型的原因很簡單：評估者只需要做一個二元判斷，條件滿足或條件未滿足，不需要大模型的推理能力。當條件未滿足，代理繼續執行；當條件滿足，評估模型將結果記錄到對話記錄並清除目標。整個流程在 Claude Code 內部完成，不需要額外的第三方可觀察性平台或自訂日誌系統。 Anthropic 檔案指出，有效的目標條件通常需要三個要素：可衡量的終態（測試結果、建置退出碼、特定檔案數量）；明確的驗證方式（例如「npm test 退出碼為 0」）；以及過程中不得變動的限制（例如「不得修改其他測試檔案」）。

資料狀態✓ 已擷取全文閱讀原文（動區 BlockTempo）

🔍歷史類似事件· 關鍵字 + 標的比對6 則

2026-05-28

相似度 170%關鍵字 code/claude同分類 zh

2026-05-26

Claude Code 讓 Uber 兩個月燒完年度預算後，COO 直言：Token 消耗和有用輸出不存在正比

相似度 170%關鍵字 code/claude同分類 zh

2026-05-24

我 30 人的公司全部用 Claude Code AI 化，結果「人類要做的工作比以往更多」

相似度 170%關鍵字 code/claude同分類 zh

2026-05-24

Claude Code 省錢密技：工程師一週靠快取省下 3 億 Token，關鍵在別打斷

相似度 170%關鍵字 code/claude同分類 zh

2026-05-22

Andrej Karpathy 提煉「CLAUDE.md 四大準則」引爆 GitHub，讓 AI 寫 Code 準確率飆破 90%

相似度 170%關鍵字 code/claude同分類 zh

2026-05-14

Notion 推出開發者平台：自訂程式碼、跨資料庫同步、整合 Claude Code,Codex,Cursor – Notion Developer Platform

相似度 170%關鍵字 code/claude同分類 zh

💡 目前用關鍵字 + 標的比對（MVP）· 之後會升級為 embedding 語意搜尋

原始資訊

ID：8659877452

來源：動區 BlockTempo

發佈：2026-05-15 01:08:07

分類：zh_news · 導出分類 zh

標的：未指定

社群投票：+0 / −0 · ⭐ 0 重要 · 💬 0 留言