ニュース一覧Claude Code の節約術:エンジニアがキャッシュ活用で週に 3 億 Token を削減、鍵は中断させないこと
動區 BlockTempo2026-05-24 04:56:39

Claude Code の節約術:エンジニアがキャッシュ活用で週に 3 億 Token を削減、鍵は中断させないこと

ORIGINALClaude Code 省錢密技:工程師一週靠快取省下 3 億 Token,關鍵在別打斷
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯4231 文字
Claude Code の長文対話で制限に達する?エンジニアの Nate Herk 氏が、キャッシュメカニズムを活用して週に 3 億 Token を節約し、1 日最大 9100 万 Token を削減した手法を公開。鍵となるのは、コードをどれだけ書くかではなく、いかにキャッシュを「中断」させず、重複するコンテキストでコストを無駄にしないかにある。 (前回の記事:Claude Code を高速化するオープンソースプロジェクト「badclaude」に Anthropic から侵害通知が届く) (背景補足:Claude Code にクラウドでの定期実行機能が追加!PC を開かなくても AI が自動で PR のレビューやアップグレードを実行) 多くの開発者が Claude Code でコーディングする際、最も頭を悩ませるのは Token の使用制限が瞬く間に底をつくことであり、長文対話はもはや贅沢品となっている。 しかし、AI の活用術をコミュニティで頻繁に共有しているインフルエンサーの Nate Herk 氏は、X への投稿で、真のコスト要因はコード量ではなく、システムが prompt caching メカニズムをうまく活用できているかどうかだと明かした。彼自身、1 週間でキャッシュにより 3 億 Token 以上を節約し、1 日のキャッシュ量は 9100 万に達した。キャッシュされた Token のコストは通常の入力 Token のわずか 10% であるため、計算上は 1 日あたり 900 万 Token 分の費用で済んでおり、プログラミング対話の寿命を実質「無料」で延長していることになる。 今週 3 億 Token を節約した。1 日 9100 万、1 週間で 3 億以上だ。 設定は何も変えていない。ただ prompt caching がバックグラウンドで正常に機能しているだけだ。 しかし、キャッシュとは何か、そしてどうすればキャッシュを「中断」させずに済むかを理解してからは、同じ使用制限内でもセッションをより長く継続できるようになった。そこで、Claude Code の prompt caching に関する 80/20 入門ガイドをまとめた。API レベルの深い詳細は省く。 キャッシュされた Token のコストは通常の入力 Token の 10%。9100 万のキャッシュ Token は、実際の請求額としては約 900 万 Token 分に相当する。 Claude Code サブスクリプション版のキャッシュ TTL は 1 時間。API のデフォルトは 5 分。Sub-agent は常に 5 分。 キャッシュはシステム層、プロジェクト層、対話層の 3 つに分かれる。 セッション途中でモデルを切り替えるとキャッシュは破壊される。「opus plan」モードの有効化も同様だ。 coding agents need glass boxes now jianshuo/ccglass > 111 stars on github > created yesterday > mit + javascript > local proxy + web dashboard for claude code, codex, deepseek-tui, and kimi > shows the full system prompt, tool schemas, message history, token/cache/cost, and… pic.twitter.com/Wot5SFV16N— Beau Johnson (@BeauJohnson89) May 24, 2026 キャッシュされたすべての Token は、通常の入力 Token の 10% のコストになる。 そのため、ダッシュボードで 1 日に 9100 万 Token がキャッシュにヒットしたと表示されても、実際の請求額は 900 万 Token 分の処理に相当する。これが、キャッシュがない場合と比べて、長時間 Claude Code を使用する際にセッションが「無料」で延長されたように感じる理由だ。 ダッシュボードには注目すべき 2 つの数値がある: Cache create:内容をキャッシュに書き込む際に発生する一度限りのコスト。これは次回の対話から機能し始める。 Cache read:Claude がキャッシュから再利用した Token。CLAUDE.md、ツール定義、過去のメッセージなどが含まれる。入力として再処理するよりもコストが 10 倍安い。 Cache read の数値が高ければ、キャッシュを有効活用できている証拠だ。低ければ、同じコンテキストに対して何度も料金を支払っていることになる。 Anthropic の Thariq 氏の言葉が印象に残っている。「我々は prompt cache のヒット率を監視しており、ヒット率が低すぎるとアラートを発し、SEV レベルのインシデントとして宣言することさえある」 彼が書いた X の投稿も素晴らしい。キャッシュヒット率が高いと、Claude Code の体感速度が上がり、Anthropic のサービスコストが下がり、サブスクリプションの枠が
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:171ed270b1
ソース:動區 BlockTempo
公開:2026-05-24 04:56:39
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント