掲載済み (2026-02-21号)
#050 173文字 • 1分

LLMエージェントのコスト曲線:コンテキスト増大に伴う二次関数的な費用の罠

原題: Expensively Quadratic: the LLM Agent Cost Curve

英語

掲載情報

2026年2月21日土曜日号 アネックス掲載

概要

コーディングエージェントのループ構造において、コンテキスト長とターン数が増えるにつれ「キャッシュ読み取り」費用が二次関数的に増大し、総コストの80%以上を占めるようになる構造的課題を指摘しています。

詳細内容

コーディングエージェント(Shelley等)の動作は「ユーザー入力→LLM→ツール実行→結果をコンテキストに追加して再試行」というループに基づいています。現在のAnthropic等の料金体系では、入力、キャッシュ書き込み、出力に加え「キャッシュ読み取り」が課金対象となります。このループ構造では、ターンを重ねるごとに「過去の全コンテキストを読み出す」コストが累積するため、コンテキストが長くなるほどコストが二次関数的に増加します。実際の分析では、コンテキストが5万トークンに達するとはるかに安価なはずのキャッシュ読み取りが総コストの半分を占め、最終的には87%に達した事例が示されています。著者はこの対策として、ツール実行を細切れにせず一括で行うこと、サブエージェントによるコンテキストの分離、あるいは定期的な会話のリセットといったオーケストレーションの重要性を説いています。