掲載済み (2025-08-10号)
#065 550文字 • 3分

## tokens are getting more expensive

掲載情報

概要

https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed

詳細内容

## tokens are getting more expensive https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed 最新LLMへの需要集中とエージェントによるトークン消費の爆発的な増加により、AIサブスクリプションのビジネスモデルは「LLMコストは劇的に下がる」という期待にもかかわらず持続不可能になっていると警鐘を鳴らす。 **Content Type**: AI Hype **Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:5/5 **Main Journal**: 80/100 | **Annex Potential**: 75/100 | **Overall**: 84/100 **Topics**: [[AIビジネスモデル, LLMコスト構造, エージェントの利用パターン, サブスクリプションモデルの課題, 垂直統合]] 「AIのコストは10分の1になる」という期待に反し、多くのAIサブスクリプション企業がなぜ利益率悪化に苦しむのかを分析しています。Webアプリケーションエンジニアにとって、これは開発やサービス設計の根本的な課題です。 主な論点は二つ。第一に、ユーザーは常に「最新かつ最高」のAIモデルを求め、安価になった旧モデルには需要が移りません。最先端モデルのトークン単価は高止まりしており、GPT-3.5が10分の1に安くなっても、需要の99%は最新のGPT-4やClaude 3 Opusに移る現実があります。ユーザーは時間とのバランスを考慮し、品質を妥協しないため、コスト削減の恩恵が限定的です。 第二に、エージェント技術の進化により、AIが一度に消費するトークン量が爆発的に増加している点です。以前は短い応答で済んだタスクが、エージェントが長時間推論・実行を繰り返すことで、何万、何億ものトークンを消費する「バックグラウンドで24時間稼働するコード変換エンジン」のような使われ方に変化しました。Claude Codeの無制限プラン撤回は、このトークン消費爆発の具体的な事例であり、固定料金モデルが根本的に破綻したことを示唆します。 この状況は、AIサービス企業に「囚人のジレンマ」を強いています。従量課金が経済的に健全と知りつつも、市場シェア争いのため競合が固定料金を提供する中で、赤字覚悟で固定料金を維持せざるを得ないのです。 著者によると、この「トークンショートスクイズ」から脱却する道は三つです。 1. **従量課金**: 消費者には不評だが、唯一経済的に持続可能なモデル。 2. **高いスイッチングコスト**: ゴールドマン・サックスのような大企業向けに特化し、導入後の解約が極めて困難になるモデル(Devinの戦略)。 3. **垂直統合**: Replitのように、コード生成エージェント自体は赤字でも、ホスティングやデータベースなどの周辺サービスで収益を上げるモデル。AIは顧客獲得のための「マーケティング費用」と見なされます。 この分析は、AIを活用したアプリケーションやサービスを開発する際、単なるAIの性能や単価だけでなく、その利用モデルやビジネス戦略の持続可能性を深く理解することの重要性を強調します。安易な価格下落予測に頼らず、ユーザーの消費行動の変化とコスト構造の現実を直視し、より堅牢なビジネスモデルを構築する視点が求められます。