概要
履歴書を読み上げるだけのチャットボットを超え、IRCプロトコルと階層型LLMを活用して実際のGitHubコードを解析・回答する自律型AIエージェントの構築記録。
詳細内容
エンジニアのGeorge Larson氏が、自身のポートフォリオサイトのために構築したAIエージェント「nullclaw」と「ironclaw」の技術解説。最大の特徴は、単に履歴書テキストを返すのではなく、訪問者の質問に応じて実際のGitHubリポジトリをクローンし、コードの内容に基づいて具体的な回答を生成する点にあります。
主な技術的ハイライトは以下の通りです:
1. **二層式エージェント構造**: 公開用VPS(nullclaw)とプライベート環境(ironclaw)をTailscaleで分離。公開側はZigで書かれた超軽量バイナリで動作し、非公開データへのアクセスを遮断するセキュリティ境界を構築。
2. **IRCプロトコルの採用**: 通信基盤に30年以上の歴史を持つIRCを採用。自前サーバー(Ergo)とWebクライアント(gamja)を運用することで、ベンダーロックインを排除し、独自の美学と柔軟性を確保。
3. **階層型推論(Tiered Inference)**: 応答速度とコストを最適化するため、挨拶や単純な振り分けにはHaikuを、コード解析などの高度な推論にはSonnetを使用し、1日2ドル以下の予算で運用。
4. **実戦的なセキュリティ設計**: Cloudflare経由のWebSocket、リソース制限、A2A(Agent-to-Agent)プロトコルを用いた制御されたエスカレーションなど、公開用エージェント特有の攻撃面を最小化しています。