「Digital Doorman」の構築：IRCと階層型AIエージェントによる実戦的ポートフォリオ

概要

履歴書を読み上げるだけのチャットボットを超え、IRCプロトコルと階層型LLMを活用して実際のGitHubコードを解析・回答する自律型AIエージェントの構築記録。

詳細内容

エンジニアのGeorge Larson氏が、自身のポートフォリオサイトのために構築したAIエージェント「nullclaw」と「ironclaw」の技術解説。最大の特徴は、単に履歴書テキストを返すのではなく、訪問者の質問に応じて実際のGitHubリポジトリをクローンし、コードの内容に基づいて具体的な回答を生成する点にあります。主な技術的ハイライトは以下の通りです： 1. **二層式エージェント構造**: 公開用VPS（nullclaw）とプライベート環境（ironclaw）をTailscaleで分離。公開側はZigで書かれた超軽量バイナリで動作し、非公開データへのアクセスを遮断するセキュリティ境界を構築。 2. **IRCプロトコルの採用**: 通信基盤に30年以上の歴史を持つIRCを採用。自前サーバー（Ergo）とWebクライアント（gamja）を運用することで、ベンダーロックインを排除し、独自の美学と柔軟性を確保。 3. **階層型推論（Tiered Inference）**: 応答速度とコストを最適化するため、挨拶や単純な振り分けにはHaikuを、コード解析などの高度な推論にはSonnetを使用し、1日2ドル以下の予算で運用。 4. **実戦的なセキュリティ設計**: Cloudflare経由のWebSocket、リソース制限、A2A（Agent-to-Agent）プロトコルを用いた制御されたエスカレーションなど、公開用エージェント特有の攻撃面を最小化しています。

元記事を読む