概要
Codex CLIの新機能であるsubagentsを活用し、大規模なRustコードのプルリクエストを並列レビューすることで、時間短縮と指摘数向上のトレードオフを検証した記事。
詳細内容
### 概要
Codex CLIに導入された、複数のエージェントを並列起動する「subagents」機能を実戦投入した検証レポートです。PythonからRustへフルリライトされた大規模なPull Request(約9000行)を対象に、単一エージェント、標準並列、カスタム定義エージェントの3パターンで比較検証を行っています。
### 検証結果とパフォーマンス
- **実行効率:** 並列化によりレビュー所要時間が約6分から3分へと半減しました。メインエージェントがタスクを分散し、結果を統合する流れがログから確認されています。
- **指摘の質:** 単一エージェントでは5件だった指摘数が、カスタムエージェント構成では11件に倍増。特定領域(セキュリティ、パフォーマンス、Rustのイディオム)に特化させたプロンプトが有効に機能しました。
- **リソース消費:** 利便性の代償として、Weekly limitの消費量が3倍(4%から12%)に増加しており、コンテキストのフォークによるコスト増が課題となります。
### 運用のヒントと限界
カスタムエージェントをTOMLで定義し、`developer_instructions`でスコープを限定することで、複雑なタスクのタイムアウトを回避できる可能性が示唆されました。しかし、Zip-slipのような高度な脆弱性を見落とすなど、LLM自体の推論限界も依然として存在するため、人手による確認との組み合わせが重要です。