概要
食べログが、障害対応の初動を迅速化するため、Slack上でログ分析や手順提案を自動で行い人間と協働するAIエージェントを構築・導入した事例。
詳細内容
食べログの検索システムにおける障害対応の課題(初動のタイムラグ、属人化、心理的負担)を解決するために開発されたAIエージェントの設計と実装に関する解説記事です。このエージェントは、アラート通知をトリガーに自律的に起動し、BigQueryによるログ分析、Confluence内の社内ナレッジ検索、Web検索を組み合わせて状況を整理し、対応手順をSlackスレッドへ提案します。技術スタックにはGoogle CloudのVertex AI Agent Engineを採用し、Slackの新機能である「chat_stream」を用いたストリーミング出力や、進捗のリアルタイム表示など、対応者が安心して利用できるUXが追求されています。AIはあくまで提案に留め、最終的な判断と実行を人間が行う「Human-in-the-Loop」の設計により、安全性を担保しつつ復旧までの時間を短縮しています。