掲載済み (2025-12-27号)
#005 462文字 • 3分

## LLMによって非定形の会話ログを価値あるFAQデータにする話

日本語

掲載情報

2025年12月27日土曜日号 メインジャーナル掲載

概要

https://www.m3tech.blog/entry/2025/12/21/100000

詳細内容

## LLMによって非定形の会話ログを価値あるFAQデータにする話 https://www.m3tech.blog/entry/2025/12/21/100000 LLMを用いて非構造化な問い合わせログを価値あるFAQ資産へと変換する「分類・クラスタリング・生成」の自動化パイプラインを構築する。 **Content Type**: Technical Reference **Language**: ja **Scores**: Signal:5/5 | Depth:4/5 | Unique:3/5 | Practical:5/5 | Anti-Hype:4/5 **Main Journal**: 85/100 | **Annex Potential**: 81/100 | **Overall**: 84/100 **Topics**: [[LLM, FAQ生成, クラスタリング, Embedding, 検索エンジン最適化]] エムスリーが構築した、サポート窓口の非定型な問い合わせログ(フロー情報)を、価値あるFAQ(ストック情報)へと自動変換するデータ処理パイプラインの詳細を解説する。サービス成長に伴い増大するユーザーの声に対し、人手によるFAQ作成の限界(高コスト・記事乱立・検索性低下)をLLMの活用で解決している。 パイプラインは「分類・クラスタリング・生成」の3ステップで構成される。まず「分類」では、LLMが既存FAQとの突合を行い、新規に作成が必要な課題のみを抽出して後続処理の純度を高める。次に「クラスタリング」では、Embeddingによる意味的類似性に基づいたグルーピングを行う。これにより、主観的なカテゴリ分けを排除し、実際のユーザー課題の粒度で「1つのIssueに対して1つの記事」という構造を維持し、類似記事の乱立を防いでいる。最後の「生成」では、ドラフト作成時に解決策を具体的に提示する制約をかけるなど、プロンプトエンジニアリングによって自己解決率を高めるコンテンツを実現している。 運用面では「Human-in-the-loop」を採用し、Elasticsearchのステータスフラグ管理によって、レビュー済みの記事のみを即時反映・公開停止できるアジャイルな仕組みを導入。さらに、検索精度の向上に向けた独自の工夫として、実際の問い合わせ行動をスコアリングに反映している。具体的には、問い合わせ内容を既存FAQに紐付け、流入の多いトピック(ホットなFAQ)を検索上位に表示させることで、実需に即した検索体験を提供している。 著者は、このフレームワークがFAQ生成に留まらず、ユーザー要望(VoC)からの開発チケット自動起票や、社内チャットからのナレッジマネジメントなど、あらゆる非構造化データの資産化に応用可能であると強調している。PoCから本番リリースまでわずか1ヶ月という短期間で実現された本事例は、LLMを単なる要約ツールではなく、データの「構造化エンジン」および「検索最適化のトリガー」として定義した実用的で優れた設計パターンと言える。