概要
https://zenn.dev/knowledgesense/articles/3bd20780949e58
詳細内容
## 「Deep Research」の「がっかり体験」を減らす手法
https://zenn.dev/knowledgesense/articles/3bd20780949e58
AIエージェントを用いた「Deep Research」の不満点を解決するため、リアルタイムのユーザー介入による軌道修正を可能にする「Enterprise Deep Research (EDR)」手法の仕組みと成果を解説する。
**Content Type**: Research & Analysis
**Language**: ja
**Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:5/5
**Main Journal**: 83/100 | **Annex Potential**: 84/100 | **Overall**: 84/100
**Topics**: [[AIエージェント, Deep Research, RAG, ユーザーフィードバック, プロセス可視化]]
本記事は、Salesforce AI Researchが2025年10月に提案した「Enterprise Deep Research (EDR)」という新しい手法について、その概要と重要性を解説する。EDRは、AIエージェントによる「Deep Research」で発生しがちな「がっかり体験」を解消するために開発された。
従来のDeep Research機能は、一度調査を開始するとAIが30分程度自己完結的に稼働し、途中でユーザーが介入して軌道修正することができないという問題があった。このため、最終的に生成されるレポートが期待と大きくズレてしまい、無駄な時間と労力を費やす「がっかり体験」に繋がりやすかった。GoogleやOpenAIのDeep Researchでも進捗状況は確認できるものの、途中で完全に停止して最初からやり直すしかなく、効率が悪いという課題があった。
EDRは、このような問題を解決するため、「途中で全消しすることなく、AIエージェントに口出しできる」仕組みを提供する。具体的には、AIのToDoリストを常にユーザーに可視化し、リアルタイムでの軌道修正を可能にする。この手法では、まず「Master Research Agent」がユーザーの質問に対し調査計画を分解してタスクリストを作成し、これを`todo.md`として可視化する。次に、Web検索、論文検索、コード検索などの専門エージェントが各タスクを遂行する。各ループの終わりに知識ギャップが特定され、ユーザーからのフィードバック(口出し)があれば、それが最優先でToDoに反映され、不要なタスクのキャンセルや新規タスクの追加が行われる。これにより、AIが想定外の方向に暴走するのを防ぎ、ユーザーが意図する調査へと導くことが可能となる。
成果として、EDRはDeepResearch BenchやDeepConsultといった公開ベンチマークにおいて、既存のDeep Researchサービスと同等以上の性能を示している。特に社内データベースに対するSQL生成・実行精度では95%超、ユーザー満足度も4.8/5と高く評価されている。
著者は、「がっかり体験」はDeep Researchに限らず、あらゆるAIエージェントで発生していると指摘する。そのため、EDRのような「追加指示」できる手法は、今後、すべてのAIエージェントにおいて標準機能となる可能性が高いと見込んでいる。この手法は、RAGシステムを構築するウェブアプリケーションエンジニアにとって、回答精度を向上させ、ユーザーエクスペリエンスを高める上で重要な選択肢となるだろう。