## ドキュメント駆動開発に備える

概要

https://zenn.dev/double_oxygen/articles/c616835f11aca6

詳細内容

## ドキュメント駆動開発に備える https://zenn.dev/double_oxygen/articles/c616835f11aca6 LLMを活用したドキュメント駆動開発（DocDD）の課題解決能力を探るため、GitHub Copilot Agentモードで複数のLLMモデルを用いた実験を行い、その有効性とモデルごとの特性を検証する。 **Content Type**: Research & Analysis **Language**: ja **Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:5/5 | Anti-Hype:4/5 **Main Journal**: 83/100 | **Annex Potential**: 82/100 | **Overall**: 84/100 **Topics**: [[LLM, ドキュメント駆動開発, GitHub Copilot, Vibe Coding, AIエージェント]] LLM技術の急速な進展により、GitHub Copilotなどの開発ツールが常態化し、Vibe Codingのような自然言語でのソフトウェア開発が注目されています。しかし、LLMに開発を任せることで、実装の一貫性欠如、運用の困難性、セキュリティリスクなどの課題が顕在化しています。本記事の著者は、これらの課題を解決する手法として「ドキュメント駆動開発（DocDD）」を提唱します。DocDDは、機能実装に先立って開発文書を最も重要な要素として位置づけ、テスト駆動開発（TDD）や仕様駆動開発（SDD）との相性が良いとされます。従来DocDDは文書作成に要するコストが問題でしたが、LLMの登場によりこの障壁が克服され、AI中心開発の欠点を補完する理にかなった方法論として期待が寄せられています。著者は、ドキュメント駆動開発を効率的かつ高品質に運用するための課題を探るため、GitHub Copilot ChatのAgentモード（0.33.4）を利用し、GPT-4o、GPT-5.1、GPT-5.1-Codex、Claude Haiku 4.5、Claude Sonnet 4.5、Claude Opus 4.5の各モデルで実験を行いました。 **実験1：日本語文書生成** AGENTS.mdで日本語の文書生成を指示したところ、どのモデルも問題なく対応できました。ただし、曖昧なカタカナ語などは仕様の厳密性を損なうため、用語集の準備などにより曖昧さを排除する工夫が必要であると指摘されています。 **実験2：テンプレートに従った生成** 事前に定義したテンプレートに従って要求仕様書を生成する実験では、どのモデルもテンプレート形式での生成に成功しました。Claude系モデルは指示がなくても項目数を柔軟に調整しましたが、GPT系モデルはテンプレートに忠実で、今回は要求仕様としての考慮不足と評価されました。テンプレート設計において、柔軟性か忠実性かのバランスを考慮した指示が重要であることが示唆されました。 **実験3：ID追跡と関連付け** 要求仕様書のIDと関連付けて外部設計書を生成する実験では、Claude系モデルがより要求内容を正確に反映した設計を行う傾向が見られました。特にClaude Opusは、設計に不要な項目を見抜くなど、高度な理解力を示しました。一方、GPT系モデルは要求との関連付けが不十分であったり、不要な設計項目にIDを無理に関連付けたりするケースがあり、複雑な課題においてはClaude系モデル、特に高性能モデルの優位性が確認されました。著者は、これらの実験を通じて、LLMを用いたドキュメント駆動開発の課題と可能性を明らかにしました。どのモデルも書式に沿った文書生成は可能ですが、より少ない指示で柔軟な対応が可能なのはClaude系モデルであり、複雑な課題ではClaude Opusのような高性能モデルが優位であると結論付けています。今後も、設計に基づくテスト生成や知見の再利用など、さらなる課題についても実験を継続し、ドキュメント主体の開発への備えを深める意向です。この研究は、LLMを用いた開発における品質と一貫性を確保するための具体的な指針を提供し、ウェブアプリケーションエンジニアがDocDDを実践する上でのモデル選択やプロンプト設計に貴重な洞察を与えます。

元記事を読む他のサマリーを見る