概要
https://blog.scottlogic.com/2025/07/23/extracting-data-from-ai-models-a-tale-of-three-approaches.html
詳細内容
## Extracting Data From AI Models: A Tale of Three Approaches
https://blog.scottlogic.com/2025/07/23/extracting-data-from-ai-models-a-tale-of-three-approaches.html
AIモデルとのペアプログラミング履歴を後から抽出する困難さを、ChatGPT、Claude、Copilotの具体例で示し、事前のデータ記録の重要性を強く訴える。
**Content Type**: ⚙️ Tools
**Scores**: Signal:4/5 | Depth:4/5 | Unique:5/5 | Practical:5/5 | Anti-Hype:5/5
**Main Journal**: 92/100 | **Annex Potential**: 93/100 | **Overall**: 92/100
**Topics**: [[AIペアプログラミング, データ抽出, 開発ワークフロー, データポータビリティ, AIツールの課題]]
記事は、Reactアプリケーション開発でChatGPT、Claude、Copilotをペアプログラミングツールとして利用した著者が、後から会話履歴データを抽出する際に直面した困難を詳細に報告しています。
ChatGPTでは、エクスポートされたJSONファイルが単一行で構造が不安定だったため、PythonスクリプトとChatGPT自身の協力を得て、数多くのデバッグと試行錯誤の末にようやく読み取り可能な形式に変換できました。これは多大な労力を要しましたが、最終的には成功しました。
一方、Claudeはプログラムによる履歴抽出機能が皆無でした。API経由でのアクセスも提案されましたが、ウェブ版の履歴とは別システムであることが判明し、利用できませんでした。結果的に、著者は将来の会話を記録するための独自のPythonロガーを構築せざるを得ませんでした。
Copilotの状況はさらに悪く、推奨されたAPIは企業向けで管理者権限が必要な上、コパイロット自身が提示したAPI権限名が誤っており、著者が利用していた「Copilot Chat」には対応していませんでした。これは、AIが自らのインフラを理解していない例として示され、データのセキュリティとプロダクトのライセンス問題が絡み合う複雑さを浮き彫りにしました。
この経験は、ウェブアプリケーション開発者にとって非常に重要です。AIとの会話履歴は、コードスニペット、設計決定、問題解決の過程など、貴重な知財の宝庫であるにもかかわらず、主要なAIツールではそのデータポータビリティが保証されていません。これは開発ワークフローにおける大きな盲点であり、後からプロジェクトの経緯を追跡したり、ナレッジベースを構築したりする際に深刻な問題を引き起こします。
したがって、AIを本格的な開発プロジェクトに導入する際には、初日から独自の会話ログシステムを構築するなど、データ抽出戦略を講じることが不可欠です。AIツールを選ぶ際には、その機能だけでなく、データアクセスとポータビリティの側面を考慮に入れるべきであるという、実用的な教訓を提示しています。