概要
国立国会図書館デジタルコレクションの膨大な資料を効率的に読み解くため、AIを活用して調査プロセスの徹底的な自動化と個人用ツール開発を行う筆者の手法と哲学を紹介している。
詳細内容
国立国会図書館デジタルコレクション(国デジ)の膨大な資料を読破するために、AIを駆使して調査・記録・出力のワークフローを徹底的に効率化した実践記録です。「一瞬でも面倒だと思ったらAIに解決させる」という基本方針の下、純粋な「読解」以外のノイズ(URLのコピー、検索結果のクリック、OCR修正等)を自動化で排除する手法が解説されています。
具体的な取り組みとして、**ndl-helper.user.js**による検索結果の自動開封と履歴保存、1キーで書誌情報を記録するPythonスクリプト、さらに**macOS Vision**、**Google Cloud Vision**、**ndlocr-lite**の3系統のOCR結果を**Gemini API**で統合校正する高度なシステム構築などが挙げられます。これらのツール群により、資料の処理件数は前年比3倍以上に向上しています。
「自分専用のコアな行動に最適化したツールを作ることこそが創造性の発揮である」という哲学は、汎用ツールに満足せず、自身のワークフローをAIで極限まで研ぎ澄ませたいエンジニアにとって示唆に富む内容です。