概要
https://cocolog-nifty.hatenablog.com/entry/2025/12/22/124436
詳細内容
## AI で日本語の長文を校正する - 山下泰平の趣味の方法
https://cocolog-nifty.hatenablog.com/entry/2025/12/22/124436
LLMとPythonスクリプトを組み合わせ、50万文字の日本語長文を効率的に校正するための実用的な自動化ワークフローを提示する。
**Content Type**: 📖 Tutorial & Guide
**Language**: ja
**Scores**: Signal:4/5 | Depth:3/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:4/5
**Main Journal**: 98/100 | **Annex Potential**: 99/100 | **Overall**: 76/100
**Topics**: [[文章校正, LLM活用, Gemini CLI, 自動化スクリプト, プロンプトエンジニアリング]]
著者の山下泰平氏は、50万文字という膨大な分量の日本語原稿を執筆するにあたり、執筆中の認知リソースを「内容の検討」に集中させるため、誤字脱字を一切気にせず書き進め、後からAIで一括処理するという合理的かつ大胆なワークフローを実践した。このアプローチの根底には、執筆期間中にAIの性能が向上し、完成時には大規模な校正が可能になっているだろうという「技術進化への賭け」があり、著者はこれに成功したと述べている。
具体的な実装プロセスにおいて、著者はAIを単なる「相談相手」としてではなく、「自動化システムの構成要素」として活用している。まず、AIに対して「原文・修正案・修正理由をJSONデータとして出力する校正用プロンプト」を作成させた上で、そのJSONを読み込んで元ファイルを一括置換するPythonスクリプト自体もAIに書かせている。この際、実務的な安全性を確保するために、Dry-run(試運転)機能、バックアップ作成、原文不一致時のエラー検知機能を含めるよう指示する手法は、エンジニアリングにおける要件定義の勘所を押さえた実用的なアプローチである。
ツールの使い分けも戦略的だ。ClaudeやChatGPTを用いて対話的にプロンプトを洗練させた後、最終的な大量処理にはGemini CLIを採用している。これはWeb UIの操作を排除し、コマンドラインからの安価で高速なバッチ処理を可能にするためだ。著者は、Unixパイプを組み合わせたテキスト分割処理(2000文字単位など)についても言及しており、10万文字単位の章を数回繰り返して校正にかけることで、最終的に「誤字なし」の状態まで追い込めることを示している。
ウェブエンジニアにとっての本記事の意義は、LLMを既存の開発・執筆ワークフローに「システム」として組み込むための具体的なパターンを提示している点にある。最新のAIモデルの特性を理解した上で、スクリプトによる自動化と組み合わせることで、人間が本来集中すべき創造的な作業にリソースを全振りする。この「AIに仕事を押し付ける」ための具体的な実装能力こそが、これからのエンジニアに求められるスキルであることを、50万文字という圧倒的な物量をもって証明している。