掲載済み (2026-02-28号)
#176 141文字 • 1分

NDLOCRLite Web: ブラウザ完結型の高精度日本語OCRツール

原題: NDLOCRLite Web: ブラウザ完結型日本語OCRツール(ONNX Web Runtime使用)

日本語

掲載情報

概要

国立国会図書館のOCRモデルをブラウザ内で実行し、外部サーバーへのデータ送信なしで高精度な日本語認識を可能にするオープンソースツールです。

詳細内容

国立国会図書館(NDL)が開発・公開している「NDLOCR-Lite」を、Webブラウザのみで完結して動作するように移植・再実装したプロジェクトです。ONNX Runtime Webを活用することで、画像やPDFの解析をすべてクライアントサイドのWASM CPUバックエンドで実行するため、機密性の高い文書も安全に処理できます。技術的には、DEIMv2モデルによるレイアウト検出と、文字数に応じて3種類のPARSeqモデルを使い分けるカスケード文字認識を組み合わせ、精度の最適化を図っています。複数ページのPDF対応、フォルダごとのバッチ処理、IndexedDBによるモデルと結果のキャッシュ機能など、実用的な機能を備えています。Vite + React 19 + TypeScriptで構築されており、OSSとして公開されています。