Zero-Trust ローカル処理Tesseract.js WASM

請求書OCRリーダー

請求書の画像（PNG/JPG）をアップロードすると、Tesseract.js（WASM版）によるクライアントサイドOCRでテキストを読み取り、金額・日付・登録番号・発行者名などの主要フィールドを自動抽出します。

OCR処理はすべてブラウザ内で実行されます。請求書画像がサーバーに送信されることは一切ありません。抽出結果はCSV/JSONでエクスポート可能です。初回読み込み時にOCRエンジン（約10MB）をダウンロードします。

請求書画像をアップロード

PNG, JPG, WEBP またはテキストファイル

抽出フィールド

画像をアップロードすると
フィールドが自動抽出されます

精度について

OCRの精度は画像品質に依存します。抽出結果は必ず目視で確認してください。公的書類への使用前に、原本との照合を推奨します。

ローカル請求書OCR（請求書 OCR Engine）：利用ガイドと技術仕様

本ツール（完全非通信型・請求書OCRエンジン・完全非通信型請求書テキスト抽出エンジン）は、経理部門（買掛金管理）や個人事業主が毎月大量に受け取る「画像・PDFファイル形式の請求書（請求書）」から、口座番号、請求金額、支払期日、発行元企業名などのテキストデータを、外部システム連携（外部通信）（Google クラウド Vision システム連携（外部通信）やAWS テキストractなど）に一切依存せずにブラウザ内のみで高精度に読み取る（光学文字認識）ための人工知能ドキュメント解析ツールです。法人の経費精算・支払業務において、取引先から送られてくるPDFファイル請求書のテキストを手作業で会計システムに入力（転記）する作業は、膨大な時間を浪費するだけでなく、口座番号や振込金額の入力ミスという致命的な支払いインシデントのリスクを常に孕んでいます。本ツールを用いれば、ブラウザに画像をドラッグ＆ドロップするだけで即座に構造化テキストが抽出され、コピー＆ペーストによる圧倒的な業務効率化（RPA連携・プロセス自動化）を実現します。

そして、このOCR領域における最大の「データプライバシー・コンプライアンス課題」である「自社の取引先情報、購買内容、単価、値引率といった極めて機密性の高い商取引データ（営業秘密）」の保護について、Zoryntoは画期的なアプローチを提供します。一般的なクラウド無料OCRサービスは、アップロードされた請求書画像を自社サーバーへ送信し、機械学習の非公開トレーニングデータとして再利用するリスク（規約上のグレーゾーン）が排除しきれません。 ZoryntoのOCRエンジンは、高精度文字認識エンジン（高速処理技術ベースのOCRライブラリ）を採用し、数十MBの人工知能言語モデル（学習データ）を事前にあなたのブラウザ（ローカルパソコン）にキャッシュ（ダウンロード）します。解析実行時（画像読み取り時）にはインターネット通信を完全に遮断（機内モードでも動作）するため、「請求書の画像データがあなたのパソコンの外側（社外ネットワーク）へ1バイトも流出しない」完全なるゼロトラスト・トランザクションを実現します。

技術スタック・フォーマット仕様

コア人工知能ロジック -
対応入力形式 JPG, PNG, ウェブP
システム構成 In-ブラウザエッジ人工知能
言語モデル -
コンプライアンス準拠秘密保持契約, 情報セキュリティマネジメントシステム, 国際セキュリティ基準
通信ルール完全オフライン (サーバー送信ゼロ)

1. 経理・買掛金管理業務：振込先口座・金額の手入力ミス（ヒューマンエラー）の撲滅

月末・月初に集中する買掛金（買掛金管理）の支払い作業において、送られてきた見積書や請求書のPDFファイルを目視しながら、会計ソフト（統合基幹業務システム）やインターネットバンキングに「振込先銀行名、支店名、口座番号、支払金額」を手打ちする作業は、経理担当者に極度の心理的ストレスを与えます。1桁の入力ミスが、資金の組み戻し（手数料発生）や取引先への支払い遅延という重大な信用問題に直結するからです。

本システムは、画像やスクリーンショット上の文字を正確にデジタルテキスト化（OCR抽出）します。抽出されたテキストボックスから必要な口座番号や金額をマウスで選択してコピーするだけで済むため、目視と手作業による「転記ミス（タイポ）」を物理的にゼロにすることが可能です。請求書のレイアウト崩れや斜めのスキャン画像に対しても、高度な画像前処理により高い認識精度を誇ります。

2. 購買・法務（エンタープライズ）：機密購買データと秘密保持契約違反リスクの完全遮断

請求書には「自社がどの企業から、何を、いくらで買い入れているか」という、競合他社に絶対に知られてはならない原価情報・取引先リストが克明に記されています。取引先と締結している秘密保持契約の観点からも、業務委託を受けていないサードパーティの「無料クラウドOCRアプリ」に対してこれらの画像をアップロード流出させる行為は、重大なコンプライアンス（契約）違反に問われる可能性があります。

Zoryntoのエッジ人工知能（ブラウザ内OCR）アーキテクチャでは、OCRエンジンそのもの（高速処理技術バイナリ）が初回のページロード時にブラウザへダウンロードされ、画像の解析プロセスのすべてがあなたのパソコンの「ローカルCPU/RAM」のリソースのみを用いて実行されます。サーバーログやシステム連携（外部通信）リクエストの痕跡すら残さないため、「自社の社内LANから請求書画像が一切外に出ていない」ことを100%保証できる、エンタープライズ対応の安全なOCR運用基盤となります。

次に使うと便利な関連・業務効率化プラットフォーム

請求書画像のテキスト化が完了した後は、読み取った登録番号の検証や、支払いデータの生成フォーマット変換など、以下の経理・購買向けローカルセキュアツール群を連携させると業務が飛躍的に加速します。

適格請求書チェッカー（インボイス制度）

OCRで読み取った請求元の「T+13桁の登録番号」や「税率ごとの記載」をコピーし、本チェッカーに貼り付けることで、その請求書が日本の適格請求書等保存方式（インボイス制度）の法定用件を満たしているか瞬時に検証します。

全銀データフォーマッター・監査

OCRで抽出した請求金額と口座番号を元に、取引先へインターネットバンキングで一括振込（総合振込）を行うための「全銀協指定フォーマット（120バイト固定長）データ」を、安全なオフライン環境下で生成します。

請求書OCRエンジンに関するFAQ

読み込み（解析）にクラウドシステム連携（外部通信）より少し時間がかかるのはなぜですか？

クラウド型のクラウドサービス（AWS等）は背後の巨大なGPUサーバーで演算を行いますが、本ツールは「データ流出の完全阻止」を優先し、お客様のパソコン内のローカルCPUのみを使用してJavaScriptで演算を行うためです。数秒の遅延は、「完全な情報セキュリティ」と引き換えのトレードオフとなります。

スキャンしたPDFファイルファイル（複数ページ）にも対応していますか？

現行バージョンのエンジンは、単一の画像ファイル（JPEG, PNG等）のテキスト抽出に特化しています。PDFファイル形式の請求書を読み込ませる場合は、オペレーティングシステム標準のスクリーンショット機能（Snipping Tool等）で画像をキャプチャし、クリップボード経由（Ctrl+V）で直接本ツールに貼り付けていただく運用が最も高速です。