FUNCTIONS
AI OCR
読み取り精度と運用効率を両立してデータ化を推進します。
安定して正確に読めるOCRで精度と運用効率を両立
請求書や検査成績書などの業務帳票のデータ化は、件数が増えるほど入力や確認の負担が大きくなります。
そこで役立つのが、紙やPDFを自動でデータ化できるOCRです。
OCRというと、「非定型OCRの方が幅広い帳票に対応できる」と感じるかもしれません。
たしかに、取引先ごとに形式が異なる帳票では、非定型OCRが有効です。
一方で、毎月同じ形式で発生する請求書や検査成績書のように、レイアウトが決まっている帳票では、
位置指定型OCRや項目指定型OCRのほうが、安定した精度を出しやすくなります。
SVF Archiverでは、帳票の特徴に合わせてOCR方式を使い分けることで、読み取り精度と運用効率を両立できます。
-
データ化のために手入力するのに時間がかかる
-
非定型OCRでは読み取り精度が低く、確認や修正に手間がかかっている
-
自社フォーマットでレイアウトが少し異なる文書のデータ化がうまくいかない
-
OCRでデータ化することで入力作業が不要に
-
定型文書なら位置指定型OCRにより正確な処理が可能
-
同じ項目名を持つ文書なら項目指定型OCRを使うことで精度を維持しつつ柔軟な対応が可能
AI OCRとは?
決まったレイアウトの帳票を、常に同じ座標で安定して読み取ります。
自社規定のフォーマットや、毎月届く定型レイアウトの帳票を正確に処理するのに最適です。
読み取る文字にあわせて、4種類のOCRのエンジンを選択できます。
「顧客名」「住所」などの見出しを探して、その近くを読み取る方式です。
見出しや読み取り項目が規定の「枠」に囲まれている必要があるため、自社でフォーマットを管理できる帳票との相性が良い方式です。
読み取る文字にあわせて、4種類のOCRのエンジンを選択できます。
- 品目ごとに読み取り位置が変わる
- 年度ごとにレイアウトが少し変わる
- 印刷やスキャンで多少ズレる
- オンプレ版では、ABBYY、Wingarc Data Captureは無償で利用できます。
- クラウド版では、BridgeサービスでのABBYY、Wingarc Data Captureは無償で利用できます。(Distributorで利用する場合はポイントが必要です)
OCR方式による設定方法の違い

位置指定型OCRでは、読み取る領域の範囲を座標入力またはドラッグ&ドロップで指定します。
項目指定型OCRでは、指定テキスト「会社名」の右側の枠で囲まれた箇所を読み取り対象に設定することで、読み取り範囲をOCRに認識させます。
利用開始までのステップ
OCR処理を行うための設定は、SVF Archiverで簡単に行えます。
位置指定型、項目指定型、非定型を組み合わせて設定します。
01
02
「位置指定型」の場合は読み取り枠のフォーマット、「項目指定型」の場合は読み取る領域を指定する指定テキスト、「dejiren AI(非定型OCR)」の場合はAIへの指示となるヒント(プロンプト)を設定します。
03
これにより、文書のアップロードをトリガーとして自動的にOCR処理が実行されるようになります。
