SVF Archiver / SVF Transact:解決のカタチ

FUNCTIONS

AI OCR

帳票の特徴に合わせてOCR方式を使い分け、
読み取り精度と運用効率を両立してデータ化を推進します。

安定して正確に読めるOCRで精度と運用効率を両立

請求書や検査成績書などの業務帳票のデータ化は、件数が増えるほど入力や確認の負担が大きくなります。

そこで役立つのが、紙やPDFを自動でデータ化できるOCRです。


OCRというと、「非定型OCRの方が幅広い帳票に対応できる」と感じるかもしれません。

たしかに、取引先ごとに形式が異なる帳票では、非定型OCRが有効です。


一方で、毎月同じ形式で発生する請求書や検査成績書のように、レイアウトが決まっている帳票では、
位置指定型OCR
項目指定型OCRのほうが、安定した精度を出しやすくなります。

SVF Archiverでは、帳票の特徴に合わせてOCR方式を使い分けることで、読み取り精度と運用効率を両立できます。

Before
  • データ化のために手入力するのに時間がかかる

  • 非定型OCRでは読み取り精度が低く、確認や修正に手間がかかっている

  • 自社フォーマットでレイアウトが少し異なる文書のデータ化がうまくいかない

After
  • OCRでデータ化することで入力作業が不要に

  • 定型文書なら位置指定型OCRにより正確な処理が可能

  • 同じ項目名を持つ文書なら項目指定型OCRを使うことで精度を維持しつつ柔軟な対応が可能

AI OCRとは?

SVF Archiverでは、帳票の特徴に合わせてOCR方式を選択できます。

OCRは「自由に読める」だけでなく、「安定して正確に読めるか」を基準に選ぶことが重要です。
ここでは「非定型OCR」ではなく、「位置指定型OCR」と「項目指定型OCR」の使い分け方を確認します。
フォーマット固定
位置指定型OCR 

決まったレイアウトの帳票を、常に同じ座標で安定して読み取ります。
自社規定のフォーマットや、毎月届く定型レイアウトの帳票を正確に処理するのに最適です。

読み取る文字にあわせて、4種類のOCRのエンジンを選択できます。

項目固定
項目指定型OCR 

「顧客名」「住所」などの見出しを探して、その近くを読み取る方式です。

見出しや読み取り項目が規定の「枠」に囲まれている必要があるため、自社でフォーマットを管理できる帳票との相性が良い方式です。
読み取る文字にあわせて、4種類のOCRのエンジンを選択できます。

基本的には「位置指定型OCR」が安定して正確に読むことができますが、
「項目指定型OCR」は座標を細かく決める必要がないため、
  • 品目ごとに読み取り位置が変わる
  • 年度ごとにレイアウトが少し変わる
  • 印刷やスキャンで多少ズレる
といった帳票で効果を発揮します。
運用のアドバイス
OCRの読み取り精度は100%ではありません。必ず「チェック工程(目視確認)」をフローに設けることで、業務の中でより安全・確実に活用できます。
利用にあたって
OCRを利用するにはOCRポイントが必要です。
次のOCRエンジンのみ無償で利用できます。
  • オンプレ版では、ABBYY、Wingarc Data Captureは無償で利用できます。
  • クラウド版では、BridgeサービスでのABBYY、Wingarc Data Captureは無償で利用できます。(Distributorで利用する場合はポイントが必要です)

OCR方式による設定方法の違い

OCR方式による設定方法の違いイメージ
図は、発注書の「会社名」の項目を読み取る設定をした場合の例です。
位置指定型OCRでは、読み取る領域の範囲を座標入力またはドラッグ&ドロップで指定します。
項目指定型OCRでは、指定テキスト「会社名」の右側の枠で囲まれた箇所を読み取り対象に設定することで、読み取り範囲をOCRに認識させます。

利用開始までのステップ

OCR処理を行うための設定は、SVF Archiverで簡単に行えます。
位置指定型、項目指定型、非定型を組み合わせて設定します。

01

監視用フォルダーを作成する
OCR対象となる文書をアップロードするための監視用フォルダーを作成します。

02

OCR処理用の文書定義を作成する
対象の帳票に合わせて設定を行います。
「位置指定型」の場合は読み取り枠のフォーマット、「項目指定型」の場合は読み取る領域を指定する指定テキスト、「dejiren AI(非定型OCR)」の場合はAIへの指示となるヒント(プロンプト)を設定します。

03

処理定義を作成し、紐づける
処理定義を作成し、「監視フォルダー」と「文書定義」を指定して完了です。
これにより、文書のアップロードをトリガーとして自動的にOCR処理が実行されるようになります。

設定手順の詳細はつぎのマニュアルで確認できます。