Microsoft Azure Form Recognizerを利用し、
貴社環境と実データを用いたフォーマットの読み取り・デジタル化の評価をご支援致します
紙媒体の資料が多すぎて、資料の整理が追いつかない。
効率的に資料をデジタル化できる技術は無いのだろうか?
ドキュメントをスキャンした画像から文字の形状や領域を検出し、
検出した領域に対し文字認識を行うことで画像中の文字をデジタル化できます。
Azure Form Recognizer とはフルマネージドの書類のデジタル化を提供するPaaSです。
ドキュメントのデジタル化とは、画像認識の手法を使用することで、紙やPDFで作成された書類に含まれる文字を検出し抽出することです。
Azure Form Recognizer では名刺から領収書、請求書等の書類まであらゆる文書ファイルの中身をデジタル化することができます。
紙面媒体をスキャンすることでデシタルデータにし、画像として読み込むことができます。
このままでは写真と同じように一文字、一文字を認識することはできません。
これを文字として認識する技術がOCR(文字起こし)です。
スキャンした書類をOCRすることで、書類の中にある文字を文字データに変換、読み込めます。
AIによって定義される項目は書類のフォーマットの位置ごとに対応します。
このカスタム機能はより貴社の扱う書類に特化させ、細かい項目定義が可能です。
はじめに欲しい項目を定義(項目の場所と項目名の設定)していただくと、
それに応じてAIが学習し、貴社のだけのAIを作成することができます。
これにより、Excelなどで作業する際に情報を細かく絞り込むことができます。
Form Recognizerを活用したシステムにより、アップロードされた書類を自動的にデジタル化し、
Excelなどのファイル形式で出力することができます。
画面はイメージとなります。実施内容によりイメージと異なる場合があります。
Microsoft Azure Form Recognizerを利用し、
貴社環境と実データを用いたForm Recognizer活用の評価をご支援致します
Microsoft Azure Form Recognizerの
認識の精度・能力の検証と評価を実施
Microsoft Azure Form Recognizer活用評価を行うためPoCの流れとなります。
Microsoft Azure Form Recognizer活用評価を行うためPoCの流れとなります。