以下のセクションで説明するように、AppSheet ドキュメント解析を使用して、PDF ファイルや画像ファイルなどのドキュメントからコンテンツを抽出します。
ドキュメント処理の概要もご覧ください。
ドキュメント解析とは
AppSheet のドキュメント解析では、Google の Document AI ソリューションを使用して、ドキュメントからコンテンツを抽出できます。
以下のドキュメント タイプを解析できます。
- 請求書
- 領収書
- W-9 フォーム
ドキュメントは、PDF、GIF、PNG、JPEG、TIFF のファイル形式で保存できます。
AppSheet Automation は、MIME タイプや拡張機能タイプ(.pdf、.docs、.png など)に関係なく、ドキュメント タイプに基づいてドキュメントのコンテンツを抽出します。フォルダ内のドキュメントが指定されたタイプまたは形式でない場合、そのドキュメントは処理されません。
注:
- AppSheet は、Google ドライブに保存されたドキュメントの解析のみをサポートしています。
- その他のドキュメントの種類や形式は、Google の Document AI ソリューションがサポートするにつれてサポートされるようになります。
AppSheet が抽出の信頼度を測定するしくみ
場合によっては、ソース ドキュメントに欠陥があり、抽出精度が 100% に満たないことがあります。たとえば、スキャンされたソースに基づいているドキュメント、複雑な画像を使用しているドキュメント、特殊なフォントを使用しているドキュメント、スペルミスや脱字があるドキュメントがあることがあります。
抽出サービスには抽出信頼度スコアが含まれており、自動化プロセスでこのスコアが使用され、抽出されたデータを個別で審査すべきかどうかが判断されます。抽出信頼度スコアが構成されたしきい値を下回ると、例外フローがトリガーされ、人間による個別審査が行われます。詳細については、ドキュメントの解析結果をモニタリングするをご覧ください。
注: 抽出信頼度のしきい値は、現時点では構成できません。
AppSheet による金銭的なコンテンツの解析のしくみ
通貨の列を含むドキュメントでは、金額と通貨コードが 2 つの列に抽出され、抽出されたデータをより柔軟に使用できるようになります。たとえば、複数の通貨にまたがるドキュメントの中央リポジトリをサポートし、ダウンストリームのプロセスをカスタマイズできるようにします。各ドキュメントは単一の通貨を使用することが想定されており、抽出に矛盾があるように見える場合は報告されます。
ドキュメント解析を使用する
ドキュメント解析を使用してドキュメントからコンテンツを抽出するには、以下の手順に沿います。
- エディタでアプリを開きます。
- [Data] に移動して Data パネルの上部ヘッダーにある [+] をクリックします。
-
アプリエディタを強化しました。
デフォルトでは新しいエディタが有効になっていますが、いつでも以前のエディタに戻すことができます。以前のナビゲーションをお使いの場合
[Data] > [Tables] に移動し、[+ New Table] をクリックします。 - [Add data from…] ダイアログで [Google Drive Documents] を選択します。
- [Documents] で、サポートされているドキュメント タイプである [Invoices]、[Receipts]、[W-9 forms] のうち 1 つを選択します。
- ドキュメントを含む Google ドライブ上のフォルダに移動し、[Select] をクリックします。
選択したフォルダに基づいて、[Source Invoice Folder] と [Table Name] 項目が表示され、データが入力されます。 - 必要に応じて、[Change] をクリックし、[Source Invoice Folder] を編集します。
- 必要に応じて、[Table name] を編集します。
テーブル名のデフォルトはフォルダ名です。 - [Create Table] をクリックします。
ドキュメント テーブルが作成されます。請求書と領収書については、項目をキャプチャするための 2 番目のテーブルが生成されます。詳細については、ドキュメント解析のテーブル スキーマをご覧ください。 - テーブル ヘッダーにある [View Data] をクリックし、新しいドキュメント テーブルで抽出されたコンテンツを表示します。
ドキュメント解析ステータスが SUCCESS のドキュメントだけが、アプリテーブルにリストされます。成功しなかった、または信頼度が低いと登録されたドキュメントは、自動化モニタリングと監査ログに記録されます。詳細については、ドキュメントの解析結果をモニタリングするをご覧ください。