Vault の書き出しファイルを確認する

Google Vault を使用して必要なデータを検索したら、分析を進めるために検索結果を書き出すことができます(方法)。書き出しには次の情報が含まれます。

  • 検索条件に一致するデータをまとめたコピー。
  • 書き出したデータを組織内の各ユーザーにリンクするために必要なメタデータ。
  • 書き出したデータが Google のサーバーに保存されているデータと一致することを証明するために必要な確認情報。

各サービスでの書き出しの操作方法について詳しくは、以下をご覧ください。

Gmail、Chat、Google グループの書き出し

書き出しに含まれるもの
情報 ファイル名 説明
メッセージの内容 [書き出し名-番号].zip

PST ファイルまたは mbox ファイルを圧縮した ZIP ファイル。これらのファイルには、書き出したメッセージの内容と詳細データが含まれています。Google Chat メッセージの場合は、送信者によるメッセージ編集日時またはメッセージ削除日時が含まれます。

複数のアカウントのメッセージが含まれている場合や、ファイルサイズが 1 GB(PST)または 10 GB(mbox)を超える場合は、複数のファイルが作成される可能性があり、各ファイル名の末尾には識別用の番号が付きます。

メッセージの確認

ZIP ファイルを展開したら、ファイル形式に応じて次の方法でメッセージを確認、処理します。

  • PST - Microsoft Outlook、一部の訴訟サポート システム。

  • mbox - Mozilla Thunderbird、テキスト エディタ、訴訟サポート システム(mbox ファイルのメール変換ツールが付属するもの)。

注: Google は、サードパーティ製品の設定に関する技術サポートを提供しておらず、サードパーティ製品に関して一切の責任を負いません。設定とサポートに関する最新情報については、該当する製品のウェブサイトをご覧ください。

グループ メンバー情報 [書き出し名]-group-membership.csv

グループの各メンバーについて次の情報が記載された CSV ファイル。

  • メンバーのメールアドレス
  • グループのメールアドレス
  • グループへの追加日時
  • メンバーのロール: MEMBER(グループ メンバー)、MANAGER(グループ マネージャー)、OWNER(グループ オーナー)
  • アカウントの種類: USER(個々のユーザー アカウント)、GROUP(グループのメールアドレス)
メッセージのメタデータ [書き出し名]-metadata.xml

Google サーバーに存在するものと同じメタデータを含む XML ファイル。このファイルをテキスト エディタで開くと、メッセージのメタデータを mbox ファイルのメッセージのコンテンツと対応させることができます。

注: PST ファイルのコンテンツを XML ファイルのメタデータと関連付けることはできません。

アカウントとメッセージの数 [書き出し名]-results-count.csv 書き出しに含まれるメッセージの所有者のアカウントと、各アカウントの所有者が所有するメッセージ数を一覧表示した CSV ファイル。
エラーレポート

error.csv

[書き出し名]-account-exceptions.csv(Gmail の書き出し)

[書き出し名]-failed-group-membership-lookups.csv(グループの書き出し)

エラーレポートは、書き出し時にエラーが発生した場合のみ含まれます。

  • error.csv - メッセージ取得時のエラーの一覧です。詳細
  • [書き出し名]-account-exceptions.csv - 検索に一致する一部のメールが書き出されなかった Gmail アカウントの一覧
  • [書き出し名]-failed-group-membership-lookups.csv - 検索に一致する一部のメンバーを取得できなかったグループのメールアドレスの一覧
ファイルのチェックサム ファイルのチェックサム 書き出しに含まれるすべてのファイルの Message Digest 5(MD5)ハッシュ値を含むチェックサム ファイルの一覧です。
メール クライアントでのメッセージの確認

Gmail のメールと Chat のメッセージを Microsoft Outlook(PST)または Mozilla Thunderbird(mbox)で確認できます。この方法は、テキスト エディタでは表示できない HTML メッセージと添付ファイルを表示するのに便利です。

PST ファイルと mbox ファイルには、書き出されたメッセージの詳細データが含まれています。メタデータ ファイルには、Google で記録されたメッセージのメタデータが含まれています。mbox のコンテンツとメッセージのメタデータを関連付けることで、Google サーバーに格納されているメッセージと Vault から書き出したデータをリンクさせることができます。

注: Gmail でメールの分類に使用されているラベルは、メールボックス フォルダに変換されません。メール クライアントで PST ファイルまたは mbox ファイルを開くと、すべてのメッセージが 1 つのフォルダに表示されます。

書き出したメッセージをメール クライアントで確認するには:

  1. メール アプリケーションでメッセージを読み込んで確認します。
  2. 案件にとって重要なメッセージについて、ヘッダーを確認します。
    • Outlook - 使用しているバージョンのメッセージ ヘッダーの表示方法については、Microsoft のドキュメントをご覧ください。
    • Thunderbird - 各メッセージのヘッダーを表示するには、[View] > [Headers] > [All] をクリックします。
  3. 各ヘッダーにはメッセージ ID が含まれています。メッセージ ID とメタデータを比較することで、メッセージと Google のサーバーに保存されているデータを関連付けることができます。
テキスト エディタでの mbox ファイルの確認

mbox ファイルはメッセージを格納するための標準形式です。これには、メッセージの本文や添付ファイルなど、書き出されたメッセージのすべての詳細が含まれます。メタデータ ファイルには、Google で記録されたメッセージのメタデータが含まれています。これらのファイルをあわせて使用することで、Google サーバーに格納されているメッセージと Vault から書き出したデータをリンクさせることができます。

書き出し後、メタデータ ファイル内のメールのパラメータを使用して、mbox ファイル内の対応するメールを見つけます。まず、テキスト エディタでメタデータ ファイルを開いて、次のような FileName のパラメータを探します。

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

このパラメータには一意の識別子が含まれています。この識別子は、mbox ファイル内の From_ 行のエントリに対応しています。From_ 行には、同じ識別子と、Google がそのメッセージを受信した日付と時刻(UTC 表記)が格納されています。たとえば、次のようになります。

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

From_ 行は、mbox ファイルに含まれる各メッセージの先頭のエントリです。新しい From_ 行に到達したら、そこからは次のメッセージが始まります。

メタデータ ファイル内のメッセージ パラメータ

メタデータ ファイルには次の情報が記載されています。

Gmail と Google グループのメッセージについて含まれる項目

  • #From - 送信者のメール アカウント
  • #To - すべての受信者のメール アカウント
  • #CC - Cc に指定されたすべての受信者のメール アカウント
  • #BCC - Bcc に指定されたすべての受信者のメール アカウント
  • #Subject - メッセージの件名
  • #DateSent - メッセージ送信時のタイムスタンプ
  • #DateReceived - メッセージ受信時のタイムスタンプ

従来のハングアウトと Chat のメッセージについて含まれる項目

  • #SubjectAtStart -(従来のハングアウトのみ)最初のメッセージが送信されたときの会話の件名
  • #SubjectAtEnd -(従来のハングアウトのみ)最後のメッセージが送信されたときの会話の件名
  • #DateFirstMessageSent - 会話の最初のメッセージが送信されたときのタイムスタンプ
  • #DateLastMessageSent - 会話の最後のメッセージが送信されたときのタイムスタンプ
  • #DateFirstMessageReceived - 会話の最初のメッセージが受信されたときのタイムスタンプ
  • #DateLastMessageReceived - 会話の最後のメッセージが受信されたときのタイムスタンプ

すべてのメッセージ(Gmail、Google グループ、Chat)について含まれる項目

  • Labels - Gmail または Chat によって付けられたラベル(^INBOX、^TRASH、^DELETED など)と、ユーザーがメッセージに付けたラベル。
  • FileName - メッセージ識別子。書き出した PST ファイルまたは mbox ファイルのメッセージ ID とこのメッセージ識別子を比較します。
  • FileSize - メッセージのサイズ(バイト単位)。
  • Hash - メッセージの MD5 ハッシュ。

Chat のメッセージについて含まれる項目(従来のハングアウトは対象外)

  • RoomID - メッセージが交わされたチャットルームまたは DM 識別子。
  • Participants - 会話に参加したすべてのユーザーのメールアドレス。
  • roomName - チャットルームの名前、または DM に参加したアカウントのカンマ区切りのリスト。
  • conversationType - メッセージが交わされた場所: チャットルームまたは DM。

書き出し全体のクエリ パラメータ

  • UserQuery - 書き出しに含まれるメッセージの取得に使用された、Vault ユーザーからのクエリ。
  • TimeZone - 日付ベースの検索に使用されたタイムゾーン。
  • Custodians - 検索対象となったユーザー アカウントのメールアドレス。個々のユーザー アカウントではなくコンテンツを検索した場合は、ここには何も含まれません。

ドライブの書き出し

書き出しに含まれるもの
情報 ファイル名 説明
ファイル [書き出し名_番号].zip

検索で見つかったすべてのファイルが含まれます。10 GB までのデータが 1 つの圧縮ファイルにまとめられます。10 GB を超えるデータを書き出す場合は、複数のファイルが作成されます。

書き出されたファイルの名前は、元のファイル名の後にアンダースコア(_)とドライブ ファイルの ID を付けたものになります。

書き出すと、Google ファイル形式が次のように変換されます。

  • Google ドキュメントは DOCX
  • Google スプレッドシートは XLSX
  • Google フォームは ZIP(HTML と CSV)
  • Google スライドは PPTX
  • Google 図形描画は PDF
ファイルのメタデータ [書き出し名]-metadata.xml

次のようなメタデータが含まれます。

  • ドキュメント ID(注: これらの ID はドライブ ファイルの ID ではありません。CSV ファイル内の値に対応しています)
  • ユーザーのメールアドレス
  • 各ファイルの作成日と更新日
  • ドキュメントの種類とタイトル

詳細

アカウントとドキュメント ID [書き出し名]-custodian-docid.csv ユーザー アカウントとそれに関連付けられているドキュメント ID の一覧です。この情報から、書き出したファイルにアクセスできるユーザーがわかります。
エラーレポート

error.csv

[書き出し名]-incomplete-accounts.csv

エラーレポートは、書き出し時にエラーが発生した場合のみ含まれます。

  • error.csv - ファイルとファイル メタデータを取得する際のエラーの一覧です。詳細
  • [書き出し名]-incomplete-accounts.csv - 検索に一致する一部のファイルが書き出されなかったアカウントの一覧です。
ファイルのチェックサム ファイルのチェックサム 書き出しに含まれるすべてのファイルの Message Digest 5(MD5)ハッシュ値を含むチェックサム ファイルの一覧です。
メタデータ ファイル内のファイル パラメータ

書き出したデータに含まれるメタデータ ファイルには、次のメタデータが記載されています。

各ファイルについて含まれるメタデータ

  • #Author - ドライブ内のファイルを所有するユーザーのメールアドレス。共有ドライブのファイルの場合は、共有ドライブの名前。
  • Collaborators - ファイルを編集したりコメントを追加したりする直接的な権限のあるアカウントとグループ。書き出し時のオプション選択によっては、ファイルに対して間接的なアクセス権のあるユーザーも含まれます。
  • Viewers - ファイルを表示する直接的な権限のあるアカウントやグループ。書き出し時のオプション選択によっては、ファイルに対して間接的なアクセス権のあるユーザーも含まれます。
  • Others - 書き出し時にアクセスレベル情報を除外するオプションを選択した場合、クエリ結果のファイルに対して間接的な権限を持つアカウント。書き出しの時点で権限レベルを特定できないユーザーが含まれることもあります。
  • #DateCreated - ドライブでの Google 形式ファイルの作成日。Google 以外の形式のファイルの場合は、ドライブへのファイルのアップロード日を示します。
  • #DateModified - ファイルの最終更新日。
  • #Title - ユーザーが割り当てたファイル名。一部のオペレーティング システムでは長いファイル名を持つ ZIP ファイルを展開できないため、Vault では書き出し時にファイル名が 128 文字に切り捨てられます。#Title タグで示された値は切り捨てられません。
  • DocumentType - Google のファイルの種類(DOCUMENT、SPREADSHEET、PRESENTATION、FORM、DRAWING など)。
  • SharedDriveID - ファイルを格納している共有ドライブの識別子(該当する場合)。
  • SourceHash - ファイルの各版に対する一意のハッシュ値。ファイルの重複書き出しを排除したり、書き出されたファイルがソースファイルの完全なコピーであることを確認したりするのに使用できます。Google ドキュメント、スプレッドシート、スライドのファイルでのみサポートされています。

書き出し全体のクエリ パラメータ

  • UserQuery - 書き出しに含まれるメッセージの取得に使用された、Vault ユーザーからのクエリ。
  • TimeZone - 日付ベースの検索に使用されたタイムゾーン。
  • Custodians - 検索対象となったユーザー アカウントのメールアドレス。個々のユーザー アカウントではなくコンテンツを検索した場合は、ここには何も含まれません。
ファイルへの間接的権限を持つユーザーのアクセスレベル情報の書き出し

ドライブから書き出したファイルのメタデータには、検索条件に一致するファイルに対して間接的な権限を持ち、そのファイルを開いたことがあるユーザーに関する情報が含まれる場合があります。

ユーザーが間接的な権限を持つのは、ファイルや、ファイルを含むフォルダの共有設定が次のようになっている場合です。

  • ユーザーが属するグループと共有
  • ドメインと共有
  • 一般公開で共有

このような情報をメタデータ出力に含めるかどうかは、書き出し時に選択できます。

  • ドメイン内のユーザーがファイルに対して持っている間接的な権限レベルを特定するには、エクスポート ダイアログで該当するチェックボックスをオンにします。メタデータ ファイルでは、それぞれのユーザーが次のカテゴリのいずれかに表示されます。

    • Collaborators - ファイルを編集またはコメントを追加する間接的権限を持つユーザー。
    • Viewers - ファイルを閲覧する間接的権限を持つユーザー。
    • Others - 場合により、書き出しの時点でユーザーの権限を特定できないことがあります。たとえば、ファイルがグループと共有されていて、その後にグループからユーザーが削除された場合は、この状況に該当することがあります。

    このようなユーザーが持つ権限を特定するには時間がかかるため、このオプションをオンにすると、ファイルのダウンロードの準備ができるまで時間がかかることがあります。

  • ドメイン内のユーザーがファイルに対して持っている間接的な権限のアクセスレベル情報を含めない場合は、エクスポート ダイアログで該当するチェックボックスをオフにします(デフォルトのまま)。このようなユーザーは、メタデータ ファイルの Others のカテゴリに表示されます。

Google Voice の書き出し

書き出しに含まれるもの
情報 ファイル名 説明
Voice データファイル [書き出し名-番号].zip アカウントごとに生成される zip ファイル。このファイルには、テキスト メッセージの会話、通話履歴、ボイスメールの MP3 音声ファイル、ボイスメールの音声文字変換の PST または mbox ファイルが含まれます。
ファイルのメタデータ [書き出し名]-metadata.xml Google サーバーに存在するものと同じメタデータを含む XML ファイル
ファイルのチェックサム ファイルのチェックサム 書き出しに含まれるすべてのファイルの Message Digest 5(MD5)ハッシュ値を含むチェックサム ファイル。
エラーレポート

error.csv

エラーレポートは、エクスポートでエラーが発生した場合のみ含まれます。詳細

注: 他のサービスとは異なり、Voice の書き出しにはカウント ファイルは含まれません。

メタデータ ファイル内の Voice データ パラメータ

メタデータ ファイルには次の情報が記載されています。

各ファイルに関する情報

  • DocID - ファイルの一意の識別子。
  • #Author - ドライブ内のファイルを所有するアカウントのメールアドレス。
  • #DateFirstMessageSent - テキスト メッセージの会話の場合、最初のメッセージを送信した日付。注: ボイスメールと通話履歴の場合も、この項目と次の 3 つの項目は同じものです。
  • #DateLastMessageSent - テキスト メッセージの会話の場合、最後のメッセージを送信した日付。
  • #DateFirstMessageReceived - テキスト メッセージの会話の場合、最初のメッセージを受信した日付。
  • #DateLastMessageReceived - テキスト メッセージの会話の場合、最後のメッセージを受信した日付。
  • ConversationType - データの種類:
    • TEXT_MESSAGE - テキスト メッセージ。
    • VOICEMAIL - ボイスメール。
    • INCOMING_CALL - 着信の通話履歴。
    • OUTGOING_CALL - 発信の通話履歴。
    • MISSED_CALL - 不在着信の通話履歴。
  • PartnerPhoneNumbers - 参加者の電話番号。
  • OwnerPhoneNumbers - ユーザーの電話番号が変更されたときは、複数の電話番号が値に含まれる場合があります。
  • Labels - 会話のすべてのラベル。たとえば、削除された会話には「DELETED」というラベルが付けられます。
  • ExternalFile FileName - PST または mbox ファイルの「Subject」に対応するファイル識別子。

書き出し全体のクエリ パラメータ

  • UserQuery - Vault 管理者が送信したクエリ。
  • TimeZone - クエリのタイムゾーン。
  • Custodians - 検索されたアカウントのメールアドレス。

エラーレポート(error.csv)

Vault でサービスからデータを書き出せない場合、エラーレポート(error.csv)が生成されます。このレポートには、書き出しエラーの項目ごとに詳細情報とメタデータが記載されます。

Vault のエラーには次の 2 つの種類があります。

  • 一時的なエラー - バックエンド サーバーでメールまたはファイルを取得できませんでした。通常、後で検索すると書き出すことができます。
  • 一時的でないエラー - 一時的なエラーと明示的に表示されていないエラーは、修正できない問題が原因で発生したエラーです。通常、メッセージの添付ファイルまたはファイルが、削除されている場合、書き出し機能でサポートされていない場合、指定した形式に変換できない場合に発生します。

問題が一時的な問題かそうでないかを調べるには、Google スプレッドシート(または同様のスプレッドシート アプリ)で CSV ファイルを開き、[Error Description] 列を確認します(注: Error Description は Voice の書き出しでは利用できません)。一時的なエラーの対処方法は、一時的なエラーから回復するをご確認ください。

エラーレポートの内容

Gmail と Google グループのエラーレポートの内容

エラーレポートには、メッセージごとに次の項目が記載されます。データが使用できない場合、またはメッセージに該当しない場合、項目は空白です。

項目

説明
Document ID ファイルの一意の識別子
Document type ドキュメントの種類。値は mail です。
File type

ファイル形式。値は mail です。

Attachments count メッセージの添付ファイルの数
Attachment names 添付ファイルのファイル名
Subject メッセージの件名
Size メッセージのサイズ
From 送信者のメール アカウント
To 全受信者のメール アカウント
Cc Cc の全受信者のメール アカウント
Sent time メッセージ送信時のタイムスタンプ
Source account 検索クエリに含まれていたアカウント
Error description エラーの説明
RFC 822 Message-ID

メールサーバーによって追加された、メールの一意の識別子

例: rfc822msgid:AANLkTilQ5MWSp7-iE6SKepvOl-
Spjupgr1NZTiLGu16Z@mail.solarmora.com

 

Chat のエラーレポートの内容

エラーレポートには、メッセージごとに次の項目が記載されます。データが使用できない場合、またはメッセージに該当しない場合、項目は空白です。

項目

説明
Document ID ファイルの一意の識別子
Filename ドキュメントの種類。値は mail です。
Conversation Type

メッセージの種類

  • mail - Gmail、Google グループ、Chat のメッセージ
  • text message - テキスト メッセージ
  • voicemail - ボイスメール。
  • incoming call - 着信の通話履歴。
  • outgoing call - 発信の通話履歴。
  • missed call - 不在着信の通話履歴。
Room Name チャットルームの名前
Error description エラーの説明

 

ドライブ ファイルのエラーレポートの内容
エラーレポートには、ファイルごとに次の項目が記載されます。データが利用できない場合、またはファイルに該当しない場合、項目は空白です。
項目 説明
Document ID ファイルの一意の識別子
Document type Google のファイルの種類(DOCUMENT、SPREADSHEET、PRESENTATION、FORM、DRAWING など)。
File type ファイル形式(PDF、XLSX など)
Title ユーザーが割り当てたファイル名
Size ファイルのサイズ
Creator ドライブ内のファイルを所有するユーザーのメールアドレス。共有ドライブのファイルの場合は、共有ドライブの名前。
Collaborators ファイルを編集したりコメントを追加したりする直接的な権限のあるアカウントとグループ。書き出し時のオプション選択によっては、ファイルに対して間接的なアクセス権のあるユーザーも含まれます。
Viewers ファイルを表示する直接的な権限のあるアカウントやグループ。書き出し時のオプション選択によっては、ファイルに対して間接的なアクセス権のあるユーザーも含まれます。
Others 書き出し時にアクセスレベル情報を除外するオプションを選択した場合、クエリ結果のファイルに対して間接的な権限を持つアカウント。書き出しの時点で権限レベルを特定できないユーザーが含まれることもあります。
Creation time ドライブでの Google ファイルの作成日。Google 以外の形式のファイルの場合は、ドライブへのファイルのアップロード日を示します。
Last modified time ファイルの最終更新日
Error description エラーの説明
Drive Document ID ドライブ内のファイルの一意の識別子

 

Voice データのエラーレポートの内容

エラーレポートには、検索に一致する一部のファイルが書き出されなかったアカウントの一覧が記載されます。

項目 説明
Account 一部のデータが書き出されなかったアカウントのメールアドレス。
Failed Conversation Count 書き出されなかった会話の数。数が不明な場合、値は Unknown Failure Count になります。

一時的なエラーから回復する

一時的なエラーのために書き出されなかったデータについては、メッセージやファイルの情報を使用して検索や書き出しを行うことができます。

  • 一時的なエラーが発生したメッセージがエラーレポートに記載されている場合は、各メッセージの RFC 822 ID で再検索して見つけることができます。検索演算子の形式は、rfc822msgid:[ID] です。
  • 一時的なエラーが発生したドライブ ファイルがエラーレポートに記載されている場合は、ファイル名で再検索して見つけることができます。検索キーワードの形式は title:"[ファイル名]" です。
この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。