查看保管箱的匯出檔案

使用 Google 保管箱搜尋所需資料後,您可以匯出資料以供進一步分析 (如需操作說明,請按這裡)。匯出項目包含以下資訊:

  • 符合搜尋條件的資料完整副本。
  • 您所需的中繼資料,讓您能夠確認匯出的資料是來自貴機構的哪一位使用者。
  • 必要的驗證資訊,以證明匯出資料與 Google 伺服器儲存的資料相符合。

瞭解如何針對下列服務匯出資料:

匯出 Gmail、Chat 和網路論壇資料

匯出內容
資訊 檔案名稱 說明
郵件/訊息內容 <匯出項目名稱-編號>.zip

PSTmbox 檔案的 ZIP 檔案,這些檔案內含匯出郵件/訊息的內容和詳細資料。Google Chat 訊息的詳細資料含有傳送者編輯訊息的時間,或是訊息遭到刪除的時間。

如果匯出項目包含來自多個帳戶的郵件/訊息,或是檔案大小超過 1 GB (針對 PST 檔案)/10 GB (針對 mbox),可能會產生多個檔案。系統會在檔案名稱結尾以累加原則標明不同的檔案。

查看郵件/訊息

將 ZIP 檔案解壓縮後,您可以查看並處理郵件/訊息,具體方式取決於檔案類型:

  • PST:請使用 Microsoft Outlook 或部分訴訟支援系統。

  • mbox:請使用 Mozilla Thunderbird、文字編輯器,或部分訴訟支援系統,這些系統可提供 mbox 檔案的電子郵件轉換工具。

注意:Google 不提供設定第三方產品的相關技術支援。Google 不為第三方產品承擔任何責任。如需這些產品的最新設定和支援資訊,請參閱產品網站。

群組成員資格資訊 <匯出項目名稱>-group-membership.csv

這個 CSV 檔案會針對每位群組成員列出下列資訊:

  • 成員的電子郵件地址
  • 群組的電子郵件地址
  • 使用者成為群組成員的時間
  • 成員的角色:MEMBER (群組成員)、MANAGER (群組管理員) 或 OWNER (版主)
  • 帳戶類型:USER (個別使用者帳戶) 或 GROUP (群組電子郵件地址)
郵件/訊息中繼資料 <匯出項目名稱>-metadata.xml

這個 XML 檔案內含 Google 伺服器中存放的郵件/訊息中繼資料。請在文字編輯器中開啟這個檔案,藉此連結郵件/訊息中繼資料以及 mbox 檔案中的郵件/訊息內容。

注意:PST 檔案內容無法與 XML 檔案中繼資料建立關聯。

帳戶和郵件/訊息數量 <匯出項目名稱>-results-count.csv 這個 CSV 檔案會列出匯出作業內含郵件/訊息擁有者的帳戶,以及每個帳戶擁有的郵件/訊息數量。
錯誤報告

error.csv

<匯出項目名稱>-account-exceptions.csv (Gmail 匯出項目)

<匯出項目名稱>-failed-group-membership-lookups.csv (網路論壇匯出項目)

匯出作業出錯時,系統才會產生這類錯誤報告。

  • error.csv:列出擷取郵件/訊息時發生的錯誤。瞭解詳情
  • <匯出項目名稱>-account-exceptions.csv:列出系統已搜尋,但未匯出部分相符郵件的 Gmail 帳戶
  • <匯出項目名稱>-failed-group-membership-lookups.csv:列出系統已搜尋,但未傳回部分成員結果的群組電子郵件地址
File checksums File checksums 這個檔案會列出匯出結果中所有檔案的 MD5 雜湊值。
在電子郵件用戶端中查看郵件

您可以在 Microsoft Outlook (PST) 或 Mozilla Thunderbird (mbox) 中查看 Gmail 郵件和 Chat 訊息。如果要查看文字編輯器無法顯示的 HTML 郵件/訊息和附件,這是相當實用的方法。

PST 和 mbox 檔案含有已匯出郵件/訊息的詳細資料,中繼資料檔案則反映出 Google 所記錄的郵件/訊息中繼資料。您可以為 mbox 內容和郵件/訊息中繼資料建立關聯,這樣就能將您儲存在 Google 伺服器上的郵件/訊息連結至您從保管箱匯出的資料。

注意:Gmail 中用於分類郵件的標籤不會轉換成信箱資料夾。當您在電子郵件用戶端中開啟 PST 或 mbox 檔案時,所有郵件都會顯示在單一資料夾中。

如何在電子郵件用戶端中查看匯出的郵件:

  1. 在電子郵件應用程式中匯入及查看郵件。
  2. 如為重要郵件,您可以查看標頭:
    • Outlook:請參閱 Microsoft 說明文件,瞭解如何針對自己使用的版本查看郵件標頭
    • Thunderbird:依序點選 [檢視] > [標頭] > [所有標頭] 即可顯示每封郵件的標頭:
  3. 在 Thunderbird 中,每個標頭都包含 1 個郵件 ID。如要為郵件和儲存在 Google 伺服器中的資料建立關聯,請比對郵件 ID 和中繼資料檔案。
在文字編輯器中查看 mbox 檔案

mbox 檔案是儲存郵件的標準格式,內含已匯出郵件的所有詳細資料,包括郵件內文以及所有附件;中繼資料檔案則反映出 Google 所記錄的郵件中繼資料。這些檔案能將您儲存在 Google 伺服器上的郵件連結至已從保管箱匯出的資料。

匯出後,您可以利用中繼資料檔案內的郵件參數,找出 mbox 檔案中相對應的郵件。方法是在文字編輯器中開啟中繼資料檔案,然後找出 FileName 參數,例如:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

這個參數內含專屬 ID,且與 mbox 檔案中名為 From_ line 的參數類似,兩個參數也互相對應。From_ 行內含相同的 ID,以及 Google 收到郵件時的日期與時間 (以世界標準時間標記);例如:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

mbox 檔案內每封郵件的首個項目皆為 From_ 行。當您讀到新的 From_ 行,代表您已讀到另一封郵件。

中繼資料檔案中的郵件/訊息參數

中繼資料檔案包含以下資訊:

Gmail 郵件和網路論壇訊息內含的項目

  • #From:寄件者的電子郵件帳戶
  • #To:所有收件者的電子郵件帳戶
  • #CC:所有副本收件者的電子郵件帳戶
  • #BCC:所有密件副本收件者的電子郵件帳戶
  • #Subject:郵件/訊息的主旨
  • #DateSent:傳送郵件/訊息時的時間戳記
  • #DateReceived:接收郵件/訊息時的時間戳記

傳統版 Hangouts 和 Chat 訊息內含的項目

  • #SubjectAtStart:(僅限傳統版 Hangouts) 傳送第一則訊息時的對話主旨
  • #SubjectAtEnd:(僅限傳統版 Hangouts) 上次傳送訊息時的對話主旨
  • #DateFirstMessageSent:對話中第一則訊息傳送時的時間戳記
  • #DateLastMessageSent:對話中最後一則訊息傳送時的時間戳記
  • #DateFirstMessageReceived:收到對話中第一則訊息時的時間戳記
  • #DateLastMessageReceived:收到對話中最後一則訊息時的時間戳記

所有郵件/訊息 (Gmail、網路論壇及 Chat) 皆包含的項目

  • Labels:Gmail 或 Chat 套用的任何標籤,例如 ^INBOX、^TRASH 和 ^DELETED。此外,也會顯示使用者對郵件/訊息套用的所有標籤。
  • FileName:郵件/訊息 ID。請將這個值與匯出的 PST 或 mbox 檔案中顯示的郵件/訊息 ID 建立關聯。
  • FileSize:郵件/訊息大小,以位元組為單位。
  • Hash:郵件/訊息的 MD5 雜湊。

Chat 訊息 (非傳統版 Hangouts) 內含的項目

  • RoomID:訊息所屬聊天室或即時訊息的 ID。
  • Participants:參與對話的所有使用者的電子郵件地址。
  • roomName:聊天室名稱,或是以逗號分隔的即時訊息參與帳戶清單。
  • conversationType:訊息位置 (聊天室或即時訊息)。

整個匯出作業的查詢參數

  • UserQuery:在這次匯出作業中,保管箱使用者為擷取郵件/訊息所提交的查詢。
  • TimeZone:以日期為基準的搜尋內容所使用的時區。
  • Custodians:帳戶在搜尋範圍內的使用者電子郵件地址。如果您搜尋內容 (而不是個別使用者帳戶),這裡就不會列出任何保管人。

匯出雲端硬碟搜尋結果

匯出內容
資訊 檔案名稱 說明
檔案 <匯出項目名稱-編號>.zip

內含透過搜尋找到的所有檔案。保管箱最多可以將 10 GB 的資料匯出成一個壓縮檔。如果您匯出超過 10 GB 的資料,保管箱會建立多個檔案。

匯出檔案的名稱格式為:原始檔名後方加上底線 (「_」) 和雲端硬碟檔案 ID。

Google 檔案匯出後會按照以下方式轉換:

  • Google 文件轉換成 DOCX
  • Google 試算表轉換成 XLSX
  • Google 表單轉換成 ZIP (HTML 和 CSV)
  • Google 簡報轉換成 PPTX
  • Google 繪圖轉換成 PDF
檔案中繼資料 <匯出項目名稱>-metadata.xml

內含下列中繼資料:

  • 文件 ID (注意:這些 ID 不是雲端硬碟檔案 ID,而是對應 CSV 檔案的值)。
  • 使用者電子郵件地址
  • 每個檔案的建立和修改日期
  • 文件類型和名稱

瞭解詳情

帳戶和文件 ID <匯出項目名稱>-custodian-docid.csv 列出使用者帳戶和相關聯的文件 ID。這項資訊可用來判斷哪些使用者具有存取匯出檔案的權限。
錯誤報告

error.csv

<匯出項目名稱>-incomplete-accounts.csv

匯出作業出錯時,系統才會產生這類錯誤報告。

  • error.csv:列出擷取檔案及檔案中繼資料時發生的錯誤。瞭解詳情
  • <匯出項目名稱>-incomplete-accounts.csv:列出系統曾搜尋,但未匯出部分相符檔案的帳戶
File checksums File checksums 這個檔案會列出匯出結果中所有檔案的 MD5 雜湊值。
中繼資料檔案中的檔案參數

匯出項目中包含的中繼資料檔案會擷取下列中繼資料:

每份檔案內含的項目

  • #Author:雲端硬碟中檔案擁有人的電子郵件地址。在共用雲端硬碟檔案中則會顯示共用雲端硬碟的名稱。
  • Collaborators:具有檔案直接編輯或加註權限的帳戶和群組。如果您在匯出時選擇這個選項,則具有檔案間接存取權的使用者也會包含在內。
  • Viewers:具有檔案直接檢視權限的帳戶和群組。如果您在匯出時選擇這個選項,則具有檔案間接存取權的使用者也會包含在內。
  • Others:如果您在匯出時選擇排除存取層級資訊,則會顯示您查詢中具有檔案間接存取權的帳戶,保管箱在匯出時無法判斷權限層級的使用者也可能包含在內。
  • #DateCreated:雲端硬碟中 Google 檔案建立的日期,非 Google 檔案則會顯示該檔案上傳至雲端硬碟的時間。
  • #DateModified:檔案最後一次更新的日期。
  • #Title:使用者指派的檔案名稱。部分作業系統無法解壓縮檔名過長的 ZIP 檔案,因此保管箱進行匯出作業時,檔案名稱會以 128 個字元為限,多餘字串將被截斷。#Title 標籤顯示的值則不會被截斷。
  • DocumentType:Google 檔案的檔案類型。可能的值包括 DOCUMENT (文件)、SPREADSHEET (試算表)、PRESENTATION (簡報)、FORM (表單) 以及 DRAWING (繪圖)。
  • SharedDriveID:檔案所屬的共用雲端硬碟 ID (如果適用的話)。
  • SourceHash:每個檔案版本的專屬雜湊值,可簡化檔案匯出作業,以及驗證匯出檔案為來源檔案的副本。僅適用於 Google 文件、試算表和簡報檔案。

整個匯出作業的查詢參數

  • UserQuery:在這次匯出作業中,保管箱使用者為擷取檔案所提交的查詢。
  • TimeZone:以日期為基準的搜尋內容所使用的時區。
  • Custodians:帳戶在搜尋範圍內的使用者電子郵件地址。如果您搜尋內容 (而不是個別使用者帳戶),這裡就不會列出任何保管人。
針對具有檔案間接存取權的使用者匯出存取層級資訊

當您從雲端硬碟匯出檔案時,如果貴機構的使用者具有相關檔案的間接存取權,而且曾經開啟符合您搜尋條件的檔案,中繼資料檔案就會納入他們的資料。

如果檔案或含有檔案的資料夾有以下情形,使用者即具有間接存取權:

  • 與使用者所屬的群組共用
  • 與該網域共用
  • 公開分享

匯出過程中,您可以選擇要在中繼資料輸出結果中納入哪些資訊類型:

  • 如果在匯出對話方塊中勾選相應方塊,保管箱就會針對您網域中具有檔案間接存取權的使用者判斷權限層級。當您開啟中繼資料檔案時,這些使用者會分別納入下列其中一個類別:

    • Collaborators:具有檔案間接編輯或加註權限的使用者。
    • Viewers:擁有檔案間接檢視權限的使用者。
    • Others:在某些情況下,保管箱在匯出時會無法判斷使用者所擁有的存取權限類型。舉例來說,如果在檔案與某個群組共用後,有使用者遭人從該群組中移除,就可能發生這種情況。

    保管箱需要時間來判斷這類使用者具有的權限,因此如果選擇這個選項,系統可能需要較長時間才會開放下載檔案。

  • 如果在匯出對話方塊中將相應方塊保持在未勾選狀態 (預設),保管箱就不會將您網域中具有檔案間接存取權的使用者納入存取層級資訊。這些使用者在中繼資料檔案中會列為 Others

匯出 Google Voice 搜尋結果

匯出內容
資訊 檔案名稱 說明
Voice 資料檔案 <匯出項目名稱-編號>.zip 這是系統為每個帳戶產生的 zip 檔案,其中含有 PST 或 mbox 檔案,內含文字對話、通話記錄、語音留言的 MP3 音訊檔案和語音留言轉錄稿。
檔案中繼資料 <匯出項目名稱>-metadata.xml 這個 XML 檔案內含 Google 伺服器中存放的中繼資料。
File checksums File checksums 這個 Checksum 檔案內含匯出結果中所有檔案的 MD5 雜湊值。
錯誤報告

error.csv

匯出作業出錯時,系統才會產生這類錯誤報告。瞭解詳情

注意:有別於其他服務,Voice 匯出檔案不會包含計數檔案。

中繼資料檔案中的 Voice 資料參數

中繼資料檔案包含以下資訊:

每個檔案的相關資訊

  • DocID:檔案的專屬 ID。
  • #Author:帳戶的電子郵件地址,這類帳戶擁有雲端硬碟檔案。
  • #DateFirstMessageSent:如果是文字對話,則是第一則訊息傳送的日期。注意:如果是語音留言和通話記錄,本欄位和接下來 3 個欄位中的項目會是相同的。
  • #DateLastMessageSent:如果是文字對話,就是上次訊息傳送的日期。
  • #DateFirstMessageReceived:如果是文字對話,就是收到第一則訊息的日期。
  • #DateLastMessageReceived:如果是文字對話,就是上次收到訊息的日期。
  • ConversationType:資料類型:
    • TEXT_MESSAGE:簡訊。
    • VOICEMAIL:語音留言。
    • INCOMING_CALL:來電的通話記錄。
    • OUTGOING_CALL:撥出電話的通話記錄。
    • MISSED_CALL:未接來電的通話記錄。
  • ParticipantPhoneNumbers:參與者的電話號碼。
  • OwnerPhoneNumbers:使用者的號碼有異動時,這個值可能包含多個電話號碼。
  • Labels:對話的任何標籤。舉例來說,已刪除的對話會加上「DELETED」(已刪除) 標籤。
  • ExternalFile FileName:與 PST 或 mbox 檔案中「主旨」相關的檔案 ID。

整個匯出作業的查詢參數

  • UserQuery:保管箱使用者所提交的查詢。
  • TimeZone:該查詢所使用的時區
  • Custodians:在搜尋範圍內的帳戶電子郵件地址。

錯誤報告 (error.csv)

當保管箱無法從服務匯出資料時,系統就會產生錯誤報告 (error.csv)。這份報告會列出含有匯出錯誤的項目與其他細節和中繼資料。

保管箱會回報以下兩種錯誤:

  • 暫時性錯誤:後端伺服器無法擷取電子郵件或檔案。稍後再次搜尋該項目,應可順利執行匯出作業。
  • 非暫時性錯誤:任何未明確標示為「暫時性」的錯誤皆屬此類,代表系統發生無法修正的問題。一般來說,當郵件附件或檔案遭到刪除、不支援匯出作業,或無法轉換成要求的格式時,就會發生這類錯誤。

如要判斷問題是否為暫時性問題,請透過 Google 試算表 (或其他試算表應用程式) 開啟 CSV 檔案,然後查看「錯誤說明」一欄 (注意:Voice 匯出檔案不提供錯誤說明)。如果是暫時性錯誤,請參閱這裡的說明,瞭解如何解決暫時性錯誤。

錯誤報告內容

Gmail 和網路論壇的錯誤報告內容

錯誤報告會針對個別郵件/訊息列出以下欄位;如果郵件/訊息沒有資料 (或資料不適用),這些欄位就會留白。

欄位

說明
Document ID 檔案的專屬 ID。
Document type 文件類型。值為 mail
File type

檔案類型。值為 mail

Attachments count 郵件/訊息的附件數量。
Attachment names 附件的檔案名稱。
Subject 郵件/訊息主旨。
Size 郵件/訊息大小。
From 寄件者的電子郵件帳戶。
To 所有收件者的電子郵件帳戶。
Cc 所有副本收件者的電子郵件帳戶。
Sent time 傳送郵件/訊息時的時間戳記。
Source account 搜尋查詢範圍內的帳戶。
Error description 錯誤相關說明。
RFC 822 Message-ID

郵件伺服器所新增的郵件專屬 ID。

範例:rfc822msgid:AANLkTilQ5MWSp7-iE6SKepvOl-
Spjupgr1NZTiLGu16Z@mail.solarmora.com

 

Chat 錯誤報告內容

錯誤報告會針對個別訊息列出以下欄位;如果訊息沒有資料 (或資料不適用),這些欄位就會留白。

欄位

說明
Document ID 檔案的專屬 ID。
Filename 文件類型。值為 mail
Conversation Type

訊息類型。

  • mail:Gmail、網路論壇或 Chat 郵件/訊息。
  • text message:簡訊。
  • voicemail:語音留言。
  • incoming call:來電的通話記錄。
  • outgoing call:撥出電話的通話記錄。
  • missed call:未接來電的通話記錄。
Room Name 訊息的附件數量。
Error description 錯誤相關說明。

 

雲端硬碟檔案的錯誤報告內容
錯誤報告會針對個別檔案列出以下欄位:如果檔案沒有資料 (或資料不適用),這些欄位就會留白。
欄位 說明
Document ID 檔案的專屬 ID。
Document type 表示 Google 檔案的檔案類型。可能的值包括 DOCUMENT (文件)、SPREADSHEET (試算表)、PRESENTATION (簡報)、FORM (表單) 以及 DRAWING (繪圖)。
File type 檔案格式,例如 PDF 或 XLSX。
Title 使用者指派的檔案名稱。
Size 檔案的大小。
Creator 雲端硬碟中檔案擁有人的電子郵件地址。在共用雲端硬碟檔案中則會顯示共用雲端硬碟的名稱。
Collaborators 具有檔案直接編輯或加註權限的帳戶和群組。如果您在匯出時選擇這個選項,則具有檔案間接存取權的使用者也會包含在內。
Viewers 具有檔案直接檢視權限的帳戶和群組。如果您在匯出時選擇這個選項,則具有檔案間接存取權的使用者也會包含在內。
Others 如果您在匯出時選擇排除存取層級資訊,則會顯示您查詢中具有檔案間接存取權的帳戶,保管箱在匯出時無法判斷權限層級的使用者也可能包含在內。
Creation time 雲端硬碟中 Google 檔案建立的日期,非 Google 檔案則會顯示該檔案上傳至雲端硬碟的時間。
Last modified time 檔案最後一次更新的日期。
Error description 錯誤相關說明。
Drive Document ID 雲端硬碟檔案的專屬 ID。

 

Voice 資料的錯誤報告內容

錯誤報告會列出系統已搜尋,但未匯出部分相符檔案的帳戶。

欄位 說明
帳戶 帳戶的電子郵件地址,這類帳戶有部分資料並未匯出。
Failed Conversation Count 未匯出的對話數量。如果數字不明,這個值會是 Unknown Failure Count

解決暫時性錯誤

如果資料因暫時性錯誤而無法順利匯出,您可以利用郵件和檔案的詳細資訊來搜尋及匯出這類資料:

  • 如果錯誤報告含有發生暫時性錯誤的郵件,當您再次搜尋時,請使用每封郵件的 RFC 822 ID 找出這些郵件。搜尋字詞的格式為 rfc822msgid:<ID>
  • 如果錯誤報告含有發生暫時性錯誤的雲端硬碟檔案,當您再次搜尋時,請使用個別檔案的名稱找這出些檔案。搜尋字詞的格式為 title:"<檔案名稱>"
這對您有幫助嗎?
我們應如何改進呢?