保管箱匯出功能運作方式

當您透過保管箱找出需要的郵件或檔案後,就可以將這些內容匯出以進一步分析。Google 保管箱的匯出功能可提供以下資料:

  • 符合您搜尋條件所有資料的完整複本。
  • 您所需的中繼資料,讓您能夠確認匯出的資料是來自於網域中的哪一位使用者。
  • 必要的驗證資訊,以證明匯出資料與 Google 伺服器儲存的資料相符合。

匯出 Gmail、即時通訊和網路論壇

保管箱處理完匯出作業後,您可以下載以下項目:

  • 1 個包含 PSTmbox 檔案的 ZIP 檔案,這些檔案內含匯出郵件的詳細資料和內容。將 ZIP 檔案解壓縮後,您可以透過以下方式開啟檔案:

    • PST:使用 Microsoft Outlook 開啟。如果匯出項目包含來自多個帳戶的郵件,或是檔案大小超過 1 GB,可能會產生多個 PST 檔案。

      注意:雖然在 Gmail 中,您可以使用標籤來分類郵件,但 Microsoft Outlook 無法支援這類標籤。因此當您使用 Outlook 開啟 PST 檔案時,郵件會全數顯示在收件匣中。
    • mbox:使用 Mozilla Thunderbird 或文字編輯器開啟。如果匯出來源包括多個帳號的郵件,或是檔案大小超過 10 GB,可能會產生多個 mbox 檔案。

    • 使用特定的訴訟支援系統:這類系統有些可開啟 PST 檔案,或提供 mbox 檔案的電子郵件轉換工具。

注意:Google 不提供第三方產品設定的相關技術支援。對於第三方產品的相關責任,Google 概不接受。請查閱產品網站,瞭解最新的產品設定與支援資訊。

  • 1 個 XML 檔案內含 Google 伺服器中存放的郵件中繼資料。請在文字編輯器中開啟這個檔案,用以連結郵件中繼資料以及 PST 或 mbox 檔案中的郵件內容。
  • 1 個 CSV 檔案內含郵件所有人的地址以及每位使用者所擁有的郵件數量。
  • 如果匯出過程中發生錯誤,系統也會提供錯誤報告
  • 1 個 Checksum 檔案內含先前檔案的 MD5 雜湊值。
在電子郵件用戶端中查看郵件

您可以在 Microsoft Outlook (PST) 或 Mozilla Thunderbird (mbox) 中查看 Gmail 和即時通訊訊息。如果要查看文字編輯器無法顯示的 HTML 郵件和附件,這是相當實用的方法。

PST 和 mbox 檔案包含所有匯出 Gmail 和即時通訊訊息的詳細資料,保管箱 XML 檔案則反映出 Google 所記錄的郵件中繼資料。這些檔案能將您儲存在 Google 伺服器上的電子郵件連結至已匯出的資料。

  1. 在電子郵件應用程式中匯入及查看郵件。
  2. 如為重要郵件,可查看標頭:
    • Outlook:相關步驟可能會因為您使用的版本而有所不同。如要瞭解如何查看郵件標頭,請參閱這裡的 Microsoft 說明文件。
    • Thunderbird:依序點選 [檢視] > [標頭] > [所有標頭] 即可顯示每封郵件的標頭。
  3. 每個標頭都含有郵件 ID。只要比對郵件 ID 和 XML 檔案的中繼資料,即可找出郵件與 Google 伺服器儲存的資料間的關聯。
在文字編輯器中查看 mbox 檔案

mbox 檔案是儲存郵件的標準格式,內含已匯出郵件的所有詳細資料,包括郵件內文以及所有附件;保管箱 XML 檔案則反映出 Google 所記錄的郵件中繼資料。這些檔案能將您儲存在 Google 伺服器上的電子郵件連結至已匯出的資料。

匯出後,您可以透過保管箱 XML 檔案內的郵件參數,以找出 mbox 檔案中相對應的郵件。方法是在文字編輯器中開啓 XML 檔案,然後找出 FileName 參數,例如:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

這個參數內含專屬識別碼,且類似 mbox 檔案中名為 From_ line 的參數,兩個參數也互相對應。From_ line 內含相同識別碼,以及 Google 收到郵件時的日期與時間 (以世界協調時間標記);例如:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

mbox 檔案內每則郵件的首個項目皆為 From_ line 參數。當您讀到新的 From_line,代表您已讀到另一封郵件。

保管箱 XML 檔案中的 Gmail 和即時通訊參數

匯出作業中的保管箱 XML 檔案內含下列中繼資料:

每封 Gmail 郵件內含的項目

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

每則即時通訊訊息內含的項目

  • #SubjectAtStart:(僅限傳統版 Hangouts)
  • #SubjectAtEnd:(僅限傳統版 Hangouts)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

Gmail 和即時通訊訊息皆包含的項目

  • Labels:顯示 Gmail 套用的標籤,例如 ^INBOX、^TRASH 和 ^DELETED。此外,也會顯示使用者對郵件套用的所有標籤。
  • FileName:顯示郵件識別碼,可與匯出的 PST 或 mbox 檔案中顯示的郵件 ID 建立關聯。

Hangouts Chat 訊息包含的項目

  • RoomID:顯示對話所屬聊天室或即時訊息的識別碼。
  • Participants:顯示參與對話的所有使用者電子郵件地址。
  • roomName:顯示聊天室名稱,或是以逗號分隔的即時訊息發送帳戶清單。
  • conversationType:顯示對話是來自聊天室或即時訊息。

整個匯出作業的查詢參數

  • UserQuery:顯示這次匯出作業中,保管箱使用者為擷取郵件所提交的查詢。
  • TimeZone:顯示以日期為基準的搜尋內容所使用的時區。
  • Custodians:顯示帳戶在搜尋範圍內的使用者的電子郵件地址。如果您搜尋內容 (而不是個別使用者帳戶),這裡就不會列出任何保管人。

匯出雲端硬碟搜尋結果

保管箱處理完匯出作業後,您可以下載以下檔案:

  • 1 個壓縮檔,內含透過搜尋找到的所有檔案。保管箱最多可以將 10 GB 的資料匯出成一個壓縮檔案。如果您匯出超過 10 GB 的資料,保管箱會建立多個檔案。
  • 1 個 XML 檔,內含下列中繼資料:
    • 文件 ID (注意:這些 ID 不是雲端硬碟檔案 ID,而是對應 CSV 檔案的值)
    • 使用者電子郵件地址
    • 每個檔案的建立和修改日期
    • 文件類型和名稱
  • 1 個 CSV 檔案,可將文件 ID 與使用者帳戶相對應。這項資訊可用來判斷哪些使用者具有存取匯出檔案的權限。
  • 如果匯出過程中發生錯誤,系統也會提供錯誤報告
  • 1 個 Checksum 檔案,內含先前檔案的 MD5 值。

匯出檔案的名稱格式為:原始檔名後方加上底線 (「_」) 和雲端硬碟檔案 ID。

匯出檔案的轉換格式如下:

雲端硬碟檔案類型 匯出格式
Google 文件 .docx
Google 試算表 .xlsx
Google 表單 .zip (.html 和 .csv)
Google 簡報 .pptx
Google 繪圖 .pdf
非 Google 檔案 格式不變

 

保管箱 XML 檔案中的檔案參數

匯出作業中的保管箱 XML 檔案內含的中繼資料項目如下:

每份檔案內含的項目

  • #Author:顯示雲端硬碟中檔案擁有人的電子郵件地址。在共用雲端硬碟檔案中則會顯示共用雲端硬碟的名稱。
  • Collaborators:顯示擁有檔案直接編輯或加註權限的帳戶和群組。如果您在匯出時選擇這個選項,也會包含擁有檔案間接存取權的使用者。
  • Viewers:顯示擁有檔案直接檢視權限的帳戶和群組。如果您在匯出時選擇這個選項,也會包含擁有檔案間接存取權的使用者。
  • Others:如果您在匯出時選擇排除存取層級資訊,則會顯示您查詢中擁有檔案間接存取權的帳戶;也可能包含保管箱在匯出時無法判斷其權限層級的使用者。
  • #DateCreated:顯示 Google 檔案建立的日期,並針對非 Google 檔案顯示該檔案上傳至雲端硬碟的時間。
  • #DateModified:顯示檔案最後一次更新的日期。
  • #Title:顯示使用者指派的檔案名稱。部分作業系統無法解壓縮檔名過長的 ZIP 檔案,因此保管箱進行匯出作業時,檔案名稱會以 128 個字元為限,多餘字串將被截斷。#Title 標籤所顯示的值則不會被截斷。
  • DocumentType:表示 Google 檔案的檔案類型。可能的值包括 DOCUMENT (文件)、SPREADSHEET (試算表)、PRESENTATION (簡報)、FORM (表單) 以及 DRAWING (繪圖)。
  • TeamDriveID:顯示檔案所屬的共用雲端硬碟 ID (如果適用的話)。
  • SourceHash:每個檔案版本的專屬雜湊值,可簡化檔案匯出作業,以及驗證匯出檔案為來源檔案的複本。僅適用於 Google 文件、試算表和簡報檔案。

整個匯出作業的查詢參數

  • UserQuery:顯示這次匯出作業中,保管箱使用者為擷取檔案所提交的查詢。
  • TimeZone:顯示以日期為基準的搜尋內容所使用的時區。
  • Custodians:顯示帳戶在搜尋範圍內的使用者的電子郵件地址。如果您搜尋內容 (而不是個別使用者帳戶),這裡就不會列出任何保管人。
針對擁有檔案間接存取權的使用者匯出存取層級資訊

當您從 Google 雲端硬碟中匯出檔案時,如果您網域中的使用者擁有相關檔案的間接存取權,而且曾經開啟符合您搜尋條件的檔案,保管箱就會納入他們的中繼資料

當檔案或含有檔案的資料夾與下列對象共用,使用者即擁有間接存取權:

  • 與使用者所屬的群組共用
  • 與該網域共用
  • 公開共用

匯出時,您可以選擇中繼資料輸出結果中所包含的資訊類型:

  • 在匯出對話方塊中勾選相應方塊,讓保管箱針對您網域中擁有檔案間接存取權的使用者判斷權限層級。當您開啟 XML 檔案時,這些使用者會分別納入下列其中一個類別:

    • Collaborators:擁有檔案間接編輯或加註權限的使用者。

    • Viewers:擁有檔案間接檢視權限的使用者。

    • Others:在某些情況下,保管箱在匯出時會無法判斷使用者所擁有的存取權限類型。舉例來說,如果在檔案與某個群組共用後,有使用者從該群組中移除,就可能發生這種情況。

    保管箱需要更多的時間來判斷這類使用者所擁有的權限,因此如果選擇這個選項,系統可能需要比較長的時間才能提供下載檔案。

  • 在匯出對話方塊中不要勾選相應方塊 (預設),保管箱就不會針對您網域中擁有檔案間接存取權的使用者納入存取層級資訊。這些使用者在 XML 檔案中會列為 Others

錯誤報告

當保管箱無法從 Gmail 匯出電子郵件,或無法從雲端硬碟匯出檔案時,系統就會產生錯誤報告。報告為 .csv 檔案格式,並會列出含有匯出錯誤的項目與其他詳細資訊和中繼資料。兩種錯誤類型如下:

  • 暫時性錯誤:後端伺服器無法擷取電子郵件或檔案。稍後再次搜尋該項目,應可順利執行匯出作業。
  • 非暫時性錯誤:任何未明確標示為暫時性的錯誤皆屬此類,代表系統發生無法修正的問題。一般來說,當郵件附件或檔案遭到刪除、不支援匯出作業,或無法轉換成要求的格式時,就會發生這類錯誤。

如要判斷問題為暫時性或非暫時性,請透過 Google 試算表 (或類似的試算表應用程式) 開啟 .csv 檔,然後查看「錯誤說明」一欄。

如果錯誤報告含有發生暫時性錯誤的電子郵件,當您再次搜尋時,請使用每封郵件的 RFC 822 識別碼找出這些郵件。搜尋運算子的格式為 rfc822msgid:identifier

準備好要開始了嗎?

匯出搜尋結果

這對您有幫助嗎?
我們應如何改進呢?