Экспорт документов из Сейфа

Найдя нужные сообщения и файлы, экспортируйте их из Сейфа для дальнейшего анализа. Функция экспорта позволяет получить следующие сведения:

  • подробную копию всех данных, соответствующих поисковому запросу;
  • метаданные, которые помогут связать экспортируемые данные с определенными пользователями в домене;
  • информацию, которая доказывает, что экспортируемые данные соответствуют данным на серверах Google.

Как экспортировать данные из Gmail, чата и Групп

Когда Сейф завершит экспорт, вы сможете скачать перечисленные ниже файлы.

  • ZIP-архив с файлами в формате PST или MBOX, которые содержат сами экспортированные сообщения и сведения о них. Распаковав архив, можно открыть письма в следующих программах:

    • Microsoft Outlook (файлы в формате PST). В архиве может быть несколько PST-файлов. Такое происходит, если были экспортированы сообщения из нескольких аккаунтов, а также если они не поместились в один файл размером 1 ГБ.

      Примечание. Microsoft Outlook не поддерживает ярлыки, которые Gmail использует для упорядочивания сообщений. Если открыть PST-файл в Outlook, все письма появятся в папке "Входящие".
    • Mozilla Thunderbird или текстовый редактор (файлы в формате MBOX).В архиве может быть несколько MBOX-файлов. Такое происходит, если были экспортированы сообщения из нескольких аккаунтов, а также если они не поместились в один файл размером 10 ГБ.

    • Отдельные системы обслуживания судебных процессов. В некоторых из них можно открывать PST-файлы или есть инструменты для преобразования сообщений электронной почты из формата MBOX.  

Примечание. Компания Google НЕ ПРЕДОСТАВЛЯЕТ техническую поддержку сторонних продуктов и НЕ НЕСЕТ ОТВЕТСТВЕННОСТИ ЗА ИХ РАБОТУ. Информация о настройке и поддержке таких продуктов приводится на их официальных сайтах.

  • XML-файл с метаданными сообщений в том виде, в котором они хранятся на серверах Google. Откройте его в текстовом редакторе и используйте, чтобы установить связь между метаданными и содержимым соответствующих сообщений в файле MBOX.Содержимое PST-файла нельзя сопоставить с метаданными XML-файла.
  • CSV-файл, содержащий адреса владельцев экспортируемых сообщений, а также информацию о количестве писем для каждого из них.
  • Отчет об ошибках создается только при их наличии.
  • Файл контрольной суммы с хеш-значениями MD5 для предыдущих файлов.
Как просматривать сообщения в почтовом клиенте

Вы можете открывать сообщения Gmail и чата в Microsoft Outlook (PST-файлы) или Mozilla Thunderbird (MBOX-файлы). Этот способ удобно использовать для просмотра сообщений и прикрепленных файлов в формате HTML, которые не отображаются в текстовом редакторе.

Файлы PST и MBOX содержат все данные экспортируемых сообщений Gmail и чата. XML-файл Сейфа отражает метаданные сообщений в том виде, в котором они хранятся на серверах Google. Вы можете сопоставить содержимое MBOX-файла и метаданные сообщения, чтобы установить связь между сообщениями на серверах Google и данными, которые экспортируются из Сейфа.

Чтобы посмотреть экспортированные сообщения в почтовом клиенте:

  1. Импортируйте сообщения в почтовый клиент и откройте их.
  2. Проверьте заголовки важных сообщений:
    • Outlook. Последовательность действий может отличаться в зависимости от версии. Подробная информация приведена в статье Просмотр заголовков сообщений электронной почты справочного центра Microsoft.  
    • Thunderbird. Чтобы включить показ всех заголовков для каждого сообщения, нажмите Вид > Заголовки > Все.
  3. В Thunderbird каждый заголовок включает идентификатор сообщения. Чтобы сопоставить сообщения с данными на серверах Google, сравните идентификаторы сообщений с метаданными в XML-файле.
Как просматривать MBOX-файлы в текстовом редакторе

MBOX – стандартный формат для хранения сообщений. Файл такого формата содержит все данные экспортируемого сообщения, включая текст и вложения. XML-файл Сейфа отражает метаданные сообщений в том виде, в котором они хранятся на серверах Google. Вместе эти файлы позволяют установить связь между сообщениями на серверах Google и данными, которые экспортируются из Сейфа.

Для сопоставления экспортированных сообщений в XML- и MBOX-файлах используются параметры, заданные в XML-файле. Откройте его в текстовом редакторе и найдите параметр FileName. Например:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Этот параметр содержит уникальный идентификатор, который соответствует аналогичной записи в файле MBOX: строке From_. Кроме идентификатора в строке From_ указаны дата и время получения сообщения в Google (в формате UTC), например:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

Строка From_ – это первая запись в блоке каждого сообщения в файле MBOX. Если вы видите строку From_, значит, предыдущее письмо закончилось и началось следующее.

Параметры Gmail и чата в XML-файле Сейфа

В XML-файле Сейфа, который включается в экспорт, содержатся перечисленные ниже метаданные.

Для каждого сообщения Gmail

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

Для каждого сообщения чата

  • #SubjectAtStart (только в классической версии Hangouts)
  • #SubjectAtEnd (только в классической версии Hangouts)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

Для сообщений Gmail и чата

  • Labels – все ярлыки, присвоенные сообщениям в Gmail (например, ^INBOX, ^TRASH и ^DELETED), в том числе пользовательские.
  • FileName – идентификатор сообщения. Сопоставьте его с идентификатором сообщения, указанным в экспортированном файле PST или MBOX.

Для сообщений в Hangouts Chat

  • RoomID – идентификатор чат-комнаты или прямой переписки, к которой принадлежит разговор.
  • Participants – адреса электронной почты всех участников чата.
  • roomName – название чат-комнаты или список аккаунтов, участвовавших в прямой переписке, через запятую.
  • conversationType – расположение чата (чат-комната или прямая переписка).

Параметры запроса для всего экспорта

  • UserQuery – запрос пользователя Сейфа на получение экспортируемых сообщений.
  • TimeZone – часовой пояс для запросов на основе даты.
  • Custodians – адреса электронной почты пользователей, в аккаунтах которых выполнялся поиск. Если вы искали определенное содержание, а не данные в аккаунтах отдельных пользователей, адреса не указываются.

Экспорт файлов с Диска

Когда Сейф завершит экспорт, вы сможете скачать перечисленные ниже файлы.

  • Сжатый файл со всеми найденными документами. Сейф может экспортировать в сжатый файл до 10 ГБ данных. Если нужно экспортировать больший объем данных, Сейф создает несколько файлов.
  • XML-файл со всеми метаданными, включая:
    • идентификаторы документов (это не идентификаторы файлов на Диске, а значения в CSV-файле);
    • адреса электронной почты пользователей;
    • даты создания и последнего изменения каждого файла;
    • типы и названия документов.
  • CSV-файл для сопоставления идентификаторов документов с аккаунтами пользователей. Эта информация позволяет определить, кто имеет доступ к экспортируемым файлам.
  • Отчет об ошибках (при их наличии).
  • Файл контрольной суммы, содержащий значения MD5 для предыдущих файлов.

Экспортированные файлы именуются в таком формате: название оригинального файла, символ подчеркивания ("_") и идентификатор файла на Диске.

В таблице ниже показано, как преобразуются экспортируемые файлы.

Тип файла на Диске Формат экспортированного файла
Google Документы DOCX
Google Таблицы XLSX
Google Формы ZIP (HTML и CSV)
Google Презентации PPTX
Google Рисунки PDF
Файлы другого формата (не Google) Формат не меняется

 

Параметры файлов в XML-файле Сейфа

В XML-файле, который включается в экспорт, содержатся перечисленные ниже метаданные.

Для каждого файла

  • #Author – адрес электронной почты владельца файла на Диске или название общего диска, на котором находится файл.
  • Collaborators – аккаунты и группы, у которых есть непосредственное разрешение редактировать файл или добавлять комментарии. К этой категории также относятся пользователи, имеющие непрямой доступ к файлу, если соответствующий параметр выбран во время экспорта.
  • Viewers – аккаунты и группы, у которых есть непосредственное разрешение просматривать файл. К этой категории также относятся пользователи, имеющие непрямой доступ к файлу, если соответствующий параметр выбран во время экспорта.
  • Others – аккаунты из вашего запроса, у которых есть непрямой доступ к файлу, если во время экспорта вы решили исключить информацию об уровне доступа. К этой категории также относятся пользователи, для которых Сейфу не удалось определить уровни разрешений во время экспорта.
  • #DateCreated – дата создания файла Google на Диске. Для файлов других форматов (не Google) это дата загрузки файла на Диск.
  • #DateModified – дата последнего изменения файла.
  • #Title – название файла, назначенное пользователем. Поскольку некоторые операционные системы не позволяют распаковывать ZIP-архивы с длинными названиями, при экспорте Сейф урезает названия, содержащие более 128 символов. В теге #Title они показаны полностью.
  • DocumentType – тип файла Google. Возможные значения: DOCUMENT (документ), SPREADSHEET (таблица), PRESENTATION (презентация), FORM (форма) и DRAWING (рисунок).
  • SharedDriveID – идентификатор общего диска, на котором находится файл (если есть).
  • SourceHash – уникальный хеш для каждой версии файла. С его помощью можно дедуплицировать экспортируемые файлы и проверить, является ли экспортируемый файл точной копией исходного. Поддерживается только для файлов Google Документов, Таблиц и Презентаций.

Параметры запроса для всего экспорта

  • UserQuery – запрос пользователя Сейфа на получение экспортируемых файлов.
  • TimeZone – часовой пояс для запросов на основе даты.
  • Custodians – адреса электронной почты пользователей, в аккаунтах которых выполнялся поиск. Если вы искали определенное содержание, а не данные в аккаунтах отдельных пользователей, адреса не указываются.
Как экспортировать сведения об уровне доступа пользователей, имеющих непрямой доступ к файлам

При экспорте файлов с Диска Сейф может включать в экспортируемую информацию метаданные пользователей домена, имеющих непрямой доступ к файлу, который соответствует критериям поиска, и открывших его.

У пользователя может быть непрямой доступ, когда файл или содержащая его папка:

  • доступны группе, к которой принадлежит пользователь;
  • доступны всем в домене;
  • доступны всем в Интернете.

В процессе экспорта вы можете указать, какие сведения следует включить в метаданные.

  • Чтобы Сейф определял уровни разрешений для пользователей домена, имеющих непрямой доступ к файлам, установите соответствующий флажок в диалоговом окне экспорта. В XML-файле каждый из этих пользователей отнесен к одной из перечисленных ниже категорий.

    • Collaborators – пользователи, имеющие непрямое разрешение редактировать файл или добавлять комментарии.

    • Viewers – пользователи, имеющие непрямое разрешение просматривать файл.

    • Others – пользователи, для которых Сейфу не удалось определить тип доступа на момент экспорта (например, если файл доступен группе, из которой человек был удален).

    Сейфу требуется время для идентификации предоставленных пользователям разрешений, поэтому установка этого флажка может увеличить время подготовки файлов к скачиванию.

  • Чтобы не включать сведения об уровне доступа пользователей домена, имеющих непрямой доступ к файлам, не устанавливайте в диалоговом окне экспорта соответствующий флажок (по умолчанию он снят). В XML-файле эти пользователи будут отнесены к категории Others.

Отчеты об ошибках

Если Сейф не может экспортировать сообщение из Gmail или файл с Диска, создается отчет об ошибках в виде CSV-файла. В нем перечислены элементы, которые не удалось экспортировать, указаны дополнительные сведения о них и метаданные. Существует два типа ошибок:

  • Перемежающиеся ошибки. Внутренний сервер не смог извлечь сообщение или файл. При повторном поиске элемент будет снова доступен для экспорта.
  • Постоянные ошибки. Все ошибки, которые нельзя однозначно идентифицировать как временные, считаются результатом неустранимой неполадки. Как правило, такое происходит, если вложенное сообщение или файл были удалены, их нельзя экспортировать или преобразовать в нужный формат.

Чтобы определить тип проблемы, откройте CSV-файл с помощью Google Таблиц (или другого редактора электронных таблиц) и найдите столбец Описание ошибки.

Если в отчете есть сообщения электронной почты с перемежающимися ошибками, найдите их по идентификаторам RFC 822. Операторы поиска имеют следующий формат: rfc822msgid:идентификатор.

Готовы начать?

Экспортировать результаты поиска

Эта информация оказалась полезной?
Как можно улучшить эту статью?