Como funcionam as exportações do Google Vault

Depois que o Google Vault localizar as mensagens ou os arquivos necessários, você poderá exportar esses itens para análise. A funcionalidade de exportação do Google Vault foi desenvolvida para gerar:

  • uma cópia abrangente de todos os dados que correspondem aos seus critérios de pesquisa;
  • os metadados necessários para vincular os dados exportados a usuários específicos no seu domínio;
  • as informações comprobatórias exigidas para provar que os dados exportados correspondem aos armazenados nos servidores do Google.

Exportações de e-mails, bate-papos e grupos

Depois que o Vault terminar de processar uma exportação, você poderá fazer o download dos seguintes itens:

  • Um arquivo ZIP com arquivos PST ou mbox: eles contêm detalhes e o conteúdo das mensagens exportadas. Após extrair o conteúdo do arquivo ZIP, você poderá abrir as mensagens nos seguintes formatos:

    • PST (Microsoft Outlook): você talvez veja diversos arquivos PST se a exportação incluir mensagens de mais de uma conta ou se o tamanho do arquivo exceder 1 GB.

    • mbox (Mozilla Thunderbird ou um editor de texto): você talvez veja diversos arquivos mbox se a exportação incluir mensagens de mais de uma conta ou se o tamanho do arquivo exceder 10 GB.

    • Alguns sistemas de suporte para litígios: podem abrir arquivos PST ou conter ferramentas de conversão de e-mail para arquivos mbox.  

Observação: o Google não dá suporte técnico para a configuração de produtos de terceiros. O GOOGLE NÃO É RESPONSÁVEL POR PRODUTOS DE TERCEIROS. Consulte o site do produto para ver informações sobre suporte e as configurações mais recentes.

  • Um arquivo XML: contém os metadados das mensagens como nos servidores do Google. Abra esse arquivo em um editor de texto e use-o para conectar metadados de mensagens ao conteúdo de mensagens em um arquivo PST ou mbox.
  • Um arquivo CSV: contém endereços de proprietários de mensagens incluídos na exportação, além do número de mensagens que pertencem a cada usuário.
  • Se houver erros, um relatório de erros também será incluído.
  • Um arquivo de soma de verificação: contém valores hash de resumo de mensagem 5 (MD5, na sigla em inglês) dos arquivos anteriores.
Analisar as mensagens em um cliente de e-mail

Você pode analisar mensagens de e-mail e de bate-papos no Microsoft Outlook (PST) ou no Mozilla Thunderbird (mbox). Esse método é útil para visualizar mensagens e anexos HTML que não são exibidos por um editor de texto.

Os arquivos PST e mbox contêm todos os detalhes das mensagens de e-mail e de bate-papos exportadas. O arquivo XML do Vault reflete os metadados da mensagem conforme eles foram gravados no Gmail. Juntos, esses arquivos fornecem um vínculo entre as mensagens armazenadas em servidores do Google e os dados que você exportou do Vault.

  1. Importe e analise mensagens no seu aplicativo de e-mail. 
  2. Visualize o cabeçalho das mensagens que são importantes para o caso:
    • Outlook: varia dependendo da versão utilizada. Consulte a documentação da Microsoft para visualizar os cabeçalhos das mensagens.  
    • Thunderbird: clique em View > Headers > All para exibir os cabeçalhos de cada mensagem:
  3. Cada cabeçalho inclui um Código da mensagem. Compare os códigos de mensagem com os metadados no arquivo XML para correlacionar as mensagens com os dados armazenados nos servidores do Google.
Analisar arquivos mbox em um editor de texto

Um arquivo mbox é um formato padrão para armazenar mensagens. Ele contém todos os detalhes das mensagens exportadas, incluindo o texto das mensagens e os anexos. O arquivo XML do Vault reflete os metadados da mensagem conforme eles foram gravados no Gmail. Juntos, esses arquivos fornecem um vínculo entre as mensagens armazenadas em servidores do Google e os dados que você exportou do Vault.

Depois da exportação, você usará os parâmetros de mensagem do arquivo XML do Google Apps Vault para identificar mensagens correspondentes no arquivo mbox. Para dar os primeiros passos, abra o arquivo XML em um editor de texto e procure o parâmetro FileName, por exemplo:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Esse parâmetro inclui um identificador exclusivo e corresponde a uma entrada similar no arquivo mbox chamada de linha From_ . A linha From_ contém o mesmo identificador, junto com a data e a hora (no fuso horário UTC) em que a mensagem foi recebida pelo Google, por exemplo:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

A linha From_ é a primeira entrada de cada mensagem incluída no arquivo mbox. Quando você encontrar uma nova linha From_, estará vendo uma mensagem diferente.

Parâmetros de e-mail e bate-papo no arquivo XML do Vault

O arquivo XML do Vault incluído na exportação captura os seguintes metadados:

Incluídos em cada mensagem de e-mail

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

Incluídos em cada mensagem de bate-papo

  • #SubjectAtStart (apenas no Hangouts clássico)
  • #SubjectAtEnd (apenas no Hangouts clássico)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

Incluídos em mensagens de e-mail e de bate-papo

  • Labels: mostra os marcadores aplicados pelo Gmail, como ^INBOX, ^TRASH e ^DELETED. Também mostra os marcadores aplicados à mensagem pelo usuário.
  • FileName: mostra o identificador da mensagem. Correlacione essa informação com o código da mensagem mostrado no arquivo PST ou mbox exportado. 

Incluídos nas mensagens do Hangouts Chat

  • RoomID: mostra o identificador da mensagem direta ou da sala a que pertence a conversa.
  • Participants: mostra os endereços de e-mail de todos os usuários que participaram da conversa.
  • roomName: mostra o nome da sala ou de uma lista de contas separadas por vírgula que participaram de uma mensagem direta.
  • conversationType: mostra se a conversa é de uma sala ou de uma mensagem direta.

Parâmetros de consulta para a exportação inteira

  • UserQuery: mostra a consulta enviada pelo usuário do Vault que recuperou as mensagens incluídas nesta exportação.
  • TimeZone: mostra o fuso horário usado para pesquisas com base em datas.
  • Custodians: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdos em vez de contas de usuário específicas, nenhum metadado será listado.

Exportações do Drive

Depois que o Vault terminar de processar uma exportação, você poderá fazer o download dos seguintes itens:

  • Um arquivo compactado: contém todos os arquivos encontrados por sua pesquisa. O Vault exporta até 10 GB de dados em um único arquivo compactado. Se você exportar mais de 10 GB de dados, o Vault criará vários arquivos. 
  • Um arquivo XML contém metadados, incluindo:
    • IDs de documentos;
    • Endereços de e-mail dos usuários;
    • Datas de criação e modificação de cada arquivo;
    • Tipos e títulos de documentos.
  • Um arquivo CSV: mapeia IDs de documentos para contas de usuários. Use essas informações para determinar quais usuários têm acesso aos arquivos exportados.
  • Se houver erros, um relatório de erros também será incluído.
  • Um arquivo de soma de verificação: contém valores MD5 dos arquivos anteriores.

Os arquivos exportados são convertidos da seguinte forma:

Tipo de arquivo do Google Drive Formato exportado
Documentos Google .docx
Planilhas Google .xlsx
Formulários Google .zip (.html e .csv)
Apresentações Google .pptx
Desenhos Google .pdf
Arquivos que não são do Google Nenhuma alteração no formato

 

Parâmetros de arquivos no arquivo XML do Vault

O arquivo XML incluído na exportação captura os seguintes metadados:

Incluídos com cada arquivo

  • #Author: mostra o endereço de e-mail da pessoa que é a proprietária do arquivo no Drive. No caso de um arquivo em um Drive de equipe, mostra o nome do Drive de equipe.
  • Collaborators: mostra as contas e os grupos que têm permissão direta para editar o arquivo ou adicionar comentários. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
  • Viewers: mostra as contas e os grupos que têm permissão direta para ver o arquivo. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
  • Others: mostra as contas da sua consulta que têm acesso indireto ao arquivo se você tiver optado por excluir informações sobre o nível de acesso durante a exportação. Também pode incluir usuários cujos níveis de permissão não foram determinados pelo Vault no momento da exportação.
  • #DateCreated: mostra a data de criação do arquivo. No caso de arquivos criados fora do G Suite, essa data é registrada pelo computador no qual o arquivo foi criado. A data não é alterada com o upload do arquivo para o Drive.
  • #DateModified: mostra a data da última modificação no arquivo. No caso de arquivos modificados fora do G Suite, essa data é registrada pelo computador no qual o arquivo foi modificado. A data não é alterada com o upload do arquivo para o Google Drive.
  • #Title: mostra o nome do arquivo conforme atribuído pelo usuário. Como alguns sistemas operacionais não expandem arquivos zip com nomes de arquivos longos demais, o Vault limita o nome do arquivo a 128 caracteres durante a exportação. O valor mostrado pela tag #Title não é limitado.
  • DocumentType: indica o tipo de arquivo do Google. Os possíveis valores são DOCUMENT, SPREADSHEET, PRESENTATION, FORM e DRAWING.
  • TeamDriveID: mostra o identificador do Drive de equipe que contém o arquivo (se aplicável).
  • SourceHash: valor de hash exclusivo para cada versão de um arquivo. Você pode usá-lo para eliminar a duplicação de exportações de arquivos e verificar se o arquivo exportado é uma cópia idêntica do arquivo de origem. Compatível apenas com arquivos do Documentos, do Planilhas e do Apresentações Google.

Parâmetros de consulta para a exportação inteira

  • UserQuery: mostra a consulta enviada pelo usuário do Vault que recuperou os arquivos incluídos nesta exportação.
  • TimeZone: mostra o fuso horário usado para pesquisas com base em datas.
  • Custodians: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdos em vez de contas de usuário específicas, nenhum metadado será listado.
Exportar informações de nível de acesso para usuários com acesso indireto a arquivos

Quando você exporta arquivos do Drive, o Vault pode incluir metadados de usuários no seu domínio que tenham acesso indireto a um arquivo que corresponda aos critérios de pesquisa e tenham aberto esse arquivo.

Um usuário pode ter acesso indireto se alguém tiver compartilhado um arquivo ou uma pasta que contenha um arquivo:

  • com um grupo ao qual o usuário pertença;
  • com o domínio; 
  • com o público em geral.

Durante a exportação, você pode escolher os tipos de informações que quer incluir nos metadados:

  • Na caixa de diálogo de exportação, marque a caixa para que o Vault determine o nível de permissão dos usuários no seu domínio que têm acesso indireto a arquivos. Cada um desses usuários é incluído em uma destas categorias quando você abre o arquivo XML:

    • Collaborators: usuários que têm permissão indireta para editar ou adicionar comentários a um arquivo.

    • Viewers: usuários que têm permissão indireta para ver um arquivo.

    • Others: em algumas circunstâncias, o Vault não determina o tipo de acesso de um usuário no momento da exportação. Por exemplo, isso pode acontecer se um arquivo tiver sido compartilhado com um grupo e o usuário tiver sido removido desse grupo.

    Como o Vault precisa de mais tempo para determinar as permissões desses usuários, essa opção pode aumentar o tempo necessário para preparar os arquivos para o download.

  • Na caixa de diálogo de exportação, deixe desmarcada (padrão) a caixa que define a exclusão das informações de nível de acesso dos usuários no seu domínio que têm acesso indireto a arquivos. Esses usuários são listados como Others no arquivo XML. 

Relatórios de erros

Ocasionalmente, o Google Apps Vault não consegue exportar uma mensagem de e-mail do Gmail ou um arquivo do Google Drive, e um relatório de erros é gerado. O relatório, na forma de um arquivo .csv, lista os itens com erros de exportação junto com detalhes adicionais e metadados. Existem dois tipos de erros:

  • Erros transitórios: um servidor de back-end não conseguiu recuperar o e-mail ou o arquivo. O item deverá estar disponível para exportação quando você pesquisá-lo mais tarde.
  • Erros não transitórios: qualquer erro não identificado explicitamente como transient é o resultado de um problema que não pode ser corrigido. Normalmente, isso ocorre quando um anexo de uma mensagem ou um arquivo foi excluído, não tem suporte para exportação ou não pode ser convertido para o formato solicitado.

Para determinar se o problema é transitório ou não transitório, abra o arquivo .csv com o Planilhas Google (ou um aplicativo de planilha semelhante) e encontre a coluna Descrição do erro.

Se o relatório de erros incluir mensagens de e-mail com erros transitórios, use o identificador RFC 822 de cada mensagem para encontrar essas mensagens específicas quando você pesquisar novamente. O formato do operador de pesquisa é rfc822msgid:identifier.

Pronto para começar?

Exporte os resultados da pesquisa

Este artigo foi útil para você?
Como podemos melhorá-lo?