Como funcionam as exportações do Vault

Após pesquisar os dados necessários do Vault, você pode exportá-los para analisar depois. A funcionalidade de exportação do Google Vault gera o seguinte:

  • Uma cópia abrangente de todos os dados que correspondem aos seus critérios de pesquisa
  • Os metadados necessários para vincular os dados exportados a usuários específicos no seu domínio
  • As informações comprobatórias para provar que os dados exportados correspondem aos armazenados nos servidores do Google

Saiba como trabalhar com exportações para os serviços compatíveis:

Exportações do Gmail, Chat e Grupos

Depois que o Vault concluir uma exportação, você poderá fazer o download dos seguintes itens:

  • Um arquivo ZIP com os arquivos PST ou mbox: esses arquivos contêm detalhes e o conteúdo das mensagens exportadas. Após extrair o conteúdo do arquivo ZIP, você poderá abrir as mensagens nos formatos abaixo.

    • PST: Microsoft Outlook. Talvez você veja vários arquivos PST se a exportação incluir mensagens de mais de uma conta ou se o tamanho do arquivo exceder 1 GB.

    • mbox: Mozilla Thunderbird ou um editor de texto.Talvez você veja vários arquivos PST se a exportação incluir mensagens de mais de uma conta ou se o tamanho do arquivo exceder 10 GB.

    • Alguns sistemas de suporte para litígios: podem abrir arquivos PST ou conter ferramentas de conversão de e-mail para arquivos mbox.  

Observação: o Google não dá suporte técnico para a configuração de produtos de terceiros. O GOOGLE SE ISENTA DE TODA RESPONSABILIDADE POR PRODUTOS DE TERCEIROS. Consulte o site do produto para ver as configurações e informações de suporte mais recentes.

  • Um arquivo XML: contém os metadados das mensagens como nos servidores do Google. Abra esse arquivo em um editor de texto e use-o para conectar os metadados ao conteúdo das mensagens em um arquivo mbox.O conteúdo do arquivo PST não pode ser correlacionado com os metadados do arquivo XML.
  • Um arquivo CSV: contém os endereços dos proprietários das mensagens incluídas na exportação, além do número de mensagens de cada usuário.
  • Um relatório de erros: incluído somente se houver erros.
  • Um arquivo de soma de verificação: contém valores hash de resumo de mensagem 5 (MD5, na sigla em inglês) dos arquivos anteriores.
Analisar as mensagens em um cliente de e-mail

É possível analisar mensagens do Gmail e do Chat no Microsoft Outlook (PST) ou no Mozilla Thunderbird (mbox). Esse método é útil para ver mensagens e anexos em HTML que não são mostrados por um editor de texto.

Os arquivos PST e mbox contêm os detalhes das mensagens exportadas do Gmail e do Chat. O arquivo XML do Vault reflete os metadados da mensagem conforme gravados pelo Google. Você pode correlacionar o conteúdo do mbox com os metadados da mensagem para vincular as mensagens armazenadas nos servidores do Google aos dados exportados do Vault.

Observação: os marcadores usados no Gmail para classificar mensagens não são convertidos em pastas na caixas de e-mails. Quando você abre um arquivo PST ou mbox em um cliente de e-mail, todas as mensagens aparecem em uma única pasta.

Para analisar as mensagens exportadas em um cliente de e-mail, siga estas etapas:

  1. Importe e analise as mensagens no seu app de e-mail.
  2. Veja o cabeçalho das mensagens que são importantes para o caso.
    • Outlook: varia dependendo da versão usada. Consulte a documentação da Microsoft para ver os cabeçalhos das mensagens.  
    • Thunderbird: clique em View > Headers > All para ver os cabeçalhos de cada mensagem:
  3. No Thunderbird, cada cabeçalho inclui um código de mensagem no campo Message ID. Para correlacionar as mensagens com os dados armazenados nos servidores do Google, compare os códigos das mensagens com os metadados no arquivo XML.
Analisar arquivos mbox em um editor de texto

Um arquivo mbox é um formato padrão para armazenar mensagens. Ele contém todos os detalhes das mensagens exportadas, incluindo o texto das mensagens e os anexos. O arquivo XML do Vault reflete os metadados da mensagem conforme gravados pelo Google. Juntos, esses arquivos fornecem um vínculo entre as mensagens armazenadas em servidores do Google e os dados que você exportou do Vault.

Depois da exportação, você usará os parâmetros de mensagem do arquivo XML do Google Apps Vault para identificar mensagens correspondentes no arquivo mbox. Para dar os primeiros passos, abra o arquivo XML em um editor de texto e procure o parâmetro FileName, por exemplo:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Esse parâmetro inclui um identificador exclusivo e corresponde a uma entrada similar no arquivo mbox chamada de linha From_ . A linha From_ contém o mesmo identificador, junto com a data e a hora (no fuso horário UTC) em que a mensagem foi recebida pelo Google, por exemplo:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

A linha From_ é a primeira entrada de cada mensagem incluída no arquivo mbox. Quando aparece uma nova linha From_, você está vendo outra mensagem.

Parâmetros do Gmail e do Chat no arquivo XML do Vault

O arquivo XML do Vault incluído na exportação captura os seguintes metadados:

Incluídos em cada mensagem do Gmail

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

Incluídos em cada mensagem do Chat

  • #SubjectAtStart (apenas no Hangouts clássico)
  • #SubjectAtEnd (apenas no Hangouts clássico)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

Incluídos nas mensagens do Gmail e do Chat

  • Labels: mostra os marcadores aplicados pelo Gmail, como ^INBOX, ^TRASH e ^DELETED, além dos que são aplicados pelo usuário.
  • FileName: mostra o identificador da mensagem. Correlacione esse valor com o código da mensagem mostrado no arquivo PST ou mbox exportado. 

Incluído nas mensagens do Google Chat

  • RoomID: mostra o identificador da mensagem direta ou da sala a que pertence a conversa.
  • Participants: mostra os endereços de e-mail de todos os usuários que participaram da conversa.
  • roomName: mostra o nome da sala ou de uma lista de contas separadas por vírgula que participaram de uma mensagem direta.
  • conversationType: mostra se a conversa é de uma sala ou de uma mensagem direta.

Parâmetros de consulta para a exportação inteira

  • UserQuery: mostra a consulta enviada pelo usuário do Vault que recuperou as mensagens incluídas nesta exportação.
  • TimeZone: mostra o fuso horário usado para pesquisas com base em datas.
  • Custodians: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdos em vez de contas de usuário específicas, nenhum metadado será listado.

Exportações do Drive

Após o Vault terminar de processar uma exportação, você poderá fazer o download dos itens a seguir.

  • Um arquivo compactado: contém todos os arquivos encontrados pela pesquisa. O Vault exporta até 10 GB de dados em um único arquivo compactado. Se você exportar mais de 10 GB de dados, o Vault criará vários arquivos.
  • Um arquivo XML: contém metadados como:
    • códigos de documentos (não são os códigos de arquivo do Drive e correspondem aos valores no arquivo CSV);
    • endereços de e-mail dos usuários;
    • Datas de criação e modificação de cada arquivo;
    • Tipos e títulos de documentos.
  • Um arquivo CSV: mapeia IDs de documentos para contas de usuários. Use essas informações para determinar quais usuários têm acesso aos arquivos exportados.
  • Se houver erros, um relatório de erros também será incluído.
  • Um arquivo de soma de verificação: contém valores MD5 dos arquivos anteriores.

Os arquivos exportados têm o nome original do arquivo seguido por um sublinhado ("_") e pelo código de arquivo do Drive.

Os arquivos exportados são convertidos da seguinte forma:

Tipo de arquivo do Google Drive Formato exportado
Documentos Google .docx
Planilhas Google .xlsx
Formulários Google .zip (.html e .csv)
Apresentações Google .pptx
Desenhos Google .pdf
Arquivos que não são do Google Nenhuma alteração no formato

 

Parâmetros de arquivos no XML do Vault

O arquivo XML incluído na exportação captura os seguintes metadados:

Incluídos com cada arquivo

  • #Author: mostra o endereço de e-mail da pessoa que é a proprietária do arquivo no Drive. No caso de um arquivo em um drive compartilhado, o nome do drive compartilhado é mostrado.
  • Collaborators: mostra as contas e os grupos que têm permissão direta para editar o arquivo ou adicionar comentários. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
  • Viewers: mostra as contas e os grupos que têm permissão direta para ver o arquivo. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
  • Others: mostra as contas da sua consulta que têm acesso indireto ao arquivo se você tiver optado por excluir informações sobre o nível de acesso durante a exportação. Também pode incluir usuários cujos níveis de permissão não foram determinados pelo Vault no momento da exportação.
  • #DateCreated: mostra a data de criação de um arquivo do Google no Drive. Nos arquivos que não são do Google, isso indica quando o arquivo foi enviado para o Drive.
  • #DateModified: mostra a data da última modificação no arquivo.
  • #Title: mostra o nome de arquivo conforme atribuído pelo usuário. Como alguns sistemas operacionais não expandem arquivos ZIP com nomes longos demais, o Vault limita o nome de arquivo a 128 caracteres durante a exportação. O valor mostrado pela tag #Title não é limitado.
  • DocumentType: indica o tipo de arquivo do Google. Os possíveis valores são DOCUMENT, SPREADSHEET, PRESENTATION, FORM e DRAWING.
  • SharedDriveID: mostra o identificador do drive compartilhado que contém o arquivo (se aplicável).
  • SourceHash: valor de hash exclusivo para cada versão de um arquivo. Você pode usá-lo para eliminar a duplicação de exportações de arquivos e verificar se o arquivo exportado é uma cópia idêntica do arquivo de origem. Compatível apenas com arquivos do Documentos, do Planilhas e do Apresentações Google.

Parâmetros de consulta para a exportação inteira

  • UserQuery: mostra a consulta enviada pelo usuário do Vault que recuperou os arquivos incluídos nesta exportação.
  • TimeZone: mostra o fuso horário usado para pesquisas com base em datas.
  • Custodians: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdos em vez de contas de usuário específicas, nenhum metadado será listado.
Exportar informações de nível de acesso para usuários com acesso indireto a arquivos

Quando você exporta arquivos do Drive, o Vault inclui osmetadados dos usuários no seu domínio com acesso indireto a um arquivo que corresponda aos critérios da pesquisa e tenha sido aberto por eles.

Um usuário pode ter acesso indireto se alguém tiver compartilhado um arquivo ou uma pasta que contenha um arquivo:

  • com um grupo a que o usuário pertença;
  • com o domínio;
  • com o público em geral.

Durante a exportação, você pode escolher as informações que quer incluir nos metadados.

  • Na caixa de diálogo de exportação, marque a opção para que o Vault determine o nível de permissão dos usuários no seu domínio com acesso indireto a arquivos. Cada um desses usuários é incluído em uma destas categorias quando você abre o arquivo XML:

    • Collaborators: usuários que têm permissão indireta para editar ou adicionar comentários a um arquivo.

    • Viewers: usuários que têm permissão indireta para ver um arquivo.

    • Others: em algumas circunstâncias, o Vault não determina o tipo de acesso de um usuário no momento da exportação. Por exemplo, isso pode acontecer se um arquivo tiver sido compartilhado com um grupo, e o usuário tiver sido removido dele.

    Como o Vault demora para determinar as permissões desses usuários, talvez essa opção aumente o tempo de preparo dos arquivos no download.

  • Na caixa de diálogo de exportação, deixe desmarcada (padrão) a opção para excluir as informações de nível de acesso dos usuários no seu domínio com acesso indireto a arquivos. Esses usuários são listados como Others no arquivo XML. 

Exportações do Google Voice

Depois que o Vault processa uma exportação de dados do Google Voice, você pode fazer o download dos seguintes itens:

  • Para cada conta, é gerado um arquivo ZIP que contém arquivos PST ou mbox de conversas por mensagem de texto, registros de chamadas, arquivos de áudio MP3 e transcrições do correio de voz.
  • Um arquivo XML que contém os metadados como nos servidores do Google.
  • Um arquivo de soma de verificação com valores de hash de resumo de mensagem 5 (MD5) para todos os arquivos incluídos na exportação.
  • Se houver falhas, um relatório de erros também será incluído. Esse relatório é um arquivo CSV com duas colunas:
    1. Account: o endereço de e-mail da conta que não recebeu alguns dados exportados.
    2. Failed Conversation Count: o número de conversas que não foram exportadas. Se o número for desconhecido, o valor será "Unknown Failure Count".

Observação: diferentemente de outros serviços, as exportações do Voice não incluem um arquivo de contagem.

Parâmetros de dados do Voice no arquivo XML do Vault

O arquivo XML do Vault na exportação contém os seguintes metadados:

Informações sobre cada arquivo

  • DocID: um identificador exclusivo do arquivo.
  • #Author: o endereço de e-mail da conta proprietária do arquivo no Drive.
  • #DateFirstMessageSent: para conversas por mensagem de texto, a data de envio da primeira mensagem. Observação: este campo e os três a seguir são idênticos nas entradas de correios de voz e registros de chamadas.
  • #DateLastMessageSent: para conversas por mensagem de texto, a data de envio da última mensagem. 
  • #DateFirstMessageReceived: para conversas por mensagem de texto, a data de recebimento da primeira mensagem. 
  • #DateLastMessageReceived: para conversas por mensagem de texto, a data de recebimento da última mensagem. 
  • ConversationType: o tipo de dados:
    • TEXT_MESSAGE: uma mensagem de texto.
    • VOICEMAIL: um correio de voz.
    • INCOMING_CALL: um registro de chamada recebida.
    • OUTGOING_CALL: um registro de chamada realizada.
    • MISSED_CALL: um registro de chamada recebida não atendida.
  • ParticipantPhoneNumbers: os números de telefone dos participantes.
  • OwnerPhoneNumbers: o valor pode incluir vários números de telefone quando o número do usuário é alterado.
  • Labels: qualquer marcador na conversa. Por exemplo, as conversas excluídas têm o marcador DELETED.
  • ExternalFile FileName: o identificador do arquivo, correlacionado ao Assunto no arquivo PST ou mbox.

Parâmetros de consulta para a exportação inteira

  • UserQuery: a consulta enviada pelo administrador do Vault.
  • TimeZone: o fuso horário da consulta.
  • Custodians: os endereços de e-mail das contas que foram pesquisadas.

Relatórios de erros

Ocasionalmente, não é possível exportar uma mensagem de e-mail do Gmail ou um arquivo do Drive usando o Vault, e um relatório de erros é gerado. O relatório, na forma de um arquivo CSV, lista os itens com erros de exportação, além de mais detalhes e metadados. Existem dois tipos de erro:

  • Erros transitórios: um servidor de back-end não recuperou o e-mail ou o arquivo. O item deverá estar disponível para exportação quando você pesquisá-lo mais tarde.
  • Erros não transitórios: qualquer erro não identificado explicitamente como transient é o resultado de um problema que não pode ser corrigido. Normalmente, esses erros ocorrem quando um anexo ou arquivo de mensagem foi excluído, é incompatível com a exportação ou não é possível convertê-lo para o formato exigido.

Para determinar se o problema é transitório ou não transitório, abra o arquivo CSV com o Planilhas Google (ou um app de planilha semelhante) e encontre a coluna Descrição do erro.

Se o relatório de erros incluir mensagens com erros transitórios, use o identificador RFC 822 de cada um desses e-mails específicos para encontrá-las quando você pesquisar novamente. O formato do operador de pesquisa é rfc822msgid:identifier.

Tudo pronto para começar?

Exportar resultados da pesquisa

Isso foi útil?
Como podemos melhorá-lo?