Conferir os arquivos de exportação do Vault

Após usar o Google Vault para pesquisar os dados, você poderá exportá-los para análise. Saiba como. Uma exportação contém as seguintes informações:

  • Uma cópia de todos os dados que correspondem aos seus critérios de pesquisa
  • Os metadados necessários para vincular os dados exportados a usuários específicos na organização
  • As informações para comprovar que os dados exportados correspondem aos armazenados nos servidores do Google

Saiba como trabalhar com exportações para os seguintes serviços:

Exportações do Gmail, Chat e Grupos

Conteúdo da exportação
Informações Nome do arquivo Descrição
Conteúdo da mensagem export_name-N.zip

Arquivos ZIP de PST ou mbox. Arquivos com o conteúdo e os detalhes das mensagens exportadas. Nas mensagens do Google Chat, esses detalhes incluem quando o remetente editou ou excluiu uma mensagem.

Você pode receber muitos arquivos ZIP nas seguintes situações:

  • A exportação inclui mensagens de mais de uma conta.
  • O arquivo excede 1 GB para arquivos PST ou 10 GB para mbox.

Os nomes terminam com um valor adicional que identifica os arquivos.

Como analisar mensagens

Depois que você extrair o arquivo ZIP, a forma de conferir e processar as mensagens depende do tipo de arquivo:

  • PST: Microsoft Outlook ou alguns sistemas de suporte a litígios.

  • mbox: Mozilla Thunderbird, um editor de texto ou sistemas de suporte a litígios que incluem ferramentas de conversão de e-mail em arquivos mbox.

Observação: o Google não dá suporte técnico para produtos de terceiros. O GOOGLE SE ISENTA DE TODA RESPONSABILIDADE POR PRODUTOS DE TERCEIROS. Consulte o site do produto para ver as configurações e informações de suporte mais recentes.

Informações sobre a assinatura do Grupos do Google export_name-group-membership.csv

Um arquivo CSV que lista as seguintes informações para cada participante do grupo:

  • endereços de e-mail do participante
  • endereço de e-mail do grupo
  • quando o usuário se tornou membro do grupo
  • função do participante: PARTICIPANTE para um participante do grupo, ADMINISTRADOR para um administrador ou PROPRIETÁRIO para um proprietário
  • tipo de conta: USUÁRIO para uma conta de usuário individual ou GRUPO para um endereço de e-mail de grupo
Metadados de mensagens export_name-metadata.xml

Um arquivo XML que contém os metadados das mensagens como nos servidores do Google. Abra o arquivo em um editor de texto e use-o para conectar os metadados ao conteúdo das mensagens em um arquivo mbox.

Observação: o conteúdo do arquivo PST não pode ser correlacionado com os metadados do arquivo XML.

Conta e número de mensagens export_name-results-count.csv Um arquivo CSV que lista as contas dos proprietários das mensagens incluídas na exportação e o número de mensagens de cada uma.
Relatórios de erros

error.csv

export_name-account-exceptions.csv (exportações do Gmail)

export_name-failed-group-membership-lookups.csv (exportações do Grupos)

Relatórios de erros só serão incluídos se houver erros na exportação.

  • error.csv: lista os erros na recuperação de mensagens. Saiba mais
  • export_name-account-exceptions.csv: lista as contas do Gmail que foram pesquisadas, mas nem todas as mensagens correspondentes foram exportadas.
  • export_name-failed-group-membership-lookups.csv: lista os endereços de e-mail do grupo que foram pesquisados, mas nem todos os participantes foram retornados
Somas de verificação de arquivos File checksums O arquivo lista os valores de hash de resumo de mensagem 5 (MD5, na sigla em inglês) de todos os arquivos na exportação.
Analisar as mensagens em um cliente de e-mail

É possível analisar mensagens do Gmail e do Chat no Microsoft Outlook (PST) ou no Mozilla Thunderbird (mbox). Esse método é útil para ver mensagens e anexos em HTML que não são mostrados por um editor de texto.

Os arquivos PST e mbox contêm os detalhes das mensagens exportadas. O arquivo de metadados reflete os metadados da mensagem conforme gravados no Google. Você pode correlacionar o conteúdo do mbox com os metadados da mensagem para vincular as mensagens armazenadas nos servidores do Google aos dados exportados do Vault.

Observação: os marcadores usados no Gmail para classificar mensagens não são convertidos em pastas nas caixas de e-mails. Quando você abre um arquivo PST ou mbox em um cliente de e-mail, todas as mensagens aparecem em uma única pasta.

Para ver as mensagens exportadas em um cliente de e-mail, siga estas etapas:

  1. Importe e leia as mensagens no seu aplicativo de e-mail.
  2. Veja o cabeçalho das mensagens que são importantes para o caso.
    • Outlook: consulte a documentação da Microsoft sobre como ver os cabeçalhos das mensagens da sua versão.
    • Thunderbird: clique em Visualizar > Cabeçalhos > Todos para ver os cabeçalhos de cada mensagem:
  3. No Thunderbird, cada cabeçalho inclui um ID de mensagem no campo Message ID. Para correlacionar mensagens a dados armazenados nos servidores do Google, compare os IDs de mensagens com os arquivos de metadados.
Analisar arquivos mbox em um editor de texto

O formato de arquivo mbox é o padrão para armazenar mensagens. Ele contém todos os detalhes das mensagens exportadas, inclusive o texto e os anexos. O arquivo de metadados reflete os metadados da mensagem conforme gravados no Google. Juntos, esses arquivos fornecem um vínculo entre as mensagens armazenadas em servidores do Google e os dados que você exportou do Vault.

Depois da exportação, você usará os parâmetros de mensagem do arquivo de metadados para identificar mensagens correspondentes no arquivo mbox. Para começar, abra o arquivo de metadados em um editor de texto e encontre o parâmetro FileName, por exemplo:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Esse parâmetro inclui um identificador exclusivo e corresponde a uma entrada similar no arquivo mbox chamada de linha From_ . A linha From_ contém o mesmo identificador, junto com a data e a hora (no fuso horário UTC) em que a mensagem foi recebida pelo Google, por exemplo:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

A linha From_ é a primeira entrada de cada mensagem incluída no arquivo mbox. Quando aparece uma nova linha From_, você está vendo outra mensagem.

Parâmetros de mensagens no arquivo de metadados

O arquivo de metadados contém as seguintes informações:

Incluído nas mensagens do Gmail e do Grupos

  • #From: a conta de e-mail do remetente
  • #To: as contas de e-mail de todos os destinatários
  • #CC: as contas de e-mail de todos os destinatários do campo "Cc".
  • #BCC: as contas de e-mail de todos os destinatários do campo "Cco"
  • #Subject: o assunto da mensagem
  • #DateSent: o carimbo de data/hora de quando a mensagem foi enviada
  • #DateReceived: o carimbo de data/hora de quando a mensagem foi recebida

Incluído nas mensagens do Hangouts clássico e do Chat

  • #SubjectAtStart (somente no Hangouts clássico): o assunto da conversa quando a primeira mensagem foi enviada
  • #SubjectAtEnd (somente no Hangouts clássico): o assunto da conversa quando a última mensagem foi enviada
  • #DateFirstMessageSent: o carimbo de data/hora da primeira mensagem de uma conversa enviada
  • #DateLastMessageSent: o carimbo de data/hora de quando a última mensagem em uma conversa foi enviada
  • #DateFirstMessageReceived: o carimbo de data/hora de quando a primeira mensagem em uma conversa foi recebida
  • #DateLastMessageReceived: o carimbo de data/hora de quando a última mensagem em uma conversa foi recebida

Incluído em todas as mensagens (Gmail, Grupos e Chat)

  • Labels: todos os marcadores aplicados pelo Gmail ou Chat, como ^INBOX, ^TRASH e ^DELETED. Também mostra os marcadores aplicados à mensagem pelo usuário.
  • FileName: o identificador da mensagem. Correlacione esse valor com o ID da mensagem que aparece no arquivo PST ou mbox exportado.
  • FileSize: o tamanho da mensagem em bytes.
  • Hash: o hash MD5 da mensagem.

Incluído nas mensagens do Chat (não no Hangouts clássico)

  • RoomID: o identificador da sala, do chat em grupo ou da mensagem direta a que a mensagem pertence.
  • Participants: mostra os endereços de e-mail de todos os usuários que participaram da conversa.
  • RoomName: o valor depende do tipo de mensagem:
    • Em salas, o nome dela.
    • Em chats em grupo criados após o início de dezembro de 2020, Group chat.
    • Em chats em grupo criados antes do início de dezembro de 2020 e mensagens diretas, uma lista de contas participantes separada por vírgula.
  • ConversationType: o tipo de mensagem:
    • Em um chat em grupo criado após o início de dezembro de 2020 ou uma sala, o valor é Room.
    • Em um chat em grupo criado antes de dezembro de 2020, o valor é Group Direct Message.
    • Em uma mensagem direta, o valor é 1:1 Direct Message.

Parâmetros de consulta para a exportação inteira

  • UserQuery: mostra a consulta enviada pelo usuário do Vault que recuperou as mensagens incluídas nesta exportação.
  • TimeZone: mostra o fuso horário usado para pesquisas com base em datas.
  • Custodians: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdo em vez de contas de usuário específicas, nenhum guardião (custodian) será listado.

Exportações do Drive

Conteúdo da exportação
Informações Nome do arquivo Descrição
Arquivos export_name_N.zip

Contém todos os arquivos encontrados pela pesquisa. O Vault exporta até 10 GB de dados em um único arquivo compactado. Se você exportar mais de 10 GB de dados, o Vault criará vários arquivos.

Os arquivos exportados têm o nome original do arquivo seguido por um sublinhado ("_") e pelo ID de arquivo do Drive.

Os arquivos exportados são convertidos da seguinte forma:

  • Documentos Google em DOCX
  • Planilhas Google em XLSX
  • Formulários Google em ZIP (HTML e CSV)
  • Apresentações Google em PPTX
  • Desenhos Google em PDF
Metadados do arquivo export_name-metadata.xml

Contém metadados, como:

  • IDs de documentos (não são os IDs de arquivo do Drive e correspondem aos valores no arquivo CSV);
  • endereços de e-mail dos usuários;
  • datas de criação e modificação de cada arquivo;
  • tipos e títulos de documentos.

Saiba mais

Contas e IDs de documentos export_name-custodian-docid.csv Lista as contas de usuário com os IDs de documentos correspondentes. Use essas informações para determinar quais usuários têm acesso aos arquivos exportados.
Relatórios de erros

error.csv

export_name-incomplete-accounts.csv

Relatórios de erros só serão incluídos se houver erros na exportação.

  • error.csv: lista erros de recuperação de arquivos e dos metadados do arquivo. Saiba mais
  • export_name-incomplete-accounts.csv: lista as contas que foram pesquisadas, mas nem todos os arquivos correspondentes foram exportados.
Somas de verificação de arquivos File checksums O arquivo lista os valores de hash de resumo de mensagem 5 (MD5, na sigla em inglês) de todos os arquivos na exportação.
Parâmetros do arquivo de metadados

O arquivo incluído na exportação captura os seguintes metadados:

Incluídos com cada arquivo

  • #Author: mostra o endereço de e-mail da pessoa que é a proprietária do arquivo no Drive. No caso de um arquivo em um drive compartilhado, o nome do drive compartilhado é mostrado.
  • Collaborators: mostra as contas e os grupos que têm permissão direta para editar o arquivo ou adicionar comentários. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
  • Viewers: mostra as contas e os grupos que têm permissão direta para ver o arquivo. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
  • Others: as contas da consulta que têm acesso indireto ao arquivo se você optar por excluir informações sobre o nível de acesso durante a exportação. Também pode incluir usuários que não tiveram níveis de permissão determinados pelo Vault no momento da exportação.
  • #DateCreated: mostra a data de criação de um arquivo do Google no Drive. Em arquivos que não são do Google, a data em que o arquivo foi enviado por upload para o Google Drive.
  • #DateModified: mostra a data da última modificação no arquivo.
  • #Title: mostra o nome do arquivo conforme atribuído pelo usuário. Como alguns sistemas operacionais não conseguem extrair arquivos ZIP com nomes longos demais, o Vault limita o nome de arquivo a 128 caracteres durante a exportação. O valor mostrado pela tag #Title não é limitado.
  • DocumentType: indica o tipo de arquivo do Google. Os possíveis valores são DOCUMENT, SPREADSHEET, PRESENTATION, FORM e DRAWING.
  • SharedDriveID: mostra o identificador do drive compartilhado que contém o arquivo (se aplicável).
  • SourceHash: valor de hash exclusivo para cada versão de um arquivo. Você pode usá-lo para eliminar a duplicação de exportações de arquivos e verificar se o arquivo exportado é uma cópia idêntica do arquivo de origem. Compatível apenas com arquivos do Documentos, do Planilhas e do Apresentações Google.

Parâmetros de consulta para a exportação inteira

  • UserQuery: mostra a consulta enviada pelo usuário do Vault que recuperou os arquivos incluídos nesta exportação.
  • TimeZone: mostra o fuso horário usado para pesquisas com base em datas.
  • Custodians: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdo em vez de contas de usuário específicas, nenhum guardião (custodian) será listado.
Exportar informações de nível de acesso para usuários com acesso indireto a arquivos

Quando você exporta arquivos do Drive, o arquivo de metadados pode incluir informações sobre os usuários na sua organização com acesso indireto a um arquivo que corresponda aos critérios da pesquisa e que tenha sido aberto por ele.

Um usuário pode ter acesso indireto quando uma pasta ou um arquivo dentro dela é compartilhado:

  • com um grupo a que o usuário pertence;
  • com o domínio;
  • com o público em geral.

Durante a exportação, você pode escolher as informações que serão incluídas nos metadados.

  • Na caixa de diálogo de exportação, marque a opção para que o Vault determine o nível de permissão dos usuários do domínio com acesso indireto a arquivos. Cada um desses usuários é incluído em uma destas categorias quando você abre o arquivo de metadados:

    • Collaborators: usuários que têm permissão indireta para editar ou adicionar comentários a um arquivo.
    • Viewers: usuários que têm permissão indireta para ver um arquivo.
    • Others: em algumas circunstâncias, o Vault não determina o tipo de acesso de um usuário no momento da exportação. Por exemplo, isso poderá acontecer se um arquivo tiver sido compartilhado com um grupo, e o usuário tiver sido removido dele.

    Como o Vault demora para determinar as permissões desses usuários, talvez a opção aumente o tempo de preparação de arquivos para download.

  • Na caixa de diálogo de exportação, deixe desmarcada (padrão) a opção para excluir as informações de nível de acesso dos usuários do domínio com acesso indireto a arquivos. Esses usuários são listados como Others no arquivo de metadados

Exportações do Google Voice

Conteúdo da exportação
Informações Nome do arquivo Descrição
Arquivos de dados de voz export_name-N.zip Para cada conta, é gerado um arquivo ZIP que contém arquivos PST ou mbox de conversas por mensagem de texto, registros de chamadas, arquivos de áudio MP3 e transcrições do correio de voz.
Metadados do arquivo export_name-metadata.xml Um arquivo XML que contém os metadados como nos servidores do Google.
Somas de verificação de arquivos File checksums Um arquivo de soma de verificação com valores de hash de resumo de mensagem 5 (MD5) para todos os arquivos incluídos na exportação.
Relatório de erros

error.csv

Relatórios de erros só serão incluídos se houver erros na exportação. Saiba mais

Observação: ao contrário de outros serviços, as exportações do Voice não incluem um arquivo de contagem.

Parâmetros de dados de voz no arquivo de metadados

O arquivo de metadados contém as seguintes informações:

Informações sobre cada arquivo

  • DocID: um identificador exclusivo do arquivo.
  • #Author: o endereço de e-mail da conta proprietária do arquivo no Drive.
  • #DateFirstMessageSent: para conversas por mensagem de texto, é a data de envio da primeira mensagem. Observação: este campo e os três a seguir são idênticos nas entradas de correios de voz e registros de chamadas.
  • #DateLastMessageSent: para conversas por mensagem de texto, é a data de envio da última mensagem.
  • #DateFirstMessageReceived: para conversas por mensagem de texto, a data de recebimento da primeira mensagem.
  • #DateLastMessageReceived: para conversas por mensagem de texto, a data de recebimento da última mensagem.
  • ConversationType: o tipo dos dados:
    • TEXT_MESSAGE: uma mensagem de texto.
    • VOICEMAIL: um correio de voz.
    • INCOMING_CALL: um registro de chamada recebida.
    • OUTGOING_CALL: um registro de chamada realizada.
    • MISSED_CALL: um registro de chamada recebida não atendida.
  • ParticipantPhoneNumbers: os números de telefone dos participantes.
  • OwnerPhoneNumbers: o valor pode incluir vários números de telefone quando o número do usuário é alterado.
  • Labels: qualquer marcador na conversa. Por exemplo, as conversas excluídas têm o marcador DELETED.
  • ExternalFile FileName: o identificador do arquivo, correlacionado ao Assunto no arquivo PST ou mbox.

Parâmetros de consulta para a exportação inteira

  • UserQuery: a consulta enviada pelo administrador do Vault.
  • TimeZone: o fuso horário da consulta.
  • Custodians: os endereços de e-mail das contas que foram pesquisadas.

Relatórios de erros (error.csv)

Quando o Vault não exporta dados de um serviço, o Vault gera um relatório de erros (error.csv). O relatório lista os itens com erros de exportação, além de mais detalhes e metadados.

O Vault informa dois tipos de erro:

  • Erros transitórios: um servidor de back-end não recuperou a mensagem de e-mail ou o arquivo. O item deverá estar disponível para exportação quando você pesquisá-lo mais tarde.
  • Erros não transitórios: qualquer erro não identificado explicitamente como transitório é o resultado de um problema que não pode ser corrigido. Normalmente, esses erros ocorrem quando um anexo ou arquivo de mensagem foi excluído, é incompatível com a exportação ou não pode ser convertido no formato exigido.

Para saber se o problema é transitório ou não, abra o arquivo CSV com o Planilhas Google ou outro app de planilhas e encontre a coluna Error Description. Observação: as descrições de erros não estão disponíveis para exportações do Voice. Se o erro for transitório, saiba como recuperar os erros transitórios.

Conteúdo do relatório de erros

Conteúdo do relatório de erros do Gmail e do Grupos

O relatório de erros contém os campos a seguir para cada mensagem. Os campos ficarão em branco se os dados não estiverem disponíveis ou não forem aplicáveis a uma mensagem.

Campo

Descrição
Document ID Um identificador exclusivo do arquivo.
Document type O tipo de documento. O valor é mail.
File type

O tipo de arquivo. O valor é mail.

Attachments count O número de anexos da mensagem.
Attachment names Os nomes dos arquivos anexos.
Subject O assunto da mensagem.
Size O tamanho da mensagem.
From A conta de e-mail do remetente.
To As contas de e-mail de todos os destinatários.
Cc As contas de e-mail de todos os destinatários com cópia.
Sent time Carimbo de data/hora de quando a mensagem foi enviada.
Source account A conta que foi incluída na consulta de pesquisa.
Error description Uma descrição do erro.
RFC 822 Message-ID

Um identificador exclusivo de uma mensagem adicionada por servidores de e-mail.

Exemplo: rfc822msgid:AANLkTilQ5MWSp7-iE6SKepvOl-
Spjupgr1NZTiLGu16Z@mail.solarmora.com

 

Conteúdo do relatório de erros do Chat

O relatório de erros contém os campos a seguir para cada mensagem. Os campos ficarão em branco se os dados não estiverem disponíveis ou não forem aplicáveis a uma mensagem.

Campo

Descrição
Document ID Um identificador exclusivo do arquivo.
Filename O tipo de documento. O valor é mail.
Conversation Type

O tipo de mensagem. O valor é mail.

Room Name O nome da sala.
Error description Uma descrição do erro.

 

Conteúdo do relatório de erros para arquivos do Drive
O relatório de erros contém os campos a seguir para cada arquivo. Os campos ficarão em branco se os dados não estiverem disponíveis ou não forem aplicáveis a um arquivo.
Campo Descrição
Document ID Um identificador exclusivo do arquivo.
Document type Indica o tipo de arquivo do Google. Os possíveis valores são DOCUMENT, SPREADSHEET, PRESENTATION, FORM e DRAWING.
File type O formato do arquivo, como PDF ou XLSX.
Title O nome de arquivo atribuído pelo usuário.
Size O tamanho do arquivo.
Creator O endereço de e-mail da pessoa que é a proprietária do arquivo no Drive. No caso de um arquivo em um drive compartilhado, o nome do drive compartilhado é mostrado.
Collaborators As contas e os grupos que têm permissão direta para editar o arquivo ou adicionar comentários. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
Viewers As contas e os grupos que têm permissão direta para visualizar o arquivo. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.
Others As contas da consulta que têm acesso indireto ao arquivo se você optar por excluir informações sobre o nível de acesso durante a exportação. Também pode incluir usuários que não tiveram níveis de permissão determinados pelo Vault no momento da exportação.
Creation time A data em que um arquivo do Google foi criado no Drive. Nos arquivos que não são do Google, isso indica quando o arquivo foi enviado para o Drive.
Last modified time A data da última modificação no arquivo.
Error description Uma descrição do erro.
Drive Document ID Um identificador exclusivo para um arquivo no Drive.

 

Conteúdo do relatório de erros para dados do Voice

O relatório de erros lista as contas pesquisadas, mas nem todos os arquivos correspondentes foram exportados.

Campo Descrição
Account O endereço de e-mail da conta que não recebeu parte dos dados exportados.
Failed Conversation Count O número de conversas que não foram exportadas. Se o número for desconhecido, o valor será Unknown Failure Count.

Recuperar a partir de erros transitórios

Você pode usar detalhes de mensagens e arquivos para pesquisar e exportar os dados que não foram exportados devido a erros transitórios:

  • Se o relatório de erros incluir mensagens com erros transitórios, use o identificador RFC 822 de cada uma delas para encontrá-las quando pesquisar novamente. O formato do termo de pesquisa é rfc822msgid:identifier.
  • Se o relatório de erros incluir arquivos do Drive com erros transitórios, use o título de cada arquivo para encontrá-los quando pesquisar novamente. O formato do termo de pesquisa é title:"title-of-file".
Isso foi útil?
Como podemos melhorá-lo?