Após usar o Google Vault para pesquisar os dados, você poderá exportá-los para análise. Saiba como. Uma exportação contém as seguintes informações:
- Uma cópia de todos os dados que correspondem aos seus critérios de pesquisa
- Os metadados necessários para vincular os dados exportados a usuários específicos na organização
- As informações para comprovar que os dados exportados correspondem aos armazenados nos servidores do Google
Saiba como trabalhar com exportações para os seguintes serviços:
Exportações do Gmail, Chat e Grupos
Conteúdo da exportaçãoInformações | Nome do arquivo | Descrição |
---|---|---|
Conteúdo da mensagem | export_name-N.zip |
Arquivos ZIP de PST ou mbox. Arquivos com o conteúdo e os detalhes das mensagens exportadas. Nas mensagens do Google Chat, esses detalhes incluem quando o remetente editou ou excluiu uma mensagem. Você pode receber muitos arquivos ZIP nas seguintes situações:
Os nomes terminam com um valor adicional que identifica os arquivos. Como analisar mensagensDepois que você extrair o arquivo ZIP, a forma de conferir e processar as mensagens depende do tipo de arquivo:
Observação: o Google não dá suporte técnico para produtos de terceiros. O GOOGLE SE ISENTA DE TODA RESPONSABILIDADE POR PRODUTOS DE TERCEIROS. Consulte o site do produto para ver as configurações e informações de suporte mais recentes. |
Informações sobre a assinatura do Grupos do Google | export_name-group-membership.csv |
Um arquivo CSV que lista as seguintes informações para cada participante do grupo:
|
Metadados de mensagens | export_name-metadata.xml |
Um arquivo XML que contém os metadados das mensagens como nos servidores do Google. Abra o arquivo em um editor de texto e use-o para conectar os metadados ao conteúdo das mensagens em um arquivo mbox. Observação: o conteúdo do arquivo PST não pode ser correlacionado com os metadados do arquivo XML. |
Conta e número de mensagens | export_name-results-count.csv | Um arquivo CSV que lista as contas dos proprietários das mensagens incluídas na exportação e o número de mensagens de cada uma. |
Relatórios de erros |
error.csv export_name-account-exceptions.csv (exportações do Gmail) export_name-failed-group-membership-lookups.csv (exportações do Grupos) |
Relatórios de erros só serão incluídos se houver erros na exportação.
|
Somas de verificação de arquivos | File checksums | O arquivo lista os valores de hash de resumo de mensagem 5 (MD5, na sigla em inglês) de todos os arquivos na exportação. |
É possível analisar mensagens do Gmail e do Chat no Microsoft Outlook (PST) ou no Mozilla Thunderbird (mbox). Esse método é útil para ver mensagens e anexos em HTML que não são mostrados por um editor de texto.
Os arquivos PST e mbox contêm os detalhes das mensagens exportadas. O arquivo de metadados reflete os metadados da mensagem conforme gravados no Google. Você pode correlacionar o conteúdo do mbox com os metadados da mensagem para vincular as mensagens armazenadas nos servidores do Google aos dados exportados do Vault.
Para ver as mensagens exportadas em um cliente de e-mail, siga estas etapas:
- Importe e leia as mensagens no seu aplicativo de e-mail.
- Veja o cabeçalho das mensagens que são importantes para o caso.
- Outlook: consulte a documentação da Microsoft sobre como ver os cabeçalhos das mensagens da sua versão.
- Thunderbird: clique em Visualizar > Cabeçalhos > Todos para ver os cabeçalhos de cada mensagem:
- No Thunderbird, cada cabeçalho inclui um ID de mensagem no campo Message ID. Para correlacionar mensagens a dados armazenados nos servidores do Google, compare os IDs de mensagens com os arquivos de metadados.
O formato de arquivo mbox é o padrão para armazenar mensagens. Ele contém todos os detalhes das mensagens exportadas, inclusive o texto e os anexos. O arquivo de metadados reflete os metadados da mensagem conforme gravados no Google. Juntos, esses arquivos fornecem um vínculo entre as mensagens armazenadas em servidores do Google e os dados que você exportou do Vault.
Depois da exportação, você usará os parâmetros de mensagem do arquivo de metadados para identificar mensagens correspondentes no arquivo mbox. Para começar, abra o arquivo de metadados em um editor de texto e encontre o parâmetro FileName
, por exemplo:
<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'
Esse parâmetro inclui um identificador exclusivo e corresponde a uma entrada similar no arquivo mbox chamada de linha From_
. A linha From_
contém o mesmo identificador, junto com a data e a hora (no fuso horário UTC) em que a mensagem foi recebida pelo Google, por exemplo:
From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014
A linha From_
é a primeira entrada de cada mensagem incluída no arquivo mbox. Quando aparece uma nova linha From_
, você está vendo outra mensagem.
O arquivo de metadados contém as seguintes informações:
Incluído nas mensagens do Gmail e do Grupos
#From
: a conta de e-mail do remetente#To
: as contas de e-mail de todos os destinatários#CC
: as contas de e-mail de todos os destinatários do campo "Cc".#BCC
: as contas de e-mail de todos os destinatários do campo "Cco"#Subject
: o assunto da mensagem#DateSent
: o carimbo de data/hora de quando a mensagem foi enviada#DateReceived
: o carimbo de data/hora de quando a mensagem foi recebida
Incluído nas mensagens do Hangouts clássico e do Chat
#SubjectAtStart
(somente no Hangouts clássico): o assunto da conversa quando a primeira mensagem foi enviada#SubjectAtEnd
(somente no Hangouts clássico): o assunto da conversa quando a última mensagem foi enviada#DateFirstMessageSent
: o carimbo de data/hora da primeira mensagem de uma conversa enviada#DateLastMessageSent
: o carimbo de data/hora de quando a última mensagem em uma conversa foi enviada#DateFirstMessageReceived
: o carimbo de data/hora de quando a primeira mensagem em uma conversa foi recebida#DateLastMessageReceived
: o carimbo de data/hora de quando a última mensagem em uma conversa foi recebida
Incluído em todas as mensagens (Gmail, Grupos e Chat)
Labels
: todos os marcadores aplicados pelo Gmail ou Chat, como ^INBOX, ^TRASH e ^DELETED. Também mostra os marcadores aplicados à mensagem pelo usuário.FileName
: o identificador da mensagem. Correlacione esse valor com o ID da mensagem que aparece no arquivo PST ou mbox exportado.FileSize
: o tamanho da mensagem em bytes.Hash
: o hash MD5 da mensagem.
Incluído nas mensagens do Chat (não no Hangouts clássico)
RoomID
: o identificador da sala, do chat em grupo ou da mensagem direta a que a mensagem pertence.Participants
: mostra os endereços de e-mail de todos os usuários que participaram da conversa.RoomName
: o valor depende do tipo de mensagem:- Em salas, o nome dela.
- Em chats em grupo criados após o início de dezembro de 2020,
Group chat
. - Em chats em grupo criados antes do início de dezembro de 2020 e mensagens diretas, uma lista de contas participantes separada por vírgula.
ConversationType
: o tipo de mensagem:- Em um chat em grupo criado após o início de dezembro de 2020 ou uma sala, o valor é
Room
. - Em um chat em grupo criado antes de dezembro de 2020, o valor é
Group Direct Message
. - Em uma mensagem direta, o valor é
1:1 Direct Message
.
- Em um chat em grupo criado após o início de dezembro de 2020 ou uma sala, o valor é
Parâmetros de consulta para a exportação inteira
UserQuery
: mostra a consulta enviada pelo usuário do Vault que recuperou as mensagens incluídas nesta exportação.TimeZone
: mostra o fuso horário usado para pesquisas com base em datas.Custodians
: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdo em vez de contas de usuário específicas, nenhum guardião (custodian) será listado.
Exportações do Drive
Conteúdo da exportaçãoInformações | Nome do arquivo | Descrição |
---|---|---|
Arquivos | export_name_N.zip |
Contém todos os arquivos encontrados pela pesquisa. O Vault exporta até 10 GB de dados em um único arquivo compactado. Se você exportar mais de 10 GB de dados, o Vault criará vários arquivos. Os arquivos exportados têm o nome original do arquivo seguido por um sublinhado ("_") e pelo ID de arquivo do Drive. Os arquivos exportados são convertidos da seguinte forma:
|
Metadados do arquivo | export_name-metadata.xml |
Contém metadados, como:
|
Contas e IDs de documentos | export_name-custodian-docid.csv | Lista as contas de usuário com os IDs de documentos correspondentes. Use essas informações para determinar quais usuários têm acesso aos arquivos exportados. |
Relatórios de erros |
error.csv export_name-incomplete-accounts.csv |
Relatórios de erros só serão incluídos se houver erros na exportação.
|
Somas de verificação de arquivos | File checksums | O arquivo lista os valores de hash de resumo de mensagem 5 (MD5, na sigla em inglês) de todos os arquivos na exportação. |
O arquivo incluído na exportação captura os seguintes metadados:
Incluídos com cada arquivo
#Author
: mostra o endereço de e-mail da pessoa que é a proprietária do arquivo no Drive. No caso de um arquivo em um drive compartilhado, o nome do drive compartilhado é mostrado.Collaborators
: mostra as contas e os grupos que têm permissão direta para editar o arquivo ou adicionar comentários. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.Viewers
: mostra as contas e os grupos que têm permissão direta para ver o arquivo. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação.Others
: as contas da consulta que têm acesso indireto ao arquivo se você optar por excluir informações sobre o nível de acesso durante a exportação. Também pode incluir usuários que não tiveram níveis de permissão determinados pelo Vault no momento da exportação.#DateCreated
: mostra a data de criação de um arquivo do Google no Drive. Em arquivos que não são do Google, a data em que o arquivo foi enviado por upload para o Google Drive.#DateModified
: mostra a data da última modificação no arquivo.#Title
: mostra o nome do arquivo conforme atribuído pelo usuário. Como alguns sistemas operacionais não conseguem extrair arquivos ZIP com nomes longos demais, o Vault limita o nome de arquivo a 128 caracteres durante a exportação. O valor mostrado pela tag#Title
não é limitado.DocumentType
: indica o tipo de arquivo do Google. Os possíveis valores são DOCUMENT, SPREADSHEET, PRESENTATION, FORM e DRAWING.SharedDriveID
: mostra o identificador do drive compartilhado que contém o arquivo (se aplicável).SourceHash
: valor de hash exclusivo para cada versão de um arquivo. Você pode usá-lo para eliminar a duplicação de exportações de arquivos e verificar se o arquivo exportado é uma cópia idêntica do arquivo de origem. Compatível apenas com arquivos do Documentos, do Planilhas e do Apresentações Google.
Parâmetros de consulta para a exportação inteira
UserQuery
: mostra a consulta enviada pelo usuário do Vault que recuperou os arquivos incluídos nesta exportação.TimeZone
: mostra o fuso horário usado para pesquisas com base em datas.Custodians
: mostra os endereços de e-mail dos usuários cujas contas foram pesquisadas. Se você pesquisou conteúdo em vez de contas de usuário específicas, nenhum guardião (custodian) será listado.
Quando você exporta arquivos do Drive, o arquivo de metadados pode incluir informações sobre os usuários na sua organização com acesso indireto a um arquivo que corresponda aos critérios da pesquisa e que tenha sido aberto por ele.
Um usuário pode ter acesso indireto quando uma pasta ou um arquivo dentro dela é compartilhado:
- com um grupo a que o usuário pertence;
- com o domínio;
- com o público em geral.
Durante a exportação, você pode escolher as informações que serão incluídas nos metadados.
-
Na caixa de diálogo de exportação, marque a opção para que o Vault determine o nível de permissão dos usuários do domínio com acesso indireto a arquivos. Cada um desses usuários é incluído em uma destas categorias quando você abre o arquivo de metadados:
Collaborators
: usuários que têm permissão indireta para editar ou adicionar comentários a um arquivo.Viewers
: usuários que têm permissão indireta para ver um arquivo.Others
: em algumas circunstâncias, o Vault não determina o tipo de acesso de um usuário no momento da exportação. Por exemplo, isso poderá acontecer se um arquivo tiver sido compartilhado com um grupo, e o usuário tiver sido removido dele.
Como o Vault demora para determinar as permissões desses usuários, talvez a opção aumente o tempo de preparação de arquivos para download.
-
Na caixa de diálogo de exportação, deixe desmarcada (padrão) a opção para excluir as informações de nível de acesso dos usuários do domínio com acesso indireto a arquivos. Esses usuários são listados como
Others
no arquivo de metadados
Exportações do Google Voice
Conteúdo da exportaçãoInformações | Nome do arquivo | Descrição |
---|---|---|
Arquivos de dados de voz | export_name-N.zip | Para cada conta, é gerado um arquivo ZIP que contém arquivos PST ou mbox de conversas por mensagem de texto, registros de chamadas, arquivos de áudio MP3 e transcrições do correio de voz. |
Metadados do arquivo | export_name-metadata.xml | Um arquivo XML que contém os metadados como nos servidores do Google. |
Somas de verificação de arquivos | File checksums | Um arquivo de soma de verificação com valores de hash de resumo de mensagem 5 (MD5) para todos os arquivos incluídos na exportação. |
Relatório de erros |
error.csv |
Relatórios de erros só serão incluídos se houver erros na exportação. Saiba mais |
Observação: ao contrário de outros serviços, as exportações do Voice não incluem um arquivo de contagem.
O arquivo de metadados contém as seguintes informações:
Informações sobre cada arquivo
DocID
: um identificador exclusivo do arquivo.#Author
: o endereço de e-mail da conta proprietária do arquivo no Drive.#DateFirstMessageSent
: para conversas por mensagem de texto, é a data de envio da primeira mensagem. Observação: este campo e os três a seguir são idênticos nas entradas de correios de voz e registros de chamadas.#DateLastMessageSent
: para conversas por mensagem de texto, é a data de envio da última mensagem.#DateFirstMessageReceived
: para conversas por mensagem de texto, a data de recebimento da primeira mensagem.#DateLastMessageReceived
: para conversas por mensagem de texto, a data de recebimento da última mensagem.ConversationType
: o tipo dos dados:TEXT_MESSAGE
: uma mensagem de texto.VOICEMAIL
: um correio de voz.INCOMING_CALL
: um registro de chamada recebida.OUTGOING_CALL
: um registro de chamada realizada.MISSED_CALL
: um registro de chamada recebida não atendida.
ParticipantPhoneNumbers
: os números de telefone dos participantes.OwnerPhoneNumbers
: o valor pode incluir vários números de telefone quando o número do usuário é alterado.Labels
: qualquer marcador na conversa. Por exemplo, as conversas excluídas têm o marcador DELETED.ExternalFile FileName
: o identificador do arquivo, correlacionado ao Assunto no arquivo PST ou mbox.
Parâmetros de consulta para a exportação inteira
UserQuery
: a consulta enviada pelo administrador do Vault.TimeZone
: o fuso horário da consulta.Custodians
: os endereços de e-mail das contas que foram pesquisadas.
Relatórios de erros (error.csv)
Quando o Vault não exporta dados de um serviço, o Vault gera um relatório de erros (error.csv). O relatório lista os itens com erros de exportação, além de mais detalhes e metadados.
O Vault informa dois tipos de erro:
- Erros transitórios: um servidor de back-end não recuperou a mensagem de e-mail ou o arquivo. O item deverá estar disponível para exportação quando você pesquisá-lo mais tarde.
- Erros não transitórios: qualquer erro não identificado explicitamente como transitório é o resultado de um problema que não pode ser corrigido. Normalmente, esses erros ocorrem quando um anexo ou arquivo de mensagem foi excluído, é incompatível com a exportação ou não pode ser convertido no formato exigido.
Para saber se o problema é transitório ou não, abra o arquivo CSV com o Planilhas Google ou outro app de planilhas e encontre a coluna Error Description. Observação: as descrições de erros não estão disponíveis para exportações do Voice. Se o erro for transitório, saiba como recuperar os erros transitórios.
Conteúdo do relatório de erros
Conteúdo do relatório de erros do Gmail e do GruposO relatório de erros contém os campos a seguir para cada mensagem. Os campos ficarão em branco se os dados não estiverem disponíveis ou não forem aplicáveis a uma mensagem.
Campo |
Descrição |
---|---|
Document ID |
Um identificador exclusivo do arquivo. |
Document type |
O tipo de documento. O valor é mail . |
File type |
O tipo de arquivo. O valor é |
Attachments count |
O número de anexos da mensagem. |
Attachment names |
Os nomes dos arquivos anexos. |
Subject |
O assunto da mensagem. |
Size |
O tamanho da mensagem. |
From |
A conta de e-mail do remetente. |
To |
As contas de e-mail de todos os destinatários. |
Cc |
As contas de e-mail de todos os destinatários com cópia. |
Sent time |
Carimbo de data/hora de quando a mensagem foi enviada. |
Source account |
A conta que foi incluída na consulta de pesquisa. |
Error description |
Uma descrição do erro. |
RFC 822 Message-ID |
Um identificador exclusivo de uma mensagem adicionada por servidores de e-mail. Exemplo: |
O relatório de erros contém os campos a seguir para cada mensagem. Os campos ficarão em branco se os dados não estiverem disponíveis ou não forem aplicáveis a uma mensagem.
Campo |
Descrição |
---|---|
Document ID |
Um identificador exclusivo do arquivo. |
Filename |
O tipo de documento. O valor é mail . |
Conversation Type |
O tipo de mensagem. O valor é |
Room Name |
O nome da sala. |
Error description |
Uma descrição do erro. |
Campo | Descrição |
---|---|
Document ID |
Um identificador exclusivo do arquivo. |
Document type |
Indica o tipo de arquivo do Google. Os possíveis valores são DOCUMENT, SPREADSHEET, PRESENTATION, FORM e DRAWING. |
File type |
O formato do arquivo, como PDF ou XLSX. |
Title |
O nome de arquivo atribuído pelo usuário. |
Size |
O tamanho do arquivo. |
Creator |
O endereço de e-mail da pessoa que é a proprietária do arquivo no Drive. No caso de um arquivo em um drive compartilhado, o nome do drive compartilhado é mostrado. |
Collaborators |
As contas e os grupos que têm permissão direta para editar o arquivo ou adicionar comentários. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação. |
Viewers |
As contas e os grupos que têm permissão direta para visualizar o arquivo. Também inclui usuários com acesso indireto ao arquivo se você escolher essa opção durante a exportação. |
Others |
As contas da consulta que têm acesso indireto ao arquivo se você optar por excluir informações sobre o nível de acesso durante a exportação. Também pode incluir usuários que não tiveram níveis de permissão determinados pelo Vault no momento da exportação. |
Creation time |
A data em que um arquivo do Google foi criado no Drive. Nos arquivos que não são do Google, isso indica quando o arquivo foi enviado para o Drive. |
Last modified time |
A data da última modificação no arquivo. |
Error description |
Uma descrição do erro. |
Drive Document ID |
Um identificador exclusivo para um arquivo no Drive. |
O relatório de erros lista as contas pesquisadas, mas nem todos os arquivos correspondentes foram exportados.
Campo | Descrição |
---|---|
Account |
O endereço de e-mail da conta que não recebeu parte dos dados exportados. |
Failed Conversation Count |
O número de conversas que não foram exportadas. Se o número for desconhecido, o valor será Unknown Failure Count . |
Recuperar a partir de erros transitórios
Você pode usar detalhes de mensagens e arquivos para pesquisar e exportar os dados que não foram exportados devido a erros transitórios:
- Se o relatório de erros incluir mensagens com erros transitórios, use o identificador RFC 822 de cada uma delas para encontrá-las quando pesquisar novamente. O formato do termo de pesquisa é rfc822msgid:identifier.
- Se o relatório de erros incluir arquivos do Drive com erros transitórios, use o título de cada arquivo para encontrá-los quando pesquisar novamente. O formato do termo de pesquisa é title:"title-of-file".