Consulter les fichiers d'exportation Vault

Après avoir recherché les données souhaitées avec Vault, vous pouvez les exporter pour effectuer une analyse plus approfondie (en savoir plus). Une exportation contient les informations suivantes :

  • Une copie complète des données correspondant à vos critères de recherche
  • Les métadonnées dont vous avez besoin pour associer les données exportées aux différents utilisateurs de votre organisation
  • Les informations attestant que les données exportées correspondent à celles stockées sur les serveurs Google

Exportations de données Gmail, Chat et Groupes

Contenu de l'exportation
Informations Nom de fichier Description
Contenus de messages nom_exportation-N.zip

Fichiers ZIP contenant des fichiers PST ou mbox. Ces fichiers contiennent les informations sur les messages exportés. Pour les messages Google Chat, ces informations incluent la date et l'heure de suppression ou de modification d'un message par l'expéditeur.

Découvrez les options pour consulter des fichiers PST et mbox.

Il se peut que plusieurs fichiers ZIP soient créés dans les cas suivants :

  • L'exportation inclut les messages de plusieurs comptes.
  • La taille du fichier dépasse 1 Go pour les fichiers PST ou 10 Go pour les fichiers mbox.

Le nom de chaque fichier se termine alors par un chiffre différent afin de les distinguer.

Informations concernant l'adhésion Google Groupes nom_exportation-group-membership.csv

Fichier CSV contenant les informations suivantes pour chaque membre du groupe :

  • Adresses e-mail du membre
  • Adresse e-mail du groupe
  • Date d'adhésion au groupe
  • Rôle du membre : MEMBER pour un membre du groupe, MANAGER pour un gestionnaire de groupe ou OWNER pour un propriétaire de groupe
  • Type de compte : USER pour un compte utilisateur individuel ou GROUP pour une adresse e-mail de groupe
Métadonnées des messages nom_exportation-metadata.xml

Fichier XML contenant les métadonnées des messages qui figurent sur les serveurs Google. Ouvrez ce fichier dans un éditeur de texte et utilisez-le pour associer les métadonnées au contenu des messages fourni dans le fichier MBOX.

Remarque : Le contenu du fichier PST ne peut pas être mis en corrélation avec les métadonnées du fichier XML.

Comptes et nombre de messages nom_exportation-results-count.csv Fichier CSV répertoriant les comptes des propriétaires des messages inclus dans l'exportation et le nombre de messages appartenant à chaque compte.
Rapports d'erreur

error.csv

nom_exportation-account-exceptions.csv (exportations Gmail)

nom_exportation-failed-group-membership-lookups.csv (exportations Groupes)

Les rapports d'erreur sont inclus uniquement si l'exportation rencontre des erreurs.

  • error.csv : répertorie les erreurs de récupération des messages. En savoir plus
  • nom_exportation-account-exceptions.csv : répertorie les comptes Gmail ayant fait l'objet d'une recherche, mais dont les messages correspondants n'ont pas tous été exportés.
  • nom_exportation-failed-group-membership-lookups.csv : répertorie les adresses e-mail de groupe ayant fait l'objet d'une recherche, mais dont les membres n'ont pas été tous obtenus.
Sommes de contrôle des fichiers File checksums Fichier répertoriant les valeurs de hachage MD5 (Message Digest 5) des fichiers inclus dans l'exportation.
Paramètres de message dans le fichier de métadonnées

Le fichier de métadonnées contient les informations suivantes :

Pour les messages Gmail et Groupes

  • #From : compte de messagerie de l'expéditeur
  • #To : comptes de messagerie de tous les destinataires
  • #CC : comptes de messagerie de tous les destinataires en copie
  • #BCC : comptes de messagerie de tous les destinataires en copie cachée
  • #Subject : objet du message
  • #DateSent : horodatage de l'envoi du message
  • #DateReceived : horodatage de la réception du message

Pour les messages de Chat et de la version classique de Hangouts

  • #SubjectAtStart : (version classique de Hangouts uniquement) objet de la conversation lors de l'envoi du premier message
  • #SubjectAtEnd : (version classique de Hangouts uniquement) objet de la conversation lors de l'envoi du dernier message
  • #DateFirstMessageSent : horodatage de l'envoi du premier message d'une conversation
  • #DateLastMessageSent : horodatage de l'envoi du dernier message d'une conversation
  • #DateFirstMessageReceived : horodatage de la réception du premier message d'une conversation
  • #DateLastMessageReceived : horodatage de la réception du dernier message d'une conversation

Pour tous les messages (Gmail, Groupes et Chat)

  • Labels : tous les libellés appliqués par Gmail ou Chat, tels que ^INBOX, ^TRASH et ^DELETED. Les libellés appliqués au message par l'utilisateur sont également indiqués.
  • FileName : identifiant du message. Cette valeur permet d'associer les métadonnées au message correspondant dans un client de messagerie ou un éditeur de texte.
  • FileSize : taille du message en octets.
  • Hash : hachage MD5 du message.

Pour les messages de Chat (et non la version classique de Hangouts)

  • RoomID : identifiant du salon, du chat de groupe ou du message privé auquel le message appartient.
  • Participants : adresses e-mail de tous les utilisateurs ayant participé à la conversation.
  • RoomName : la valeur dépend du type de message :
    • Pour les salons : nom du salon.
    • Pour les chats de groupe créés après le début du mois de décembre 2020 : Group chat.
    • Pour les chats de groupe créés avant le début du mois de décembre 2020 et les messages privés : liste des comptes ayant participé séparés par une virgule.
  • ConversationType : le type de message :
    • Pour un chat de groupe créé après début décembre 2020 ou un salon, la valeur est Room.
    • Pour un chat de groupe créé avant décembre 2020, la valeur est Group Direct Message.
    • Pour un MP, la valeur est 1:1 Direct Message.

Paramètres de requête pour l'ensemble de l'exportation

  • UserQuery : requête envoyée par l'utilisateur Vault qui a permis de récupérer les messages inclus dans cette exportation.
  • TimeZone : fuseau horaire utilisé pour effectuer des recherches par date.
  • Custodians : adresses e-mail des comptes utilisateur ayant fait l'objet de la recherche. Si votre recherche a porté sur le contenu plutôt que sur les comptes utilisateur, aucune information n'est affichée ici.

Exportations Drive

Contenu de l'exportation
Informations Nom de fichier Description
Fichiers nom_exportation_N.zip

Contient tous les fichiers correspondant à votre recherche. Vault permet d'exporter jusqu'à 10 Go de données dans un même fichier compressé. Si vous exportez plus de 10 Go de données, Vault crée plusieurs fichiers.

Les fichiers exportés portent le nom d'origine du fichier, suivi d'un trait de soulignement ("_") et de l'ID du fichier Drive.

Les fichiers Google exportés sont convertis comme suit :

  • Google Docs en DOCX
  • Google Sheets en XLSX
  • Google Forms en ZIP (HTML et CSV)
  • Google Slides en PPTX
  • Google Drawings en PDF
Métadonnées des fichiers nom_exportation-metadata.xml

Contient les métadonnées, y compris :

  • Les ID de document. Remarque : il ne s'agit pas des ID de fichier Drive, mais des valeurs du fichier CSV.
  • L'adresse e-mail des utilisateurs
  • Les dates de création et de modification de chaque fichier
  • Le type et le titre des documents

En savoir plus

ID des comptes et des documents nom_exportation-custodian-docid.csv Répertorie les comptes utilisateur avec les ID de document associés. Ces informations vous permettent de savoir quels utilisateurs ont accès aux fichiers exportés.
Rapports d'erreur

error.csv

nom_exportation-incomplete-accounts.csv

Les rapports d'erreur sont inclus uniquement si l'exportation rencontre des erreurs.

  • error.csvMiss : répertorie les erreurs de récupération de fichiers et les métadonnées du fichier. En savoir plus
  • nom_exportation-incomplete-accounts.csv : répertorie les comptes qui ont fait l'objet d'une recherche, mais dont les fichiers correspondants n'ont pas tous été exportés.
Sommes de contrôle des fichiers File checksums Fichier répertoriant les valeurs de hachage MD5 (Message Digest 5) des fichiers inclus dans l'exportation.
Paramètres des fichiers dans le fichier de métadonnées

Le fichier de métadonnées inclus dans votre exportation contient les métadonnées suivantes :

Dans chaque fichier

  • #Author : adresse e-mail du propriétaire du fichier Drive. S'il s'agit du fichier d'un Drive partagé, le nom du Drive en question est indiqué.
  • Collaborators : comptes et groupes directement autorisés à modifier le fichier et à ajouter des commentaires. Inclut également les utilisateurs bénéficiant d'un accès indirect au fichier si vous avez choisi cette option lors de l'exportation.
  • Viewers : comptes et groupes directement autorisés à afficher le fichier. Inclut également les utilisateurs bénéficiant d'un accès indirect au fichier si vous avez choisi cette option lors de l'exportation.
  • Others : comptes de votre requête bénéficiant d'un accès indirect au fichier si vous avez opté pour l'exclusion des informations de niveau d'accès lors de l'exportation. Peut également inclure les utilisateurs pour lesquels Vault n'a pas pu déterminer les niveaux d'autorisation au moment de l'exportation.
  • #DateCreated : date de création d'un fichier Google dans Drive. Pour les fichiers autres que Google, il s'agit de la date de leur importation dans Drive.
  • #DateModified : date de dernière modification du fichier.
  • #Title : nom du fichier tel que défini par l'utilisateur. Vault tronque les noms de fichier contenant plus de 128 caractères lors de l'exportation, car certains systèmes d'exploitation ne permettent pas de développer des fichiers ZIP contenant des noms de fichier trop longs. Cependant, la valeur indiquée dans la balise #Title n'est pas tronquée.
  • DocumentType : type de fichier pour les fichiers Google. Valeurs possibles : DOCUMENT, SPREADSHEET, PRESENTATION, FORM et DRAWING.
  • SharedDriveID : identifiant du Drive partagé qui contient le fichier, le cas échéant.
  • SourceHash : valeur de hachage unique pour chaque version d'un fichier. Elle peut être utilisée pour dédoublonner les exportations de fichiers et vérifier que le fichier exporté est une copie exacte du fichier source. Compatible avec les fichiers Google Docs, Sheets et Slides uniquement.

Paramètres de requête pour l'ensemble de l'exportation

  • UserQuery : requête envoyée par l'utilisateur Vault qui a permis de récupérer les fichiers inclus dans cette exportation.
  • TimeZone : fuseau horaire utilisé pour effectuer des recherches par date.
  • Custodians : adresses e-mail des comptes utilisateur ayant fait l'objet de la recherche. Si votre recherche a porté sur le contenu plutôt que sur les comptes utilisateur, aucune information n'est affichée ici.
Exportation des informations de niveau d'accès pour les utilisateurs bénéficiant d'un accès indirect aux fichiers

Lorsque vous exportez des fichiers depuis Drive, le fichier de métadonnées peut contenir des informations sur les utilisateurs de votre organisation bénéficiant d'un accès indirect et ayant ouvert un fichier correspondant à vos critères de recherche.

Un utilisateur peut disposer d'un accès indirect lorsqu'un fichier ou un dossier contenant un fichier est :

  • partagé avec un groupe auquel l'utilisateur appartient ;
  • partagé avec le domaine ;
  • partagé en mode public.

Lors de l'exportation, vous pouvez choisir les informations que vous souhaitez inclure dans le résultat des métadonnées :

  • Dans la boîte de dialogue d'exportation, cochez l'option permettant de déterminer le niveau d'autorisation des utilisateurs de votre domaine qui disposent d'un accès indirect aux fichiers. Les différents utilisateurs figurent dans l'une des catégories suivantes lorsque vous ouvrez le fichier de métadonnées :

    • Collaborators : utilisateurs indirectement autorisés à modifier un fichier ou à y ajouter des commentaires.
    • Viewers : utilisateurs indirectement autorisés à afficher un fichier.
    • Others : dans certaines circonstances, Vault ne parvient pas à déterminer le type d'accès d'un utilisateur au moment de l'exportation. Cela peut se produire, par exemple, si un fichier a été partagé avec un groupe et que l'utilisateur a été ensuite retiré du groupe.

    Vault a besoin de temps pour déterminer les autorisations dont disposent ces utilisateurs, de sorte que cette option peut augmenter le temps nécessaire à la préparation de vos fichiers pour téléchargement.

  • Dans la boîte de dialogue d'exportation, laissez la case décochée (paramétrage par défaut) afin d'exclure les informations de niveau d'accès pour les utilisateurs de votre domaine bénéficiant d'un accès indirect aux fichiers. Ces utilisateurs sont répertoriés dans la catégorie Others du fichier de métadonnées.

Exportations Google Voice

Contenu de l'exportation
Informations Nom de fichier Description
Fichiers de données vocales nom_exportation-N.zip Fichier ZIP généré pour chaque compte, qui contient des fichiers PST ou mbox de conversations SMS, des journaux d'appels, des fichiers audio MP3 de la messagerie vocale et des transcriptions de messages vocaux
Métadonnées des fichiers nom_exportation-metadata.xml Fichier XML contenant les métadonnées des messages figurant sur les serveurs Google
Sommes de contrôle des fichiers File checksums Fichier de contrôle contenant les valeurs de hachage MD5 (Message Digest 5) des fichiers inclus dans l'exportation
Rapport d'erreur

error.csv

Les rapports d'erreur sont inclus uniquement si l'exportation rencontre des erreurs. En savoir plus

Remarque : Contrairement aux autres services, les exportations Voice n'incluent pas de fichier de décompte.

Paramètres des données vocales dans le fichier de métadonnées

Le fichier de métadonnées contient les informations suivantes :

Informations sur chaque fichier

  • DocID : identifiant unique du fichier.
  • #Author : adresse e-mail du compte propriétaire du fichier dans Drive.
  • #DateFirstMessageSent : pour les conversations SMS, date à laquelle le premier message a été envoyé. Remarque : ce champ et les trois champs suivants sont identiques dans les entrées des messages vocaux et des journaux d'appels.
  • #DateLastMessageSent : pour les conversations SMS, date à laquelle le dernier message a été envoyé.
  • #DateFirstMessageReceived : pour les conversations SMS, date de réception du premier message.
  • #DateLastMessageReceived : pour les conversations SMS, date de réception du dernier message.
  • ConversationType : le type de données :
    • TEXT_MESSAGE : SMS
    • VOICEMAIL : message vocal
    • INCOMING_CALL : journal d'appels d'un appel entrant
    • Outgoing_CALL : journal d'appels d'un appel sortant
    • MISSED_CALL : journal d'appels d'un appel entrant sans réponse
  • ParticipantPhoneNumbers : numéros de téléphone des participants
  • OwnerPhoneNumbers : valeur pouvant inclure plusieurs numéros de téléphone lorsque le numéro de l'utilisateur a changé
  • Labels : tous les libellés de la conversation (par exemple, DELETED pour les conversations supprimées)
  • ExternalFile FileName : identifiant du fichier, qui correspond à l'objet du fichier PST ou mbox

Paramètres de requête pour l'ensemble de l'exportation

  • UserQuery : requête envoyée par l'administrateur Vault
  • TimeZone : fuseau horaire de la requête
  • Custodians : adresse e-mail des comptes ayant fait l'objet d'une recherche

Consulter les messages exportés

Une fois le fichier ZIP décompressé pour une exportation Gmail ou Chat, différents outils vous permettent de consulter et traiter les messages en fonction du type de fichier :

  • PST : Microsoft Outlook ou certains systèmes d'assistance aux litiges

  • mbox : Mozilla Thunderbird, un éditeur de texte ou un système d'assistance aux litiges comprenant des outils de conversion des e-mails pour les fichiers mbox

Remarque : Google ne propose pas d'assistance technique pour les produits tiers. GOOGLE DÉCLINE TOUTE RESPONSABILITÉ CONCERNANT CES PRODUITS. Pour obtenir des informations récentes pour l'assistance et la configuration, consultez le site Web du produit concerné.

Consulter des messages dans un client de messagerie

Vous pouvez consulter les messages Gmail et Chat dans Microsoft Outlook (PST) ou Mozilla Thunderbird (mbox). Cette méthode permet de consulter les messages HTML et les pièces jointes qui ne s'affichent pas dans un éditeur de texte.

Les fichiers PST et mbox contiennent les informations sur les messages exportés. Le fichier de métadonnées présente les métadonnées des messages telles qu'elles sont enregistrées par Google. Vous pouvez associer le contenu mbox et les métadonnées des messages pour établir un lien entre les messages stockés sur les serveurs Google et les données que vous exportez à l'aide de Vault.

Remarque : Les libellés définis dans Gmail pour classer les messages ne sont pas convertis en dossiers de boîte aux lettres. Lorsque vous ouvrez un fichier PST ou mbox dans un client de messagerie, tous les messages apparaissent dans un seul dossier.

Pour consulter les messages exportés dans un client de messagerie, procédez comme suit :

  1. Importez les messages dans votre application de messagerie pour les consulter.
  2. Pour les messages importants, examinez les en-têtes :
    • Outlook : consultez la documentation Microsoft concernant l'affichage des en-têtes de messages pour votre version.
    • Thunderbird : cliquez sur Affichage > En-têtes > Complets pour que les en-têtes de chaque message s'affichent :
  3. Dans Thunderbird, chaque en-tête inclut un ID de message. Pour corréler les messages avec les données stockées sur les serveurs de Google, comparez les ID de message avec le fichier de métadonnées.
Lecture des fichiers mbox dans un éditeur de texte

MBOX est un format de fichier standard permettant de stocker des messages. Il contient tous les détails relatifs aux messages exportés, y compris le texte et les éventuelles pièces jointes. Le fichier de métadonnées présente les métadonnées des messages telles qu'elles sont enregistrées par Google. Ces deux fichiers associés permettent d'établir le lien entre les messages stockés sur les serveurs Google et les données que vous avez exportées à l'aide de Vault.

Une fois l'exportation effectuée, les paramètres de message du fichier de métadonnées vous permettent d'identifier les messages correspondants dans le fichier mbox. Dans un premier temps, ouvrez le fichier de métadonnées dans un éditeur de texte et recherchez le paramètre FileName, par exemple :

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Ce paramètre contient un identifiant unique que vous retrouverez dans une entrée similaire du fichier mbox appelée From_. La ligne From_ contient ce même identifiant, ainsi que la date et l'heure (indiquées en temps universel) de réception du message par Google. Exemple :

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

From_ est l'entrée apparaissant en premier pour chaque message du fichier mbox. Lorsque vous arrivez à une autre entrée From_, il s'agit d'un message différent.

Rapports d'erreur

Un rapport d'erreur est généré quand Vault ne parvient pas à exporter des données d'un service. Ce rapport répertorie les éléments qui ont donné lieu à une erreur d'exportation, ainsi que d'autres informations et métadonnées.

Vault signale deux types d'erreurs :

  • Erreurs temporaires : un serveur backend n'a pas pu extraire le message ou le fichier. Vous pourrez vraisemblablement exporter l'élément plus tard, lorsque vous effectuerez une nouvelle recherche.
  • Erreurs non temporaires : toute erreur n'étant pas définie comme temporaire est le résultat d'un problème ne pouvant pas être corrigé. En général, ces erreurs se produisent lorsqu'une pièce jointe ou un fichier ont été supprimés, ne sont pas compatibles avec l'exportation ou ne peuvent pas être convertis au format demandé.

Pour savoir si le problème est temporaire ou non, ouvrez le fichier CSV dans Google Sheets ou dans une autre application de feuille de calcul, puis recherchez la colonne Error Description (Description de l'erreur). Remarque : cette option n'est pas disponible pour les exportations Voice.

Effectuer une récupération après des erreurs temporaires

À l'aide des informations sur le message et le fichier, vous pouvez rechercher et exporter les données qui n'ont pas été exportées en raison d'erreurs temporaires :

  • Si le rapport d'erreur contient des messages qui ont généré des erreurs temporaires, utilisez l'identifiant RFC 822 de chaque message pour retrouver ces messages lorsque vous effectuez à nouveau votre recherche. Le format du terme de recherche est rfc822msgid:identifiant.
  • Si le rapport d'erreurs inclut des fichiers Drive contenant des erreurs temporaires, le titre de chacun des fichiers vous permet de les retrouver lors d'une nouvelle recherche. Le format du terme de recherche est title:"titre-du-fichier".

Contenu du rapport d'erreur

Contenu des rapports d'erreurs pour Gmail et Groupes

Le rapport d'erreur contient les champs suivants pour chaque message. Les champs sont vides si les données ne sont pas disponibles ou ne s'appliquent pas pour un message.

Champ

Description
Document ID Identifiant unique du fichier.
Document type Type du document. La valeur est mail.
File type

Type du fichier. La valeur est mail.

Attachments count Nombre de pièces jointes du message.
Attachment names Noms des fichiers en pièce jointe.
Subject Objet du message.
Size Taille du message.
From Compte de messagerie de l'expéditeur.
To Comptes de messagerie de tous les destinataires.
Cc Comptes de messagerie de tous les destinataires en copie.
Sent time Horodatage de l'envoi du message.
Source account Compte inclus dans la requête de recherche.
Error description Description de l'erreur.
RFC 822 Message-ID

Identifiant unique d'un message, défini par les serveurs de messagerie.

Exemple : rfc822msgid:AANLkTilQ5MWSp7-iE6SKepvOl-
Spjupgr1NZTiLGu16Z@mail.solarmora.com

 

Contenu du rapport d'erreurs pour Chat

Le rapport d'erreur contient les champs suivants pour chaque message. Les champs sont vides si les données ne sont pas disponibles ou ne s'appliquent pas pour un message.

Champ

Description
Document ID Identifiant unique du fichier.
Filename Type du document. La valeur est mail.
Conversation Type

Type du message. La valeur est mail.

Room Name Nom du salon.
Error description Description de l'erreur.

 

Contenu du rapport d'erreur pour les fichiers Drive

Le rapport d'erreurs contient les champs suivants pour chaque fichier. Les champs sont vides si les données ne sont pas disponibles ou ne s'appliquent pas pour un fichier.

Champ Description
Document ID Identifiant unique du fichier.
Document type Type de fichier pour les fichiers Google. Valeurs possibles : DOCUMENT, SPREADSHEET, PRESENTATION, FORM et DRAWING.
File type Format de fichier (PDF ou XLSX, par exemple).
Title Nom de fichier attribué par l'utilisateur.
Size Taille du fichier.
Creator Adresse e-mail du propriétaire du fichier Drive. S'il s'agit du fichier d'un Drive partagé, le nom du Drive en question est indiqué.
Collaborators Comptes et groupes directement autorisés à modifier le fichier et à ajouter des commentaires. Inclut également les utilisateurs bénéficiant d'un accès indirect au fichier si vous avez choisi cette option lors de l'exportation.
Viewers Comptes et groupes directement autorisés à afficher le fichier. Inclut également les utilisateurs bénéficiant d'un accès indirect au fichier si vous avez choisi cette option lors de l'exportation.
Others Comptes de votre requête bénéficiant d'un accès indirect au fichier si vous avez opté pour l'exclusion des informations de niveau d'accès lors de l'exportation. Peut également inclure les utilisateurs pour lesquels Vault n'a pas pu déterminer les niveaux d'autorisation au moment de l'exportation.
Creation time Date de création d'un fichier Google dans Drive. Pour les fichiers non Google, cela indique à quel moment le fichier a été importé dans Drive.
Last modified time Date de dernière modification du fichier.
Error description Description de l'erreur.
Drive Document ID Identifiant unique d'un fichier dans Drive.

 

Contenu du rapport d'erreur pour les données Voice

Le rapport d'erreurs répertorie les comptes qui ont fait l'objet d'une recherche, mais dont les fichiers correspondants n'ont pas tous été exportés.

Champ Description
Account Adresse e-mail du compte dont certaines données n'ont pas été exportées.
Failed Conversation Count Nombre de conversations qui n'ont pas été exportées. Si le nombre d'échecs est inconnu, la valeur est Unknown Failure Count.
Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?