Fonctionnement des exportations Vault

Une fois que vous avez trouvé dans Vault les messages ou les fichiers dont vous avez besoin, vous pouvez procéder à leur exportation afin de les analyser plus en détail. La fonctionnalité d'exportation de Google Vault est conçue pour vous fournir les éléments suivants :

  • Une copie complète de toutes les données correspondant à vos critères de recherche
  • Les métadonnées dont vous avez besoin pour associer les données exportées aux différents utilisateurs de votre domaine
  • Les informations attestant que les données exportées correspondent à celles qui sont stockées sur les serveurs Google

Exportations d'e-mails, de messages de chat et de groupes

Une fois que Vault a fini de traiter une exportation, vous pouvez télécharger les éléments figurant dans la liste ci-dessous :

  • Un fichier ZIP contenant des fichiers PST ou mbox. Ces fichiers contiennent les détails et le contenu des messages exportés. Après avoir extrait le fichier ZIP, ouvrez les messages à l'aide de l'outil approprié :

    • PST : Microsoft Outlook. Il se peut que vous disposiez de plusieurs fichiers PST si l'exportation comprend des messages provenant de plusieurs comptes ou si la taille du fichier dépasse 1 Go.

      Remarque : Microsoft Outlook ne prend pas en charge les libellés, que Gmail utilise pour classer les messages. Tous les messages apparaissent dans la boîte de réception lorsque vous ouvrez un fichier PST dans Outlook. 
    • mbox : Mozilla Thunderbird ou un éditeur de texte. Il se peut que vous disposiez de plusieurs fichiers mbox si l'exportation comprend des messages provenant de plusieurs comptes ou si la taille du fichier dépasse 10 Go.

    • Certains systèmes d'assistance aux litiges. Certains de ces systèmes peuvent ouvrir les fichiers PST ou comprennent des outils de conversion des e-mails pour les fichiers mbox.  

Remarque : Google ne fournit pas d'assistance technique pour la configuration des produits tiers. GOOGLE DÉCLINE TOUTE RESPONSABILITÉ CONCERNANT LES PRODUITS TIERS. Veuillez vous reporter au site Web du produit en question pour obtenir les informations de configuration et d'assistance les plus récentes.

  • Un fichier XML contenant les métadonnées des messages figurant sur les serveurs Google. Ouvrez ce fichier dans un éditeur de texte afin d'associer les métadonnées au contenu des messages fourni dans le fichier PST ou mbox.
  • Un fichier CSV contenant les adresses des propriétaires des messages inclus dans l'exportation, ainsi que le nombre de messages appartenant à chaque utilisateur.
  • Un rapport d'erreur, le cas échéant.
  • Un fichier de contrôle contenant les valeurs de hachage MD5 (Message Digest 5) des fichiers ci-dessus.
Consulter des messages dans un client de messagerie

Vous pouvez consulter les e-mails et les messages de chat dans Microsoft Outlook (PST) ou Mozilla Thunderbird (mbox). Cette méthode permet de lire les messages HTML et les pièces jointes qui ne s'affichent pas dans un éditeur de texte.

Les fichiers PST et mbox contiennent tous les détails relatifs aux e-mails et aux messages de chat exportés. Le fichier XML fourni par Vault présente les métadonnées des messages, telles qu'elles sont enregistrées par Google. Ces deux fichiers associés permettent d'établir le lien entre les messages stockés sur les serveurs Google et les données que vous avez exportées à l'aide de Vault.

  1. Importez les messages dans votre application e-mail pour les consulter. 
  2. Pour les messages importants, examinez les en-têtes :
    • Outlook : la méthode dépend de la version que vous utilisez. Consultez la documentation de Microsoft pour savoir comment afficher les en-têtes de messages.  
    • Thunderbird : cliquez sur Affichage > En-têtes > Complets pour que s'affichent les en-têtes de chaque message :
  3. Chaque en-tête contient un identifiant du message. Comparez ces identifiants avec les métadonnées contenues dans les fichiers XML pour identifier les messages dont les données sont stockées sur les serveurs de Google.
Lecture des fichiers mbox dans un éditeur de texte

Mbox est un format de fichier standard permettant de stocker des messages. Le fichier mbox contient tous les détails relatifs aux messages exportés, y compris le texte et les éventuelles pièces jointes. Le fichier XML fourni par Vault présente les métadonnées des messages, telles qu'elles sont enregistrées par Google. Ces deux fichiers associés permettent d'établir le lien entre les messages stockés sur les serveurs Google et les données que vous avez exportées à l'aide de Vault.

Une fois l'exportation effectuée, utilisez les paramètres de message du fichier XML de Vault pour identifier les messages correspondants dans le fichier mbox. Dans un premier temps, ouvrez le fichier XML dans un éditeur de texte et recherchez le paramètre FileName. Par exemple :

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Ce paramètre contient un identifiant unique que vous retrouverez dans une entrée similaire du fichier mbox appelée From_. La ligne From_ contient ce même identifiant, ainsi que la date et l'heure (indiquées en temps universel) de réception du message par Google. Exemple :

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

From_ est l'entrée apparaissant en premier pour chaque message du fichier mbox. Si vous passez à une autre entrée From_, il s'agit d'un message différent.

Paramètres des e-mails et des messages de chat dans le fichier XML de Vault

Le fichier XML de Vault inclus dans votre exportation contient les métadonnées suivantes :

Dans chaque e-mail

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

Dans chaque message de chat

  • #SubjectAtStart - (version classique de Hangouts uniquement)
  • #SubjectAtEnd - (version classique de Hangouts uniquement)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

Aussi bien dans les e-mails que dans les messages de chat

  • Labels indique les libellés ajoutés par Gmail (^INBOX, ^TRASH, et ^DELETED, par exemple), ainsi que les libellés ajoutés au message par l'utilisateur.
  • FileName indique l'identifiant du message. Parcourez le fichier PST ou mbox que vous avez exporté pour trouver l'identifiant de message correspondant. 

Dans les messages de Hangouts Chat

  • RoomID affiche le salon ou l'identifiant MP auquel la conversation appartient.
  • Participants affiche les adresses e-mail de tous les utilisateurs ayant participé à la conversation.
  • roomName affiche le nom du salon ou une liste d'éléments séparés par une virgule indiquant les comptes qui ont participé à une conversation en MP.
  • conversationType indique si la conversation est issue d'un salon ou d'un MP.

Paramètres de requête pour l'ensemble de l'exportation

  • UserQuery indique la requête envoyée par l'utilisateur Vault qui a permis de récupérer les messages inclus dans cette exportation.
  • TimeZone indique le fuseau horaire utilisé pour les recherches en fonction de la date.
  • Custodians indique les adresses e-mail des comptes utilisateur ayant fait l'objet de la recherche. Si votre recherche a porté sur le contenu plutôt que sur les comptes utilisateur, aucune information n'est affichée ici.

Exportations Drive

Une fois que Vault a fini de traiter une exportation, vous pouvez télécharger les fichiers figurant dans la liste ci-dessous :

  • Un fichier compressé contenant tous les fichiers correspondant à votre recherche. Vault permet d'exporter jusqu'à 10 Go de données dans un même fichier compressé. Si vous exportez plus de 10 Go de données, Vault crée plusieurs fichiers. 
  • Un fichier XML contenant des métadonnées, y compris :
    • L'ID des documents
    • L'adresse e-mail des utilisateurs
    • Les dates de création et de modification de chaque fichier
    • Le type et le titre des documents
  • Un fichier CSV associant l'ID des documents au compte utilisateur correspondant. Ces informations vous permettent de savoir quel utilisateur a accès à quel fichier exporté.
  • Un rapport d'erreur, le cas échéant.
  • Un fichier de contrôle contenant les valeurs de hachage MD5 (Message Digest 5) des fichiers ci-dessus.

Les fichiers exportés sont convertis comme suit :

Type de fichier Drive Format d'exportation
Google Docs .docx
Google Sheets .xlsx
Google Forms .zip (.html et .csv)
Google Slides .pptx
Google Drawings .pdf
Fichiers non Google Pas de conversion de format

 

Paramètres des fichiers dans le fichier XML de Vault

Le fichier XML de Vault inclus dans votre exportation fournit les métadonnées suivantes :

Dans chaque fichier

  • #Author indique l'adresse e-mail du propriétaire du fichier Drive. S'il s'agit du fichier d'un Drive partagé, le nom du Drive en question est indiqué.
  • Collaborators indique les comptes et les groupes directement autorisés à modifier le fichier et à ajouter des commentaires. Inclut également les utilisateurs bénéficiant d'un accès indirect au fichier si vous avez choisi cette option lors de l'exportation.
  • Viewers indique les comptes et les groupes directement autorisés à afficher le fichier. Inclut également les utilisateurs bénéficiant d'un accès indirect au fichier si vous avez choisi cette option lors de l'exportation.
  • Others indique les comptes de votre requête bénéficiant d'un accès indirect au fichier si vous avez opté pour l'exclusion des informations de niveau d'accès lors de l'exportation. Peut également inclure les utilisateurs pour lesquels Vault n'a pas pu déterminer les niveaux d'autorisation au moment de l'exportation.
  • #DateCreated indique la date de création du fichier. Pour les fichiers créés en dehors de G Suite, il s'agit de la date enregistrée par l'ordinateur du créateur, qui n'est pas modifiée lors de l'importation dans Drive.
  • #DateModified indique la date de dernière modification du fichier. Pour les fichiers modifiés en dehors de G Suite, il s'agit de la date enregistrée par l'ordinateur de la personne ayant modifié le fichier, qui demeure inchangée lors de l'importation dans Drive.
  • #Title indique le nom du fichier tel que défini par l'utilisateur. Vault tronque les noms de fichier contenant plus de 128 caractères, car certains systèmes d'exploitation ne permettent pas de développer des fichiers ZIP contenant des noms de fichier trop longs. Cependant, la valeur indiquée dans la balise #Title n'est pas tronquée.
  • DocumentType indique le type de fichier pour les fichiers Google. Valeurs possibles : DOCUMENT, SPREADSHEET, PRESENTATION, FORM et DRAWING.
  • SharedDriveID affiche l'identifiant du Drive partagé qui contient le fichier, le cas échéant.
  • SourceHash : valeur de hachage unique pour chaque version d'un fichier. Elle peut être utilisée pour dédoublonner les exportations de fichiers et vérifier que le fichier exporté est une copie exacte du fichier source. Compatible avec les fichiers Google Docs, Sheets et Slides uniquement.

Paramètres de requête pour l'ensemble de l'exportation

  • UserQuery indique la requête envoyée par l'utilisateur Vault qui a permis de récupérer les fichiers inclus dans cette exportation.
  • TimeZone indique le fuseau horaire utilisé pour les recherches en fonction de la date.
  • Custodians indique les adresses e-mail des comptes utilisateur ayant fait l'objet de la recherche. Si votre recherche a porté sur le contenu plutôt que sur les comptes utilisateur, aucune information n'est affichée ici.
Exportation des informations de niveau d'accès pour les utilisateurs bénéficiant d'un accès indirect aux fichiers

Lorsque vous exportez des fichiers depuis Drive, Vault peut inclure des métadonnées pour les utilisateurs de votre domaine bénéficiant d'un accès indirect et ayant ouvert un fichier correspondant à vos critères de recherche.

Un utilisateur peut disposer d'un accès indirect lorsqu'un fichier ou un dossier contenant un fichier est :

  • partagé avec un groupe auquel l'utilisateur appartient ;
  • partagé avec le domaine ; 
  • partagé en mode public.

Lors de l'exportation, vous avez la possibilité de choisir le type d'informations à inclure dans la sortie de métadonnées :

  • Dans la boîte de dialogue d'exportation, cochez la case d'option permettant de déterminer le niveau d'autorisation des utilisateurs de votre domaine bénéficiant d'un accès indirect aux fichiers. Les différents utilisateurs figurent dans l'une des catégories suivantes lorsque vous ouvrez le fichier XML :

    • Collaborators indique les utilisateurs indirectement autorisés à modifier un fichier ou à y ajouter des commentaires.

    • Viewers indique les utilisateurs indirectement autorisés à afficher un fichier.

    • Others : dans certaines circonstances, Vault ne parvient pas à déterminer le type d'accès d'un utilisateur au moment de l'exportation. Cela peut se produire, par exemple, si un fichier a été partagé avec un groupe et que l'utilisateur a été ensuite retiré du groupe.

    Vault a besoin de temps supplémentaire pour déterminer les autorisations dont disposent ces utilisateurs, de sorte que cette option peut augmenter le temps nécessaire à la préparation de vos fichiers pour téléchargement.

  • Dans la boîte de dialogue d'exportation, laissez la case décochée (paramétrage par défaut) afin d'exclure les informations de niveau d'accès pour les utilisateurs de votre domaine bénéficiant d'un accès indirect aux fichiers. Ces utilisateurs sont répertoriés dans la catégorie Others du fichier XML. 

Rapports d'erreur

Il arrive que Vault ne parvienne pas à exporter certains messages électroniques de Gmail ou certains fichiers de Drive. Dans ce cas, un rapport d'erreur est généré. Le fichier de rapport est au format CSV. Il répertorie les éléments qui ont donné lieu à une erreur d'exportation ainsi que d'autres informations et métadonnées. Il existe deux types d'erreurs :

  • Erreurs temporaires : un serveur backend n'a pas pu extraire le message ou le fichier. Vous pourrez vraisemblablement exporter l'élément plus tard, lorsque vous effectuerez une nouvelle recherche.
  • Erreurs non temporaires : ce sont des erreurs qui sont le résultat de problèmes qui ne peuvent pas être corrigés et qui sont donc jugées permanentes. En général, ce type de problème se produit lorsqu'une pièce jointe ou un fichier ont été supprimés, ne sont pas compatibles avec l'exportation ou ne peuvent pas être convertis au format demandé.

Pour savoir si le problème est temporaire ou non, ouvrez le fichier CSV dans Google Sheets ou dans un tableur similaire, puis recherchez la colonne Description de l'erreur.

Si le rapport d'erreur contient des messages électroniques qui ont généré des erreurs temporaires, utilisez l'identifiant RFC 822 de chaque message pour retrouver ces messages lorsque vous effectuerez à nouveau votre recherche. Le format de l'opérateur de recherche est rfc822msgid:identifiant.

Prêt à vous lancer ?

Exporter les résultats d'une recherche

Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?