Revisar archivos de exportación de Vault

Una vez que has usado Google Vault para buscar los datos que quieres, puedes exportarlos para analizarlos más a fondo. El archivo de exportación contiene los siguientes datos:

  • Una copia de todos los datos que cumplen los criterios de búsqueda que has especificado.
  • Los metadatos que necesitas para vincular los datos exportados a usuarios concretos de tu organización.
  • Información que corrobore que los datos exportados coinciden con los almacenados en los servidores de Google.

Consulta cómo funcionan las exportaciones en los siguientes servicios:

Exportaciones de Gmail, Chat y Grupos

Contenido de la exportación
Información Nombre de archivo Descripción
Contenido de los mensajes nombre_de_exportacion-N.zip

Archivos ZIP con archivos PST o mbox, que incluyen el contenido y los detalles de los mensajes exportados. En los mensajes de Google Chat, se indica el momento en que el remitente ha modificado o eliminado un mensaje.

Puede que te encuentres con muchos archivos ZIP en los siguientes casos:

  • La exportación incluye mensajes de más de una cuenta.
  • El tamaño de los archivos PST es superior a 1 GB o el de los archivos mbox es superior a 10 GB.

Para distinguir los archivos, al final de su nombre se incluye un número asignado de manera secuencial.

Revisión de mensajes

Una vez extraído el archivo ZIP, la forma de revisar y procesar los mensajes depende del tipo de archivo del que se trate:

  • PST: se revisan con Microsoft Outlook o con determinados sistemas de asistencia en caso de litigio.

  • mbox: se revisan con Mozilla Thunderbird, un editor de texto o con determinados sistemas de asistencia en caso de litigio que incluyen herramientas para convertir correos en archivos mbox.

Nota: Google no ofrece asistencia técnica para configurar productos de terceros. GOOGLE NO ASUME RESPONSABILIDAD ALGUNA EN LO QUE RESPECTA A PRODUCTOS DE TERCEROS. Consulta el sitio web del producto en cuestión para comprobar la configuración e información de asistencia más recientes.

Información de pertenencia a Grupos de Google nombre_de_exportacion-group-membership.csv

Un archivo CSV que incluye la siguiente información sobre cada miembro del grupo:

  • Sus direcciones de correo electrónico
  • La dirección de correo electrónico del grupo
  • La fecha en que el usuario se unió al grupo
  • Su rol dentro del grupo: MEMBER si es miembro, MANAGER si es administrador u OWNER si es propietario
  • El tipo de cuenta: USER si es una cuenta de usuario individual o GROUP si es una dirección de correo de grupo
Metadatos de mensajes nombre_de_exportación-metadata.xml

Un archivo XML que contiene los metadatos de los mensajes tal como están almacenados en los servidores de Google. Este archivo se puede abrir en un editor de texto para conectar los metadatos de los mensajes con el contenido de los mensajes del archivo mbox.

Nota: El contenido del archivo PST no se puede asociar a los metadatos del archivo XML.

Cuentas y recuento de mensajes nombre_de_exportación-results-count.csv Un archivo CSV que contiene las cuentas de los propietarios de los mensajes incluidos en la exportación, junto con el número de mensajes que pertenece a cada cuenta.
Informes de errores

error.csv

nombre_de_exportacion-account-exceptions.csv (exportaciones de Gmail)

nombre_de_exportacion-failed-group-membership-lookups.csv (exportaciones de Grupos)

Los informes de errores solo se incluyen si se producen errores durante la exportación.

  • error.csv: muestra los errores producidos al obtener mensajes. Más información
  • nombre_de_exportacion-account-exceptions.csv: muestra las cuentas de Gmail en las que se ha hecho la búsqueda, pero de las que no se han exportado todos los mensajes coincidentes.
  • nombre_de_exportacion-failed-group-membership-lookups.csv: muestra las direcciones de correo de grupo en las que se ha hecho la búsqueda, pero de las que no se han exportado todos los miembros.
Sumas de comprobación del archivo File checksums Este archivo contiene los valores de hash de Message Digest 5 (MD5) de todos los archivos incluidos en la exportación.
Revisar mensajes desde clientes de correo electrónico

Puedes revisar mensajes de Gmail y Chat desde Microsoft Outlook (PST) o Mozilla Thunderbird (mbox). Ambas herramientas son útiles para ver mensajes HTML y los archivos adjuntos que no se pueden ver en editores de texto.

Los archivos PST y mbox contienen los detalles de los mensajes exportados. El archivo de metadatos, por su parte, incluye los metadatos de los mensajes tal como se han registrado en Google. Puedes asociar el contenido de los archivos mbox y los metadatos de los mensajes para vincular los mensajes almacenados en los servidores de Google con los datos que exportas de Vault.

Nota: Las etiquetas con las que se clasifican los mensajes en Gmail no se convierten en carpetas del buzón de correo, sino que cuando abres un archivo PST o mbox en un cliente de correo, todos los mensajes se muestran en una misma carpeta.

Para revisar los mensajes exportados en un cliente de correo, sigue estos pasos:

  1. Importa y revisa mensajes en tu aplicación de correo electrónico.
  2. Revisa las cabeceras de los mensajes importantes siguiendo estos pasos:
    • Outlook: consulta la documentación de Microsoft sobre cómo ver los encabezados de los mensajes correspondientes a tu versión.
    • Thunderbird: haz clic en Ver > Cabeceras > Todas para mostrar las cabeceras de los mensajes:
  3. En Thunderbird, cada cabecera incluye un ID de mensaje. Para asociar un mensaje a los datos almacenados en los servidores de Google, compara los ID de mensaje con los del archivo de metadatos.
Revisar los archivos mbox en un editor de texto

El formato mbox es un estándar de almacenamiento de mensajes. Un archivo de este formato contiene toda la información de los mensajes exportados, incluidos el texto y todos los archivos adjuntos. El archivo de metadatos, por su parte, incluye los metadatos de los mensajes tal como se han registrado en Google. Combinar la información de estos archivos te permite relacionar los mensajes almacenados en los servidores de Google con los datos que has exportado de Vault.

Después de la exportación, con los parámetros de los mensajes del archivo de metadatos puedes identificar los mensajes correspondientes del archivo mbox. Para empezar, abre el archivo de metadatos en un editor de texto y busca el parámetro FileName. Por ejemplo:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Este parámetro incluye un identificador único y se corresponde con una entrada similar en el archivo mbox, denominada línea From_. La línea From_ contiene el mismo identificador, así como la fecha y la hora en que se recibió el mensaje en Google, en formato UTC; por ejemplo:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

La línea From_ es la primera entrada de cada mensaje que se incluye en el archivo mbox. Por tanto, siempre que llegues a una línea From_ nueva, estarás viendo otro mensaje.

Parámetros de los mensajes del archivo de metadatos

El archivo de metadatos contiene la siguiente información:

En los mensajes de Gmail y Grupos

  • #From: muestra la cuenta de correo del remitente.
  • #To: muestra las cuentas de correo de todos los destinatarios.
  • #CC: muestra las cuentas de correo de todos los destinatarios en copia.
  • #BCC: muestra las cuentas de correo de todos los destinatarios en Cco.
  • #Subject: muestra el asunto.
  • #DateSent: muestra la marca de tiempo de su envío.
  • #DateReceived: muestra la marca de tiempo de su recepción.

En los mensajes de la versión clásica de Hangouts y de Chat

  • #SubjectAtStart (solo en la versión clásica de Hangouts): muestra el asunto de la conversación a la que se envió el primer mensaje.
  • #SubjectAtEnd (solo en la versión clásica de Hangouts): muestra el asunto de la conversación a la que se envió el último mensaje.
  • #DateFirstMessageSent: muestra la marca de tiempo que indica cuándo se envió el primer mensaje de una conversación.
  • #DateLastMessageSent: muestra la marca de tiempo que indica cuándo se envió el último mensaje de una conversación.
  • #DateFirstMessageReceived: muestra la marca de tiempo que indica cuándo se recibió el primer mensaje de una conversación.
  • #DateLastMessageReceived: muestra la marca de tiempo que indica cuándo se recibió el último mensaje de una conversación.

En todos los mensajes (Gmail, Grupos y Chat)

  • Labels: muestra las etiquetas aplicadas por Gmail o Chat, como ^INBOX, ^TRASH o ^DELETED, además de todas las etiquetas aplicadas al mensaje por los usuarios.
  • FileName: muestra el identificador del mensaje, que puedes asociar al ID de mensaje que se muestra en los archivos mbox o PST exportados.
  • FileSize: muestra su tamaño, expresado en bytes.
  • Hash: muestra su hash de MD5.

En los mensajes de Chat (no en los de la versión clásica de Hangouts)

  • RoomID: muestra el identificador de la sala, del grupo de chat o del MD al que pertenecen.
  • Participants: muestra las direcciones de correo de todos los usuarios que han participado en la conversación.
  • RoomName: el valor depende del tipo de mensaje:
    • Si se trata de una sala, se indica el nombre de la sala.
    • Si se trata de chats de grupo creados a partir de principios de diciembre del 2020, se indica Group chat.
    • Si se trata de chats de grupo creados antes de principios de diciembre del 2020 o de mensajes directos, se proporciona una lista separada por comas con las cuentas que han participado en los chats o mensajes.
  • ConversationType: muestra el tipo de mensaje:
    • Si se trata de chats de grupo creados a partir de principios de diciembre del 2020 o de una sala, el valor es Room.
    • Si se trata de chats de grupo creados antes de diciembre del 2020, el valor es Group Direct Message.
    • Si se trata de mensajes directos, el valor es 1:1 Direct Message.

Parámetros de consulta de toda la exportación

  • UserQuery: muestra la consulta enviada por el usuario de Vault que obtuvo los mensajes incluidos en la exportación.
  • TimeZone: muestra la zona horaria que se ha aplicado al hacer búsquedas por fechas.
  • Custodians: muestra las direcciones de correo de las cuentas de usuario que se han buscado. Si has buscado contenido en lugar de cuentas de usuario concretas, no aparecerá ningún valor.

Exportaciones de Drive

Contenido de la exportación
Información Nombre de archivo Descripción
Archivos nombre_de_exportación_N.zip

Contiene todos los archivos que se han encontrado en la búsqueda. Vault exporta hasta 10 GB de datos en un único archivo comprimido. Si exportas más de 10 GB de datos, Vault crea varios archivos.

El nombre de cada archivo exportado está formado por su nombre original seguido de un guion bajo ("_") y del ID de archivo de Drive.

Los archivos de Google exportados se convierten de esta forma:

  • Los Documentos de Google pasan a ser archivos DOCX.
  • Las Hojas de cálculo de Google pasan a ser archivos XLSX.
  • Los Formularios de Google pasan a ser archivos ZIP (HTML y CSV).
  • Las Presentaciones de Google pasan a ser archivos PPTX.
  • Los Dibujos de Google pasan a ser archivos PDF.
Metadatos de archivos nombre_de_exportación-metadata.xml

Contiene metadatos, entre los que se incluyen los siguientes:

  • IDs de documentos (estos ID no son los ID de archivo de Drive, sino valores del archivo CSV)
  • Direcciones de correo electrónico de usuarios
  • Fechas de creación y de modificación de cada archivo
  • Tipos de documentos y sus títulos

Más información

Cuentas e IDs de documentos nombre_de_exportación-custodian-docid.csv Muestra las cuentas de usuario con sus ID de documento asociados. Con esta información puedes determinar qué usuarios tienen acceso a los archivos exportados.
Informes de errores

error.csv

nombre_de_exportación-incomplete-accounts.csv

Los informes de errores solo se incluyen si se producen errores durante la exportación.

  • error.csv: muestra los errores detectados al obtener los archivos y sus metadatos. Más información
  • nombre_de_exportación-incomplete-accounts.csv: se muestran las cuentas en las que se han hecho búsquedas, pero de las que no se han exportado todos los archivos coincidentes.
Sumas de comprobación del archivo File checksums Este archivo contiene los valores de hash de Message Digest 5 (MD5) de todos los archivos incluidos en la exportación.
Parámetros de archivos del archivo de metadatos

El archivo de metadatos que se incluye en la exportación consta de los siguientes metadatos:

En todos los archivos

  • #Author: muestra la dirección de correo del usuario al que pertenece el archivo en Drive. Si el archivo está en una unidad compartida, se indica el nombre de la unidad.
  • Collaborators: muestra las cuentas y los grupos que tienen permiso directo para editar el archivo o añadirle comentarios. Si eliges la opción correspondiente durante la exportación, también incluirá a los usuarios que tengan acceso indirecto al archivo.
  • Viewers: muestra las cuentas y los grupos que tienen permiso directo para ver el archivo. Si eliges la opción correspondiente durante la exportación, también incluirá a los usuarios que tengan acceso indirecto al archivo.
  • Others: muestra las cuentas de tu consulta que pueden acceder al archivo de forma indirecta si has optado por excluir la información de nivel de acceso durante la exportación. También puede incluir usuarios para los que Vault no pudo determinar el nivel de permiso en el momento de la exportación.
  • #DateCreated: si es un archivo de Google, muestra la fecha en que se creó en Drive; si no lo es, muestra la fecha en que se subió a Drive.
  • #DateModified: muestra la fecha en que se modificó el archivo por última vez.
  • #Title: muestra el nombre de archivo que le ha dado el usuario. Como algunos sistemas operativos no pueden descomprimir los archivos ZIP con nombres excesivamente largos, Vault los reduce a 128 caracteres durante la exportación. El valor que se muestra en la etiqueta #Title no se trunca.
  • DocumentType: muestra el tipo de archivo de los archivos de Google. Los posibles valores son DOCUMENT (Documento), SPREADSHEET (Hoja de cálculo), PRESENTATION (Presentación), FORM (Formulario) y DRAWING (Dibujo).
  • SharedDriveID: muestra el identificador de la unidad compartida que contiene el archivo (si procede).
  • SourceHash: muestra el hash único de cada una de las versiones del archivo. Con este valor, se pueden anular los duplicados de exportaciones de archivos y verificar que los archivos exportados sean una copia exacta de los originales. Solo es compatible con archivos de Documentos, Hojas de cálculo y Presentaciones de Google.

Parámetros de consulta de toda la exportación

  • UserQuery: muestra la consulta enviada por el usuario de Vault que obtuvo los archivos incluidos en la exportación.
  • TimeZone: muestra la zona horaria que se ha aplicado al hacer búsquedas por fechas.
  • Custodians: muestra las direcciones de correo de las cuentas de usuario que se han buscado. Si has buscado contenido en lugar de cuentas de usuario concretas, no aparecerá ningún valor.
Exportar la información de nivel de acceso de los usuarios que tienen acceso indirecto a los archivos

Al exportar archivos de Drive, el archivo de metadatos puede incluir información de los usuarios de tu organización que tengan acceso indirecto a un archivo que cumpla tus criterios de búsqueda y que hayan abierto.

Un usuario puede tener acceso indirecto cuando un archivo o la carpeta que lo contiene cumple alguna de estas condiciones:

  • Se comparte con un grupo al que pertenece el usuario.
  • Se comparte con el dominio.
  • Se comparte públicamente.

Durante la exportación, puedes elegir la información que quieres incluir en los metadatos extraídos.

  • En el cuadro de diálogo de exportación, marca la casilla correspondiente para que Vault determine el nivel de permiso de los usuarios de tu dominio que tengan acceso indirecto a los archivos. Cuando abres el archivo de metadatos, cada uno de estos usuarios se incluye en una de estas categorías:

    • Collaborators: usuarios que tienen permiso indirecto para editar o añadir comentarios a un archivo.
    • Viewers: usuarios que tienen permiso indirecto para ver un archivo.
    • Others: en algunas circunstancias, Vault no puede determinar el tipo de acceso que tiene un usuario en el momento de la exportación. Esta situación puede darse, por ejemplo, si un archivo se comparte con un grupo del que más tarde se elimina al usuario.

    Vault necesita tiempo para determinar qué permisos tienen estos usuarios, por lo que esta opción puede incrementar el tiempo de preparación de los archivos que se van a descargar.

  • En el cuadro de diálogo de exportación, deja desmarcada la casilla para excluir la información de nivel de acceso de los usuarios de tu dominio con acceso indirecto a los archivos. Esta casilla está desmarcada de forma predeterminada. Estos usuarios aparecen en la categoría Others del archivo de metadatos.

Exportaciones de Google Voice

Contenido de la exportación
Información Nombre de archivo Descripción
Archivos de datos de Voice nombre_de_exportacion-N.zip Por cada cuenta se genera un archivo zip que contiene archivos PST o mbox de conversaciones de texto, registros de llamadas, archivos de audio en MP3 del buzón de voz y transcripciones de mensajes de voz.
Metadatos de archivos nombre_de_exportación-metadata.xml Un archivo XML que contiene los metadatos tal como están almacenados en los servidores de Google.
Sumas de comprobación del archivo File checksums Un archivo de suma de comprobación que contiene los valores de hash de Message Digest 5 (MD5) de todos los archivos incluidos en la exportación.
Informe de errores

error.csv

Los informes de errores solo se incluyen si se producen errores durante la exportación. Más información

Nota: A diferencia de otros servicios, las exportaciones de Voice no incluyen ningún archivo de recuento.

Parámetros de datos de Voice del archivo de metadatos

El archivo de metadatos contiene la siguiente información:

Información sobre cada archivo

  • DocID: identificador único del archivo.
  • #Author: la dirección de correo electrónico de la cuenta a la que pertenece el archivo en Drive.
  • #DateFirstMessageSent: en el caso de las conversaciones de texto, la fecha en que se envió el primer mensaje. Nota: Este campo y los tres siguientes muestran la misma información en las entradas de los mensajes de voz y de los registros de llamadas.
  • #DateLastMessageSent: en el caso de las conversaciones de texto, la fecha en que se envió el último mensaje.
  • #DateFirstMessageReceived: en el caso de las conversaciones de texto, la fecha en que se recibió el primer mensaje.
  • #DateLastMessageReceived: en el caso de las conversaciones de texto, la fecha en que se recibió el último mensaje.
  • ConversationType: el tipo de datos:
    • TEXT_MESSAGE: mensaje de texto.
    • VOICEMAIL: mensaje de voz.
    • INCOMING_CALL: registro de una llamada entrante.
    • OUTGOING_CALL: registro de una llamada realizada.
    • MISSED_CALL: registro de una llamada entrante no respondida.
  • ParticipantPhoneNumbers: los números de teléfono de los participantes.
  • OwnerPhoneNumbers: este valor puede incluir varios números de teléfono si el usuario ha cambiado de número.
  • Labels: cualquier etiqueta de la conversación. Por ejemplo, las conversaciones eliminadas tienen la etiqueta DELETED.
  • ExternalFile FileName: el identificador de archivo, que se corresponde con el asunto del archivo PST o mbox.

Parámetros de consulta de toda la exportación

  • UserQuery: la consulta enviada por el administrador de Vault.
  • TimeZone: la zona horaria de la consulta.
  • Custodians: las direcciones de correo electrónico de las cuentas que se han buscado.

Informes de errores (error.csv)

Cuando Vault no puede exportar datos de un servicio, genera un informe de errores (error.csv), que incluye los elementos que tienen errores de exportación, junto con información adicional y metadatos.

En Vault se pueden registrar dos tipos de errores:

  • Errores transitorios: un servidor backend no ha podido obtener un correo electrónico o un archivo. El elemento en cuestión debería poderse exportar cuando lo busques pasado un tiempo.
  • Errores no transitorios: todos los errores que no se etiquetan explícitamente como transitorios son consecuencia de un problema que no se puede corregir. Habitualmente, estos errores se producen cuando un archivo adjunto a un mensaje o un archivo se han eliminado, no admiten la exportación o no se pueden convertir al formato solicitado.

Para averiguar si el problema es o no transitorio, abre el archivo CSV con Hojas de cálculo de Google o con otra aplicación de hojas de cálculo y localiza la columna Error Description (Descripción del error). Nota: En las exportaciones de Voice no aparecen descripciones de errores. Si el error es transitorio, consulta las soluciones para errores transitorios.

Contenido del informe de errores

Contenido del informe de errores de Gmail y Grupos

El informe de errores contiene los siguientes campos sobre cada mensaje. Si los datos de algún campo no están disponibles o no proceden, el campo aparecerá en blanco.

Campo

Descripción
Document ID Muestra el identificador único del archivo.
Document type Muestra el tipo de documento (su valor es mail).
File type

Muestra el tipo de archivo (su valor es mail).

Attachments count Muestra el número de archivos adjuntos que incluye el mensaje.
Attachment names Muestra los nombres de los archivos adjuntos.
Subject El asunto del mensaje.
Size Muestra el tamaño el mensaje.
From Muestra la cuenta de correo del remitente.
To Muestra las cuentas de correo de todos los destinatarios.
Cc Muestra las cuentas de correo de todos los destinatarios en copia.
Sent time Muestra la marca de tiempo de su envío.
Source account Muestra la cuenta incluida en la consulta de búsqueda.
Error description Muestra una descripción del error.
RFC 822 Message-ID

Muestra el identificador único de un mensaje que añaden los servidores de correo.

Ejemplo: rfc822msgid:AANLkTilQ5MWSp7-iE6SKepvOl-
Spjupgr1NZTiLGu16Z@mail.solarmora.com

 

Contenido del informe de errores de Chat

El informe de errores contiene los siguientes campos sobre cada mensaje. Si los datos de algún campo no están disponibles o no proceden, el campo aparecerá en blanco.

Campo

Descripción
Document ID Muestra el identificador único del archivo.
Filename Muestra el tipo de documento (su valor es mail).
Conversation Type

Muestra el tipo de mensaje (su valor es mail).

Room Name Muestra el nombre de la sala.
Error description Muestra una descripción del error.

 

Contenido del informe de errores de archivos de Drive
El informe de errores contiene los siguientes campos sobre cada archivo. Si los datos de algún campo no están disponibles o no proceden, el campo aparecerá en blanco.
Campo Descripción
Document ID Muestra el identificador único del archivo.
Document type Muestra el tipo de archivo de Google que es. Los posibles valores son DOCUMENT (Documento), SPREADSHEET (Hoja de cálculo), PRESENTATION (Presentación), FORM (Formulario) y DRAWING (Dibujo).
File type Muestra el formato del archivo (como PDF o XLSX).
Title Muestra el nombre de archivo que le ha dado el usuario.
Size Muestra el tamaño del archivo.
Creator Muestra la dirección de correo del usuario al que pertenece el archivo en Drive. Si el archivo está en una unidad compartida, se indica el nombre de la unidad.
Collaborators Muestra las cuentas y los grupos que tienen permiso directo para editar el archivo o añadirle comentarios. Si eliges la opción correspondiente durante la exportación, también incluirá a los usuarios que tengan acceso indirecto al archivo.
Viewers Muestra las cuentas y los grupos que tienen permiso directo para ver el archivo. Si eliges la opción correspondiente durante la exportación, también incluirá a los usuarios que tengan acceso indirecto al archivo.
Others Muestra las cuentas de tu consulta que tienen acceso indirecto al archivo si has optado por excluir la información de nivel de acceso durante la exportación. También puede incluir usuarios para los que Vault no pudo determinar el nivel de permiso en el momento de la exportación.
Creation time Si es un archivo de Google, muestra la fecha en que se creó en Drive; si no lo es, muestra la fecha en que se subió a Drive.
Last modified time Muestra la fecha en que se modificó el archivo por última vez.
Error description Muestra una descripción del error.
Drive Document ID Muestra el identificador único del archivo en Drive.

 

Contenido del informe de errores de datos de Voice

En el informe de errores se indican las cuentas que se han buscado, pero de las que no se han exportado todos los archivos coincidentes.

Campo Descripción
Account Muestra la dirección de correo de la cuenta en la que se han producido errores.
Failed Conversation Count Muestra el número de conversaciones que no se han exportado. Si se desconoce el número, su valor es Unknown Failure Count (recuento de fallos desconocido).

Soluciones para errores transitorios

Con los detalles de los mensajes y los archivos, puedes buscar y exportar los datos que no se hayan exportado debido a errores transitorios:

  • Si el informe de errores incluye mensajes con errores transitorios, el identificador RFC 822 de cada mensaje te permitirá encontrarlos cuando vuelvas a hacer la búsqueda. El formato del término de búsqueda es rfc822msgid:identificador.
  • Si el informe de errores incluye archivos de Drive con errores transitorios, el título de cada archivo te permitirá encontrarlos cuando vuelvas a hacer la búsqueda. El formato del término de búsqueda es title:"título-del-archivo".
¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?