Cómo funcionan las exportaciones de Vault

Una vez que Vault encuentra los mensajes o los archivos que necesitas, puedes exportarlos para analizarlos con más detalle. Las funciones de exportación de Vault se han diseñado para proporcionarte:

  • Una copia de todos los datos que cumplen los criterios de búsqueda que has especificado.
  • Los metadatos que necesitas para enlazar los datos exportados con usuarios concretos de tu dominio.
  • Información que corrobore que los datos exportados coinciden con los almacenados en los servidores de Google.

Exportaciones de Gmail, chat y Grupos

Una vez que Vault termina de procesar una exportación, puedes descargar los siguientes elementos:

  • Un archivo ZIP con archivos PSTmbox: estos archivos contienen los detalles y el contenido de los mensajes exportados. Una vez extraído el contenido del archivo ZIP, puedes abrir los mensajes con las siguientes herramientas:

    • PST: se abren con Microsoft Outlook. Si la exportación incluye mensajes de más de una cuenta o si el tamaño de archivo es superior a 1 GB, es posible que se hayan generado varios archivos PST.

    • mbox: se abren con Mozilla Thunderbird o con un editor de texto. Si la exportación incluye mensajes de más de una cuenta o si el tamaño de archivo es superior a 10 GB, es posible que se hayan generado varios archivos mbox.

    • Algunos sistemas de apoyo en caso de litigio: algunos de estos sistemas pueden abrir archivos PST o incluyen herramientas de conversión de correo electrónico para abrir archivos mbox.  

Nota: Google no ofrece asistencia técnica para configurar productos de terceros. GOOGLE NO ASUME RESPONSABILIDAD ALGUNA EN LO QUE RESPECTA A PRODUCTOS DE TERCEROS. Consulta el sitio web del producto en cuestión para comprobar la configuración e información de asistencia más recientes.

  • Un archivo XML que contiene los metadatos de los mensajes tal como están almacenados en los servidores de Google. Abre este archivo en un editor de texto y utilízalo para conectar los metadatos de los mensajes con el contenido de los mensajes del archivo mbox. El contenido del archivo PST no se puede asociar a los metadatos del archivo XML.
  • Un archivo CSV que contiene las direcciones de los propietarios de los mensajes incluidos en la exportación, junto con el número de mensajes que tiene cada usuario.
  • Un informe de errores (en el caso de que haya errores).
  • Un archivo de suma de comprobación que contiene parámetros hash de Message Digests 5 (MD5) de los archivos anteriores.
Revisar mensajes desde clientes de correo electrónico

Puedes revisar mensajes de Gmail y chat desde Microsoft Outlook (PST) o Mozilla Thunderbird (mbox). Ambas herramientas son útiles para ver los mensajes HTML y los archivos adjuntos que no se pueden ver en editores de texto.

Los archivos PST y mbox contienen los detalles de los mensajes de Gmail y chat exportados. El archivo XML que proporciona Vault, por su parte, incluye los metadatos de los mensajes tal como se han registrado en Google. Puedes asociar el contenido de los archivos mbox y los metadatos de los mensajes para vincular los mensajes almacenados en los servidores de Google con los datos que has exportado de Vault.

Nota: Las etiquetas con las que se clasifican los mensajes en Gmail no se convierten en carpetas del buzón de correo, sino que cuando abres un archivo PST o mbox en un cliente de correo, todos los mensajes se muestran en una misma carpeta.

Para revisar los mensajes exportados en un cliente de correo, sigue estos pasos:

  1. Importa y revisa mensajes en tu aplicación de correo electrónico.
  2. Examina las cabeceras de los mensajes importantes siguiendo estos pasos:
    • Outlook: el proceso es diferente según la versión. Para saber dónde encontrar las cabeceras de los mensajes, consulta la documentación de Microsoft correspondiente.  
    • Thunderbird: haz clic en Ver > Cabeceras > Todas para mostrar las cabeceras de todos los mensajes:
  3. En Thunderbird, cada cabecera incluye un ID de mensaje. Para asociar un mensaje a los datos almacenados en los servidores de Google, compara los ID de mensaje con los metadatos del archivo XML.
Revisar los archivos mbox en un editor de texto

El formato mbox es un estándar de almacenamiento de mensajes. Un archivo de este formato contiene toda la información de los mensajes exportados, incluidos el texto y todos los archivos adjuntos. El archivo XML que proporciona Vault, por su parte, incluye los metadatos de los mensajes tal como se han registrado en Google. Juntos, estos archivos sirven para vincular los mensajes almacenados en los servidores de Google con los datos que has exportado de Vault.

Después de la exportación, utiliza los parámetros de los mensajes del archivo XML de Vault para identificar los mensajes correspondientes en el archivo mbox. Para comenzar, abre el archivo XML en un editor de texto y busca el parámetro FileName; por ejemplo:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Este parámetro incluye un identificador único y se corresponde con una entrada similar en el archivo mbox, denominada línea From_. La línea From_ contiene el mismo identificador, así como la fecha y la hora en que se recibió el mensaje en Google, en formato UTC; por ejemplo:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

La línea From_ es la primera entrada de cada mensaje que se incluye en el archivo mbox. Por tanto, siempre que llegues a una línea From_ nueva, verás un mensaje diferente.

Parámetros de Gmail y chat que aparecen en el archivo XML de Vault

El archivo XML de Vault que se incluye en la exportación contiene los siguientes metadatos:

En todos los mensajes de Gmail

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

En todos los mensajes de chat

  • #SubjectAtStart (solo en la versión clásica de Hangouts)
  • #SubjectAtEnd (solo en la versión clásica de Hangouts)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

En los mensajes de chat y Gmail

  • Labels: muestra las etiquetas que ha añadido Gmail al mensaje, como ^INBOX, ^TRASH y ^DELETED, así como todas las que haya aplicado el usuario.
  • FileName: muestra el identificador del mensaje, que puedes asociar al ID de mensaje que se muestra en los archivos mbox o PST exportados. 

En los mensajes de Google Chat

  • RoomID: muestra el identificador de sala o de mensaje directo al que pertenece una conversación.
  • Participants: muestra las direcciones de correo electrónico de todos los usuarios que han participado en la conversación.
  • roomName: muestra el nombre de la sala o una lista con elementos separados por comas de las cuentas que han participado en una conversación de mensajes directos determinada.
  • conversationType: indica si se trata de una conversación de sala o de mensajes directos.

Parámetros de consulta de toda la exportación

  • UserQuery: muestra la consulta enviada por el usuario de Vault que recuperó los mensajes incluidos en esta exportación.
  • TimeZone: muestra la zona horaria que se ha utilizado para realizar búsquedas por fechas.
  • Custodians: muestra las direcciones de correo electrónico de las cuentas de usuario que se buscaron. Si has buscado contenido en lugar de cuentas de usuario individuales, no aparecerá ningún valor.

Exportaciones de Drive

Una vez que Vault haya terminado de procesar una exportación, podrás descargar los siguientes archivos:

  • Un archivo comprimido: contiene todos los archivos que se han encontrado en la búsqueda. Vault exporta hasta 10 GB de datos en un único archivo comprimido. Si exportas más de 10 GB de datos, Vault crea varios archivos. 
  • Un archivo XML: contiene metadatos, entre los que se incluyen:
    • IDs de documentos (estos no son los ID de archivo de Drive, sino valores del archivo CSV)
    • Direcciones de correo electrónico de usuarios
    • Fechas de creación y de modificación de cada archivo
    • Tipos de documentos y títulos
  • Un archivo CSV: asocia IDs de documentos a cuentas de usuario. Utiliza esta información para determinar qué usuarios tienen acceso a los archivos exportados.
  • También se incluye un informe de errores, si los hay.
  • Un archivo de suma de comprobación: contiene los valores MD5 de los archivos anteriores.

El nombre de cada archivo exportado se compone de su nombre original seguido de un guion bajo ("_") y del ID de archivo de Drive.

Los archivos exportados se convierten de esta forma:

Tipo de archivo de Drive Formato de exportación
Documentos de Google .docx
Hojas de cálculo de Google .xlsx
Formularios de Google .zip (.html y .csv)
Presentaciones de Google .pptx
Dibujos de Google .pdf
Otros tipos de archivos que no sean de Google Sin cambio de formato

 

Parámetros del archivo XML de Vault

El archivo XML que se incluye en la exportación consta de los siguientes metadatos:

En todos los archivos

  • #Author: muestra la dirección de correo electrónico del usuario al que pertenece el archivo de Drive. Si el archivo está en una unidad compartida, también se indica el nombre de la unidad.
  • Collaborators: muestra las cuentas y los grupos que tienen permiso directo para editar el archivo o añadir comentarios. Si eliges la opción correspondiente durante la exportación, también incluirá a los usuarios con acceso indirecto al archivo.
  • Viewers: muestra las cuentas y los grupos que tienen permiso directo para ver el archivo. Si eliges la opción correspondiente durante la exportación, también incluirá a los usuarios con acceso indirecto al archivo.
  • Others: muestra las cuentas de tu consulta que tienen acceso indirecto al archivo si has optado por excluir la información de nivel de acceso durante la exportación. También puede incluir a los usuarios cuyos niveles de permiso Vault no pudo determinar en el momento de la exportación.
  • #DateCreated: si el archivo es de Google, muestra la fecha en la que se creó en Drive. Si no lo es, muestra la fecha en la que se subió a Drive.
  • #DateModified: muestra la fecha en que se modificó el archivo por última vez.
  • #Title: muestra el nombre que el usuario ha dado al archivo. Como algunos sistemas operativos no pueden descomprimir los archivos ZIP con nombres excesivamente largos, Vault los reduce a 128 caracteres durante la exportación. El valor que se muestra en la etiqueta #Title no se trunca.
  • DocumentType: indica el tipo de archivo de los archivos de Google. Los posibles valores son DOCUMENT (documento), SPREADSHEET (hoja de cálculo), PRESENTATION (presentación), FORM (formulario) y DRAWING (dibujo).
  • SharedDriveID: muestra el identificador de la unidad compartida que contiene el archivo (si procede).
  • SourceHash: muestra el hash único de cada versión de un archivo. Con este valor, se pueden anular los duplicados de exportaciones de archivos y verificar que los archivos exportados sean una copia exacta de los originales. Solo es compatible con archivos de Documentos, Hojas de cálculo y Presentaciones de Google.

Parámetros de consulta de toda la exportación

  • UserQuery: muestra la consulta enviada por el usuario de Vault que recuperó los archivos incluidos en la exportación.
  • TimeZone: muestra la zona horaria que se ha utilizado para realizar búsquedas por fechas.
  • Custodians: muestra las direcciones de correo electrónico de las cuentas de usuario que se buscaron. Si has buscado contenido en lugar de cuentas de usuario individuales, no aparecerá ningún valor.
Exportar la información de nivel de acceso de usuarios con acceso indirecto a los archivos

Al exportar archivos de Drive, Vault puede incluir metadatos de los usuarios de tu dominio que tengan acceso indirecto a un archivo que cumpla tus criterios de búsqueda y que lo hayan abierto.

Un usuario puede tener acceso indirecto cuando un archivo o una carpeta que contiene un archivo:

  • Se comparte con un grupo al que pertenece el usuario
  • Se comparte con el dominio
  • Se comparte públicamente

Durante la exportación, puedes elegir la información que quieres incluir en los metadatos:

  • En el cuadro de diálogo de exportación, marca la casilla correspondiente para que Vault determine el nivel de permiso de los usuarios de tu dominio que tengan acceso indirecto a los archivos. Cuando abres el archivo XML, cada uno de los usuarios se incluye en una de estas categorías:

    • Collaborators: usuarios que tienen permiso indirecto para editar o añadir comentarios a un archivo.

    • Viewers: usuarios que tienen permiso indirecto para ver un archivo.

    • Others: en algunas circunstancias, Vault no puede determinar el tipo de acceso que tiene un usuario en el momento de la exportación. Esta situación puede darse, por ejemplo, si un archivo se comparte con un grupo del que más tarde se elimina al usuario.

    Vault necesita tiempo para determinar qué permisos tienen estos usuarios, de modo que esta opción puede incrementar el tiempo de preparación de los archivos que se van a descargar.

  • En el cuadro de diálogo de exportación, deja desmarcada la casilla para excluir la información de nivel de acceso de los usuarios de tu dominio con acceso indirecto a los archivos. Esta casilla está desmarcada de forma predeterminada. Estos usuarios aparecen en la categoría Others del archivo XML.

Informes de errores

En algunos casos, Vault no puede exportar un mensaje de correo electrónico desde Gmail o un archivo desde Drive. Cuando esto ocurre, se genera un informe de errores. Este informe tiene formato de archivo CSV y en él se enumeran los elementos en los que se han producido errores durante la exportación, junto con otros detalles y metadatos. Se pueden producir dos tipos de errores:

  • Errores transitorios: un servidor backend no ha podido recuperar un correo electrónico o un archivo. El elemento en cuestión debería estar disponible para exportarse cuando lo busques pasado un tiempo.
  • Errores no transitorios: todos los errores que no se etiquetan explícitamente como transitorios son consecuencia de un problema que no se puede corregir. Habitualmente, estos errores se producen cuando un archivo adjunto a un mensaje o un archivo se han eliminado, no admiten la exportación o no se pueden convertir al formato solicitado.

Para averiguar si el problema es o no transitorio, abre el archivo CSV con Hojas de cálculo de Google (o con una aplicación de hojas de cálculo similar) y localiza la columna Error Description (Descripción del error).

Si el informe de errores incluye mensajes de correo electrónico con errores transitorios, utiliza el identificador RFC 822 de cada mensaje para encontrarlos cuando vuelvas a realizar la búsqueda. El formato del operador de búsqueda es rfc822msgid:identificador.

¿Empezamos?

Exportar resultados de búsqueda

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?