Funzionamento dell'esportazione in Vault

Dopo che Vault ha trovato i messaggi o i file di cui hai bisogno, puoi esportarli per ulteriori analisi. La funzionalità di esportazione di Google Vault è stata progettata per fornirti:

  • Un elenco completo di tutti i dati che corrispondono ai criteri di ricerca.
  • I metadati necessari per collegare i dati esportati ai singoli utenti del tuo dominio.
  • Le informazioni necessarie per dimostrare che i dati esportati corrispondono ai dati archiviati sui server di Google.

Esportazioni di Gmail, chat e Gruppi

Dopo che Vault ha completato l'elaborazione di un'esportazione, puoi scaricare i seguenti elementi:

  • Un file ZIP contenente file PST o mbox: questi file contengono i dettagli e i contenuti dei messaggi esportati. Dopo aver estratto il file ZIP puoi aprire i messaggi in:

    • PST: Microsoft Outlook. Potresti avere più file PST se l'esportazione include messaggi provenienti da più di un account o se le dimensioni del file superano 1 GB.

      Nota: Microsoft Outlook non supporta le etichette utilizzate da Gmail per classificare i messaggi. Quando apri un file PST in Outlook, tutti i messaggi vengono visualizzati nella Posta in arrivo. 
    • mbox: Mozilla Thunderbird o un editor di testo. Potresti avere più file mbox se l'esportazione include messaggi provenienti da più di un account o se le dimensioni del file superano 10 GB.

    • Alcuni sistemi di supporto per contenziosi. Alcuni di questi sistemi possono aprire i file PST o includono strumenti di conversione dell'email per i file mbox.  

Nota: Google non fornisce supporto tecnico per la configurazione dei prodotti di terze parti. GOOGLE NON SI ASSUME ALCUNA RESPONSABILITÀ PER I PRODOTTI DI TERZE PARTI. Consulta il sito web del prodotto per le informazioni più aggiornate sulla configurazione e l'assistenza.

  • Un file XML che contiene i metadati dei messaggi esistenti sui server di Google. Puoi aprire il file in un editor di testo e utilizzarlo per collegare i metadati del messaggio ai contenuti dello stesso dal file PST o mbox.
  • Un file CSV che contiene gli indirizzi dei proprietari dei messaggi inclusi nell'esportazione, insieme al numero di messaggi di proprietà di ciascun utente.
  • In caso di errori viene incluso anche il rapporto degli errori.
  • Un file di checksum che contiene i valori hash digest 5 (MD5) dei messaggi per i file elencati sopra.
Esaminare i messaggi in un client email

Puoi esaminare i messaggi di posta e di chat su Microsoft Outlook (PST) o Mozilla Thunderbird (mbox). Questo metodo è particolarmente utile per i messaggi e gli allegati HTML non visualizzabili mediante un editor di testo.

I file PST e mbox contengono tutti i dettagli dei messaggi di Gmail e di chat esportati. Il file XML di Vault contiene i metadati del messaggio così come sono stati registrati da Google. Insieme, questi file forniscono un collegamento tra i messaggi archiviati sui server di Google e i dati che hai esportato da Vault.

  1. Importa ed esamina i messaggi nella tua applicazione email. 
  2. Per visualizzare le intestazioni dei messaggi importanti, procedi come segue:
    • Outlook: le modalità cambiano a seconda della versione che utilizzi. Consulta la documentazione di Microsoft relativa alla visualizzazione delle intestazioni dei messaggi.  
    • Thunderbird: fai clic su Visualizza > Intestazioni > Tutte per vedere le intestazioni di ciascun messaggio:
  3. Ogni intestazione include un ID messaggio. Confronta gli ID messaggio con i metadati del file XML per stabilirne la correlazione ai dati archiviati sui server di Google.
Esaminare i file mbox in un editor di testo

Il file mbox è un formato standard per l'archiviazione dei messaggi e contiene tutti i dettagli relativi ai messaggi esportati, inclusi il testo e gli eventuali allegati. Il file XML di Vault contiene i metadati del messaggio così come sono stati registrati da Google. Insieme, questi file forniscono un collegamento tra i messaggi archiviati sui server di Google e i dati che hai esportato da Vault.

In seguito all'esportazione puoi utilizzare i parametri del messaggio contenuti nel file XML di Vault per identificare i messaggi corrispondenti nel file mbox. Per iniziare, apri il file XML in un editor di testo e cerca il parametro FileName, ad esempio:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Questo parametro contiene un identificatore univoco e corrisponde a una voce simile nel file mbox, denominata riga From_. La riga From_ contiene il medesimo identificatore, insieme alla data e all'ora (nel fuso orario UTC) di ricezione del messaggio da parte di Google, ad esempio:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

La riga From_ è la prima di ciascun messaggio incluso nel file mbox. Quando vedi una nuova riga From_, significa che si tratta di un messaggio diverso.

Parametri di Gmail e di chat esportati nel file XML di Vault

Il file XML di Vault incluso nell'esportazione contiene i seguenti metadati:

Inclusi in ogni messaggio di Gmail

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

Inclusi in ogni messaggio di chat

  • #SubjectAtStart - (solo versione classica di Hangouts)
  • #SubjectAtEnd - (solo versione classica di Hangouts)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

Inclusi nei messaggi di Gmail e di chat

  • Labels: mostra le etichette applicate da Gmail, ad esempio ^INBOX, ^TRASH e ^DELETED, nonché tutte le etichette applicate al messaggio dall'utente.
  • FileName: mostra l'identificatore del messaggio, che puoi rapportare all'ID messaggio visualizzato nel file PST o mbox esportato. 

Inclusi nei messaggi di Hangouts Chat

  • RoomID: mostra l'identificatore della stanza virtuale o del messaggio diretto a cui appartiene la conversazione.
  • Participants: mostra gli indirizzi email di tutti gli utenti che hanno partecipato alla conversazione.
  • roomName: mostra il nome della stanza virtuale o un elenco di account separati da virgole che hanno partecipato a un messaggio diretto.
  • conversationType: indica se la conversazione proviene da una stanza virtuale o da un messaggio diretto.

Parametri delle query per l'intera esportazione

  • UserQuery: mostra la query inviata dall'utente di Vault che ha recuperato i messaggi inclusi nell'esportazione.
  • TimeZone: mostra il fuso orario utilizzato per ricerche basate sulla data.
  • Custodians: mostra gli indirizzi email degli utenti i cui account sono oggetto della ricerca. Se hai cercato contenuti anziché singoli account utente, qui non sarà elencato alcun custodian (possessore).

Esportazioni di Drive

Dopo che Vault ha completato l'elaborazione di un'esportazione, puoi scaricare i seguenti file:

  • Un file compresso che contiene tutti i file restituiti dalla ricerca. Vault esporta fino a 10 GB di dati in un singolo file compresso. Se esporti più di 10 GB di dati, Vault crea più file. 
  • Un file XML che contiene metadati, tra cui:
    • ID documento. Nota: non si tratta degli ID dei file di Drive, bensì di ID che corrispondono ai valori contenuti nel file CSV.
    • Indirizzi email degli utenti
    • Date di creazione e modifica di ciascun file
    • Tipi e titoli di documenti
  • Un file CSV di mappatura degli ID dei documenti agli account utente. Questa informazione serve a determinare quali utenti hanno accesso ai file esportati.
  • In caso di errori viene incluso anche il rapporto degli errori.
  • Un file di checksum che contiene i valori MD5 per i file precedenti.

Ai file esportati viene assegnato il nome originale del file seguito da un trattino basso ("_") e dall'ID del file di Drive.

I file esportati vengono convertiti come segue:

Tipo di file Drive Formato esportato
Documenti Google .docx
Fogli Google .xlsx
Moduli Google .zip (.html e .csv)
Presentazioni Google .pptx
Disegni Google .pdf
File non Google Nessuna conversione di formato

 

Parametri file del file XML di Vault

Il file XML incluso nell'esportazione contiene i seguenti metadati:

Inclusi in ogni file

  • #Author: mostra l'indirizzo email del proprietario del file su Drive. Per un file di un Drive condiviso, mostra il nome del Drive condiviso.
  • Collaborators: mostra gli account e i gruppi con l'autorizzazione diretta a modificare il file o aggiungere commenti. Include anche gli utenti con accesso indiretto al file, se hai scelto questa opzione durante l'esportazione.
  • Viewers: mostra gli account e i gruppi con l'autorizzazione diretta a visualizzare il file. Include anche gli utenti con accesso indiretto al file, se hai scelto questa opzione durante l'esportazione.
  • Others: mostra gli account della query con accesso indiretto al file, se hai scelto di escludere le informazioni sul livello di accesso durante l'esportazione. Potrebbe includere anche gli utenti di cui Vault non è riuscito a determinare i livelli di autorizzazione al momento dell'esportazione.
  • #DateCreated: mostra la data di creazione di un file Google in Drive. Per i file non Google, indica la data in cui il file è stato caricato su Drive.
  • #DateModified: mostra la data dell'ultima modifica del file.
  • #Title: mostra il nome del file assegnato dall'utente. Poiché alcuni sistemi operativi non sono in grado di espandere i file zip con nomi molto lunghi, durante l'esportazione Vault ne tronca il nome a 128 caratteri. Il valore indicato dal tag #Title non viene troncato.
  • DocumentType: indica il tipo di file per i file Google. I valori possibili sono DOCUMENT, SPREADSHEET, PRESENTATION, FORM e DRAWING.
  • SharedDriveID: mostra l'identificatore del Drive condiviso che contiene il file (se applicabile).
  • SourceHash: valore hash univoco per ciascuna versione di un file. Può essere utilizzato per deduplicare le esportazioni di file e verificare che il file esportato sia una copia esatta del file di origine. Supportato solo dai file di Documenti, Fogli e Presentazioni Google.

Parametri delle query per l'intera esportazione

  • UserQuery: mostra la query inviata dall'utente di Vault che ha recuperato i file inclusi nell'esportazione.
  • TimeZone: mostra il fuso orario utilizzato per ricerche basate sulla data.
  • Custodians: mostra gli indirizzi email degli utenti i cui account sono oggetto della ricerca. Se hai cercato contenuti anziché singoli account utente, qui non sarà elencato alcun custodian (possessore).
Esportare le informazioni sul livello di accesso per gli utenti con accesso indiretto ai file

Quando esporti file da Drive, Vault potrebbe includere metadati per gli utenti del tuo dominio che dispongono dell'accesso indiretto e che hanno aperto un file che corrisponde ai tuoi criteri di ricerca.

Un utente può disporre dell'accesso indiretto quando un file (o una cartella contenente un file) è:

  • Condiviso con un gruppo di cui l'utente fa parte
  • Condiviso con il dominio 
  • Condiviso pubblicamente

Durante l'esportazione, hai la possibilità di scegliere il tipo di informazioni da includere nell'output dei metadati:

  • Nella finestra di dialogo di esportazione, seleziona la casella che consente a Vault di determinare il livello di autorizzazione degli utenti del dominio con accesso indiretto ai file. Quando apri il file XML, ciascuno di questi utenti sarà incluso in una delle categorie seguenti:

    • Collaborators: utenti con autorizzazione indiretta a modificare o aggiungere commenti a un file.

    • Viewers: utenti con autorizzazione indiretta a visualizzare un file.

    • Others: in alcune circostanze, Vault non può determinare il tipo di accesso di cui gli utenti dispongono al momento dell'esportazione. Questo può accadere, ad esempio, se un file è stato condiviso con un gruppo e se l'utente è stato successivamente rimosso dal gruppo.

    Vault ha bisogno di più tempo per determinare le autorizzazioni di tali utenti, pertanto questa opzione può comportare l'aumento del tempo necessario per preparare i file per il download.

  • Nella finestra di dialogo di esportazione, lascia deselezionata la casella (impostazione predefinita) per escludere le informazioni sul livello di accesso degli utenti del dominio con accesso indiretto ai file. Questi utenti sono elencati alla voce Others nel file XML. 

Rapporti degli errori

Può capitare che Vault non riesca a esportare un messaggio di posta da Gmail o un file da Drive. In questi casi viene generato un rapporto degli errori. Il rapporto, sotto forma di file .csv, elenca gli elementi con errori di esportazione, oltre a dettagli e metadati aggiuntivi. Ci sono due tipi di errori:

  • Errori temporanei: un server di backend non è stato in grado di recuperare il messaggio email o il file. L'elemento dovrebbe essere disponibile per l'esportazione se cercato in un secondo momento.
  • Errori non temporanei: gli errori vengono categorizzati come non temporanei (non-transient) quando un problema non può essere risolto. In genere questo accade quando l'allegato di un messaggio o un file è stato eliminato, non può essere esportato o non può essere convertito nel formato richiesto.

Per verificare se il problema è temporaneo o non temporaneo, apri il file .csv con Fogli Google (o con un'applicazione simile per fogli di lavoro) e cerca la colonna Error Description (Descrizione errore).

Se il rapporto degli errori include messaggi email con errori temporanei, puoi utilizzare l'identificatore RFC 822 di ciascun messaggio per ritrovarlo con una ricerca successiva. Il formato dell'operatore di ricerca è rfc822msgid:identifier.

Tutto pronto per iniziare?

Esportare i risultati di ricerca

È stato utile?
Come possiamo migliorare l'articolo?