Utilizzare SourceHash per la deduplicazione dei file di Drive esportati

Quando crei un'esportazione di file di Documenti, Fogli e Presentazioni Google da Drive, il file di metadati XML include l'hash sorgente di ogni file. L'hash sorgente dovrebbe fornire un identificatore univoco per ogni versione dell'elemento, in modo da permetterti di confrontare più esportazioni e deduplicare i file con contenuti identici prima di analizzare gli elementi.

Nel calcolo dell'hash sorgente è inclusa la data di modifica. La data di modifica di un file viene aggiornata quando il contenuto del file cambia, ma può essere aggiornata anche a seguito di modifiche al file non correlate a modifiche del contenuto, ad esempio le modifiche alle autorizzazioni di condivisione. Pertanto, due versioni di un file possono avere hash sorgente diversi, ma uguale contenuto.

È stato utile?
Come possiamo migliorare l'articolo?