Mit Quellhash exportierte Drive-Dateien deduplizieren

Wenn Sie Google Docs-, Google Tabellen- und Google Präsentationen-Dateien aus Google Drive exportieren, enthält die XML-Metadatendatei den Quellhash der einzelnen Dateien. Der Quellhash dient als eindeutige Kennung für jede Dateiversion. So können Sie mehrere Exporte vergleichen und Dateien mit identischem Inhalt deduplizieren, bevor Sie sie analysieren.

Bei der Berechnung des Quellhashs wird das Änderungsdatum mit einbezogen. Das Änderungsdatum einer Datei wird aktualisiert, wenn sich ihr Inhalt ändert. Es wird aber auch durch inhaltsunabhängige Änderungen aktualisiert, z. B. bei Änderungen an den Freigabeberechtigungen. Zwei Versionen einer Datei können daher zwar unterschiedliche Quellhashes, aber denselben Inhalt haben.

War das hilfreich?
Wie können wir die Seite verbessern?