Jak działa eksportowanie w Vault

Po wyszukaniu potrzebnych danych w Vault można je wyeksportować do dalszej analizy. Funkcja eksportowania w Google Vault pozwala:

  • pobrać pełną kopię wszystkich danych spełniających kryteria wyszukiwania;
  • uzyskać metadane potrzebne do powiązania wyeksportowanych danych z poszczególnymi użytkownikami w domenie;
  • uzyskać informacje potwierdzające, że wyeksportowane dane są zgodne z danymi zapisanymi na serwerach Google.

Dowiedz się, jak korzystać z wyeksportowanych danych w obsługiwanych usługach:

Dane wyeksportowane z Gmaila, Google Chat i Grup dyskusyjnych

Gdy Vault zakończy eksportowanie, możesz pobrać te elementy:

  • Plik ZIP zawierający pliki PST lub MBOX – pliki te zawierają szczegóły i treść wyeksportowanych wiadomości. Po rozpakowaniu archiwum ZIP możesz otworzyć wiadomości w następujących programach:

    • PST – Microsoft Outlook. Jeśli eksport obejmuje wiadomości z kilku kont lub rozmiar pliku przekracza 1 GB, możesz mieć kilka plików PST.

    • MBOX – w programie Mozilla Thunderbird lub edytorze tekstu.Jeśli eksport obejmuje wiadomości z kilku kont lub rozmiar pliku przekracza 10 GB, możesz mieć kilka plików MBOX.

    • W wybranych systemach do obsługi postępowań sądowych. Niektóre z tych systemów pozwalają otwierać pliki PST i zawierają narzędzia do konwersji e-maili z plików mbox.  

Uwaga: Google nie oferuje pomocy technicznej związanej z konfigurowaniem usług innych firm. GOOGLE NIE PONOSI ODPOWIEDZIALNOŚCI ZA USŁUGI INNYCH FIRM. Najnowsze informacje na temat konfiguracji i pomocy znajdziesz na stronach poświęconych poszczególnym usługom.

  • Plik XMLzawiera metadane wiadomości istniejące na serwerach Google. Otwórz ten plik w edytorze tekstu i użyj go, aby połączyć metadane wiadomości z treścią wiadomości znajdującą się w pliku mbox.Zawartości pliku PST nie można skorelować z metadanymi pliku XML.
  • Plik CSV zawiera adresy właścicieli wiadomości uwzględnionych podczas eksportowania wraz z liczbą wiadomości, które należą do każdego z użytkowników.
  • Raport o błędach – dołączany tylko w przypadku wystąpienia błędów.
  • Plik sum kontrolnych zawiera wartości skrótów MD5 pozostałych plików.
Przeglądanie wiadomości w kliencie poczty e-mail

Wiadomości Gmaila i Google Chat możesz przeglądać w programie Microsoft Outlook (PST) lub Mozilla Thunderbird (mbox). Ta metoda przydaje się do przeglądania wiadomości HTML i załączników, których nie może wyświetlić edytor tekstu.

Pliki PST i mbox zawierają wszystkie szczegóły wyeksportowanych wiadomości Gmaila i Google Chat. Plik XML z Vault zawiera metadane wiadomości w postaci, w jakiej są zapisane w Google. Możesz skorelować zawartość pliku mbox i metadane wiadomości, by skojarzyć wiadomości zapisane na serwerach Google z danymi wyeksportowanymi z Vault.

Uwaga: etykiety używane w Gmailu do klasyfikowania wiadomości nie są konwertowane na foldery skrzynki pocztowej. Gdy otworzysz plik PST lub mbox w kliencie poczty e-mail, wszystkie wiadomości będą w jednym folderze.

Aby przejrzeć wyeksportowane wiadomości w kliencie poczty e-mail:

  1. Zaimportuj wiadomości i przejrzyj je w aplikacji do obsługi poczty e-mail. 
  2. W przypadku wiadomości, które są istotne dla sprawy, wyświetl nagłówki:
    • Outlook – zależnie od używanej wersji. Zobacz dokumentację firmy Microsoft na temat wyświetlania nagłówków wiadomości.  
    • Thunderbird – kliknij Widok > Pokazuj nagłówki > Wszystkie, aby wyświetlić nagłówki wszystkich wiadomości:
  3. W programie Thunderbird każdy nagłówek zawiera identyfikator wiadomości. Aby skorelować wiadomości z danymi przechowywanymi na serwerach Google, porównaj identyfikatory wiadomości z metadanymi w pliku XML.
Przeglądanie plików MBOX w edytorze tekstu

Plik mbox jest standardowym formatem przechowywania wiadomości. Zawiera wszystkie szczegóły wyeksportowanych wiadomości (w tym ich tekst i wszystkie załączniki). Plik XML z Vault zawiera metadane wiadomości w postaci, w jakiej są zapisane w Google. Razem te pliki pozwalają skojarzyć wiadomości zapisane na serwerach Google z danymi wyeksportowanymi z Vault.

Po wyeksportowaniu danych możesz użyć parametrów wiadomości znajdujących się w pliku XML z Vault do określenia odpowiadających im e-maili w pliku mbox. Na początek otwórz plik XML w edytorze tekstu i znajdź parametr FileName, na przykład:

<ExternalFile FileName='1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox'

Ten parametr zawiera unikatowy identyfikator i odpowiada podobnemu wpisowi w pliku mbox, który jest nazywany wierszem From_. Wiersz From_ zawiera taki sam identyfikator oraz datę i godzinę (w czasie UTC) odebrania wiadomości przez Google, na przykład:

From 1463030154355209614-d7f2c19a-73f3-40e4-a17a-130b90c37aac.mbox@xxx Wed Mar 19 06:38:02 2014

Wiersz From_ to pierwszy wiersz każdej wiadomości w pliku mbox. Jeśli napotkasz nowy wiersz From_, to znaczy, że patrzysz na inną wiadomość.

Parametry Gmaila i Google Chat w pliku XML z Vault

Plik XML wyeksportowany z Vault zawiera te metadane:

Dla każdej wiadomości Gmaila

  • #From
  • #To
  • #CC
  • #BCC
  • #Subject
  • #DateSent
  • #DateReceived

Dla każdej wiadomości Google Chat

  • #SubjectAtStart – (tylko w klasycznej wersji Hangouts)
  • #SubjectAtEnd – (tylko w klasycznej wersji Hangouts)
  • #DateFirstMessageSent
  • #DateLastMessageSent
  • #DateFirstMessageReceived
  • #DateLastMessageReceived

Dla wszystkich wiadomości Gmaila i Google Chat

  • Labels – określa etykiety zastosowane przez Gmaila, takie jak ^INBOX, ^TRASH i ^DELETED, a także etykiety zastosowane do wiadomości przez użytkownika.
  • FileName – określa identyfikator wiadomości, który możesz skojarzyć z identyfikatorem wiadomości wyświetlanym w wyeksportowanym pliku PST lub MBOX.

Dla wiadomości z Google Chat

  • RoomID – identyfikator pokoju lub czatu, do którego należy dana rozmowa.
  • Participants – określa adresy e-mail wszystkich użytkowników, którzy brali udział w danej rozmowie.
  • roomName – wyświetla nazwę pokoju lub listę rozdzielonych przecinkami kont uczestniczących w czacie.
  • conversationType – informuje o tym, czy rozmowa pochodzi z pokoju czy z czatu.

Parametry zapytania obsługiwane w całym eksporcie

  • UserQuery – określa zapytanie, które zostało wysłane przez użytkownika Vault, aby pobrać wiadomości znajdujące się w tym eksporcie.
  • TimeZone – określa strefę czasową w wyszukiwaniach na podstawie dat.
  • Custodians – określa adresy e-mail użytkowników wyszukiwanych kont. Jeśli wyszukiwana była treść, a nie poszczególne konta użytkowników, nie są tu wyświetlane żadne adresy.

Dane wyeksportowane z Dysku

Gdy Vault zakończy przetwarzanie eksportu, możesz pobrać takie pliki:

  • Skompresowany plik – zawiera wszystkie pliki znalezione podczas wyszukiwania. Vault eksportuje maksymalnie 10 GB danych w jednym skompresowanym pliku. Jeśli wyeksportujesz więcej niż 10 GB danych, utworzonych zostanie więcej plików. 
  • Plik XML – zawiera metadane, w tym:
    • Identyfikatory dokumentów (uwaga: nie są to identyfikatory plików na Dysku; odpowiadają one wartościom w pliku CSV).
    • Adresy e-mail użytkowników.
    • Daty utworzenia i modyfikacji poszczególnych plików.
    • Typy i nazwy dokumentów.
  • Plik CSV – mapuje identyfikatory dokumentów na konta użytkowników. Dzięki tym informacjom możesz określić, którzy użytkownicy mają dostęp do eksportowanych plików.
  • W przypadku wystąpienia błędów dołączany jest też raport na ich temat.
  • Plik sum kontrolnych – zawiera wartości skrótów MD5 pozostałych plików.

Wyeksportowane pliki mają takie same nazwy, jak oryginalne pliki, z dodanym na początku znakiem podkreślenia (_) oraz identyfikatorem pliku na Dysku.

Eksportowane pliki są konwertowane w ten sposób:

Typ pliku na Dysku Wyeksportowany format
Dokumenty Google .docx
Arkusze Google .xlsx
Formularze Google .zip (.html i .csv)
Prezentacje Google .pptx
Rysunki Google .pdf
Pliki w formacie innym niż Google Oryginalny format (nie ulega zmianie)

 

Parametry plików w pliku XML z Vault

Wyeksportowany plik XML zawiera następujące metadane każdego pliku:

Dla każdego pliku

  • #Author – określa adres e-mail osoby będącej właścicielem pliku na Dysku. W przypadku pliku na dysku współdzielonym ten parametr określa nazwę dysku współdzielonego.
  • Collaborators – określa konta i grupy, które mają bezpośrednie uprawnienia do edytowania pliku lub dodawania komentarzy. Jeśli wybierzesz odpowiednią opcję podczas eksportowania, w tych metadanych znajdziesz też konta użytkowników, którzy mają pośredni dostęp do pliku.
  • Viewers – określa konta i grupy, które mają bezpośrednie uprawnienia do wyświetlania pliku. Jeśli wybierzesz odpowiednią opcję podczas eksportowania, w tych metadanych znajdziesz też konta użytkowników, którzy mają pośredni dostęp do pliku.
  • Others – jeśli podczas eksportu wykluczysz informacje o poziomie dostępu, określa konta z wyników wyszukiwania, które mają pośredni dostęp do pliku. Może też obejmować konta użytkowników, których poziomu dostępu nie udało się zidentyfikować w czasie eksportowania.
  • #DateCreated – określa datę utworzenia pliku. W przypadku plików spoza usług Google wskazuje również datę przesłania pliku na Dysk.
  • #DateModified – określa datę ostatniej modyfikacji pliku.
  • #Title – określa nazwę pliku podaną przez użytkownika. W niektórych systemach operacyjnych nie można rozpakować plików ZIP zawierających pliki z bardzo długimi nazwami, dlatego podczas eksportowania Vault skraca nazwy plików do 128 znaków. Wartość tagu #Title nie jest skracana i zawiera pełną nazwę pliku.
  • DocumentType – określa typ plików Google. Dostępne wartości to DOCUMENT, SPREADSHEET, PRESENTATION, FORM i DRAWING (dokument, arkusz kalkulacyjny, prezentacja, formularz i rysunek).
  • SharedDriveID – określa identyfikator dysku współdzielonego zawierającego plik (jeśli ma zastosowanie).
  • SourceHash – niepowtarzalna wartość hash dla każdej wersji pliku. Za jej pomocą można usuwać duplikaty wyeksportowanych plików i sprawdzać, czy wyeksportowany plik jest dokładną kopią pliku źródłowego. Działa tylko w przypadku plików Dokumentów, Arkuszy i Prezentacji Google.

Parametry zapytania obsługiwane w całym eksporcie

  • UserQuery – określa zapytanie, które zostało wysłane przez użytkownika Vault, aby pobrać pliki znajdujące się w tym eksporcie.
  • TimeZone – określa strefę czasową w wyszukiwaniach na podstawie dat.
  • Custodians – określa adresy e-mail użytkowników wyszukiwanych kont. Jeśli wyszukiwana była treść, a nie poszczególne konta użytkowników, nie są tu wyświetlane żadne adresy.
Eksportowanie informacji o poziomie dostępu kont użytkowników, którzy mają pośredni dostęp do plików

Gdy eksportujesz pliki z Dysku, Vault może dołączyć metadane na temat pasujących do kryteriów wyszukiwania kont użytkowników z Twojej domeny, którzy mają pośredni dostęp do pliku i otworzyli go.

Użytkownik może mieć pośredni dostęp, gdy plik lub zawierający go folder jest:

  • udostępniony grupie, do której użytkownik należy;
  • udostępniony w domenie; 
  • udostępniony publicznie.

Podczas eksportowania możesz wybrać informacje, które chcesz uwzględnić w wygenerowanych metadanych:

  • W oknie dialogowym eksportowania zaznacz odpowiednie pole wyboru, jeśli Vault ma określić poziom uprawnień użytkowników w domenie, którzy mają pośredni dostęp do plików. W wynikowym pliku XML każde z kont takich użytkowników jest uwzględnione w jednej z tych kategorii:

    • Collaborators – użytkownicy z pośrednimi uprawnieniami do edytowania i komentowania pliku.

    • Viewers – użytkownicy z pośrednimi uprawnieniami do wyświetlania pliku.

    • Others – w niektórych sytuacjach podczas eksportowania Vault nie jest w stanie określić poziomu dostępu użytkownika. Może się tak zdarzyć, jeśli na przykład plik został udostępniony grupie, z której następnie użytkownik został usunięty.

    Vault potrzebuje więcej czasu, aby określić uprawnienia takich użytkowników, więc zaznaczenie tej opcji może wydłużyć czas potrzebny na wygenerowanie plików do pobrania.

  • W oknie eksportowania pozostaw odznaczone odpowiednie pole wyboru (ustawienie domyślne), aby wykluczyć informacje o poziomie dostępu użytkowników z domeny, którzy mają pośredni dostęp do plików. Konta takich użytkowników są wymienione w pliku XML w sekcji Others

Dane wyeksportowane z Google Voice

Gdy Vault przetworzy eksport danych z Google Voice, możesz pobrać te elementy:

  • Dla każdego konta generowany jest plik ZIP zawierający pliki PST lub mbox z wątkami SMS-ów, rejestrami połączeń, plikami audio MP3 poczty głosowej i transkrypcjami wiadomości głosowych.
  • Plik XML zawierający metadane istniejące na serwerach Google.
  • Plik sum kontrolnych z wartościami skrótów MD5 dla wszystkich plików objętych eksportem.
  • W przypadku wystąpienia błędów dołączany jest raport na ich temat. Raport o błędach to plik CSV z dwiema kolumnami:
    1. Konto – adres e-mail konta, dla którego nie wyeksportowano niektórych danych.
    2. Liczba wątków zakończonych błędem – liczba wątków, które nie zostały wyeksportowane. Jeśli liczba jest nieznana, wartość to Nieznana liczba błędów.

Uwaga: w odróżnieniu od innych usług eksporty z Voice nie zawierają pliku z liczbą.

Parametry danych Voice w pliku XML z Vault

Zawarty w eksporcie plik XML z Vault zawiera te metadane:

Informacje o poszczególnych plikach

  • DocID – unikalny identyfikator pliku.
  • #Author – adres e-mail konta będącego właścicielem pliku na Dysku.
  • #DateFirstMessageSent – w przypadku wątków SMS-ów jest to data wysłania pierwszej wiadomości. Uwaga: to i trzy kolejne pola są identyczne we wpisach dotyczących poczty głosowej i rejestrów połączeń.
  • #DateLastMessageSent – w przypadku wątków SMS-ów jest to data wysłania ostatniej wiadomości. 
  • #DateFirstMessageReceived – w przypadku wątków SMS-ów jest to data otrzymania pierwszej wiadomości. 
  • #DateLastMessageReceived – w przypadku wątków SMS-ów jest to data otrzymania ostatniej wiadomości. 
  • ConversationType – typ danych:
    • TEXT_MESSAGE – SMS.
    • VOICEMAIL – wiadomość głosowa.
    • INCOMING_CALL – rejestr połączeń przychodzących.
    • OUTGOING_CALL – rejestr połączeń wychodzących.
    • MISSED_CALL – rejestr nieodebranych połączeń przychodzących.
  • ParticipantPhoneNumbers – numery telefonów uczestników.
  • OwnerPhoneNumbers – w przypadku zmiany numeru użytkownika ta wartość może zawierać wiele numerów telefonu.
  • Labels – wszystkie etykiety w wątku. Na przykład usunięte wątki mają etykietę DELETED.
  • ExternalFile FileName – identyfikator pliku, który jest powiązany z tematem w pliku PST lub mbox.

Parametry zapytania obsługiwane w całym eksporcie

  • UserQuery – zapytanie przesłane przez administratora Vault.
  • TimeZone – strefa czasowa zapytania
  • Custodians – adresy e-mail wyszukiwanych kont.

Raporty o błędach

Czasami Vault nie może wyeksportować e-maila z Gmaila lub pliku z Dysku. Wtedy generowany jest raport o błędzie. Raport w pliku CSV zawiera listę elementów z błędami eksportowania oraz dodatkowymi informacjami i metadanymi. Możesz napotkać dwa rodzaje błędów:

  • Błędy przejściowe – serwer zaplecza nie może pobrać e-maila lub pliku. Element powinien być dostępny do eksportu, gdy go później wyszukasz.
  • Błędy trwałe – każdy błąd, który nie jest oznaczony jako przejściowy, jest wynikiem problemu, którego nie da się naprawić. Takie błędy występują zazwyczaj wtedy, gdy załącznik wiadomości albo plik został usunięty, nie można go wyeksportować lub nie może być przekonwertowany na odpowiedni format.

Aby określić, czy problem jest przejściowy czy trwały, otwórz plik CSV w Arkuszach Google (lub podobnej aplikacji do obsługi arkuszy kalkulacyjnych) i znajdź kolumnę Opis błędu.

Jeśli raport o błędach zawiera e-maile z błędami przejściowymi, użyj ich identyfikatorów RFC 822, aby znaleźć te wiadomości przy kolejnym wyszukiwaniu. Format operatora wyszukiwania to rfc822msgid:identyfikator.

Chcesz zacząć?

Eksportowanie wyników wyszukiwania

Czy to było pomocne?
Jak możemy ją poprawić?