Wytyczne i materiały referencyjne dotyczące tabel

Nazwy i lokalizacja tabel

Zbiorczy eksport danych Search Console powoduje utworzenie w projekcie BigQuery tych tabel:

Nazwa zbioru danych: searchconsole (można go dostosować, więc podczas konfiguracji Ty lub inna osoba możecie wybrać inną nazwę).

Lista tabel:

Zbiorcze eksportowanie danych: tabele i wskazówki – szkolenie z Google Search Console

Harmonogram zapisywania tabel

Search Console eksportuje dane zbiorcze raz dziennie, ale niekoniecznie o tej samej porze w przypadku poszczególnych tabel.

Jeśli Search Console napotka tymczasowy błąd, np. problem z połączeniem, będzie ponawiać próby eksportu bez żadnych powiadomień.

Jeśli podczas próby zapisu wystąpi błąd trwały (np. błąd dotyczący braku uprawnień), Search Console spróbuje wyeksportować tabelę ponownie dopiero następnego dnia – zgodnie z harmonogramem. Search Console będzie ponawiać próby eksportu danych z brakującego dnia przez około tydzień, a potem ich zaprzestanie. Jeśli np. Search Console spróbuje zapisać dane z pierwszego dnia, ale napotka błąd uwierzytelniania, który zostanie naprawiony dopiero dziewiątego dnia, dane z pierwszego i drugiego dnia nie zostaną wyeksportowane, ale po odzyskaniu dostępu w dniu dziewiątym usługa uwzględni dane z pozostałych dni.

Jeśli zapisane dane będą wymagać korekty z powodu błędu podczas przetwarzania, który został już naprawiony, wprowadzenie wszystkich zmian będzie miało charakter atomowy, co oznacza, że Search Console zaktualizuje wszystkie dane z tego dnia w jednym zatwierdzeniu. Naprawianie starych danych zdarza się rzadko i nie powoduje wysłania e-maila, ale zostaje odnotowane w dzienniku eksportu.

Search Console gromadzi dane w sposób przyrostowy, co prowadzi do powtarzania kluczy w wierszach tabel. Dane te nie są kompresowane przed wyeksportowaniem do tabel. Dlatego praktycznie zawsze należy agregować wszystkie dane.

Czas przechowywania danych

Podobnie jak partycje, tabele są domyślnie przechowywane na stałe zgodnie z globalnymi ustawieniami domyślnymi określonymi przez organizację lub projekt Google Cloud.

Aby uniknąć gromadzenia danych w nieskończoność, zalecamy ustawienie daty wygaśnięcia partycji po upływie określonego czasu: po miesiącu, 6 miesiącach, 12 miesiącach lub innym okresie w zależności od Twoich potrzeb oraz ilości gromadzonych danych. Podanie daty ważności całej tabeli nie jest zalecanym rozwiązaniem, ponieważ powoduje usunięcie wszystkich danych.

Schemat tabeli

Oto schemat tabel wyeksportowanych z Search Console. Wszystkie tabele mają prefiks <identyfikator_Twojego_projektu>.searchconsole.

Tabela searchdata_site_impression

Ta tabela zawiera dane agregowane według usługi. Tabela obejmuje te pola:

  • data_date: dzień wygenerowania danych w określonym wierszu (czas pacyficzny).
  • site_url: URL usługi. W przypadku usług na poziomie domeny będzie to sc-domain:nazwa-usługi. W przypadku usług z prefiksami URL będzie to pełny adres URL definicji usługi. Przykłady: sc-domain:developers.google.com, https://developers.google.com/webmaster-tools/
  • query: zapytanie użytkownika. Jeśli parametr is_anonymized_query ma wartość prawda, ciąg znaków będzie miał długość zero. 
  • is_anonymized_query: tą wartością logiczną są oznaczane rzadkie zapytania (nazywane zapytaniami zanonimizowanymi). Jeśli prywatność użytkowników, którzy korzystają z danego zapytania, ma być chroniona, pole zapytania ma wartość null.
  • country: kraj, z którego wysłano zapytanie, w formacie ISO-3166-1-Alpha-3.
  • search_type: jedna z tych wartości w postaci ciągu znaków:
    • web: domyślna karta („Wszystko”) w wyszukiwarce Google.
    • image: karta „Grafika” w wyszukiwarce Google.
    • video: karta „Wideo” w wyszukiwarce Google.
    • news: karta „Wiadomości” w wyszukiwarce Google.
    • discover: wyniki na kartach Discover.
    • googleNews: news.google.com i aplikacja Wiadomości Google na Androida i iOS.
  • device: urządzenie, z którego wysłano zapytanie.
  • impressions: liczba wyświetleń w danym wierszu.
  • clicks: liczba kliknięć w danym wierszu.
  • sum_top_position: wartość sumaryczna najwyższej pozycji witryny w wynikach wyszukiwania dla każdego wyświetlenia w danym wierszu tabeli, gdzie zero to najwyższa pozycja w wynikach wyszukiwania. Aby obliczyć średnią pozycję (w numeracji od 1), należy wykonać działanie SUM(sum_top_position)/SUM(impressions) + 1.

Tabela searchdata_url_impression

Ta tabela zawiera dane agregowane według adresu URL. Tabela obejmuje te pola:

  • data_date: jak wyżej.
  • site_url: jak wyżej.
  • url: pełny adres URL strony, na którą użytkownik trafia po kliknięciu wyniku wyszukiwania lub relacji w Discover.
  • query: jak wyżej.
  • is_anonymized_query: jak wyżej.
  • is_anonymized_discover: określa, czy wiersz danych nie przekracza progu anonimizacji na kartach Discover. Poniżej progu niektóre pola (takie jak URL i country) nie będą widoczne, co pozwala chronić prywatność użytkowników.
  • country: jak wyżej.
  • search_type: jak wyżej.
  • device: jak wyżej.
  • is_[search_appearance_type]: jest kilka pól wartości logicznej, które służą do oznaczania typu wyglądu w wyszukiwarce, np. is_amp_top_stories, is_job_listing i is_job_details. Jeśli w przypadku konkretnego wyniku z elementami rozszerzonymi pojawia się określony wiersz, pole ma wartość prawda.
  • impressionsjak wyżej.
  • clicksjak wyżej.
  • sum_position: liczba w numeracji od zera, która wskazuje najwyższą pozycję danego adresu URL w wynikach wyszukiwania dla danego zapytania. (Zero to najwyższa pozycja w wynikach). Aby obliczyć średnią pozycję (w numeracji od 1), należy wykonać działanie SUM(sum_position)/SUM(impressions) + 1.

Tabela ExportLog

Jest to rekord danych zapisanych w danym dniu. Nieudane operacje eksportu nie są tu rejestrowane. Dowiedz się więcej o błędach śledzenia. Tabela obejmuje te pola:

  • agenda: typ zapisanych danych. Obecnie jedyna wartość to SEARCHDATA.
  • namespace: tabela, w której dane zostały zapisane. Search Console zazwyczaj eksportuje dane oddzielnie do każdej tabeli, więc na każdy dzień przypadają zwykle 2 wiersze eksportu.
  • data_date: data kliknięcia lub wyświetlenia podana w czasie pacyficznym. Jest to data partycji używana przez tabele.
  • epoch_version: liczba całkowita, przy czym 0 to pierwszy zapis danych w konkretnej tabeli w określonym dniu. W rzadkich przypadkach, gdy Search Console musi się cofnąć i skorygować poprzednie dane, np. z powodu anomalii, po każdej aktualizacji danych w określonej tabeli w konkretnym dniu ta wartość zwiększa się o 1.
  • publish_time: godzina zakończenia eksportu podana w czasie pacyficznym.

Czy to było pomocne?

Jak możemy ją poprawić?

Potrzebujesz dodatkowej pomocy?

Wykonaj te czynności:

Szukaj
Wyczyść wyszukiwanie
Zamknij wyszukiwanie
Menu główne
10197348318778970873
true
Wyszukaj w Centrum pomocy
true
true
true
true
true
83844
false
false