Nazwy i lokalizacja tabel
Zbiorczy eksport danych Search Console powoduje utworzenie w projekcie BigQuery tych tabel:
Nazwa zbioru danych: searchconsole
(można go dostosować, więc podczas konfiguracji Ty lub inna osoba możecie wybrać inną nazwę).
Lista tabel:
- searchdata_site_impression: zawiera dane o skuteczności Twojej usługi zagregowane według usługi.
- searchdata_url_impression: zawiera dane o skuteczności usługi zagregowane według adresu URL.
- ExportLog: zawiera informacje o każdym udanym eksporcie do jednej z wymienionych powyżej tabel danych. Pamiętaj, że Search Console zwykle eksportuje dane do tych tabel oddzielnie. Nieudane próby eksportu nie są tu rejestrowane.
Zbiorcze eksportowanie danych: tabele i wskazówki – szkolenie z Google Search Console
Harmonogram zapisywania tabel
Search Console eksportuje dane zbiorcze raz dziennie, ale niekoniecznie o tej samej porze w przypadku poszczególnych tabel.
Jeśli Search Console napotka tymczasowy błąd, np. problem z połączeniem, będzie ponawiać próby eksportu bez żadnych powiadomień.
Jeśli podczas próby zapisu wystąpi błąd trwały (np. błąd dotyczący braku uprawnień), Search Console spróbuje wyeksportować tabelę ponownie dopiero następnego dnia – zgodnie z harmonogramem. Search Console będzie ponawiać próby eksportu danych z brakującego dnia przez około tydzień, a potem ich zaprzestanie. Jeśli np. Search Console spróbuje zapisać dane z pierwszego dnia, ale napotka błąd uwierzytelniania, który zostanie naprawiony dopiero dziewiątego dnia, dane z pierwszego i drugiego dnia nie zostaną wyeksportowane, ale po odzyskaniu dostępu w dniu dziewiątym usługa uwzględni dane z pozostałych dni.
Jeśli zapisane dane będą wymagać korekty z powodu błędu podczas przetwarzania, który został już naprawiony, wprowadzenie wszystkich zmian będzie miało charakter atomowy, co oznacza, że Search Console zaktualizuje wszystkie dane z tego dnia w jednym zatwierdzeniu. Naprawianie starych danych zdarza się rzadko i nie powoduje wysłania e-maila, ale zostaje odnotowane w dzienniku eksportu.
Search Console gromadzi dane w sposób przyrostowy, co prowadzi do powtarzania kluczy w wierszach tabel. Dane te nie są kompresowane przed wyeksportowaniem do tabel. Dlatego praktycznie zawsze należy agregować wszystkie dane.
Czas przechowywania danych
Podobnie jak partycje, tabele są domyślnie przechowywane na stałe zgodnie z globalnymi ustawieniami domyślnymi określonymi przez organizację lub projekt Google Cloud.
Aby uniknąć gromadzenia danych w nieskończoność, zalecamy ustawienie daty wygaśnięcia partycji po upływie określonego czasu: po miesiącu, 6 miesiącach, 12 miesiącach lub innym okresie w zależności od Twoich potrzeb oraz ilości gromadzonych danych. Podanie daty ważności całej tabeli nie jest zalecanym rozwiązaniem, ponieważ powoduje usunięcie wszystkich danych.
Schemat tabeli
Oto schemat tabel wyeksportowanych z Search Console. Wszystkie tabele mają prefiks <identyfikator_Twojego_projektu>.searchconsole
.
Tabela searchdata_site_impression
Ta tabela zawiera dane agregowane według usługi. Tabela obejmuje te pola:
- data_date: dzień wygenerowania danych w określonym wierszu (czas pacyficzny).
- site_url: URL usługi. W przypadku usług na poziomie domeny będzie to sc-domain:nazwa-usługi. W przypadku usług z prefiksami URL będzie to pełny adres URL definicji usługi. Przykłady: sc-domain:developers.google.com, https://developers.google.com/webmaster-tools/
- query: zapytanie użytkownika. Jeśli parametr is_anonymized_query ma wartość prawda, ciąg znaków będzie miał długość zero.
- is_anonymized_query: tą wartością logiczną są oznaczane rzadkie zapytania (nazywane zapytaniami zanonimizowanymi). Jeśli prywatność użytkowników, którzy korzystają z danego zapytania, ma być chroniona, pole zapytania ma wartość null.
- country: kraj, z którego wysłano zapytanie, w formacie ISO-3166-1-Alpha-3.
- search_type: jedna z tych wartości w postaci ciągu znaków:
- web: domyślna karta („Wszystko”) w wyszukiwarce Google.
- image: karta „Grafika” w wyszukiwarce Google.
- video: karta „Wideo” w wyszukiwarce Google.
- news: karta „Wiadomości” w wyszukiwarce Google.
- discover: wyniki na kartach Discover.
- googleNews: news.google.com i aplikacja Wiadomości Google na Androida i iOS.
- device: urządzenie, z którego wysłano zapytanie.
- impressions: liczba wyświetleń w danym wierszu.
- clicks: liczba kliknięć w danym wierszu.
- sum_top_position: wartość sumaryczna najwyższej pozycji witryny w wynikach wyszukiwania dla każdego wyświetlenia w danym wierszu tabeli, gdzie zero to najwyższa pozycja w wynikach wyszukiwania. Aby obliczyć średnią pozycję (w numeracji od 1), należy wykonać działanie
SUM(sum_top_position)/SUM(impressions) + 1
.
Tabela searchdata_url_impression
Ta tabela zawiera dane agregowane według adresu URL. Tabela obejmuje te pola:
- data_date: jak wyżej.
- site_url: jak wyżej.
- url: pełny adres URL strony, na którą użytkownik trafia po kliknięciu wyniku wyszukiwania lub relacji w Discover.
- query: jak wyżej.
- is_anonymized_query: jak wyżej.
- is_anonymized_discover: określa, czy wiersz danych nie przekracza progu anonimizacji na kartach Discover. Poniżej progu niektóre pola (takie jak URL i country) nie będą widoczne, co pozwala chronić prywatność użytkowników.
- country: jak wyżej.
- search_type: jak wyżej.
- device: jak wyżej.
- is_[search_appearance_type]: jest kilka pól wartości logicznej, które służą do oznaczania typu wyglądu w wyszukiwarce, np. is_amp_top_stories, is_job_listing i is_job_details. Jeśli w przypadku konkretnego wyniku z elementami rozszerzonymi pojawia się określony wiersz, pole ma wartość prawda.
- impressions: jak wyżej.
- clicks: jak wyżej.
- sum_position: liczba w numeracji od zera, która wskazuje najwyższą pozycję danego adresu URL w wynikach wyszukiwania dla danego zapytania. (Zero to najwyższa pozycja w wynikach). Aby obliczyć średnią pozycję (w numeracji od 1), należy wykonać działanie
SUM(sum_position)/SUM(impressions) + 1
.
Tabela ExportLog
Jest to rekord danych zapisanych w danym dniu. Nieudane operacje eksportu nie są tu rejestrowane. Dowiedz się więcej o błędach śledzenia. Tabela obejmuje te pola:
- agenda: typ zapisanych danych. Obecnie jedyna wartość to SEARCHDATA.
- namespace: tabela, w której dane zostały zapisane. Search Console zazwyczaj eksportuje dane oddzielnie do każdej tabeli, więc na każdy dzień przypadają zwykle 2 wiersze eksportu.
- data_date: data kliknięcia lub wyświetlenia podana w czasie pacyficznym. Jest to data partycji używana przez tabele.
- epoch_version: liczba całkowita, przy czym 0 to pierwszy zapis danych w konkretnej tabeli w określonym dniu. W rzadkich przypadkach, gdy Search Console musi się cofnąć i skorygować poprzednie dane, np. z powodu anomalii, po każdej aktualizacji danych w określonej tabeli w konkretnym dniu ta wartość zwiększa się o 1.
- publish_time: godzina zakończenia eksportu podana w czasie pacyficznym.