Názvy a umístění tabulek
Hromadné exporty dat ze Search Console vytvoří v projektu BigQuery následující tabulky:
Název datové sady: searchconsole (lze přizpůsobit, takže jste při nastavování mohli vy nebo někdo jiný zvolit jiný název)
Seznam tabulek:
- searchdata_site_impression: Obsahuje data o výkonu služby agregovaná podle služby.
- searchdata_url_impression: Obsahuje data o výkonu služby agregovaná podle adres URL.
- ExportLog: Obsahuje informace o každém úspěšném exportu do jedné z předchozích datových tabulek. Search Console obvykle do těchto tabulek exportuje data samostatně. Neúspěšné pokusy o export zde nejsou zaznamenány.
Hromadné exporty dat: tabulky a tipy – školení Google Search Console
Plán ukládání tabulek
Search Console provádí hromadný export dat jednou denně, data pro jednotlivé tabulky však nutně nemusí exportovat ve stejnou dobu.
Pokud Search Console narazí na přechodnou chybu, například na problém s připojením, bude pokus opakovat, aniž by vygenerovala jakékoliv oznámení.
Pokud při pokusu o zápis dojde k nepřechodné chybě (například k chybě oprávnění), až do naplánovaného exportu pro další den se Search Console o export dané tabulky nebude pokoušet znovu. Data ze zmeškaného dne se Search Console bude pokoušet exportovat asi týden, poté se o jejich uložení přestane pokoušet. Pokud se například Search Console pokusí uložit data pro 1. den, ale narazí na chybu ověření, která bude opravena až 9. den, data pro 1. a 2. den nebudou exportována, ale data pro zbývající dny budou po obnovení přístupu 9. den zahrnuta.
Pokud Search Console kvůli dříve opravené chybě zpracování musí upravit dříve uložená data, všechny změny budou atomické. To znamená, že všechna data pro daný den budou aktualizována pomocí jedné operace commit. K opravám starých dat nedochází často a nebudete o nich informováni e‑mailem, ale budou uvedeny v protokolu exportů.
Data o výkonu shromažďuje Search Console inkrementálně, což vede k tomu, že se klíče v řádcích opakují. Tato data se před exportem do tabulek nekomprimují. Je proto vhodné vždy všechny metriky agregovat.
Doba uchovávání dat
Tabulky se ve výchozím nastavení stejně jako oddíly uchovávají neomezeně dlouho. Vztahuje se na ně však globální výchozí nastavení projektu Google Cloud a vaší organizace.
Pokud data nechcete hromadit neomezeně dlouho, doporučujeme nastavit vypršení platnosti oddílu po uplynutí přijatelné doby – měsíc, šest měsíců, dvanáct měsíců nebo po jiné době, která je pro vaše potřeby a množství dat přiměřená. Nastavení data konce platnosti pro celou tabulku pravděpodobně není žádoucí, protože tím smažete všechna data.
Schéma tabulek
Zde je schéma tabulek exportovaných ze Search Console. Všechny tabulky mají předponu <ID_projektu>.searchconsole.
Tabulka searchdata_site_impression
Tato tabulka obsahuje data agregovaná podle služby. Tabulka obsahuje následující pole:
- data_date: Den, kdy byla data v tomto řádku vygenerována (tichomořský čas).
- site_url: Adresa URL služby. U služeb na úrovni domény bude hodnota tohoto pole „sc-domain:název-služby“. U služeb s předponou adresy URL se použije úplná adresa URL z definice služby. Příklady: sc-domain:developers.google.com, https://developers.google.com/webmaster-tools/
- query: Dotaz uživatele. Pokud má pole is_anonymized_query hodnotu true, bude se jednat o řetězec s nulovou délkou.
- is_anonymized_query: Tato logická hodnota označuje vzácné dotazy (tzv. anonymizované dotazy). Pokud je tato hodnota true, je v poli „query“ kvůli ochraně soukromí uživatelů, kteří tento dotaz zadali, řetězec s nulovou délkou.
- Country: Země, ze které byl dotaz odeslán, ve formátu ISO-3166-1-Alpha-3.
- search_type – Jedna z následujících textových hodnot:
- web: Výchozí karta (Vše) ve Vyhledávání Google.
- image: Karta Obrázky ve Vyhledávání Google.
- video: Karta Videa ve Vyhledávání Google.
- news: Karta Zprávy ve Vyhledávání Google.
- discover: Výsledky z feedu Objevit.
- googleNews: Web news.google.com a aplikace Zprávy Google pro Android a iOS
- device: Zařízení, ze kterého byl dotaz odeslán.
- impressions: Počet zobrazení pro tento řádek.
- clicks: Počet kliknutí pro tento řádek.
- sum_top_position: Součet nejvyšších pozic webu ve výsledcích vyhledávání pro jednotlivá zobrazení v daném řádku tabulky. Nejvyšší pozici ve výsledcích odpovídá hodnota nula. Průměrnou pozici začínající jedničkou vypočítáte takto:
SUM(sum_top_position)/SUM(impressions) + 1
Tabulka searchdata_url_impression
Tato tabulka obsahuje data agregovaná podle adresy URL. Tabulka obsahuje následující pole:
- data_date: Stejné jako výše.
- site_url: Stejné jako výše.
- url: Plně kvalifikovaná adresa URL, na kterou se uživatel dostane po kliknutí na výsledek vyhledávání nebo na příběh ve feedu Objevit.
- query: Stejné jako výše.
- is_anonymized_query: Stejné jako výše.
- is_anonymized_discover: Udává, zda řádek dat spadá pod anonymizační limit feedu Objevit. V případě nedosažení anonymizačního limitu budou z důvodu ochrany soukromí některá další pole (například adresa URL nebo země) chybět.
- country: Stejné jako výše.
- search_type: Stejné jako výše.
- device: Stejné jako výše.
- is_[typ_vzhledu_vyhledávání]: Tabulka zahrnuje několik logických polí, která poskytují informace o typu vzhledu vyhledávání, například is_amp_top_stories, is_job_listing a is_job_details. Pokud se řádek zobrazuje pro konkrétní typ rozšířeného výsledku, bude v příslušném poli hodnota true.
- impressions: Stejné jako výše.
- clicks: Stejné jako výše.
- sum_position: Číslo udávající nejvyšší pozici této adresy URL ve výsledcích vyhledávání pro daný dotaz.! (Nejvyšší pozici ve výsledcích odpovídá hodnota nula.) Průměrnou pozici začínající jedničkou vypočítáte takto:
SUM(sum_position)/SUM(impressions) + 1
Tabulka ExportLog
Tato tabulka obsahuje záznam o datech uložených pro daný den. Neúspěšné pokusy o export zde nejsou zaznamenány. Další informace o sledování chyb. Tabulka obsahuje následující pole:
- agenda: Jaký typ dat byl uložen. V současné době je jedinou hodnotou SEARCHDATA.
- namespace: Tabulka, do které byla data uložena. Search Console obvykle exportuje data pro každou tabulku samostatně, proto tato tabulka obvykle pro každý den obsahuje dva řádky exportu.
- data_date: Datum kliknutí nebo zobrazení v tichomořském čase. Toto je datum oddílu používaného tabulkami.
- epoch_version: Celé číslo, kde 0 je první uložení dat pro toto datum do této tabulky. Ve vzácných případech, kdy se Search Console potřebuje vrátit a upravit předchozí data (například kvůli anomálii dat), se tato hodnota při každé aktualizaci dat pro danou tabulku a den zvýší o 1.
- publish_time: Čas dokončení exportu (v tichomořském čase).