Jak funguje Vyhledávání Google

Informace o tom, jak Google objevuje, prohledává a zobrazuje webové stránky

Jak funguje Google? Níže najdete krátké a dlouhé vysvětlení.

Google získává informace z mnoha různých zdrojů, včetně těchto: 

  • webové stránky,
  • obsah odeslaný uživateli, jako jsou uživatelské příspěvky ve službách Moje firma na Googlu a Mapy,
  • skenování knih,
  • veřejné databáze na internetu,
  • mnoho dalších zdrojů.

V tomto článku se však zaměříme na webové stránky.

Krátká verze

Google při generování výsledků z webových stránek provádí tři základní kroky:

Procházení

Jako první krok je potřeba zjistit, jaké stránky jsou na webu k dispozici. Žádný centrální registr všech webových stránek neexistuje, proto musí Google neustále vyhledávat nové a přidávat je do svého seznamu. O některých stránkách Google ví, protože už je v minulosti navštívil. Jiné stránky Google objeví následováním odkazu ze známé stránky na novou. Další stránky objeví pomocí seznamů stránek (tzv. map webů nebo souborů Sitemap), které vlastníci webů odešlou do Googlu k procházení. Pokud používáte spravovaného webového hostitele, například sužbu Wix nebo Blogger, může takový hostitel žádat Google o procházení aktualizovaných nebo nových stránek, které vytvoříte.

Když Google najde adresu URL stránky, navštíví (projde) ji, a tak zjistí, co se na ní nachází. Kromě textového a netextového obsahu analyzuje Google i celkové vizuální rozvržení stránky, aby mohl rozhodnout, kde se má stránka ve výsledcích Vyhledávání zobrazovat. Čím lépe dokáže Google webu porozumět, tím lépe ho může přiřadit k lidem, kteří hledají váš obsah.

Pokyny ke zlepšení procházení webu:

  • Zkontrolujte, zda se Google na stránky vašeho webu může dostat a zda vypadají správně. Google prochází web jako anonymní uživatel (bez hesel a jiných informací). Aby Google webu mohl správně porozumět, měl by mít možnost zobrazit i všechny obrázky a jiné prvky na stránce. Můžete to rychle vyzkoušet tak, že adresu URL stránky zadáte do nástroje Test použitelnosti v mobilech.
  • Pokud jste vytvořili nebo aktualizovali jednu stránku, můžete do Googlu odeslat jednotlivou adresu URL. Chcete-li Google informovat o mnoha nových nebo aktualizovaných stránkách najednou, použijte soubor Sitemap.
  • Pokud Google žádáte o projití jen jedné stránky, měla by to být vaše domovská stránka. Domovská stránka je pro Google nejdůležitější stránkou vašeho webu. Chcete-li podpořit procházení celého webu, měla by domovská stránka (a všechny ostatní) obsahovat dobrý navigační systém odkazující na všechny důležité sekce a stránky webu. Usnadní to orientaci uživatelům i Googlu. V případě menších webů (méně než 1 000 stránek) stačí informovat Google o domovské stránce (pokud se Google na všechny ostatní stránky může dostat následováním řetězce odkazů z domovské stránky). 
  • Zajistěte, aby na stránku odkazovala jiná stránka, o které již Google ví. Upozorňujeme však, že Google nebude následovat odkazy v reklamách, placené odkazy na jiných webech, odkazy v komentářích ani jiné odkazy, které nejsou v souladu s pokyny společnosti Google pro webmastery.

 

Google nepřijímá platby za častější procházení webu ani za zvýšení jeho hodnocení. Pokud vám někdo tvrdí něco jiného, lže, jako když tiskne.

Indexování

Po objevení stránky se Google snaží zjistit, o čem stránka je. Tento proces se nazývá indexování. Google analyzuje obsah stránky, zařazuje do katalogu vložené obrázky a videosoubory a dalšími způsoby se snaží stránce porozumět. Tyto informace se zapisují do indexu Google, obrovské databáze uložené na mnoha a mnoha počítačích.

Pokyny ke zlepšení indexování stránek:

  • Vytvářejte krátké a smysluplné názvy stránek.
  • Používejte záhlaví stránek, která vyjadřují hlavní téma stránky.
  • Sdělujte obsah pomocí textu, nikoliv pomocí obrázků. (Google některým obrázkům a videím dokáže porozumět, ale ne tak dobře, jako rozumí textu. Videaobrázky přinejmenším popište pomocí alternativního textu a dalších vhodných atributů.)

Zobrazování (a hodnocení)

Když uživatel zadá dotaz, Google se v indexu na základě mnoha faktorů pokusí najít nejrelevantnější odpověď. Google se pokusí určit nejkvalitnější odpovědi a zohlednit i další aspekty, které umožní nabídnout nejlepší uživatelský dojem a nejvhodnější odpověď, jako je například umístění, jazyk a zařízení (počítač nebo telefon) uživatele. Na dotaz „opravny jízdních kol“ by se zobrazily jiné odpovědi uživateli v Paříži a jiné uživateli v Hongkongu. Google nepřijímá platby za vyšší hodnocení stránek. Hodnocení se provádí algoritmicky.

Pokyny ke zlepšení zobrazování a hodnocení:

Dlouhá verze

Chcete víc informací? Tady jsou:

Dlouhá verze

Procházení

Procházení je proces, při kterém Googlebot navštěvuje nové a aktualizované stránky, které mají být přidány do indexu Google.

K načítání (neboli „procházení“) miliard stránek na webu používáme obrovskou sestavu počítačů. Program, který procházení provádí, se nazývá Googlebot (také se mu říká robot nebo prohledávač). Googlebot pomocí algoritmů určuje, které weby a jak často je třeba procházet a kolik má z každého z nich načíst stránek.

Google při procházení začíná seznamem adres URL webových stránek vygenerovaným z předchozích procházení a rozšířeným o data ze souborů Sitemap, které poskytli webmasteři. Když Googlebot navštíví stránku, vyhledá na ní odkazy a přidá je na seznam stránek k procházení. Nové stránky, změny stávajících stránek a nefunkční odkazy se zaznamenají a aktualizuje se na základě nich index Google.

Při procházení Google stránku vykresluje pomocí některé z posledních verzí Chromu. Při vykreslování spouští všechny skripty, které na stránce najde. Pokud váš web používá dynamicky generovaný obsah, řiďte se základními pokyny pro SEO ohledně JavaScriptu.

Primární/sekundární procházení

Google k procházení webu používá dva různé prohledávače: prohledávač pro mobilní zařízení a prohledávač pro počítače. Každý typ prohledávače simuluje uživatele, který stránku navštěvuje na daném typu zařízení.

Jeden typ prohledávače (pro mobilní zařízení, nebo pro počítače) používá Google u každého webu jako primární. Všechny stránky na vašem webu, které Google prochází, prochází pomocí primárního prohledávače. U všech nových webů se jako primární používá prohledávač pro mobilní zařízení.

Několik stránek vašeho webu Google projde také druhým typem prohledávače (pro mobilní zařízení, nebo pro počítače). Tato funkce se nazývá sekundární procházení a má za účel zjistit, jak web funguje na druhém typu zařízení.

Jak Google ví, které stránky nemá procházet?

  • Nebudeme procházet stránky blokované souborem robots.txt. Pokud na ně ale odkazuje jiná stránka, můžeme je přesto indexovat. (Google dokáže odvodit obsah stránky z odkazu, který na ni vede, a indexovat ji, aniž by analyzoval její obsah.)
  • Google nemůže procházet žádné stránky, které nejsou přístupné anonymním uživatelům. Ochrana pomocí přihlášení nebo ověření proto procházení stránky znemožní.
  • Stránky, které jsme již prošli a které považujeme za duplikáty jiné stránky, procházíme méně často.

Vylepšení procházení

Chcete-li Googlu pomoci, aby na vašem webu objevil správné stránky, použijte tyto postupy:

Indexování

Každou navštívenou stránku Googlebot zpracovává s cílem porozumět jejímu obsahu. Zpracovává například textový obsah, klíčové značky a atributy obsahu (např. značky <title> a atributy „alt“), obrázky, videa apod. Googlebot dokáže zpracovat mnoho typů obsahu, nikoli však všechny. Nedokáže například zpracovat obsah některých multimediálních souborů.

Někde mezi procházením a indexováním Google zjišťuje, zda je stránka duplicitní nebo kanonickou verzí jiné stránky. Pokud stránku vyhodnotí jako duplikát, bude ji procházet méně často. Podobné stránky seskupuje Google do dokumentů, což jsou skupiny jedné nebo více stránek, které obsahují kanonickou stránku (nejreprezentativnější zástupce skupiny) a všechny nalezené duplikáty. Duplikáty mohou být alternativní adresy URL vedoucí na stejnou stránku, nebo alternativní verze stejné stránky určené pro mobilní zařízení či počítače.

Stránky s direktivou noindex (v záhlaví nebo značce) Google neindexuje. Musí však tuto direktivu vidět. Pokud je stránka blokována souborem robots.txt, přihlašovací stránkou nebo jiným způsobem, může ji Google indexovat i v případě, že ji nenavštívil.

Zlepšení indexování

Je mnoho způsobů, jak Googlu pomoci porozumět obsahu stránky:

Co je to „dokument“?

Interně Google web reprezentuje jako (obrovskou) sadu dokumentů. Každý dokument představuje jednu nebo více webových stránek. Tyto stránky jsou buď identické, nebo velmi podobné, ale v podstatě představují stejný obsah dostupný pomocí několika různých adres URL. Různé adresy URL v dokumentu mohou vést na stejnou stránku (např. example.com/saty/leto/1234 a example.com?produkt=1234 mohou zobrazit stejnou stránku) nebo na stejnou stránku s drobnými rozdíly pro uživatele různých zařízení (např. example.com/stranka pro uživatele počítačů a m.example.com/stranka pro uživatele mobilních zařízení).

Jednu z adres URL v dokumentu Google vybere a definuje jako kanonickou. Kanonická adresa URL dokumentu se prochází a indexuje nejčastěji. Ostatní adresy URL považuje Google za duplikáty nebo alternativní verze a může je v závislosti na žádostech uživatelů procházet občas. Je-li například kanonickou adresou URL mobilní adresa, uživatelům vyhledávání na počítačích bude Google pravděpodobně přesto zobrazovat adresu URL pro počítače (alternativní adresu).

Ve většina přehledů služby Search Console jsou data přiřazena ke kanonické adrese URL dokumentu. Některé nástroje (například nástroj Kontrola adresy URL) podporují testování alternativních adres. Kontrola kanonické adresy URL by však měla poskytnout i informace o alternativních adresách.

Můžete Googlu sdělit, která adresa URL je podle vás kanonická, ale Google může z různých důvodů za kanonickou vybrat jinou verzi.

Zde jsou přehled pojmů a jejich použití ve službě Search Console:

  • Dokument: Sbírka podobných stránek. Obsahuje kanonickou adresu URL a případně i alternativní adresy URL (pokud na webu máte duplicitní stránky). Adresy URL v dokumentu mohou pocházet ze stejné, nebo jiné organizace, (kořenové domény, například „google“ v případě adresy www.google.com). Nejlepší adresu URL k zobrazení ve výsledcích vyhledávání vybírá Google podle platformy (mobilní zařízení / počítač), jazyka uživatele a mnoha dalších proměnných. Související stránky na vašem webu objevuje Google procházením nebo pomocí funkcí implementovaných na webu, jako jsou přesměrování či značky <link rel=alternate/canonical>. Související stránky jiných organizací mohou být za alternativní považovány pouze v případě, že je tak na webu explicitně označíte (prostřednictvím přesměrování nebo značek link).
  • Adresa URL: Adresa URL použitá k dosažení určitého obsahu na webu. Jednu stránku může web zobrazovat pomocí několika adres URL.
  • Stránka: Webová stránka, dostupná prostřednictvím jedné nebo několika adres URL. Stránka může mít několik verzí pro různé platformy (mobilní zařízení, počítač, tablet apod.)
  • Verze: Jedna varianta stránky, obvykle klasifikovaná jako pro mobily, pro počítače či AMP (stránky AMP samy o sobě mohou mít samostatné verze pro mobilní zařízení a pro počítače). V závislosti na konfiguraci webu může mít každá verze jinou adresu (example.com vs. m.example.com), nebo mohou mít různé verze jednu společnou adresu (pokud web používá dynamické zobrazování nebo responzivní návrh webu, může jedna adresa zobrazovat různé verze stránky). Jazykové varianty se nepovažují za různé verze, ale za různé dokumenty.
  • Kanonická stránka nebo adresa URL: Adresa URL, kterou Google považuje za nejreprezentativnějšího představitele dokumentu. Tuto adresu URL prochází Google vždy. Občas prochází i duplicitní adresy URL v dokumentu.
  • Alternativní/duplicitní stránka nebo adresa URL: Adresa URL dokumentu, kterou Google občas může procházet. Tyto adresy URL Google zobrazuje v případě, že jsou pro uživatele a požadavek vhodné (uživatelům na počítačích například namísto kanonické mobilní adresy URL zobrazí alternativní adresu URL pro počítače).
  • Web: Obvykle označuje konceptuálně související sadu webových stránek, někdy se však používá také jako synonymum pro službu v Search Console. Služba však může být definována jako pouhá část webu. Web může zahrnovat několik subdomén (a dokonce i organizací, pokud mají správně propojené stránky AMP).

Stránky se stejným obsahem v různých jazycích jsou uloženy v různých dokumentech, které na sebe navzájem odkazují pomocí značek hreflang. Proto je důležité používat pro přeložený obsah značky hreflang.

Zobrazení výsledků

Když uživatel zadá dotaz, naše počítače vyhledají v indexu odpovídající stránky a vrátí výsledky, o nichž se domníváme, že jsou pro uživatele nejrelevantnější. Relevanci určujeme na základě několika set faktorů a příslušný algoritmus neustále vylepšujeme. Google při výběru a hodnocení výsledků bere v úvahu uživatelský dojem. Zajistěte proto, aby se stránka rychle načítala a byla optimalizovaná pro mobily.

Vylepšení zobrazování

  • Pokud vaše výsledky cílí na uživatele v konkrétních lokalitách nebo na konkrétní jazyky, můžete Googlu sdělit své preference.
  • Zajistěte, aby se stránka rychle načítala a byla optimalizovaná pro mobily.
  • Řiďte se pokyny pro webmastery, abyste se vyhnuli obvyklým nástrahám a zlepšili hodnocení svého webu.
  • Zvažte, zda byste na svůj web nemohli implementovat funkce výsledků Vyhledávání, jako jsou karty receptů nebo článků.
  • Implementujte AMP, aby se stránky na mobilních zařízeních načítaly rychleji. Některé stránky AMP jsou vhodné také pro další funkce vyhledávání, jako je například pás hlavních událostí.
  • Algoritmus Googlu je neustále vylepšován. Nesnažte se ho uhádnout a navrhnou stránky speciálně pro něj, raději vytvářejte kvalitní a aktuální obsah, který uživatelé chtějí a který odpovídá našim pokynům.

Ještě delší verze

Můžete si přečíst ještě delší vysvětlení, jak funguje Vyhledávání Google (s obrázky a videem).

Pomohly vám tyto informace?
Jak bychom článek mohli vylepšit?