A Google Kereső működése

További információ arról, hogy hogyan fedezi és térképezi fel, valamint jeleníti meg a weboldalakat a Google

Hogyan működik a Google? Erre van egy rövid és egy hosszú válaszunk.

A Google számos különböző forrásból szerez információkat, például a következőkből: 

  • weboldalak;
  • felhasználótól származó tartalmak (például a Google Cégem és Google Térkép szolgáltatásokon keresztül);
  • könyvek szkennelése;
  • az interneten található nyilvános adatbázisok;
  • és még számos további forrás.

Ez az oldal azonban a weboldalakra összpontosít.

A rövid válasz

A weboldalakról származó találatok létrehozása érdekében a Google három alapvető lépést tesz:

Feltérképezés

Az első lépés az interneten található oldalak felfedezése. Nincs olyan központi nyilvántartás, amely az összes weboldalt tartalmazná, ezért a Google-nak folyamatosan új oldalakat kell keresnie, hogy hozzáadhassa őket az általa ismert oldalakat tartalmazó listához. Bizonyos oldalakat azért ismerünk, mert a Google már felkereste őket. Más oldalakat úgy tud felfedezni a Google, hogy követi az egyik már ismert oldalról az új oldalra mutató linket. Az is előfordulhat, hogy a webhelytulajdonos listát (webhelytérképet) küld a Google-nak a feltérképezendő oldalakról. Ha olyan kezelt webszolgáltatót használ, mint például a Wix vagy a Blogger, lehetséges, hogy a webszolgáltató elküldi feltérképezésre a Google-nak az Ön által újonnan létrehozott vagy frissített oldalakat.

Miután a Google felfedezi egy oldal URL-jét, felkeresi avagy feltérképezi az oldalt, hogy megtudja, mi van rajta. A Google megjeleníti az oldalt, és mind a szöveges és nem szöveges tartalmakat, mind az általános vizuális elrendezést elemzi annak eldöntéséhez, hogy az oldal hol jelenjen meg a Kereső találatai között. Minél jobban megérti a Google az Ön webhelyét, annál jobban meg tudjuk mutatni azoknak, akik az Ön tartalmait keresik.

A webhelye feltérképezésének javítása érdekében:

  • Ellenőrizze, hogy a Google a webhely minden oldalát eléri-e, és hogy az oldalak jónak tűnnek-e. A Google névtelen felhasználóként fér hozzá az internethez (vagyis olyan felhasználóként, aki nem rendelkezik jelszavakkal és információkkal). A Google-nak az oldalon szereplő minden képet és egyéb elemet is látnia kell ahhoz, hogy képes legyen megfelelően értelmezni az oldalt. Végezhet egy gyors ellenőrzést, ha begépeli az adott oldal URL-jét a Mobilbarát jelleget vizsgáló tesztelőeszközbe.
  • Ha egyetlen oldalt hozott létre vagy frissített, akkor beküldhet egy egyedi URL-címet a Google-nak. Ha több új vagy frissített oldalról szeretné egyszerre tájékoztatni a Google-t, használjon webhelytérképet.
  • Ha csak egyetlen oldal feltérképezését kéri a Google-tól, tegye azt az oldalt a kezdőlapjává. A Google szempontjából a webhelyen lévő legfontosabb oldal a kezdőlap. Ha a webhely teljes feltérképezését szeretné elérni, gondoskodjon arról, hogy a kezdőlap (és az összes oldal) megfelelő webhely-navigációs rendszert tartalmazzon, amely hivatkozik a webhely összes fontos szakaszára és oldalára; ez segít a felhasználóknak (és a Google-nak) a webhelyen való tájékozódásban. Kisebb (1000-nél kevesebb oldalt tartalmazó) webhelyek esetében mindössze annyit kell tennie, hogy csak a kezdőlapjáról tájékoztatja a Google-t, feltéve, hogy a Google hozzáférhet az összes többi oldalhoz, ha követi a kezdőlapról induló linkek útvonalát. 
  • Linkeléssel hivatkozzon oldalára valamelyik, a Google által már ismert oldalról. Arra azonban felhívjuk figyelmét, hogy a Google nem követi az olyan linkeket, amelyek hirdetésekben szerepelnek, esetleg más webhelyeken fizetett linkként jelennek meg, valamint amelyek hozzászólásokban találhatók, vagy nem követik a Google webmestereknek szóló útmutatóját.

 

A Google nem fogad el pénzt a webhelyek gyakoribb feltérképezéséért vagy előkelőbb rangsorolásáért. Amennyiben valakitől ezzel ellentétes információt kap, az a személy téved.

Indexelés

Egy bizonyos oldal felfedezése után a Google megpróbálja megérteni, hogy pontosan miről szól az adott oldal. Ezt a folyamatot indexelésnek nevezzük. A Google elemzi az oldal tartalmát, katalogizálja az oldalba beágyazott kép- és videofájlokat, valamint további módokon megpróbálja értelmezni az oldalt. Az így kapott információkat a Google indexben tárolja, amely egy hatalmas, rengeteg (tényleg rengeteg) számítógépen tárolt adatbázis.

A weboldala indexelésének javítása érdekében:

  • Rövid, jelentéssel rendelkező oldalcímeket hozzon létre.
  • Olyan oldalcímeket alkalmazzon, amelyek utalnak az oldal tárgyára.
  • A tartalom átadásához inkább szöveges, mintsem képi eszközöket használjon. (A Google képes bizonyos képek és videók értelmezésére, azonban kevésbé hatékonyan, mint a szöveg megértésére. A legkevesebb, amit tehet, hogy a videókat és a képeket helyettesítő szöveggel és más megfelelő attribútumokkal látja el.)

Megjelenítés (és rangsorolás)

Amikor valamelyik felhasználó lekérdezést hajt végre, a Google számos különböző tényező alapján igyekszik megtalálni a leginkább relevánsnak választ az indexből. A Google megpróbálja meghatározni a legjobb minőségű válaszokat, és figyelembe vesz olyan további szempontokat, amelyek segítenek abban, hogy a legjobb felhasználói élményt és a legmegfelelőbb választ nyújtsa. Ilyen szempontok lehetnek például a következők: a felhasználó tartózkodási helye, anyanyelve és eszközének típusa (asztali számítógép vagy telefon). Például a „kerékpárszerviz” kifejezés keresésekor a Google eltérő válaszokat jelenít meg a Párizsban és a Hongkongban tartózkodó felhasználóknak. A Google nem fogad el befizetéseket a weboldalak magasabbra rangsorolásáért, a rangsorolás automatizált módon történik.

A megjelenítés és rangsorolás javításának érdekében:

A hosszú válasz

További információra van szüksége? Íme:

A hosszú válasz

Feltérképezés

A feltérképezés az a folyamat, amelynek során a Googlebot felkeresi a Google indexbe felvehető új és frissített oldalakat.

Számítógépek egész hadát vetjük be az interneten található oldalak milliárdjainak beolvasásához (feltérképezéséhez). A műveletet végző program neve Googlebot (keresőrobotként vagy robotként is ismert). A Googlebot egy algoritmikus folyamat segítségével határozza meg, hogy mely webhelyeket és milyen gyakran térképezzük fel, illetve az egyes webhelyek hány oldalát kérjük le.

A Google a feltérképezési folyamatot a korábbi feltérképezések során talált weboldalak URL-címeivel kezdi, amelyekhez hozzájönnek még a webmesterektől kapott webhelytérképek. Amikor a Googlebot felkeres egy weboldalt, az oldalon talált linkeket felveszi a feltérképezésre váró oldalak listájára. Ezután megkeresi az új és a megváltozott webhelyeket, valamint az inaktív linkeket, majd ezek alapján frissíti a Google indexet.

A feltérképezés során a Google megjeleníti az oldalt a Chrome legújabb verziójának segítségével. A megjelenítési folyamat részeként lefuttatja az oldalon talált szkripteket is. Ha az Ön webhelye dinamikusan generált tartalmakat használ, akkor gondoskodjon róla, hogy követi a JavaScript SEO alapjait.

Elsődleges feltérképezés / másodlagos feltérképezés

A Google két különböző feltérképező robotot használ a webhelyek feltérképezésére: egy mobilos feltérképező robotot és egy asztali feltérképező robotot. Mindegyik robottípus azt szimulálja, hogy egy felhasználó az adott eszköztípus használatával felkeresi az oldalt.

A Google az egyik robottípust (mobilos vagy asztali) használja az Ön webhelye elsődleges feltérképező robotjaként. A Google által az Ön webhelyén feltérképezett minden oldal feltérképezése az elsődleges feltérképező robot segítségével történik. Minden új webhely esetén a mobilos feltérképező robot az elsődleges feltérképező robot.

Ezenfelül a Google a webhely néhány oldalát újra feltérképezi a másik (mobilos vagy asztali) robottípussal is. Ezt hívjuk másodlagos feltérképezésnek, amelynek célja, hogy lássuk, mennyire működik a webhely a másik eszköztípussal.

Honnan tudja a Google, hogy mely oldalakat nem kell feltérképeznie?

  • A robots.txt fájlban letiltott oldalakat nem térképezi fel, de előfordulhat, hogy indexeli őket, ha valamelyik másik oldal hivatkozik rájuk. (A Google következtetéseket vonhat le az oldal tartalmával kapcsolatban a rá mutató link alapján, és indexelheti azt a tartalom elemzése nélkül is.)
  • A Google nem képes az olyan oldalak feltérképezésére, amelyekhez a névtelen felhasználók nem férhetnek hozzá. Így a bejelentkezési vagy egyéb hitelesítési védelemmel ellátott oldalak kimaradnak a feltérképezésből.
  • Ritkábban térképezzük fel azokat az oldalakat, amelyeket egyszer már feltérképeztünk, és más oldalak ismétlődéseinek tűnnek.

A feltérképezés javítása

Annak érdekében, hogy a Google a megfelelő oldalakat fedezze fel webhelyén, alkalmazza az alábbi módszereket:

Indexelés

A Googlebot minden egyes feltérképezett oldalt feldolgoz, hogy megértse az adott oldal tartalmát. Ide tartozik a szöveges tartalmak, a főbb tartalomcímkék és -attribútumok, például a <title> címkék és az alt attribútumok, valamint a képek, videók és további elemek feldolgozása. A Googlebot sokféle tartalomtípust tud kezelni, de nem mindegyiket. Nem tudja feldolgozni például bizonyos multimédiás fájlok tartalmát.

Az oldalak feltérképezése-indexelése során a Google azt is meghatározza, hogy más oldal ismétlődéseiről vagy gyűjtőoldalairól van-e szó. Az ismétlődéseket ritkábban térképezzük fel. A hasonló oldalakat egy közös dokumentumba csoportosítjuk, amely egy vagy több oldalból álló csoport, és amely tartalmazza a gyűjtőoldalt (a csoport leginkább jellemző oldalát) és minden ismétlődő oldalt, amelyet találunk (ezek lehetnek egyszerűen az ugyanazon oldal elérése szolgáló alternatív URL-ek, illetve ugyanannak az oldalnak a mobilos vagy asztali verziói).

Felhívjuk figyelmét, hogy a Google nem indexel (akár fejlécben, akár címkében) „noindex” utasítással ellátott oldalakat. Ehhez azonban a Google-nak látnia kell az utasítást; amennyiben az oldalt letiltja a robots.txt fájl, a bejelentkezési oldal vagy más eszköz, előfordulhat, hogy a Google meglátogatás nélkül indexeli!

Az indexelés javítása

Számos módszerrel javíthatja a Google azon képességét, hogy megértse az oldal tartalmát:

Mi az a „dokumentum”?

A Google belsőleg dokumentumok (hatalmas) halmazaként képezi le az internetet. Minden dokumentum egy vagy több weboldalt jelöl. Ezek az oldalak azonosak vagy nagyon hasonlók, de tartalmuk alapvetően ugyanaz, amelyet különböző URL-ekről lehet elérni. Előfordulhat, hogy az adott dokumentumban lévő URL-ek pontosan ugyanarra az oldalra vezetnek (például előfordulhat, hogy az example.com/dresses/summer/1234 és az example.com?product=1234 ugyanazt az oldalt jeleníti meg), vagy ugyanarra az oldalra, csak kisebb eltérésekkel a különböző eszközök felhasználói számára (például example.com/mypage az asztali felhasználók, míg m.example.com/mypage a mobilos felhasználók esetén).

A Google kiválasztja az egyik dokumentumban lévő URL-t, és ezt határozza meg a dokumentum gyűjtő-URL-jeként. A dokumentum gyűjtő-URL-jét térképezi fel és indexeli a Google a leggyakrabban; a többi URL ismétlődésnek vagy alternatív URL-nek minősül, amelyeket alkalmanként feltérképezhetünk, vagy a felhasználó kérése szerint jelenítjük meg őket: például ha a dokumentum gyűjtő-URL-je a mobil URL, akkor a Google továbbra is az asztali (alternatív) URL-t fogja megjeleníti az asztali eszközön kereső felhasználók számára.

A Search Console legtöbb jelentése a dokumentum gyűjtő-URL-jéhez rendeli hozzá az adatokat. Néhány eszköz (például az URL-ellenőrző eszköz) támogatja az alternatív URL-ek tesztelését, de a gyűjtő-URL ellenőrzése általában információt nyújt az alternatív URL-ekről is.

Elmondhatja a Google-nak, hogy Ön szerint melyik URL a gyűjtő-URL, de előfordulhat, hogy különböző okokból kifolyólag a Google másik gyűjtő-URL-t választ.

Az alábbiakban találja a legfontosabb kifejezések összefoglalását és a Search Console felületén alkalmazott jelentésüket:

  • Dokumentum: Hasonló oldalak gyűjteménye. Rendelkezik gyűjtő-URL-lel, és valószínűleg alternatív URL-ekkel is, ha a webhelyének ismétlődő oldalai is vannak. A dokumentum URL-jei származhatnak azonos vagy eltérő szervezetektől is (a gyökérdomain, például a www.google.com URL esetén a „google”). A Google a platform (mobil/asztali eszköz), a felhasználó nyelve vagy tartózkodási helye és számos egyéb változó alapján választja ki a legjobb URL-t, amely megjelenik a Kereső találatai között. A Google organikus feltérképezés, a webhelyen megvalósított funkciók (például átirányítások) vagy <link rel=alternate/canonical> címkék segítségével fedezi fel a webhelyen a kapcsolódó oldalakat. Más szervezeteken található kapcsolódó oldalakat csak akkor jelölünk meg alternatív URL-ként, ha ezt kifejezetten belekódolja a webhely (átirányítások vagy a link címkék útján).
  • URL: A webhely adott tartalmának elérésére használt URL. Előfordulhat, hogy a webhely különböző URL-ekkel éri el ugyanazt az oldalt.
  • Oldal: Egy vagy több URL-lel elérhető adott weboldal. Az oldalnak lehetnek különböző verziói, a felhasználó által használt platformtól függően (mobil, asztali számítógép, táblagép stb.).
  • Verzió: Az oldal egyik változata, jellemzően „mobil”, „asztali” és „AMP” kategóriákba sorolva (bár az AMP verziónak szintén lehet külön mobil és asztali verziója). A webhely-konfigurációtól függően az egyes verzióknak lehet eltérő URL-je (example.com és m.example.com) vagy azonos URL-je is (ha az Ön webhelye dinamikus megjelenítést vagy eszközhöz alkalmazkodó megjelenítést alkalmaz, akkor ugyanazon oldal különböző verziói esetén is ugyanaz az URL jelenik meg). A nyelvi változatok nem különböző verzióknak, hanem különböző dokumentumoknak minősülnek.
  • Gyűjtőoldal vagy -URL: Az az URL, amelyet a Google a dokumentum legjellemzőbb URL-jének tekint. A Google ezt az URL-t mindig feltérképezi; a dokumentumban lévő ismétlődő URL-eket alkalmanként szintén feltérképezhetjük.
  • Alternatív/ismétlődő oldal vagy URL: A dokumentumban szereplő azon URL, amelyet a Google alkalmanként feltérképezhet. A Google akkor is ezeket az URL-eket jeleníti meg, ha megfelelnek az adott felhasználónak és kérésnek (például asztali számítógépről érkező kérés esetén a mobilos gyűjtő-URL helyett az asztali felhasználók számára tervezett alternatív URL-t jelenítjük meg).
  • Webhely: Általában a fogalmilag kapcsolódó weboldalak halmazát értjük alatta, de néha a Search Console-tulajdon szinonimájaként is használjuk, bár a tulajdon igazából a webhely egy részeként határozható meg. A webhelyek több aldomainen is átívelhetnek (vagy akár szervezeteken is, ha megfelelően összekapcsolt AMP-oldalakkal rendelkeznek).

Az azonos, de különböző nyelvű tartalommal rendelkező oldalakat különböző dokumentumokban tároljuk, amelyek hreflang címkék segítségével hivatkoznak egymásra; ezért fontos, hogy használjunk hreflang címkéket a lefordított tartalmak esetén.

Találatok megjelenítése

Amikor egy felhasználó lekérdezést ír be, számítógépeink kikeresik az indexből a megfelelő oldalakat, és megjelenítik azokat a találatokat, amelyeket a felhasználó szempontjából a leginkább relevánsnak ítélnek. Az oldalak relevanciáját több száz tényező határozza meg, és folyamatosan dolgozunk az algoritmusunk fejlesztésén. A Google a felhasználói élményt is figyelembe veszi a találatok kiválasztása és rangsorolása során, ezért gondoskodjon arról, hogy oldala gyorsan betöltődjön és mobilbarát legyen.

A megjelenítés fejlesztése

A még hosszabb válasz

A Google Kereső működéséről szóló még hosszabb választ itt találhatja (képekkel és videóval!)

Hasznosnak találta?
Hogyan fejleszthetnénk?