A Google Keresés működése

Ismerje meg, hogyan fedezi és térképezi fel, valamint jeleníti meg a weboldalakat a Google

Amikor számítógéphez ül, és keresést végez a Google rendszerében, jóformán azonnal megjelenik a teljes internetet átfogó találati lista. Hogyan találja meg a Google a lekérdezésnek megfelelő weboldalakat, és hogyan határozza meg a találatok sorrendjét?

Egyszerű hasonlattal élve az internetes keresést úgy képzelhetjük el, mintha egy hatalmas könyvben egy terjedelmes tárgymutató címszavai alapján próbálnánk a keresett oldalakat megtalálni. A Google-kereséskor programjaink az index alapján keresik ki a legrelevánsabb találatokat, amelyeket megjelenítünk Önnek.

A keresési eredmények megjelenítésének három fő fázisa a következő:

Feltérképezés

A feltérképezés az a folyamat, amelynek során a Googlebot megkeresi a Google indexébe felvehető új és frissített oldalakat.

Számítógépek egész hadát vetjük be az interneten található oldalak milliárdjainak beolvasásához (feltérképezéséhez). A műveletet végző program neve Googlebot (keresőrobotként vagy robotként is ismert). A Googlebot algoritmikusan működik, ami azt jelenti, hogy a számítógépes programok határozzák meg, hogy mely webhelyeket milyen gyakran térképezzen fel a keresőrobot, illetve hogy az adott webhelyről hány oldalt olvasson be.

A Google a feltérképezési folyamatot a korábbi feltérképezések során talált weboldalak URL-címeivel, valamint a webmesterektől kapott webhelytérképekkel kezdi. Ahogy a Googlebot végiglátogatja ezeket a webhelyeket, az egyes oldalakon talált linkeket felveszi a feltérképezésre váró oldalak listájára. Ezután megkeresi az új és a megváltozott webhelyeket, valamint az inaktív linkeket, majd ezek alapján frissíti a Google indexét.

A Google nem teszi lehetővé, hogy díjfizetés ellenében egy webhely gyakoribb feltérképezését kérjék, mert a keresési szolgáltatást az árbevételt hozó AdWords szolgáltatástól elkülönítve kezeli.

Indexelés

A Googlebot a feltérképezett oldalakat indexelve hatalmas tárgymutatót hoz létre, amelyben nyilvántart minden szót, és a szavak előfordulási helyét az egyes oldalakon. Emellett feldolgozza a főbb tartalomcímkékben és -attribútumokban, például a TITLE címkékben és az ALT attribútumokban tárolt információkat is. A Googlebot sokféle tartalomtípust tud kezelni, de nem mindegyiket. Nem tudja például feldolgozni egyes multimédiás fájlok és a dinamikus oldalak tartalmát.

Eredmények megjelenítése

Amikor a felhasználó lekérdezést ír be, számítógépeink kikeresik az indexből a megfelelő oldalakat, és a rendszer megjeleníti azokat a találatokat, amelyeket a felhasználó szempontjából a legrelevánsabbnak ítél. Az oldalak relevanciáját több mint 200 tényező határozza meg, többek között a PageRank mutató. A PageRank az oldalak fontosságának mérőszáma, amely a más oldalakról az adott oldalra mutató linkek számán alapul. Vagyis minden link, amely más webhelyről az Ön webhelyének valamely oldalára mutat, növeli a PageRank mutató értékét. Nem minden link egyenlő: a Google folyamatosan arra törekszik, hogy a felhasználók érdekében kiszűrje a spam jellegű linkeket és az egyéb olyan módszereket, amelyek kedvezőtlenül befolyásolják a keresések eredményét. Azok a legértékesebb linkek, amelyeket az Ön webhelyén kínált tartalom minőségének köszönhetően hoznak létre.

Ahhoz, hogy webhelye jó rangsorolást kapjon a keresési eredményoldalakon, fontos biztosítani, hogy a Google megfelelően feltérképezhesse és indexelje a webhelyet. Az Útmutató webmestereknek című dokumentumban adunk néhány gyakorlati tanácsot ahhoz, hogyan lehet elkerülni a leggyakoribb buktatókat, és miként javítható a webhely rangsorolása.

A Google Erre gondolt és Google automatikus kitöltés funkcióinak célja, hogy a kapcsolódó kifejezések, agyakori elgépelések és a népszerű lekérdezések megjelenítésével időt takarítsanak meg a felhasználó számára. A google.com keresési eredményeihez hasonlóan, az ezen funkciók által használt kulcsszavakat is a keresőrobotok és keresési algoritmusok generálják. Ezeket a várható kifejezéseket csak akkor jelenítjük meg, amikor úgy gondoljuk, hogy ezzel a felhasználó számára időt takaríthatunk meg. Ha egy webhely jó helyezést ér el egy kulcsszó vonatkozásában, akkor ez azért van, mert algoritmusok révén meghatároztuk, hogy az adott tartalom relevánsabb a felhasználó kérdéséhez.