Párhuzamos URL-ek összevonása

Gyűjtőoldal megadása hasonló vagy párhuzamos oldalakhoz

Ha olyan egyedi weboldallal rendelkezik, amely több URL-ről is megnyitható, illetve ha több weboldala is hasonló tartalommal rendelkezik (például adott oldalnak mobilos és asztali verziója is van), akkor a Google ezeket ugyanannak az oldalnak a párhuzamos verzióiként érzékeli. A Google kiválaszt egy URL-t gyűjtőverzióként, és azt térképezi fel, a többi URL-t pedig párhuzamos URL-ként kezeli, és ritkábban térképezi fel. 

Ha nem adja meg kifejezetten a Google-nak, hogy melyik a gyűjtő-URL, akkor a Google hozza meg a döntést Ön helyett, de az is előfordulhat, hogy mindkettőt azonos súllyal kezeli – ami nem kívánt viselkedéshez vezethet (a részleteket lásd a Miért válasszam ki a gyűjtő-URL-t című részben alább).

Mi az a gyűjtő-URL?
A gyűjtő-URL az oldal azon URL-jét jelenti, amely a Google szerint a legjobban képviseli az oldalt a különböző párhuzamos oldalak közül. Ha például webhelyének bizonyos oldala több URL-en is megtalálható (pl. example.com?dress=1234 és example.com/dresses/1234), akkor a Google az egyiket gyűjtő-URL-ként választja ki. Fontos, hogy az oldalaknak nem kell pontosan megegyezniük. A listaoldalak rendezésében vagy szűrésében végzett kisebb módosítások (például ár szerinti rendezés vagy tétel színe szerinti szűrés) nem teszik az oldalt egyedivé.
A gyűjtőoldal lehet a párhuzamos oldaltól eltérő domainen.
További részletek
A Googlebot a webhelyek indexelésekor megpróbálja meghatározni az oldalak elsődleges tartalmát. Ha ugyanazon a webhelyen több olyan oldalt is talál, amelyek látszólag ugyanarról a témáról szólnak, kiválasztja a legjobbnak és leghasznosabbnak ítélt oldalt, és megjelöli gyűjtőoldalként. A gyűjtőoldalon végzünk feltérképezést a leggyakrabban; a párhuzamos oldalakat ritkábban látogatjuk meg, hogy a feltérképezés kevésbé terhelje a webhelyet.
A Google több tényezőt (vagy jelet) figyelembe vesz a gyűjtőoldal kiválasztásakor. Ezek közé tartozik például, hogy az oldal http vagy https protokollon keresztül jelenik meg; a felhasználó által előnyben részesített domain; az oldalminőség; az URL megléte a webhelytérképben; valamint az összes „rel=canonical” címke. Ezekkel a módszerekkel jelezheti a Google felé, hogy Ön mely oldalt szeretné gyűjtőoldalként látni, de különböző okokból kifolyólag nem biztos, hogy a jelzett oldalt választjuk.
Egy adott oldal eltérő nyelvi változatai csak akkor minősülnek párhuzamosnak, ha a fő tartalom ugyanazon a nyelven van (azaz ha csak a fejléc, a lábléc és a nem fontos szövegek vannak lefordítva, de a törzs ugyanaz, akkor az oldalak párhuzamosak).
A Google elsősorban a gyűjtőoldalak alapján értékeli a tartalmakat és azok minőségét. A Google Keresés találatai általában a gyűjtőoldalakra mutatnak, kivéve akkor, ha az egyik párhuzamos oldal egyértelműen jobb találat a felhasználó számára; például a mobilos felhasználók valószínűleg a mobilos oldalra mutató találatot kapják, még akkor is, ha az asztali változat a gyűjtőoldal.

Miért lehetnek hasonló vagy párhuzamos oldalaim?

Több oka is lehet annak, hogy egy adott webhelyen különböző URL-ek is ugyanarra az oldalra mutatnak, illetve annak, hogy párhuzamos vagy nagyon hasonló oldalak találhatók eltérő URL-eken. A leggyakoribb okok a következők:

  • Több eszköztípus támogatása:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • Dinamikus URL-ek engedélyezése például keresési paraméterekhez vagy munkamenet-azonosítókhoz:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • A blogmotor automatikusan több URL-t ment, ha ugyanaz a bejegyzés több szakaszba is bekerül.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • A szerver úgy van beállítva, hogy ugyanazt a tartalmat jelenítse meg a www/nem www, illetve a http/https változatok esetében:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • A blogon más webhelyekre történő terjesztés céljából közzétett tartalmak részben vagy egészben megtalálhatók a többi domainen:
    https://news.example.com/green-dresses-for-every-day-155672.html (terjesztett bejegyzés) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (eredeti bejegyzés)

Miért válasszam ki a gyűjtő-URL-t?

Több oka is van, miért érdemes gyűjtőoldalt választania több párhuzamos vagy hasonló oldal közül:

  • Megadhatja, hogy az emberek melyik URL-t lássák a keresési eredményekben. Ön például jobban szeretné, ha az emberek a zöld ruhákkal foglalkozó termékoldalát a https://www.example.com/dresses/green/greendress.html címen keresztül érnék el a https://example.com/dresses/cocktail?gclid=ABCD cím helyett.
  • Összevonhatja a párhuzamos vagy hasonló oldalakra vonatkozó linkjelzéseket. Ez a keresőmotoroknak segít abban, hogy össze tudják vonni az egyes URL-ekkel kapcsolatos információikat (például a rájuk mutató linkeket) egyetlen, preferált URL-be. Ez azt jelenti, hogy a http://example.com/dresses/cocktail?gclid=ABCD címre mutató linkek össze lesznek vonva a https://www.example.com/dresses/green/greendress.html címre mutató linkekkel.
  • Megkönnyítheti egyetlen termék vagy téma mutatóinak nyomon követését. Számos különböző URL esetén nehezebb összevont mutatókat kapni egy adott tartalomról.
  • Kezelheti a más webhelyekre terjesztett tartalmakat. Ha tartalmát terjeszti más domaineken történő közzétételre, akkor az oldalrangsort az előnyben részesített URL-re célszerű összevonni.
  • Csökkentheti a párhuzamos oldalakon eltöltött feltérképezési időt. Hogy a Googlebot a legtöbbet kihozza a webhelyből, jobb, ha az új (vagy frissített) oldalak feltérképezésével foglalkozik, nem pedig ugyanazon oldalak asztali és mobilverzióinak feltérképezésével.

A Google szerint melyik a gyűjtő-URL?

Az URL-ellenőrző eszköz segítségével megismerheti, hogy mely oldalakat kezeli a Google gyűjtő-URL-ként. Kérjük, vegye figyelembe, hogy még ha kifejezetten ki is jelöli a gyűjtőoldalt, előfordulhat, hogy a Google különböző okokból (pl. a teljesítmény vagy a tartalom miatt) másik gyűjtő-URL-t választ ki.

Hibaelhárítás

Ha a gyűjtő-URL nem az Ön tulajdonában van, nem fogja látni a párhuzamos oldal forgalmát. Íme néhány gyakori ok arra, hogy miért lehet a gyűjtő-URL külön tulajdonon:
  • Helytelenül megjelölt nyelvi változatok: Ha több webhelye van, amelyek lényegében ugyanazt a tartalmat jelenítik meg a felhasználóknak a világ különböző nyelveire lefordítva, ügyeljen a lokalizált webhelyekre vonatkozó irányelveink betartására.
  • Helytelen gyűjtőcímkék: Néhány tartalomkezelő rendszer (CMS) vagy CMS beépülő modul helytelenül használhatja a gyűjtési technikákat a külső webhelyek URL-jeire való hivatkozáshoz. Ellenőrizze tartalmait, hogy nem onnan erednek-e a problémák. Ha webhelye gyűjtő URL-jeként egy nem várt oldal van beállítva (például a rel="canonical" vagy 301-es átirányítás rossz használata miatt), javítsa közvetlenül a hibát.
  • Hibásan konfigurált szerverek: A helytelenül beállított tárhelyek váratlan, domaineken átnyúló URL-kiválasztásokat okozhatnak. Például:
    • A helytelenül konfigurált szerver a b.com webhelyen szereplő URL-re irányuló kérésre válaszul az a.com webhelyről adhat vissza tartalmat
    • Előfordulhat, hogy két, egymástól független webszerver egyforma lágy 404-es hibaoldalakat ad vissza, amelyeket a Google nem ismert fel hibaoldalként.
  • Webhely rosszindulatú feltörése: A webhelyek elleni támadások során olyan kód is kerülhet az oldalba, amely 301-es átirányítást ad vissza, vagy domaineken átnyúló rel=”canonical” linkelemet szúr be a HTML-kód <head> részébe vagy a HTTP-fejlécbe. Ezek általában rosszindulatú vagy spam jellegű tartalmat tároló URL-re mutatnak. Ilyen esetekben algoritmusaink a rosszindulatú vagy spamelő URL-t választhatják a feltört webhelyen lévő URL helyett.
  • Másolt webhely: Ritka esetekben előfordulhat, hogy algoritmusunk az Ön tartalmát engedély nélkül tároló külső webhelyről választ URL-t. Ha úgy gondolja, hogy a másik webhely a szerzői jogokat megsértve másolja az Ön tartalmát, kapcsolatba léphet a webhely tárhelyszolgáltatójával, hogy a tartalom eltávolítását kérvényezze. Ezenfelül a Digital Millennium Copyright Act (Digitális Évezred Szerzői Jogi Törvény) szerinti igénylést benyújtva kérheti, hogy a Google távolítsa el a jogsértő oldalt keresési eredményei közül.

Gyűjtőoldal megadása

Használattól függően többféle módon is megadható a párhuzamos oldalakat tartalmazó csoport gyűjtőoldala:

Módszer Leírás
Általános irányelvek Ezeket az irányelveket mindegyik gyűjtési módszer esetében tartsa be.
Előnyben részesített domain megadása

Adott domainen lévő URL-ek gyűjtőként való meghatározása valamilyen másik domainen lévő megfelelőikkel szemben a Search Console használatával. Például: www.example.com helyett example.com. Csak akkor használja ezt a módszert, ha két ugyanolyan webhelye van, amelyek csak az aldomainjükben különböznek egymástól. Ne használja, ha az eltérés a http/https protokoll használatából áll.

Előnyök:

  • Könnyen megvalósítható, kezelhető és módosítható.
  • Akkor használható, ha ugyanaz a webhely különböző domaineken van.

Hátrányok:

  • Csak domainek szintjén működik, és az oldalak elérési útjának és nevének is egyeznie kell, hogy párhuzamosnak tekintse őket a rendszer.
  • Csak adott oldalak közti társítást tesz lehetővé azonos útvonallal és névvel rendelkező oldalak esetében.
rel=canonical <link> címke

A gyűjtőoldalra mutató <link> címke hozzáadása a kódhoz az összes párhuzamos oldalnál.

Előnyök:

  • Végtelen számú párhuzamos oldal társítható ily módon.

Hátrányok:

  • Növelheti az oldal méretét.
  • A társításokat nehezebb lehet kezelni a nagy webhelyeken, illetve az olyan webhelyeken, amelyeken az URL-ek gyakran módosulnak.
  • Kizárólag HTML-oldalak esetében működik, fájlok (például PDF-fájl) esetében nem. Erre a célra a rel=canonical HTTP-fejlécet használhatja.
rel=canonical HTTP-fejléc

A rel=canonical fejléc elküldése az oldalválaszban.

Előnyök:

  • Nem növeli az oldal méretét.
  • Végtelen számú párhuzamos oldal társítható ily módon.

Hátrányok:

  • A társításokat nehezebb lehet kezelni a nagy webhelyeken, illetve az olyan webhelyeken, amelyeken az URL-ek gyakran módosulnak.
Webhelytérkép

A gyűjtőoldalak megadása webhelytérképben.

Előnyök:

  • Könnyű elkészíteni és kezelni, különösen nagy webhelyek esetében.

Hátrányok:

  • A Googlebotnak továbbra is meg kell határoznia a webhelytérképben megadott gyűjtőoldalakhoz társuló párhuzamos tartalmakat.
  • Kevésbé szigorú jelzés a Googlebot számára, mint a rel=canonical társítási módszer.
301-es átirányítás A Googlebot tájékoztatása 301-es átirányítások használatával arról, hogy az átirányítás végcélja jobb változatot tartalmaz, mint a megadott URL. Csak akkor használja ezt, ha megszüntet egy párhuzamos oldalt.
AMP-változat Ha a változatok egyike AMP-oldal, az AMP-irányelveknek megfelelően jelezheti a gyűjtőoldalt és az AMP-változatot.

 

Bár mi a fenti módszerek valamelyikének használatára szeretnénk ösztönözni mindenkit, egyik sem kötelező. Ha nem ad meg gyűjtő-URL-t, akkor az általunk legjobbnak ítélt verziót vesszük figyelembe.

Általános irányelvek

Az összes gyűjtési módszer esetében tartsa be az alábbi általános irányelveket.

Általános irányelvek
  • Ne használja a robots.txt fájlt gyűjtési célra.
  • Ne használja az URL-eltávolító eszközt ilyen célokra: ezzel az URL összes változatát eltávolítja a keresésből.
  • Ne adjon meg több különböző URL-t ugyanannak az oldalnak a gyűjtő-URL-jeként ugyanolyan vagy más gyűjtési módszer használatával (például ne adjon meg URL-t a webhelytérképben és az ugyanarra az oldalra mutató másik URL-t a rel="canonical" használatával).
  • Ne használja a noindex címkét arra, hogy megakadályozza a gyűjtőoldal kiválasztását. Ez az utasítás arra szolgál, hogy kizárjon oldalakat az indexből, nem pedig a gyűjtőoldal kiválasztásának befolyásolására. 
  • Adjon meg gyűjtőoldalt, ha használ hreflang címkéket. A gyűjtőoldalt ugyanazon a nyelven, vagy ha az adott nyelvhez nem létezik gyűjtőoldal, akkor a lehető legjobb helyettesítő nyelven adja meg.

  • A gyűjtő-URL-re linkeljen párhuzamos URL helyett, ha webhelyen belüli linkeket készít. Ha következetesen arra az URL-re hivatkozik, amelyet gyűjtő-URL-nek tekint, a Google könnyebben megérti majd preferenciáját.

A HTTPS protokoll előnyben részesítése a HTTP protokollal szemben a gyűjtő-URL-eknél

A Google a HTTPS-oldalakat részesíti előnyben az azonos HTTP-oldalakkal szemben gyűjtő-URL-ként; kivéve a problémás vagy ütközést okozó eseteknél, így például a következő körülmények között:

  • A HTTPS-oldal SSL-tanúsítványa érvénytelen.
  • A HTTPS-oldal nem biztonságos függőségeket tartalmaz (amelyek nem képek).
  • A HTTPS-oldal átirányítja a felhasználókat egy HTTP-oldalra vagy azon keresztül.
  • A HTTPS-oldal rel="canonical" linket tartalmaz a HTTP-oldalra.

Bár rendszereink alapértelmezés szerint is előnyben részesítik a HTTPS-oldalakat a HTTP-oldalakkal szemben, ezt a viselkedést az alábbi műveletekkel biztosíthatja:

  • Adjon hozzá átirányításokat a HTTP-oldalról a HTTPS-oldalra.
  • Adjon hozzá rel="canonical" linket, amely a HTTP-oldalról a HTTPS-oldalra mutat.
  • A HSTS megvalósítása.

Ha meg szeretné akadályozni, hogy a Google tévesen a HTTP-oldalt tegye gyűjtő-URL-lé, kerülje az alábbiakat:

  • Helytelen SSL-tanúsítványok és HTTPS-HTTP átirányítások, amelyek következtében a HTTP-t preferáljuk. A HSTS implementálásával nem írja felül ezt az erősebb beállítást.
  • A HTTPS-verzió helyett a HTTP-oldal szerepeltetése a webhelytérképben vagy a hreflang-elemekben.
  • Az SSL-/TLS-tanúsítvány nem megfelelő hostváltozathoz való implementálása: például amikor az example.com a www.example.com tanúsítványát mutatja be.  A tanúsítványnak a webhely pontos és teljes URL-jéhez kell tartoznia, illetve olyan, helyettesítő karaktereket tartalmazó tanúsítványnak kell lennie, amely több aldomainnél vagy domainnél is felhasználható.

Haladó felhasználóknak: Kérje a Google-t a dinamikus paraméterek figyelmen kívül hagyására

A paraméterkezelő eszközzel tájékoztathatja a Googlebotot azokról a paraméterekről, amelyeket figyelmen kívül kell hagyni a feltérképezés során. Bizonyos paraméterek figyelmen kívül hagyása csökkentheti a párhuzamos tartalmat a Google indexében, és könnyebben feltérképezhetővé teszi webhelyét. Ha például megadja, hogy a sessionid paramétert figyelmen kívül kell hagyni, akkor a Googlebot párhuzamosnak fogja tekinteni a következő URL-eket:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

A konkrét módszerek

Az alábbi módszerek valamelyikének használatával adjon meg gyűjtő-URL-t a párhuzamos URL-ek, illetve a párhuzamos vagy hasonló oldalak számára.

Az összes módszer esetében tartsa be a fent ismertetett általános irányelveket.

Előnyben részesített domain beállítása

A Search Console használatával árulja el a Google-nak, hogy webhelye melyik URL-verzióját részesíti előnyben gyűjtő-URL-ként a domainje esetében:

  • https://www.example.com
  • https://example.com

Ha a preferált domain a https://example.com, a Google a www.example.com domainen lévő hasonló URL-eket vagy oldalakat az example.com domainen lévő URL-ek vagy oldalak ismétlődésének tekinti.

További tájékoztatást az Előnyben részesített domain beállítása című cikkben talál.

A rel="canonical" link címke használata

Az oldal fejlécében lévő <link> címkével jelezheti, hogy az oldal egy másik oldal párhuzamos tartalma.

Tegyük fel, hogy a https://example.com/dresses/green-dresses oldalt szeretné beállítani gyűjtő-URL-ként, még ha több URL-en keresztül is el lehet érni ugyanezt a tartalmat. A következőképpen jelölheti meg az URL-t gyűjtőként:

  1. Jelölje meg a párhuzamos oldalakat a rel="canonical" linkelemmel. Adjon gyűjtőoldalra mutató <link> elemet rel="canonical" attribútummal a párhuzamos oldalak <head> szakaszához. Példa:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. Ha a gyűjtőoldalnak mobilváltozata is van, adja hozzá a rel="alternate" linket, amely az oldal mobilos változatára mutat:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. Adja az oldalhoz a szükséges hreflang címkéket vagy más átirányításokat.

Abszolút elérési utat adjon meg a rel="canonical" linkelemmel, ne relatív útvonalat.

Ezt a struktúrát használja:  https://www.example.com/dresses/green/greendresss.html
Ne ezt a struktúrát: /dresses/green/greendress.html
A rel="canonical" HTTP-fejléc használata

Szervere beállításakor használhatja a rel="canonical" HTTP-fejlécet (HTML-címkék helyett) a nem HTML-dokumentumok (például PDF-fájlok) gyűjtő-URL-jének jelzésére.

Ha például több URL-en is elérhetővé teszi ugyanazt a PDF-fájlt, úgy tájékoztathatja a Googlebotot a fájl gyűjtő-URL-jéről, hogy a párhuzamos URL-ekkel visszaküldi a rel="canonical" HTTP-fejlécet:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

A Google jelenleg csak ezt a módszert támogatja az internetes keresési találatok esetében.

Abszolút elérési utat adjon meg a rel="canonical" linkelemmel, ne relatív útvonalat. Tehát:
Ezt a struktúrát használja: http://www.example.com/downloads/white-paper.pdf
Ne ezt a struktúrát: /downloads/white-paper.pdf
Webhelytérkép használata

Válasszon ki gyűjtő-URL-eket az oldalaihoz, majd küldje el őket webhelytérképben. A webhelytérképben feltüntetett oldalakat a rendszer gyűjtőoldalra vonatkozó javaslatnak tekinti, és a tartalmak hasonlósága alapján a Googlebot dönti el, hogy mely oldalak párhuzamosak (ha vannak ilyenek).

Azt nem garantáljuk, hogy a webhelytérképben szereplő URL-eket fogjuk gyűjtő-URL-eknek tekinteni, de nagyobb webhelyek esetében ezzel a módszerrel egyszerűen megadhatók a gyűjtő-URL-ek, ráadásul a webhelytérképek azért is hasznosak, mert tájékoztatják a Google-t arról, hogy Ön a webhelye mely oldalait tekinti legfontosabbnak.

Ne vegyen fel nem gyűjtőoldalakat a webhelytérképbe. Ha webhelytérképet használ, abban csak gyűjtő-URL-eket adjon meg.

301-es átirányítások használata megszüntetett URL-ekhez

Akkor használja ezt a módszert, ha meg szeretne szabadulni a párhuzamos oldalaktól, de a régi URL-ek megszüntetése előtt biztosítani szeretné a zökkenőmentes átmenetet.

Tegyük fel, hogy oldalát többféleképpen is el lehet érni:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Válassza ki az egyik URL-címet gyűjtő-URL-ként, és 301-es átirányításokkal küldje tovább a bejövő forgalmat az egyéb URL-címekről az előnyben részesített URL-címre. A szerveroldali 301-es átirányítás révén biztosítható legeredményesebben, hogy a felhasználókat és a keresőmotorokat a rendszer a megfelelő oldal felé irányítsa. A 301-es állapotkód arra utal, hogy a kért oldal véglegesen új helyre került.

Ha Ön egy webhelytároló szolgáltatáson tartózkodik, végezzen keresést a dokumentációjukban a 301-es átirányítások beállításáról.

Hasznos volt ez a cikk?
Hogyan fejleszthetnénk?