Ismétlődő URL-ek összevonása

Gyűjtőoldal megadása hasonló vagy ismétlődő oldalakhoz

Összegzés

Ha rendelkezik olyan egyedi weboldallal, amely több URL-ről is elérhető, illetve ha több weboldala is hasonló tartalommal rendelkezik (például adott oldalnak mobilos és asztali verziója is van), érdemes tájékoztatnia a Google-t arról, hogy az adott oldalra vonatkozóan melyik URL a mérvadó (gyűjtő-URL). Ha ezt nem teszi meg, akkor a Google hozza meg a döntést Ön helyett, de az is előfordulhat, hogy mindkettőt azonos súllyal kezeli, ami nem kívánt viselkedéshez vezethet (a részleteket lásd alább).

Felhívjuk figyelmét, hogy bár azt javasoljuk, hogy adjon meg gyűjtőoldalt az ismétlődő URL-ekhez és verziókhoz, mégis lehetséges, hogy a Google algoritmusai bizonyos okok (például tartalom- vagy teljesítménybeli okok) miatt másik oldalt választanak ki gyűjtőoldalként.

Miért lehetnek hasonló vagy ismétlődő oldalaim?

Több oka is lehet annak, hogy egy adott webhelyen különböző URL-ek is ugyanarra az oldalra mutatnak, illetve annak, hogy ismétlődő vagy nagyon hasonló oldalak találhatók eltérő URL-eken. A leggyakoribb okok a következők:

  • Több eszköztípus támogatása:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • Dinamikus URL-ek engedélyezése például keresési paraméterekhez vagy munkamenet-azonosítókhoz:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • A blogmotor automatikusan több URL-t ment, ha ugyanaz a bejegyzés több szakaszba is bekerül.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • A szerver úgy van beállítva, hogy ugyanazt a tartalmat jelenítse meg a www/nem www, illetve a http/https változatok esetében:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • A blogon más webhelyekre történő terjesztés céljából közzétett tartalmak részben vagy egészben megtalálhatók a többi domainen:
    https://news.example.com/green-dresses-for-every-day-155672.html (terjesztett bejegyzés) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (eredeti bejegyzés)
Részletek
A következőkben valószínűleg több információt talál a gyűjtésről, mint amennyire szüksége van, ezért nyugodtan hagyja ki ezt a részt. Ha azonban érdeklik az ilyen dolgok, olvasson tovább.
Amikor a Googlebot indexel egy adott webhelyet, megpróbálja megállapítani, hogy az egyes oldalak milyen témákkal foglalkoznak. Ha ugyanazon a webhelyen több olyan oldalt is talál, amelyek látszólag ugyanarról a témáról szólnak, kiválasztja a legjobbnak és leghasznosabbnak ítélt oldalt, és megjelöli ezt gyűjtőoldalként. A jövőben a gyűjtőoldalt térképezi fel a legnagyobb rendszerességgel, az ismétlődő oldalakat pedig kevésbé gyakran, így spórol a webhely feltérképezésének költségein. Ha tehát Ön nem mondja meg a Googlebotnak, hogy melyik a gyűjtőoldala, és egy másik oldalt használ erre a célra, akkor olyan oldal frissítésébe fektetheti az energiáját, amelyet a Googlebot nem indexel és nem jelenít meg túl sűrűn a keresési eredményekben.
A Google a webhely gyűjtőoldalait használja a tartalommal kapcsolatos zsinórmértékként a tartalom és a minőség megítélésének tekintetében, és a Google Keresés találatai általában a gyűjtőoldalakra mutatnak. Ez alól kivételt jelent, ha az ismétlődő oldalak valamelyike jobban megfelel a felhasználó lekérdezésének; ha például a felhasználó mobileszközt használ, akkor a keresési találat valószínűleg még akkor is az oldal mobilverziójára mutat, ha a hagyományos változat van megjelölve gyűjtőoldalként.
A Google több tényezőt (vagy jelet) figyelembe vesz a gyűjtőoldal kiválasztásakor. Ezek közé tartozik például, hogy az oldal http vagy https protokollon keresztül jelenik meg; a felhasználó által előnyben részesített domain; az oldalminőség; az URL megléte a webhelytérképben; valamint az összes „rel=canonical” címke. Nem kényszerítheti rá a Google-t konkrét gyűjtőoldal használatára, de az alább ismertetett módszerek használatával befolyásolhatja a döntését.

Miért fontos ez?

Több oka is van, miért érdemes kiválasztani egy gyűjtőoldalt több ismétlődő vagy hasonló oldal közül:

  • Megadhatja, hogy az emberek melyik URL-t lássák a keresési eredményekben. Ön például jobban szeretné, ha az emberek a zöld ruhákkal foglalkozó termékoldalát a https://www.example.com/dresses/green/greendress.html címen keresztül érnék el a https://example.com/dresses/cocktail?gclid=ABCD cím helyett.
  • Összevonhatja az ismétlődő vagy hasonló oldalakra vonatkozó linkjelzéseket. Ez a keresőmotoroknak segít abban, hogy össze tudják vonni az egyes URL-ekkel kapcsolatos információikat (például a rájuk mutató linkeket) egyetlen, preferált URL-be. Ez azt jelenti, hogy a http://example.com/dresses/cocktail?gclid=ABCD címre mutató linkek össze lesznek vonva a https://www.example.com/dresses/green/greendress.html címre mutató linkekkel.
  • Megkönnyítheti egyetlen termék vagy téma mutatóinak nyomon követését. Számos különböző URL esetén nehezebb összevont mutatókat kapni egy adott tartalomról.
  • Kezelheti a más webhelyekre terjesztett tartalmakat. Ha tartalmát terjeszti más domaineken történő közzétételre, akkor az oldalrangsort az előnyben részesített URL-re célszerű összevonni.
  • Csökkentheti az ismétlődő oldalakon eltöltött feltérképezési időt. Hogy a Googlebot a legtöbbet kihozza a webhelyből, jobb, ha az új (vagy frissített) oldalak feltérképezésével foglalkozik, nem pedig ugyanazon oldalak asztali és mobilverzióinak feltérképezésével.

Milyen URL-eket tekint a Google gyűjtőoldalaknak (vagy ismétlődőnek)?

Az Indexelési állapot jelentéssel ellenőrizheti, mely URL-ek minősülnek gyűjtőnek, illetve ismétlődőnek. Az ismétlődő URL-ek kizártként, míg a gyűjtőoldalak érvényesként lesznek megjelölve.

Ha szeretné megnézni, mely oldalakat érdemes kifejezetten megjelölni gyűjtőoldalként, keresse a következő megjelöléssel rendelkező érvényes URL-eket: „Indexelve; vegye fontolóra a kanonikussá alakítást”.

Ha arra kíváncsi, mely csoportok esetében választott a Google az Önétől eltérő gyűjtőoldalt, keresse a következő megjelöléssel rendelkező kizárt URL-eket: „A Google a felhasználó által megjelölt gyűjtőoldaltól eltérőt választott”.

Gyűjtőoldal megadása

Használattól függően többféle módon is megadható az ismétlődő oldalakat tartalmazó csoport gyűjtőoldala:

Módszer Leírás
Általános irányelvek Ezeket az irányelveket mindegyik gyűjtési módszer esetében tartsa be.
Előnyben részesített domain megadása

Adott domainen lévő URL-ek gyűjtőként való meghatározása valamilyen másik domainen lévő megfelelőikkel szemben a Search Console használatával. Például: www.example.com helyett example.com. Csak akkor használja ezt a módszert, ha két ugyanolyan webhelye van, amelyek csak az aldomainjükben különböznek egymástól. Ne használja, ha az eltérés a http/https protokoll használatából áll.

Előnyök:

  • Könnyen megvalósítható, kezelhető és módosítható.
  • Akkor használható, ha ugyanaz a webhely különböző domaineken van.

Hátrányok:

  • Csak domainek szintjén működik, és az oldalak elérési útjának és nevének is egyeznie kell, hogy ismétlődőnek tekintse őket a rendszer.
  • Csak adott oldalak közti társítást tesz lehetővé azonos útvonallal és névvel rendelkező oldalak esetében.
rel=canonical <link> címke

A gyűjtőoldalra mutató <link> címke hozzáadása a kódhoz az összes ismétlődő oldalnál.

Előnyök:

  • Végtelen számú ismétlődő oldal társítható ily módon.

Hátrányok:

  • Növelheti az oldal méretét.
  • A társításokat nehezebb lehet kezelni a nagy webhelyeken, illetve az olyan webhelyeken, amelyeken az URL-ek gyakran módosulnak.
  • Kizárólag HTML-oldalak esetében működik, fájlok (például PDF-fájl) esetében nem. Erre a célra a rel=canonical HTTP-fejlécet használhatja.
rel=canonical HTTP-fejléc

A rel=canonical fejléc elküldése az oldalválaszban.

Előnyök:

  • Nem növeli az oldal méretét.
  • Végtelen számú ismétlődő oldal társítható ily módon.

Hátrányok:

  • A társításokat nehezebb lehet kezelni a nagy webhelyeken, illetve az olyan webhelyeken, amelyeken az URL-ek gyakran módosulnak.
Webhelytérkép

A gyűjtőoldalak megadása webhelytérképben.

Előnyök:

  • Könnyű elkészíteni és kezelni, különösen nagy webhelyek esetében.

Hátrányok:

  • A Googlebotnak továbbra is meg kell határoznia a webhelytérképben megadott gyűjtőoldalakhoz társuló ismétlődő tartalmakat.
  • Kevésbé szigorú jelzés a Googlebot számára, mint a rel=canonical társítási módszer.
301-es átirányítás A Googlebot tájékoztatása 301-es átirányítások használatával arról, hogy az átirányítás végcélja jobb változatot tartalmaz, mint a megadott URL. Csak akkor használja ezt, ha megszüntet egy ismétlődő oldalt.
AMP-változat Ha a változatok egyike AMP-oldal, az AMP-irányelveknek megfelelően jelezheti a gyűjtőoldalt és az AMP-változatot.

 

Bár mi a fenti módszerek valamelyikének használatára szeretnénk ösztönözni mindenkit, egyik sem kötelező. Ha nem ad meg gyűjtő-URL-t, akkor az általunk legjobbnak ítélt verziót vesszük figyelembe.

Általános irányelvek

Az összes gyűjtési módszer esetében tartsa be az alábbi általános irányelveket.

Általános irányelvek
  • Ne használja a robots.txt fájlt gyűjtési célra.
  • Ne használja az URL-eltávolító eszközt ilyen célokra: ezzel az URL összes változatát eltávolítja a keresésből.
  • Ne adjon meg több különböző URL-t ugyanannak az oldalnak a gyűjtő-URL-jeként ugyanolyan vagy más gyűjtési módszer használatával (például ne adjon meg URL-t a webhelytérképben és egy ugyanarra az oldalra mutató másik URL-t a rel="canonical" használatával).
  • Ne használja a noindex címkét arra, hogy megakadályozza a gyűjtőoldal kiválasztását. Ez az utasítás arra szolgál, hogy kizárjon oldalakat az indexből, nem pedig a gyűjtőoldal kiválasztásának befolyásolására. 
  • Adjon meg gyűjtőoldalt, ha használ hreflang címkéket. A gyűjtőoldalt ugyanazon a nyelven, vagy ha az adott nyelvhez nem létezik gyűjtőoldal, akkor a lehető legjobb helyettesítő nyelven adja meg.

A HTTPS protokoll előnyben részesítése a HTTP protokollal szemben a gyűjtő-URL-eknél

A Google a HTTPS-oldalakat részesíti előnyben az azonos HTTP-oldalakkal szemben gyűjtő-URL-ként; kivéve a problémás vagy ütközést okozó eseteknél, így például a következő körülmények között:

  • A HTTPS-oldal SSL-tanúsítványa érvénytelen.
  • A HTTPS-oldal nem biztonságos függőségeket tartalmaz (amelyek nem képek).
  • A HTTPS-oldal átirányítja a felhasználókat egy HTTP-oldalra vagy azon keresztül.
  • A HTTPS-oldal rel="canonical" linket tartalmaz a HTTP-oldalra.

Bár rendszereink alapértelmezés szerint is előnyben részesítik a HTTPS-oldalakat a HTTP-oldalakkal szemben, ezt a viselkedést az alábbi műveletekkel biztosíthatja:

  • Adjon hozzá átirányításokat a HTTP-oldalról a HTTPS-oldalra.
  • Adjon hozzá rel="canonical" linket, amely a HTTP-oldalról a HTTPS-oldalra mutat.
  • A HSTS megvalósítása.

Ha meg szeretné akadályozni, hogy a Google tévesen a HTTP-oldalt tegye gyűjtő-URL-lé, kerülje az alábbiakat:

  • Helytelen SSL-tanúsítványok és HTTPS-HTTP átirányítások, amelyek következtében a HTTP-t preferáljuk. A HSTS implementálásával nem írja felül ezt az erősebb beállítást.
  • A HTTPS-verzió helyett a HTTP-oldal szerepeltetése a webhelytérképben vagy a hreflang-elemekben.
  • Az SSL-/TLS-tanúsítvány nem megfelelő hostváltozathoz való implementálása: például amikor az example.com a www.example.com tanúsítványát mutatja be.  A tanúsítványnak a webhely pontos és teljes URL-jéhez kell tartoznia, illetve egy olyan helyettesítő karaktereket tartalmazó tanúsítványnak kell lennie, amely több aldomainnél vagy domainnél is felhasználható.

A Google megkérése arra, hogy hagyja figyelmen kívül a dinamikus paramétereket

A paraméterkezelő eszközzel tájékoztathatja a Googlebotot azokról a paraméterekről, amelyeket figyelmen kívül kell hagyni a feltérképezés során. Bizonyos paraméterek figyelmen kívül hagyása csökkentheti az ismétlődő tartalmat a Google indexében, és könnyebben feltérképezhetővé teszi webhelyét. Ha például megadja, hogy a sessionid paramétert figyelmen kívül kell hagyni, akkor a Googlebot ismétlődőnek fogja tekinteni a következő URL-eket:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

A konkrét módszerek

Az alábbi módszerek valamelyikének használatával adjon meg gyűjtő-URL-t az ismétlődő URL-ek, illetve az ismétlődő vagy hasonló oldalak számára.

Az összes módszer esetében tartsa be a fent ismertetett általános irányelveket.

Előnyben részesített domain beállítása

A Search Console használatával árulja el a Google-nak, hogy webhelye melyik URL-verzióját részesíti előnyben gyűjtő-URL-ként a domainje esetében:

  • https://www.example.com
  • https://example.com

Ha a preferált domain a https://example.com, a Google a www.example.com domainen lévő hasonló URL-eket vagy oldalakat az example.com domainen lévő URL-ek vagy oldalak ismétlődésének tekinti.

További tájékoztatást az Előnyben részesített domain beállítása című cikkben talál.

A rel="canonical" link címke használata

Az oldal fejlécében lévő <link> címkével jelezheti, hogy az oldal egy másik oldal ismétlődő tartalma.

Tegyük fel, hogy a https://example.com/dresses/green-dresses oldalt szeretné beállítani gyűjtő-URL-ként, még ha több URL-en keresztül is el lehet érni ugyanezt a tartalmat. A következőképpen jelölheti meg az URL-t gyűjtőként:

  1. Az összes ismétlődő oldalt jelölje meg a rel="canonical" linkelemmel. Az ismétlődő oldalak <head> szakaszához adjon hozzá egy-egy <link> elemet a rel="canonical" attribútummal, amely a gyűjtőoldalra mutat. Példa:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. Ha a gyűjtőoldalnak van mobilváltozata is, adjon hozzá egy rel="alternate" linket, amely az oldal mobilverziójára mutat:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. Adja hozzá az oldalhoz a szükséges hreflang címkéket vagy más átirányításokat.

A rel="canonical" linkelemmel abszolút elérési utat adjon meg relatív helyett.

Ezt a struktúrát használja:  https://www.example.com/dresses/green/greendresss.html
Ne ezt a struktúrát: /dresses/green/greendress.html
A rel="canonical" HTTP-fejléc használata

Szervere beállításakor használhatja a rel="canonical" HTTP-fejlécet (HTML-címkék helyett) a nem HTML-dokumentumok (például PDF-fájlok) gyűjtő-URL-jének jelzésére.

Ha például több URL-en is elérhetővé teszi ugyanazt a PDF-fájlt, úgy tájékoztathatja a Googlebotot a fájl gyűjtő-URL-jéről, hogy az ismétlődő URL-ekkel visszaküldi a rel="canonical" HTTP-fejlécet:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

A Google jelenleg csak ezt a módszert támogatja az internetes keresési találatok esetében.

A rel="canonical" linkelemmel abszolút elérési utat adjon meg relatív helyett. Tehát:
Ezt a struktúrát használja: http://www.example.com/downloads/white-paper.pdf
Ne ezt a struktúrát: /downloads/white-paper.pdf
Webhelytérkép használata

Válasszon ki gyűjtő-URL-eket az oldalaihoz, majd küldje el őket webhelytérképben. A webhelytérképben feltüntetett oldalakat a rendszer gyűjtőoldalra vonatkozó javaslatnak tekinti, és a tartalmak hasonlósága alapján a Googlebot dönti el, hogy mely oldalak ismétlődnek (ha vannak ilyenek).

Azt nem garantáljuk, hogy a webhelytérképben szereplő URL-eket fogjuk gyűjtő-URL-eknek tekinteni, de nagyobb webhelyek esetében ezzel a módszerrel egyszerűen megadhatók a gyűjtő-URL-ek, ráadásul a webhelytérképek azért is hasznosak, mert tájékoztatják a Google-t arról, hogy Ön a webhelye mely oldalait tekinti legfontosabbnak.

Ne vegyen fel nem gyűjtőoldalakat a webhelytérképbe. Ha webhelytérképet használ, abban csak gyűjtő-URL-eket adjon meg.

301-es átirányítások használata megszüntetett URL-ekhez

Akkor használja ezt a módszert, ha meg szeretne szabadulni az ismétlődő oldalaktól, de a régi URL-ek megszüntetése előtt biztosítani szeretné a zökkenőmentes átmenetet.

Tegyük fel, hogy oldalát többféleképpen is el lehet érni:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Válassza ki az egyik URL-címet gyűjtő-URL-ként, és 301-es átirányításokkal küldje tovább a bejövő forgalmat az egyéb URL-címekről az előnyben részesített URL-címre. A szerveroldali 301-es átirányítás révén biztosítható legeredményesebben, hogy a felhasználókat és a keresőmotorokat a rendszer a megfelelő oldal felé irányítsa. A 301-es állapotkód arra utal, hogy a kért oldal véglegesen új helyre került.

Hasznos volt ez a cikk?
Hogyan fejleszthetnénk?