Ismétlődő URL-ek összevonása

Gyűjtőoldal megadása hasonló vagy ismétlődő oldalakhoz

Összegzés

Ha olyan egyedi weboldallal rendelkezik, amely több URL-ről is elérhető, illetve ha több weboldala is hasonló tartalommal rendelkezik (például adott oldalnak mobilos és asztali verziója is van), akkor a Google ezeket ugyanannak az oldalnak az ismétlődő verzióiként érzékeli. A Google kiválaszt egy URL-t gyűjtőverzióként, és azt térképezi fel, a többi URL-t pedig ismétlődő URL-ként kezeli, és ritkábban térképezi fel. 

Ha nem adja meg kifejezetten a Google-nak, hogy melyik a gyűjtő-URL, akkor a Google hozza meg a döntést Ön helyett, de az is előfordulhat, hogy mindkettőt azonos súllyal kezeli – ami nem kívánt viselkedéshez vezethet (a részleteket lásd a Miért válasszam ki a gyűjtő-URL-t című részben alább).

További részletek
A következőkben valószínűleg több információt talál a gyűjtésről, mint amennyire szüksége van, ezért nyugodtan hagyja ki ezt a részt. Ha azonban érdeklik az ilyen dolgok, olvasson tovább.
Amikor a Googlebot indexel egy adott webhelyet, megpróbálja megállapítani, hogy az egyes oldalak milyen témákkal foglalkoznak. Ha ugyanazon a webhelyen több olyan oldalt is talál, amelyek látszólag ugyanarról a témáról szólnak, kiválasztja a legjobbnak és leghasznosabbnak ítélt oldalt, és megjelöli ezt gyűjtőoldalként. A jövőben a gyűjtőoldalt térképezi fel a legnagyobb rendszerességgel, az ismétlődő oldalakat pedig kevésbé gyakran, így spórol a webhely feltérképezésének költségein. Ha tehát Ön nem mondja meg a Googlebotnak, hogy melyik a gyűjtőoldala, és egy másik oldalt használ erre a célra, akkor olyan oldal frissítésébe fektetheti az energiáját, amelyet a Googlebot nem indexel és nem jelenít meg túl sűrűn a keresési eredményekben.
A Google a webhely gyűjtőoldalait használja a tartalommal kapcsolatos zsinórmértékként a tartalom és a minőség megítélésének tekintetében, és a Google Keresés találatai általában a gyűjtőoldalakra mutatnak. Ez alól kivételt jelent, ha az ismétlődő oldalak valamelyike jobban megfelel a felhasználó lekérdezésének; ha például a felhasználó mobileszközt használ, akkor a keresési találat valószínűleg még akkor is az oldal mobilverziójára mutat, ha a hagyományos változat van megjelölve gyűjtőoldalként.
A Google több tényezőt (vagy jelet) figyelembe vesz a gyűjtőoldal kiválasztásakor. Ezek közé tartozik például, hogy az oldal http vagy https protokollon keresztül jelenik meg; a felhasználó által előnyben részesített domain; az oldalminőség; az URL megléte a webhelytérképben; valamint az összes „rel=canonical” címke. Nem kényszerítheti a Google-t konkrét gyűjtőoldal használatára, de az alább ismertetett módszerek használatával befolyásolhatja a döntését.

 

Miért lehetnek hasonló vagy ismétlődő oldalaim?

Több oka is lehet annak, hogy egy adott webhelyen különböző URL-ek is ugyanarra az oldalra mutatnak, illetve annak, hogy ismétlődő vagy nagyon hasonló oldalak találhatók eltérő URL-eken. A leggyakoribb okok a következők:

  • Több eszköztípus támogatása:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • Dinamikus URL-ek engedélyezése például keresési paraméterekhez vagy munkamenet-azonosítókhoz:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • A blogmotor automatikusan több URL-t ment, ha ugyanaz a bejegyzés több szakaszba is bekerül.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • A szerver úgy van beállítva, hogy ugyanazt a tartalmat jelenítse meg a www/nem www, illetve a http/https változatok esetében:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • A blogon más webhelyekre történő terjesztés céljából közzétett tartalmak részben vagy egészben megtalálhatók a többi domainen:
    https://news.example.com/green-dresses-for-every-day-155672.html (terjesztett bejegyzés) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (eredeti bejegyzés)

Miért válasszam ki a gyűjtő-URL-t?

Több oka is van, miért érdemes gyűjtőoldalt választania több ismétlődő vagy hasonló oldal közül:

  • Megadhatja, hogy az emberek melyik URL-t lássák a keresési eredményekben. Ön például jobban szeretné, ha az emberek a zöld ruhákkal foglalkozó termékoldalát a https://www.example.com/dresses/green/greendress.html címen keresztül érnék el a https://example.com/dresses/cocktail?gclid=ABCD cím helyett.
  • Összevonhatja az ismétlődő vagy hasonló oldalakra vonatkozó linkjelzéseket. Ez a keresőmotoroknak segít abban, hogy össze tudják vonni az egyes URL-ekkel kapcsolatos információikat (például a rájuk mutató linkeket) egyetlen, preferált URL-be. Ez azt jelenti, hogy a http://example.com/dresses/cocktail?gclid=ABCD címre mutató linkek össze lesznek vonva a https://www.example.com/dresses/green/greendress.html címre mutató linkekkel.
  • Megkönnyítheti egyetlen termék vagy téma mutatóinak nyomon követését. Számos különböző URL esetén nehezebb összevont mutatókat kapni egy adott tartalomról.
  • Kezelheti a más webhelyekre terjesztett tartalmakat. Ha tartalmát terjeszti más domaineken történő közzétételre, akkor az oldalrangsort az előnyben részesített URL-re célszerű összevonni.
  • Csökkentheti az ismétlődő oldalakon eltöltött feltérképezési időt. Hogy a Googlebot a legtöbbet kihozza a webhelyből, jobb, ha az új (vagy frissített) oldalak feltérképezésével foglalkozik, nem pedig ugyanazon oldalak asztali és mobilverzióinak feltérképezésével.

Milyen URL-eket tekint a Google gyűjtőoldalaknak (vagy ismétlődőnek)?

Az URL-ellenőrző eszköz segítségével megismerheti, hogy mely oldalakat kezeli a Google gyűjtő-URL-ként. Kérjük, vegye figyelembe, hogy még ha kifejezetten ki is jelöli a gyűjtőoldalt, előfordulhat, hogy a Google különböző okokból (pl. a teljesítmény vagy a tartalom miatt) másik gyűjtő-URL-t választ ki.

Gyűjtőoldal megadása

Használattól függően többféle módon is megadható az ismétlődő oldalakat tartalmazó csoport gyűjtőoldala:

Módszer Leírás
Általános irányelvek Ezeket az irányelveket mindegyik gyűjtési módszer esetében tartsa be.
Előnyben részesített domain megadása

Adott domainen lévő URL-ek gyűjtőként való meghatározása valamilyen másik domainen lévő megfelelőikkel szemben a Search Console használatával. Például: www.example.com helyett example.com. Csak akkor használja ezt a módszert, ha két ugyanolyan webhelye van, amelyek csak az aldomainjükben különböznek egymástól. Ne használja, ha az eltérés a http/https protokoll használatából áll.

Előnyök:

  • Könnyen megvalósítható, kezelhető és módosítható.
  • Akkor használható, ha ugyanaz a webhely különböző domaineken van.

Hátrányok:

  • Csak domainek szintjén működik, és az oldalak elérési útjának és nevének is egyeznie kell, hogy ismétlődőnek tekintse őket a rendszer.
  • Csak adott oldalak közti társítást tesz lehetővé azonos útvonallal és névvel rendelkező oldalak esetében.
rel=canonical <link> címke

A gyűjtőoldalra mutató <link> címke hozzáadása a kódhoz az összes ismétlődő oldalnál.

Előnyök:

  • Végtelen számú ismétlődő oldal társítható ily módon.

Hátrányok:

  • Növelheti az oldal méretét.
  • A társításokat nehezebb lehet kezelni a nagy webhelyeken, illetve az olyan webhelyeken, amelyeken az URL-ek gyakran módosulnak.
  • Kizárólag HTML-oldalak esetében működik, fájlok (például PDF-fájl) esetében nem. Erre a célra a rel=canonical HTTP-fejlécet használhatja.
rel=canonical HTTP-fejléc

A rel=canonical fejléc elküldése az oldalválaszban.

Előnyök:

  • Nem növeli az oldal méretét.
  • Végtelen számú ismétlődő oldal társítható ily módon.

Hátrányok:

  • A társításokat nehezebb lehet kezelni a nagy webhelyeken, illetve az olyan webhelyeken, amelyeken az URL-ek gyakran módosulnak.
Webhelytérkép

A gyűjtőoldalak megadása webhelytérképben.

Előnyök:

  • Könnyű elkészíteni és kezelni, különösen nagy webhelyek esetében.

Hátrányok:

  • A Googlebotnak továbbra is meg kell határoznia a webhelytérképben megadott gyűjtőoldalakhoz társuló ismétlődő tartalmakat.
  • Kevésbé szigorú jelzés a Googlebot számára, mint a rel=canonical társítási módszer.
301-es átirányítás A Googlebot tájékoztatása 301-es átirányítások használatával arról, hogy az átirányítás végcélja jobb változatot tartalmaz, mint a megadott URL. Csak akkor használja ezt, ha megszüntet egy ismétlődő oldalt.
AMP-változat Ha a változatok egyike AMP-oldal, az AMP-irányelveknek megfelelően jelezheti a gyűjtőoldalt és az AMP-változatot.

 

Bár mi a fenti módszerek valamelyikének használatára szeretnénk ösztönözni mindenkit, egyik sem kötelező. Ha nem ad meg gyűjtő-URL-t, akkor az általunk legjobbnak ítélt verziót vesszük figyelembe.

Általános irányelvek

Az összes gyűjtési módszer esetében tartsa be az alábbi általános irányelveket.

Általános irányelvek
  • Ne használja a robots.txt fájlt gyűjtési célra.
  • Ne használja az URL-eltávolító eszközt ilyen célokra: ezzel az URL összes változatát eltávolítja a keresésből.
  • Ne adjon meg több különböző URL-t ugyanannak az oldalnak a gyűjtő-URL-jeként ugyanolyan vagy más gyűjtési módszer használatával (például ne adjon meg URL-t a webhelytérképben és az ugyanarra az oldalra mutató másik URL-t a rel="canonical" használatával).
  • Ne használja a noindex címkét arra, hogy megakadályozza a gyűjtőoldal kiválasztását. Ez az utasítás arra szolgál, hogy kizárjon oldalakat az indexből, nem pedig a gyűjtőoldal kiválasztásának befolyásolására. 
  • Adjon meg gyűjtőoldalt, ha használ hreflang címkéket. A gyűjtőoldalt ugyanazon a nyelven, vagy ha az adott nyelvhez nem létezik gyűjtőoldal, akkor a lehető legjobb helyettesítő nyelven adja meg.

A HTTPS protokoll előnyben részesítése a HTTP protokollal szemben a gyűjtő-URL-eknél

A Google a HTTPS-oldalakat részesíti előnyben az azonos HTTP-oldalakkal szemben gyűjtő-URL-ként; kivéve a problémás vagy ütközést okozó eseteknél, így például a következő körülmények között:

  • A HTTPS-oldal SSL-tanúsítványa érvénytelen.
  • A HTTPS-oldal nem biztonságos függőségeket tartalmaz (amelyek nem képek).
  • A HTTPS-oldal átirányítja a felhasználókat egy HTTP-oldalra vagy azon keresztül.
  • A HTTPS-oldal rel="canonical" linket tartalmaz a HTTP-oldalra.

Bár rendszereink alapértelmezés szerint is előnyben részesítik a HTTPS-oldalakat a HTTP-oldalakkal szemben, ezt a viselkedést az alábbi műveletekkel biztosíthatja:

  • Adjon hozzá átirányításokat a HTTP-oldalról a HTTPS-oldalra.
  • Adjon hozzá rel="canonical" linket, amely a HTTP-oldalról a HTTPS-oldalra mutat.
  • A HSTS megvalósítása.

Ha meg szeretné akadályozni, hogy a Google tévesen a HTTP-oldalt tegye gyűjtő-URL-lé, kerülje az alábbiakat:

  • Helytelen SSL-tanúsítványok és HTTPS-HTTP átirányítások, amelyek következtében a HTTP-t preferáljuk. A HSTS implementálásával nem írja felül ezt az erősebb beállítást.
  • A HTTPS-verzió helyett a HTTP-oldal szerepeltetése a webhelytérképben vagy a hreflang-elemekben.
  • Az SSL-/TLS-tanúsítvány nem megfelelő hostváltozathoz való implementálása: például amikor az example.com a www.example.com tanúsítványát mutatja be.  A tanúsítványnak a webhely pontos és teljes URL-jéhez kell tartoznia, illetve olyan, helyettesítő karaktereket tartalmazó tanúsítványnak kell lennie, amely több aldomainnél vagy domainnél is felhasználható.

A Google megkérése arra, hogy hagyja figyelmen kívül a dinamikus paramétereket

A paraméterkezelő eszközzel tájékoztathatja a Googlebotot azokról a paraméterekről, amelyeket figyelmen kívül kell hagyni a feltérképezés során. Bizonyos paraméterek figyelmen kívül hagyása csökkentheti az ismétlődő tartalmat a Google indexében, és könnyebben feltérképezhetővé teszi webhelyét. Ha például megadja, hogy a sessionid paramétert figyelmen kívül kell hagyni, akkor a Googlebot ismétlődőnek fogja tekinteni a következő URL-eket:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

A konkrét módszerek

Az alábbi módszerek valamelyikének használatával adjon meg gyűjtő-URL-t az ismétlődő URL-ek, illetve az ismétlődő vagy hasonló oldalak számára.

Az összes módszer esetében tartsa be a fent ismertetett általános irányelveket.

Előnyben részesített domain beállítása

A Search Console használatával árulja el a Google-nak, hogy webhelye melyik URL-verzióját részesíti előnyben gyűjtő-URL-ként a domainje esetében:

  • https://www.example.com
  • https://example.com

Ha a preferált domain a https://example.com, a Google a www.example.com domainen lévő hasonló URL-eket vagy oldalakat az example.com domainen lévő URL-ek vagy oldalak ismétlődésének tekinti.

További tájékoztatást az Előnyben részesített domain beállítása című cikkben talál.

A rel="canonical" link címke használata

Az oldal fejlécében lévő <link> címkével jelezheti, hogy az oldal egy másik oldal ismétlődő tartalma.

Tegyük fel, hogy a https://example.com/dresses/green-dresses oldalt szeretné beállítani gyűjtő-URL-ként, még ha több URL-en keresztül is el lehet érni ugyanezt a tartalmat. A következőképpen jelölheti meg az URL-t gyűjtőként:

  1. Az összes ismétlődő oldalt jelölje meg a rel="canonical" link elemmel. Az ismétlődő oldalak <head> szakaszához adjon hozzá egy-egy <link> elemet a rel="canonical" attribútummal, amely a gyűjtőoldalra mutat. Példa:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. Ha a gyűjtőoldalnak van mobilváltozata is, adja hozzá a rel="alternate" linket, amely az oldal mobilverziójára mutat:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. Adja hozzá az oldalhoz a szükséges hreflang címkéket vagy más átirányításokat.

A rel="canonical" link elemmel abszolút elérési utat adjon meg a relatív helyett.

Ezt a struktúrát használja:  https://www.example.com/dresses/green/greendresss.html
Ne ezt a struktúrát: /dresses/green/greendress.html
A rel="canonical" HTTP-fejléc használata

Szervere beállításakor használhatja a rel="canonical" HTTP-fejlécet (HTML-címkék helyett) a nem HTML-dokumentumok (például PDF-fájlok) gyűjtő-URL-jének jelzésére.

Ha például több URL-en is elérhetővé teszi ugyanazt a PDF-fájlt, úgy tájékoztathatja a Googlebotot a fájl gyűjtő-URL-jéről, hogy az ismétlődő URL-ekkel visszaküldi a rel="canonical" HTTP-fejlécet:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

A Google jelenleg csak ezt a módszert támogatja az internetes keresési találatok esetében.

A rel="canonical" link elemmel abszolút elérési utat adjon meg a relatív helyett. Tehát:
Ezt a struktúrát használja: http://www.example.com/downloads/white-paper.pdf
Ne ezt a struktúrát: /downloads/white-paper.pdf
Webhelytérkép használata

Válasszon ki gyűjtő-URL-eket az oldalaihoz, majd küldje el őket webhelytérképben. A webhelytérképben feltüntetett oldalakat a rendszer gyűjtőoldalra vonatkozó javaslatnak tekinti, és a tartalmak hasonlósága alapján a Googlebot dönti el, hogy mely oldalak ismétlődnek (ha vannak ilyenek).

Azt nem garantáljuk, hogy a webhelytérképben szereplő URL-eket fogjuk gyűjtő-URL-eknek tekinteni, de nagyobb webhelyek esetében ezzel a módszerrel egyszerűen megadhatók a gyűjtő-URL-ek, ráadásul a webhelytérképek azért is hasznosak, mert tájékoztatják a Google-t arról, hogy Ön a webhelye mely oldalait tekinti legfontosabbnak.

Ne vegyen fel nem gyűjtőoldalakat a webhelytérképbe. Ha webhelytérképet használ, abban csak gyűjtő-URL-eket adjon meg.

301-es átirányítások használata megszüntetett URL-ekhez

Akkor használja ezt a módszert, ha meg szeretne szabadulni az ismétlődő oldalaktól, de a régi URL-ek megszüntetése előtt biztosítani szeretné a zökkenőmentes átmenetet.

Tegyük fel, hogy oldalát többféleképpen is el lehet érni:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Válassza ki az egyik URL-címet gyűjtő-URL-ként, és 301-es átirányításokkal küldje tovább a bejövő forgalmat az egyéb URL-címekről az előnyben részesített URL-címre. A szerveroldali 301-es átirányítás révén biztosítható legeredményesebben, hogy a felhasználókat és a keresőmotorokat a rendszer a megfelelő oldal felé irányítsa. A 301-es állapotkód arra utal, hogy a kért oldal véglegesen új helyre került.

Ha Ön egy webhelytároló szolgáltatáson tartózkodik, végezzen keresést a dokumentációjukban a 301-es átirányítások beállításáról.

Hasznos volt ez a cikk?
Hogyan fejleszthetnénk?