Päällekkäisten URL‑osoitteiden yhdistäminen

Ensisijaisen sivun määrittäminen samanlaisten tai päällekkäisten sivujen joukosta

Jos sivustosi yhdelle sivulle pääsee usean URL-osoitteen kautta tai monella sivulla on samanlaista sisältöä (esim. sivun mobiili- ja tietokoneversiot), Google näkee ne saman sivun kopioina. Google valitsee yhden ensisijaisen URL-osoitteen ja indeksoi sen. Kaikki muut URL-osoitteet katsotaan kopioiksi ja indeksoidaan harvemmin. 

Jos et itse määritä URL-osoitteen ensisijaisuutta, Google tekee sen puolestasi tai pitää molempia vaihtoehtoja samanarvoisina, millä voi olla ei-toivottuja seurauksia – lue lisää Miksi ensisijainen URL-osoite kannattaa valita? ‑kohdasta.

Mikä on ensisijainen URL-osoite?
Ensisijainen URL-osoite on sen sivun URL-osoite, joka edustaa Googlen mielestä sivustollasi olevia päällekkäisiä sivuja parhaiten. Jos samaa sivua varten on useampia URL-osoitteita (esim. example.com?dress=1234 ja example.com/dresses/1234), Google valitsee niistä yhden ensisijaiseksi. Huomaa, että sivujen ei tarvitse olla täsmälleen samanlaisia. Pienet eroavuudet lajittelussa ja suodatuksessa (esimerkiksi lajittelu hinnan tai suodatus tuotteen värin mukaan) eivät tee sivusta ainutlaatuista.
Ensisijainen sivu voi sijaita eri verkkotunnuksessa kuin päällekkäinen sivu.
Lue lisää
Kun Googlebot indeksoi sivuston, se pyrkii selvittämään kunkin sivun ensisijaisen sisällön. Jos Googlebot löytää sivustolta useita sivuja, jotka vaikuttavat samanlaisilta, se valitsee täydellisimmältä ja hyödyllisimmältä vaikuttavan sivun ja merkitsee sen ensisijaiseksi. Ensisijainen sivu indeksoidaan useimmin. Päällekkäiset sivut indeksoidaan harvemmin, jotta sivustosi indeksointikuormaa voidaan vähentää.
Google valitsee ensisijaisen sivun useiden tekijöiden eli signaalien perusteella: onko kyseessä http- vai https-sivu, millainen sivu on laadultaan, onko URL-osoite sivustokartassa ja onko sivulla "rel=canonical"-tunnuksia. Voit määrittää sivun ensisijaisuuden näillä tavoilla, mutta Google saattaa eri syistä valita toisen sivun ensisijaiseksi.
Yhden sivun eri kieliversioita pidetään päällekkäisinä vain, jos pääsisältö on samalla kielellä (eli jos vain ylä- ja alatunniste sekä muut vähemmän keskeiset tekstin osat käännetään mutta runko pysyy samana, sivuja pidetään päällekkäisinä).
Google käyttää ensisijaisia sivuja tärkeimpänä lähteenä sisällön ja laadun arvioinnissa. Google-hakutuloksissa näytetään yleensä ensisijainen sivu, ellei jokin muu sivu vastaa paremmin käyttäjän hakua. Esimerkiksi mobiililaitteella tehdyn haun tuloksissa näytetään todennäköisesti mobiilisivu, vaikka tietokoneversio olisi merkitty ensisijaiseksi.

Syitä samanlaisiin tai päällekkäisiin sivuihin

Sivustolla voi monestakin syystä olla useita URL-osoitteita, jotka johtavat samalle sivulle, tai päällekkäisiä tai hyvin samanlaisia sivuja, joilla on eri URL-osoitteet. Tässä on tavallisimpia syitä:

  • Useiden laitetyyppien tukeminen:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • Dynaamisten URL-osoitteiden käyttö esim. hakuparametrien tai käyttökertatunnusten säilyttämiseen:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • Blogijärjestelmä, joka tallentaa automaattisesti useita URL-osoitteita, jos lisäät saman viestin useampaan osioon:
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • Palvelin, joka on määritetty näyttämään samaa sisältöä www:n kanssa tai ilman sitä, tai http- ja https-versioiden kanssa:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • Luot blogiisi sisältöä, jota jaellaan muille sivustoille, ja se toistuu osittain tai kokonaan muiden sivustojen verkkotunnuksissa:
    https://news.example.com/green-dresses-for-every-day-155672.html (jaettu postaus) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (alkuperäinen postaus)

Miksi ensisijainen URL-osoite kannattaa valita?

Ensisijaisen sivun valinta päällekkäisten tai samanlaisten sivujen joukosta voi olla hyödyllistä seuraavista syistä:

  • Hakutuloksissa näkyvän URL-osoitteen valinta. Sinun kannaltasi on parempi, jos ihmiset tavoittavat vihreitä mekkoja sisältävän tuotesivusi mieluummin osoitteen https://www.example.com/dresses/green/greendress.html kuin osoitteen https://example.com/dresses/cocktail?gclid=ABCD kautta.
  • Päällekkäisten tai samanlaisten sivujen linkkitietojen yhdistäminen. Hakukoneiden on helpompi yhdistää yksittäisten URL-osoitteiden tietoja (kuten linkkejä niihin) yhteen ensisijaiseen URL-osoitteeseen. Tämä tarkoittaa sitä, että linkit muilta sivustoilta osoitteeseen http://example.com/dresses/cocktail?gclid=ABCD yhdistetään osoitteeseen https://www.example.com/dresses/green/greendress.html johtavien linkkien kanssa.
  • Yhden tuotteen tai aiheen selkeämpi tulosseuranta. Jos URL-osoitteita on useita, on haastavampaa saada tietyn sisällön yhdistettyjä tulostietoja.
  • Jaetun sisällön hallinta. Jos jakelet sisältöäsi julkaistavaksi muissa verkkotunnuksissa, sinun kannaltasi on parempi yhdistää sivujen sijoitukset ensisijaiseen URL-osoitteeseesi.
  • Indeksointiajan säästäminen päällekkäisissä sivuissa. Jotta Googlebot löytää varmasti sivustosi kaiken sisällön, sen on parempi käyttää aikaa sivuston uusien tai päivitettyjen sivujen indeksointiin kuin samojen sivujen tietokone- ja mobiiliversioiden indeksointiin.

Mikä sivu on Googlen mielestä ensisijainen?

Selvitä URL-tarkastustyökalulla, mikä sivu on Googlen mielestä ensisijainen. Vaikka itse määrittäisit ensisijaisen sivun, Google voi valita toisin esimerkiksi toimintakyvyn tai sisällön vuoksi.

Vianetsintä

Jos et omista verkko-omaisuutta, johon ensisijainen URL-osoite kuuluu, et näe päällekkäisen sivusi liikennettä. Tässä on joitain yleisiä syitä, miksi ensisijainen sivu on erillisessä verkko-omaisuudessa:
  • Virheellisesti merkityt kieliversiot: Jos monet sivustosi näyttävät lähestulkoon samaa sisältöä, joka on lokalisoitu erikielisille käyttäjille, seuraa lokalisoitujen sivustojen ohjeita.
  • Virheelliset ensisijaiset tagit: Jotkin sisällönhallintajärjestelmät (CMS) tai niiden laajennukset voivat käyttää ensisijaisuuden merkitsemismenetelmiä virheellisesti, jolloin ne osoittavat ulkoisilla sivustoilla oleviin URL-osoitteisiin. Tarkista sisältösi tämän varalta. Jos sivustollesi ilmoitetaan odottamaton ensisijainen URL-osoite esimerkiksi rel=”canonical”-tagin virheellisen käytön tai 301-uudelleenohjauksen vuoksi, korjaa ongelma välittömästi.
  • Väärin määritetyt palvelimet: Hostauksen virheellinen määritys voi johtaa odottamattomaan verkkotunnusten välisten URL-osoitteiden valintaan. Esimerkki:
    • Palvelin on ehkä virheellisesti määritetty palauttamaan sisältöä a.com-osoitteesta vastauksena b.com-osoitteen URL-osoitepyyntöön.
    • Kaksi toisiinsa liittymätöntä verkkopalvelinta voivat palauttaa identtisiä 404-virhesivuja, joita Google ei tunnista virhesivuiksi.
  • Sivustojen hakkerointi: Joidenkin sivustomurtojen yhteydessä sivustoille lisätään koodia, joka palauttaa HTTP 301 -uudelleenohjauksen tai lisää verkkotunnusten välisen rel="canonical"-linkkielementin HTML-koodin <head>- tai HTTP-otsikkoon. Tällöin käyttäjät ohjataan yleensä haitalliselle tai roskasisältöiselle sivulle. Näissä tapauksissa algoritmimme voivat valita haitta- tai roskaposti-URL-osoitteen hakkeroidun verkkosivuston URL-osoitteen sijaan.
  • Sisältöä kopioiva sivusto: Harvinaisissa tapauksissa algoritmimme voi valita URL-osoitteen ulkoiselta sivustolta, jolla sisältöäsi ylläpidetään ilman lupaasi. Jos uskot, että toinen sivusto kopioi sisältöäsi tekijänoikeuslain vastaisesti, voit ottaa yhteyttä sivuston ylläpitoon ja pyytää poistoa. Voit lisäksi pyytää Googlea poistamaan loukkaavan sivun hakutuloksista jättämällä DMCA-lain mukaisen pyynnön.

Ensisijaisuuden määritys

Voit määrittää päällekkäisten sivujen joukosta ensisijaisen eri tavoilla, riippuen käyttötarpeistasi:

Tapa Kuvaus
Yleiset säännöt Noudata näitä sääntöjä kaikkien ensisijaisuuden määritystapojen yhteydessä.
rel=canonical <link>-tagi

Lisää kaikkien päällekkäisten sivujen koodiin <link>-tagi, joka johtaa ensisijaiselle sivulle.

Hyvät puolet:

  • Päällekkäisten sivujen määrällä ei ole ylärajaa.

Huonot puolet:

  • Saattaa kasvattaa sivun kokoa.
  • Jos sivusto on suuri tai URL-osoitteet muuttuvat usein, vastaavuuksien säilyttäminen voi olla vaivalloista.
  • Toimii vain HTML-sivuilla, ei PDF:ien tai muiden tiedostojen kohdalla. Käytä näissä tapauksissa rel=canonical-HTTP-otsikkoa.
rel=canonical-HTTP-otsikko

Aseta sivun vastaukseen rel=canonical-otsikko.

Hyvät puolet:

  • Ei kasvata sivun kokoa.
  • Päällekkäisten sivujen määrällä ei ole ylärajaa.

Huonot puolet:

  • Jos sivusto on suuri tai URL-osoitteet muuttuvat usein, vastaavuuksien säilyttäminen voi olla vaivalloista.
Sivustokartta

Määritä sivustokartassa, mitkä sivut ovat ensisijaisia.

Hyvät puolet:

  • Helppo toteuttaa ja ylläpitää, varsinkin suurilla sivustoilla

Huonot puolet:

  • Googlebotin on silti löydettävä ilmoittamaasi ensisijaiseen sivuun liittyvät päällekkäiset sivut.
  • Rel=canonical-otsikoiden käyttö on vahvempi signaali Googlebotille.
301-uudelleenohjaus Kerro 301-uudelleenohjausten avulla, että uudelleenohjausosoite on tiettyä URL-osoitetta parempi. Käytä tätä vain, kun poistat päällekkäistä sivua käytöstä.
AMP-versio Jos yksi sivun versioista on AMP-sivu, määritä ensisijainen sivu ja sen AMP-versio AMP-sääntöjen mukaisesti.

 

Kaikki näistä ovat suositeltuja tapoja, mutta mikään ei ole pakollinen. Jos et määritä ensisijaista URL-osoitetta, valitsemme mielestämme parhaan URL-version.

Yleiset säännöt

Noudata näitä yleissääntöjä kaikissa ensisijaisuuden määritystavoissa.

Yleiset säännöt
  • Älä käytä robots.txt-tiedostoa osoitteiden ensisijaiseksi määrittämiseen.
  • Älä käytä URL-osoitteen poistotyökalua osoitteiden ensisijaiseksi määrittämiseen: se poistaa kaikki URL-osoitteen versiot hausta.
  • Älä määritä useita URL-osoitteita saman sivun ensisijaisiksi osoitteiksi samalla tai eri määritystekniikalla (esim. yksi URL-osoite sivustokartassa ja toinen saman sivun URL-osoite rel="canonical").
  • Älä estä ensisijaisen sivun valintaa noindex-tagilla. Komennon tarkoituksena on jättää sivuja indeksoinnin ulkopuolelle, ei määrittää ensisijaista sivua. 
  • Määritä ensisijainen sivu, jos käytät hreflang-tageja. Määritä samalla kielellä kirjoitettu ensisijainen sivu tai paras mahdollinen vaihtoehto, jos samankielistä ensisijaista sivua ei ole.

  • Linkitä verkkosivuston sisäiset linkit ensisijaiseen URL-osoitteeseen päällekkäisen osoitteen sijaan. Kun linkität johdonmukaisesti ensisijaisena pitämääsi URL-osoitteeseen, valintasi on selkeämpi Googlelle.

HTTPS:n valinta HTTP:n sijaan ensisijaisissa URL-osoitteissa

Google valitsee HTTPS-sivut ensisijaisiksi niitä vastaavien HTTP-sivujen sijaan, paitsi jos havaitsemme ristiriitaisia signaaleja, esimerkiksi nämä:

  • HTTPS-sivulla on virheellinen SSL-varmenne.
  • HTTPS-sivulla on suojaamattomia riippuvuuksia (muita kuin kuvia).
  • HTTPS-sivu ohjaa käyttäjät uudelleen HTTP-sivulle.
  • HTTPS-sivulla on rel="canonical"-linkki HTTP-sivulle.

Vaikka järjestelmämme suosii oletuksena HTTPS-sivuja HTTP-sivujen sijaan, voit varmistaa tämän jollakin seuraavista tavoista:

  • Lisää uudelleenohjaus HTTP-sivulta HTTPS-sivulle.
  • Lisää rel="canonical"-linkki HTTP-sivulta HTTPS-sivulle.
  • Ota käyttöön HSTS.

Jos haluat estää Googlea tekemästä HTTP-sivusta ensisijaista, muista seuraavat asiat:

  • Huonot SSL-varmenteet ja uudelleenohjaukset HTTPS:stä HTTP:hen vahvistavat HTTP:n ensisijaisuutta voimakkaasti. Tällöin sitä ei voi ohittaa HSTS:n avulla.
  • Vältä HTTP-sivun sisällyttämistä sivustokarttaan tai hreflang-teksteihin HTTPS-version sijaan.
  • Vältä SSL/TLS-varmenteen käyttämistä väärälle isäntäversiolle, esimerkiksi example.comin varmenteen jakamista www.example.comille.  Varmenteen on vastattava koko sivuston URL-osoitetta tai oltava korvausvarmenne, jota voi käyttää useissa verkkotunnuksen aliverkkotunnuksissa.

Vain kokeneille käyttäjille: Ilmoitus Googlelle dynaamisten parametrien ohittamisesta

Kerro parametrien käsittelyn avulla Googlelle, mitkä parametrit haluat sen ohittavan indeksoinnissa. Tiettyjen parametrien ohittaminen vähentää päällekkäistä sisältöä Googlen hakemistossa ja helpottaa sivustosi indeksoimista. Jos esimerkiksi määrität sessionid-parametrin ohitettavaksi, Google pitää näitä kahta osoitetta päällekkäisinä:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

Vaihtoehdot tarkemmin

Määritä ensisijainen sivu päällekkäisten URL-osoitteiden tai päällekkäisten tai samanlaisten sivujen joukosta jollakin seuraavista tavoista.

Noudata kaikkien tapojen kohdalla yllä olevia yleisiä sääntöjä.

Rel="canonical"-linkkitagin käyttö

Voit määrittää sivun päällekkäiseksi toisen sivun kanssa asettamalla sivun otsikkoon <link>-tagin.

Oletetaan, että haluat määrittää osoitteen https://blog.example.com/dresses/green-dresses-are-awesome/ ensisijaiseksi URL-osoitteeksi, vaikka tätä sisältöä voi käyttää monen eri URL-osoitteen kautta. Näin määrität kyseisen URL-osoitteen ensisijaiseksi:

  1. Merkitse päällekkäiset sivut rel="canonical"-linkkielementillä. Lisää näiden sivujen <head>-osioon <link>-elementti, joka sisältää määritteen rel="canonical" ja ohjaa ensisijaiselle sivulle. Esimerkki:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. Jos ensisijaisesta sivusta on olemassa mobiiliversio, lisää tälle sivulle rel="alternate"-linkki, joka johtaa sivun mobiiliversioon:
    <link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">

  3. Lisää hreflang-uudelleenohjaukset ja muut sivulle mahdollisesti kuuluvat uudelleenohjaukset.

Käytä absoluuttisia polkuja suhteellisten polkujen sijaan rel="canonical"-linkkielementin avulla.

Käytä tätä rakennetta: https://www.example.com/dresses/green/greendresss.html
Älä käytä tätä rakennetta: /dresses/green/greendress.html
Rel="canonical"-HTTP-otsikon käyttö

Jos voit muokata palvelimesi asetuksia, voit määrittää muiden kuin HTML-asiakirjojen (esim. PDF-tiedostojen) ensisijaisen URL-osoitteen rel="canonical"-HTTP-otsikoiden avulla HTML-tagien sijaan.

Esimerkiksi näin ilmoitat Googlebotille PDF-tiedoston ensisijaisen URL-osoitteen käyttämällä rel="canonical"-HTTP-otsikkoa, jos PDF on käytettävissä monen URL-osoitteen kautta:

Linkki: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

Google tukee toistaiseksi tätä tapaa vain verkkohakuhakutuloksissa.

Käytä absoluuttisia polkuja suhteellisten polkujen sijaan rel="canonical"-linkkielementin avulla. Toisin sanoen
käytä tätä rakennetta: http://www.example.com/downloads/white-paper.pdf,
älä tätä rakennetta: /downloads/white-paper.pdf
Sivustokartan käyttö

Valitse kullekin sivulle ensisijainen URL-osoite ja lähetä valinnat meille sivustokartassa. Sivustokartassa olevat sivut tulkitaan käyttäjän ehdotuksiksi ensisijaisista sivuista. Googlebot päättää sisällön vastaavuuden perusteella, onko osa sivuista päällekkäisiä.

Emme takaa, että sivustokartassa annettuja URL-osoitteita pidetään ensisijaisina, mutta sivustokartan lähettäminen on silti kätevä tapa määritellä suuren sivuston ensisijaiset sivut ja kertoa Googlelle mielipiteesi sivuston tärkeimmistä sivuista.

Älä lisää sivustokarttaan muita kuin ensisijaisia sivuja. Jos käytät sivustokarttaa, lisää siihen vain ensisijaisia URL-osoitteita.

301-uudelleenohjausten käyttö vanhentuneiden URL-osoitteiden kohdalla

Käytä tätä tapaa, jos haluat poistaa päällekkäisiä sivuja ja varmistaa, että siirtyminen pois vanhoilta sivuilta on saumatonta.

Oletetaan, että sivullesi pääsee monin eri tavoin:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Valitse ensisijainen URL-osoite ja ohjaa liikenne muista osoitteista ensisijaiselle sivulle 301-uudelleenohjauksilla. Palvelinpuolen 301-uudelleenohjaus on paras tapa varmistaa, että käyttäjät ja hakukoneet ohjataan oikealle sivulle. 301-tilakoodi tarkoittaa, että sivu on siirretty pysyvästi toiseen paikkaan.

Jos käytät verkkosivuston hostauspalvelua, etsi sen dokumentaatiosta ohjeita 301-uudelleenohjauksiin.

Oliko tästä apua?
Miten sivua voisi parantaa?