Dubbele content

Dubbele content verwijst gewoonlijk naar substantiële blokken content binnen of tussen domeinen die ofwel volledig gelijk zijn of aanzienlijk op elkaar lijken. Dit is meestal niet misleidend bedoeld. Voorbeelden van niet-kwaadwillige dubbele content zijn:

  • Discussiegroepen die zowel normale pagina's als ingekorte versies voor mobiele apparaten kunnen genereren
  • Items die worden weergegeven of waarnaar wordt verwezen via meerdere, afzonderlijke URL's
  • Printerversies van webpagina's

Als je site meerdere pagina's met grotendeels dezelfde content bevat, kun je Google op verschillende manieren laten weten wat je voorkeurs-URL is. (Dit wordt ook wel de canonieke URL genoemd.) Meer informatie over canonieke URL's

In sommige gevallen wordt content echter opzettelijk tussen domeinen gekopieerd in een poging de positie in zoekresultaten te manipuleren of meer verkeer te genereren. Misleidende praktijken zoals deze kunnen leiden tot een slechte gebruikerservaring wanneer een gebruiker grotendeels dezelfde content ziet in een reeks zoekresultaten.

Google streeft ernaar pagina's met verschillende gegevens te indexeren en weer te geven. Dit betekent bijvoorbeeld dat als je site een 'normale' versie en een 'printerversie' van elk artikel bevat en geen van beide geblokkeerd is met een noindex-metatag, we een van beide weergeven. In de zeldzame gevallen waarin Google merkt dat dubbele content wordt weergegeven met de bedoeling de positie te manipuleren en onze gebruikers te misleiden, brengen we ook de juiste aanpassingen aan in de indexering en positie in zoekresultaten van de betreffende sites. Dit kan nadelig van invloed zijn op de positie van de site of de site kan worden verwijderd uit de index van Google en daardoor niet meer in zoekresultaten worden weergegeven.

Hier volgen enkele stappen die je kunt nemen om het probleem met dubbele content te voorkomen en ervoor te zorgen dat bezoekers de content zien die je ze wilt laten zien.

  • Gebruik 301's: Als je de structuur van je site hebt gewijzigd, moet je permanente 301-omleidingen ('RedirectPermanent') in het .htaccess-bestand gebruiken om gebruikers, Googlebot en andere spiders op een slimme manier om te leiden. (In Apache kun je dit doen met een .htaccess-bestand; in IIS gebruik je hiervoor de beheerinterface.)

  • Wees consistent: Probeer interne links consistent te houden. Link bijvoorbeeld niet naar http://www.example.com/page/ en http://www.example.com/page en http://www.example.com/page/index.htm.

  • Gebruik hoofddomeinen: Je kunt ons helpen de meest geschikte versie van een document aan te bieden door waar mogelijk hoofddomeinen te gebruiken voor landspecifieke content. De kans is bijvoorbeeld groter dat we weten dat http://www.example.de op Duitsland gerichte content bevat dan http://www.example.com/de of http://de.example.com.

  • Bied je site zorgvuldig aan: Als je je content aanbiedt op andere sites, toont Google altijd de versie die volgens ons het meest geschikt is voor gebruikers voor een bepaalde zoekopdracht, maar dat is mogelijk niet de versie waaraan jij de voorkeur geeft. Zorg er daarom voor dat elke site waarop je content wordt aangeboden, een link terug naar het oorspronkelijke artikel bevat. Je kunt degenen die je syndicatiemateriaal gebruiken ook vragen de noindex-metatag te gebruiken om te voorkomen dat zoekmachines hun versie van de content indexeren.

  • Vermijd clichétekst: In plaats van een lange auteursrechttekst onderaan op elke pagina te herhalen, kun je een zeer korte samenvatting toevoegen met een verwijzing naar een pagina met meer informatie. Daarnaast kun je de tool 'Parameterbehandeling' gebruiken om op te geven hoe Google URL-parameters moet verwerken.

  • Publiceer geen tijdelijke pagina's: Gebruikers zien liever geen 'lege' pagina's. Gebruik daarom bij voorkeur geen tijdelijke aanduidingen. Publiceer bijvoorbeeld geen pagina's waarvoor je nog geen echte content hebt. Als je toch pagina's met tijdelijke aanduidingen maakt, moet je de noindex-metatag gebruiken om te voorkomen dat deze pagina's worden geïndexeerd.

  • Begrijp je contentmanagementsysteem: Zorg ervoor dat je bekend bent met de manier waarop content op je website wordt weergegeven. Blogs, forums en verwante systemen tonen vaak dezelfde content in meerdere indelingen. Een blogartikel kan bijvoorbeeld worden weergegeven op de homepage van een blog, op een archiefpagina en op een pagina met andere artikelen in dezelfde categorie.

  • Gebruik zo min mogelijk vergelijkbare content: Als je veel pagina's hebt die op elkaar lijken, kun je overwegen elke pagina uit te breiden of de pagina's samen te voegen tot één pagina. Als je bijvoorbeeld een reissite hebt met aparte pagina's voor twee steden, terwijl beide pagina's dezelfde informatie bevatten, kun je de pagina's samenvoegen tot één pagina over twee steden of beide pagina's uitbreiden, zodat ze unieke content over elke stad bevatten.

Google raadt je af de crawlertoegang tot dubbele content op je website te blokkeren, hetzij met een robots.txt-bestand of met andere methoden. Als zoekmachines pagina's met dubbele content niet kunnen crawlen, kunnen ze niet automatisch detecteren dat deze URL's naar dezelfde content wijzen en behandelen ze deze pagina's als afzonderlijke, unieke pagina's. Een betere oplossing is toestaan dat zoekmachines deze URL's crawlen, maar de URL's markeren als duplicaten door gebruik te maken van het linkelement rel="canonical", de tool voor URL-parameterbehandeling of 301-omleidingen. In gevallen waar dubbele content tot gevolg heeft dat we te veel van je website crawlen, kun je ook de instelling voor de crawlsnelheid aanpassen in Search Console.

Dubbele content op een site is geen reden om stappen tegen die site te ondernemen, tenzij het erop lijkt dat de dubbele content is bedoeld om te misleiden en om de resultaten van zoekmachines te manipuleren. Als je site problemen heeft met dubbele content en je het bovenstaande advies niet opvolgt, kiezen wij de versie van de content die in onze zoekresultaten wordt weergegeven.

Als ons onderzoek echter uitwijst dat je gebruikmaakt van misleidende praktijken en je site uit onze zoekresultaten is verwijderd, moet je je site zorgvuldig bekijken. Als je site uit onze zoekresultaten is verwijderd, kun je voor meer informatie onze Richtlijnen voor webmasters raadplegen. Nadat je wijzigingen hebt aangebracht en van mening bent dat je site onze richtlijnen niet langer schendt, dien je een heroverwegingsverzoek voor je site in.

Zeer sporadisch kan ons algoritme een URL van een externe site selecteren waarop je content zonder jouw toestemming wordt gehost. Als je denkt dat een andere site je content kopieert en hiermee het auteursrecht schendt, kun je contact opnemen met de host van de site en verwijdering van de content aanvragen. Daarnaast kun je Google vragen een inbreukmakende pagina uit de zoekresultaten te verwijderen door een verzoek in te dienen volgens de procedure uit de Digital Millennium Copyright Act (DMCA).

Was dit nuttig?
Hoe kunnen we dit verbeteren?