Technische richtlijnen

Google gebruikt een computeralgoritme om nieuwswebsites te crawlen. Help ons systeem om te bepalen welke van je webpagina's artikelen zijn door ervoor te zorgen dat je site aan deze technische richtlijnen voldoet.

Vereisten voor sitestructuur

Google Nieuws adviseert uitgevers de onderstaande richtlijnen voor de sitestructuur te volgen, zodat nieuwe content correct kan worden gecrawld.

Pagina's met permanente secties

Als URL's in belangrijkste nieuwssecties regelmatig veranderen, kan Google Nieuws je site mogelijk niet begrijpen. Niet-permanente URL's zorgen ervoor dat we nieuwe content niet kunnen crawlen, omdat we niet kunnen bepalen welke de meest recente URL is die moet worden gecrawld.

Onze geautomatiseerde crawler (Googlebot-News) is het meest effectief als de URL's van je belangrijkste nieuwssecties niet veranderen. Googlebot-News kan het beste html-links crawlen. De crawler kan geen afbeeldingslinks of in JavaScript ingesloten links crawlen. Zorg ervoor dat je artikelen op je sectiepagina's alleen html-links bevatten.

Zorg er ook voor dat de linktekst die naar een artikel op je sectiepagina verwijst, overeenkomt met de titel van je artikel en de paginatitel. Als deze technische vereisten een probleem vormen, is het uitsluitend crawlen op sitemaps een mogelijke oplossing. Neem contact op met ons team als je je site uitsluitend op basis van sitemaps wilt laten crawlen.

Toegankelijke content

Onze crawler heeft toegang tot je site nodig om je content op te nemen in Google Nieuws. Controleer of de directory's waarin je artikelen worden gehost, niet door een robots.txt-bestand worden geblokkeerd. Controleer ook of metatags of headerspecificaties de toegang tot je artikellinks niet verhinderen. Google Nieuws crawlt met dezelfde robot als Google Zoeken: Googlebot.

  • Lees De toegang tot content op je site beheren als je vermoedt dat het robots.txt-bestand, de metatags of de html-headerspecificaties van je site onze crawler blokkeren, waardoor deze geen toegang tot je content kan krijgen.

Vereisten voor talen en codering

Het is belangrijk dat je onze richtlijnen met betrekking tot talen voor content en de codering van je site begrijpt.

Taal

Google Nieuws geeft geen sites weer met artikelen die binnen in één artikel meerdere talen weergeven. Ons systeem heeft problemen met het analyseren van content die meerdere talen bevat, wat het lastig maakt om de content in de juiste taal weer te geven.

Als je site taalspecifieke secties bevat, zoals example.com/french en example.com/english, maak je voor elke taal afzonderlijke publicaties. Op deze manier krijgen gebruikers content in hun eigen taal te zien. Meer informatie over het instellen van een publicatie.

Je site coderen

Voor de beste resultaten codeer je je site in UTF-8. Ga naar www.w3.org voor meer informatie over codering.

Vereisten voor afzonderlijke artikelpagina's

Google Nieuws heeft een aantal vereisten waaraan afzonderlijke artikelpagina's moeten voldoen. Op deze manier kunnen we ervoor zorgen dat we alleen je nieuwsartikelen crawlen. Volg de onderstaande stappen om ervoor te zorgen dat je aan de richtlijnen voldoet.

URL's van artikelen

De URL's van je artikelen zijn uniek en permanent:

  • Unieke URL's: Elke pagina waarop de volledige tekst van een artikel wordt weergegeven, moet een unieke URL hebben. We kunnen geen sites in Google Nieuws opnemen die meerdere artikelen onder één URL weergeven of die geen afzonderlijke link voor elke aparte pagina met een artikel gebruiken.

  • Permanente URL's: Elk artikel moet op je nieuwssite zijn gekoppeld aan een permanente URL die voor elk artikel uniek is om ervoor te zorgen dat onze links naar de artikelen werken. We kunnen bijvoorbeeld de pagina www.yoursite.com/news1.html niet crawlen als hierop elke dag een ander artikel wordt weergegeven.


Belangrijk: Publiceer artikelen niet opnieuw onder een nieuwe URL.

Als een artikel op een later tijdstip opnieuw wordt gepubliceerd, verandert de URL niet. Als een artikel bijvoorbeeld eerst wordt gepubliceerd onder www.example.com/nieuws1.html, wordt het niet opnieuw gepubliceerd onder www.example.com/nieuws2.html. Als het URL-patroon verandert door een wijziging in domeinen of in de structuur van het CMS (contentmanagementsysteem), stuur ons dan je transformatieregels voor patronen. Wij kunnen je helpen met deze veranderingen in het patroon.

Richtlijnen voor pagina-indelingen

Zorg ervoor dat de artikelkoppen en publicatietijden duidelijk door onze geautomatiseerde crawler kunnen worden geïdentificeerd. Je artikelpagina's moeten een html-indeling hebben en de hoofdtekst mag niet zijn ingesloten in JavaScript.

true
Zoeken
Zoekopdracht wissen
Zoekfunctie sluiten
Hoofdmenu
3148009143201181044
true
Zoeken in het Helpcentrum
true
true
true
true
true
100499
false
false