Specifieke Nieuws-crawlfouten

Opmerking: Houd er rekening mee dat onze nieuwsindex wordt samengesteld door computeralgoritmen. Uiteraard doen we er alles aan om zo veel mogelijk van uw inhoud op te nemen, maar we kunnen niet garanderen dat al uw artikelen worden opgenomen. We stellen uw begrip op prijs.

Voordat nieuwsuitgevers specifieke foutmeldingen voor Google Nieuws kunnen bekijken, moeten ze hun site in Google Nieuws hebben opgenomen, een Search Console-account maken en hun site hieraan toevoegen. Nadat deze stappen zijn uitgevoerd, gaat u als volgt te werk in Search Console:

  • Klik op de URL van de site op de startpagina.
  • Klik in het dashboard op Crawlen > Crawlfouten.
  • Klik op het tabblad Nieuws om crawlfouten weer te geven voor uw nieuwsinhoud.
  • Crawlfouten zijn onderverdeeld in categorieën, zoals 'Artikel ophalen' of 'Titelfout'. Als u op een van deze categorieën klikt, wordt een lijst van de getroffen URL's weergegeven met de gegenereerde crawlfouten.

Specifieke Nieuws-fouten zijn onder andere:

Artikel naar verhouding te kort

Toelichting

De artikeltekst die we hebben opgehaald van de HTML-pagina is te klein in vergelijking met andere tekstdelen zonder links op de pagina. Dit is van toepassing op de meeste pagina's die nieuwsoverzichten of multimedia-inhoud bevatten, in plaats van volledige nieuwsartikelen. We hebben deze fout gemeld om te voorkomen dat we een verkeerd stuk tekst opnemen.

Aanbevelingen

Dit probleem wordt vaak veroorzaakt door:

  • Te veel fragmenten voor gerelateerde artikelen: u kunt ons ophaalprogramma helpen door deze fragmenten klikbaar te maken.
  • Functies zoals 'Dit artikel naar vrienden verzenden' met lange beschrijvingen: probeer de stijl 'display:none' of 'visibility:hidden' in te stellen om tekst onzichtbaar te maken of deze stukken HTML-code dynamisch te schrijven met JavasScript.
  • Gebruikersreacties: u kunt de reacties opnemen in een iframe, ze dynamisch ophalen met AJAX of ze naar een volgende pagina verplaatsen.
Artikel gefragmenteerd

Toelichting

De hoofdtekst van het artikel die we hebben opgehaald van de HTML-pagina, lijkt te bestaan uit afzonderlijke zinnen die niet zijn samengevoegd tot alinea's. We hebben deze fout gemeld om te voorkomen dat we een verkeerd stuk tekst opnemen.

Aanbevelingen

  • Zorg ervoor dat uw alinea's uit meer dan één regel bestaan.
  • Breng correcte leestekens aan in uw zinnen.
  • Gebruik niet te vaak de tags <br> en <p> in uw alinea's en probeer de hoofdtekst van het artikel in het algemeen intact te houden.
  • Probeer een deel van de tekst die niet bij het artikel hoort, te verwijderen van de artikelpagina.
Artikel te lang

Toelichting

De hoofdtekst van het artikel die we hebben opgehaald van de HTML-pagina lijkt te weinig woorden te bevatten voor een nieuwsartikel. We hebben deze fout gemeld om te voorkomen dat we een verkeerd stuk tekst opnemen. Algemene oorzaken zijn nieuwsartikelen met daaronder een lange rij reacties van lezers, of HTML-lay-outs die ander materiaal bevatten naast het nieuwsartikel zelf.

Aanbevelingen

Probeer een deel van de tekst die niet bij het artikel hoort, te verwijderen van de artikelpagina. Als het artikel reacties van gebruikers bevat, kunt u het volgende doen:

  • De reacties opnemen in een iframe.
  • De reacties dynamisch ophalen met AJAX.
  • Een deel van de reacties naar een aangrenzende pagina verplaatsen.
Artikel te kort

Toelichting

De hoofdtekst van het artikel die we hebben opgehaald van de HTML-pagina, lijkt te weinig woorden te bevatten voor een nieuwsartikel. Dit is van toepassing op de meeste pagina's die nieuwsoverzichten of multimedia-inhoud bevatten, in plaats van volledige nieuwsartikelen. We hebben deze fout gemeld om te voorkomen dat we een verkeerd stuk tekst opnemen.

Aanbevelingen

  • Probeer uw artikelen onder te verdelen in alinea's van telkens enkele zinnen. Wanneer de inhoud van het artikel te weinig woorden voor een nieuwsartikel bevat, kunnen we deze inhoud niet opnemen.
  • Zorg ervoor dat uw artikelen langer zijn dan 80 woorden.
Geen datum gevonden

Toelichting

We kunnen de publicatiedatum van het artikel niet vaststellen.

Aanbevelingen

Volg de onderstaande aanbevelingen voor datumnotatie:

  • Plaats in al uw artikelen een duidelijke datum en tijd in een aparte HTML-regel tussen de titel en de tekst van het artikel. De datum moet aangeven wanneer het artikel voor het eerst werd gepubliceerd.
  • Verwijder eventuele andere datums uit de HTML op de artikelpagina, zodat de crawler deze niet interpreteert als de juiste publicatiedatum.
  • Als u metatag voor de datum wilt gebruiken, moet u eerst contact met ons opnemen. U moet metatags voor datums opgeven in de volgende notatie: <meta name="DC.date.issued" content="YYYY-MM-DD">, waarbij de datum in W3C-notatie wordt weergegeven met de notatie 'volledige datum' (JJJJ-MM-DD) of de notatie 'volledige datum plus uren, minuten en seconden' (JJJJ-MM-DDTuu:mm:ssTZD) met de tijdzone als achtervoegsel.
  • Maak een Nieuws-sitemap. De tag <publication_date> zorgt ervoor dat we de juiste datum voor uw artikelen kiezen.
Datum te oud

Toelichting

De datum die we voor dit artikel hebben gevonden in de tag <publication_date> in de sitemap of in de HTML-code van de pagina zelf, is te oud.

Aanbevelingen

  • Zorg ervoor dat uw artikel niet ouder is dan twee dagen. Momenteel verzamelen we alleen artikelen die maximaal twee dagen oud zijn.
  • Volg de bovenstaande aanbevelingen voor datumnotatie.
Leeg artikel

Toelichting

De hoofdtekst van het artikel die we hebben opgehaald van de HTML-pagina, lijkt leeg te zijn.

Aanbevelingen

  • Controleer of de volledige tekst van uw artikelen beschikbaar is in de broncode van uw artikelpagina's (en niet is ingesloten in bijvoorbeeld een JavaScript-bestand of iframe).
  • Zorg ervoor dat u geen stijl gebruikt in de broncode van uw artikelen, zoals 'display:none' of 'visibility:hidden'.
  • Zorg ervoor dat de links naar uw artikelen rechtstreeks naar uw artikelpagina's leiden en niet via een JavaScript-verwijzing naar een tussenliggende pagina.
Ophalen mislukt

Toelichting

We kunnen het artikel niet van de pagina ophalen. Het ophalen kan mislukken wanneer we geen geldige titel, tekst of tijdstempel voor een artikel kunnen vinden. We maken melding van URL's met deze fout om u te laten weten waarom sommige artikelen mogelijk niet worden weergegeven in Google Nieuws.

Aanbevelingen

  • Zorg ervoor dat de titel, de tekst en het tijdstempel gemakkelijk kunnen worden gecrawld (beschikbaar zijn als tekst en niet als afbeeldingen). Momenteel wordt deze fout vooral ter informatie weergegeven. We werken er hard aan om onze ophaalmethode te verbeteren, zodat u deze fout minder vaak zult zien.
  • Verzend een Nieuws-sitemap.
Geen zinnen gevonden

Toelichting

De hoofdtekst van het artikel die we hebben opgehaald van de HTML-pagina, lijkt geen zinnen met interpunctie of een logische woordvolgorde te bevatten. We hebben deze fout gemeld om te voorkomen dat we een verkeerd stuk tekst opnemen.

Aanbevelingen

  • Wanneer de inhoud van het artikel geen zinnen met interpunctie of een logische woordvolgorde heeft, kunnen we deze inhoud niet opnemen in Google Nieuws. Zorg ervoor dat de tekst van uw artikel bestaat uit zinnen en dat u niet te veel <br>- of <p>-tags gebruikt in uw alinea's.
  • Zorg ervoor dat de volledige tekst van al uw artikelen beschikbaar is in de broncode van de pagina's van uw artikelen (en bijvoorbeeld niet in een JavaScript-bestand is ingesloten).
  • Zorg ervoor dat de links naar uw artikelen rechtstreeks naar uw artikelpagina's leiden en niet via een JavaScript-verwijzing naar een tussenliggende pagina.
Offsite verwijzing

Toelichting

Het onderdeel of de artikelpagina verwijst naar een URL op een ander domein.

Aanbevelingen

  • Alle onderdeelpagina's en artikelen moeten zich op het domein bevinden van de site die is opgenomen in Google Nieuws.
  • Als u geen offsite verwijzingen gebruikt, controleert u of uw site niet is gewijzigd door derden. Meer informatie over gehackte sites.
Pagina te lang

Toelichting

De lengte van de artikelpagina of het artikel overschrijdt het toegestane maximum.

Aanbevelingen

De HTML-bronpagina mag maximaal 256 KB groot zijn.

Titel niet toegestaan

Toelichting

De titel die we hebben opgehaald van de HTML-pagina, doet vermoeden dat het niet om een nieuwsartikel gaat.

Aanbevelingen

Dit probleem kan vaak worden opgelost door ervoor te zorgen dat de <title>-tag in de HTML-pagina de titel van het artikel bevat en door de titel op een prominente plaats op de HTML-pagina te herhalen, zoals in een <h1>-tag. Meer informatie over titels.

Titel niet gevonden

Toelichting

We kunnen geen titel voor het artikel ophalen van de HTML-pagina.

Aanbevelingen

  • Volg onze aanbevelingen voor de notatie van titels.
  • Zorg ervoor dat uw artikelen correct worden weergegeven op mobiele toestellen door in de ankertekst van de titel geen voorloopnummer te plaatsen (dit kan overeenkomen met een toegangssleutel).
Decomprimeren mislukt

Toelichting

Googlebot-News heeft vastgesteld dat de pagina is gecomprimeerd, maar kan deze niet decomprimeren. Dit kan worden veroorzaakt door een slechte netwerkverbinding of een fout in de programmering of configuratie van de webserver.

Aanbevelingen

Controleer uw netwerk/webserver.

Niet-ondersteund inhoudstype

Toelichting

De pagina heeft een type HTTP-inhoud dat niet wordt ondersteund door Google Nieuws.

Aanbevelingen

Artikelen moeten het inhoudstype text/html, text/plain of application/xhtml+xml hebben.

Was dit artikel nuttig?
Hoe kunnen we dit verbeteren?