Errores de rastreo específicos de Google Noticias

Nota: Tenga en cuenta que nuestro índice de noticias se compila mediante algoritmos informáticos. Aunque nos esforzamos por incluir la mayor cantidad posible de su contenido, no podemos garantizar la inclusión de todos los artículos. Agradecemos su comprensión.

Para ver los informes de errores específicos de Google Noticias, los editores de noticias deben incluir su sitio en Google Noticias, disponer de una cuenta de Search Console y tener el sitio incluido en ella. Después de realizar estos pasos, siga el procedimiento que se indica a continuación en Search Console:

  • En la Página principal, haga clic en la URL del sitio.
  • En el Panel de control, haga clic en Rastreo > Errores de rastreo.
  • Haga clic en la ficha Noticias para ver los errores de rastreo relacionados con su contenido de noticias.
  • Los errores de rastreo están organizados en categorías, como "Extracción del artículo" o "Error en el título". Al hacer clic en una categoría se muestra una lista de las URL afectadas y los errores de rastreo que generan.

Entre los errores específicos de Google Noticias se incluyen:

Artículo desproporcionadamente corto

Explicación

El cuerpo del artículo que hemos extraído de la página HTML es demasiado pequeño en comparación con los otros grupos de texto sin enlaces de la página. Esto se puede aplicar a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos de noticias completos. Hemos generado este error para evitar que se incluya lo que podría ser un fragmento de texto incorrecto.

Recomendaciones

Las causas más habituales de este problema suelen ser:

  • Demasiados fragmentos de artículos relacionados: para ayudar a nuestro extractor, le recomendamos que haga que se pueda hacer clic en esos fragmentos.
  • Funciones con descripciones demasiado largas, como "Enviar este artículo a amigos": recomendamos que establezca etiquetas de estilo "display:none" o "visibility:hidden" para que el texto se haga invisible o que escriba los fragmentos de código HTML con JavaScript de forma dinámica.
  • Comentarios de usuarios: considere la posibilidad de incluir los comentarios en un marco flotante, extraerlos de forma dinámica con AJAX o moverlos a una página adyacente.
Artículo fragmentado

Explicación

El cuerpo del artículo que hemos extraído de la página HTML parece estar formado por frases aisladas no agrupadas en párrafos. Hemos generado este error para evitar que se incluya lo que podría ser un fragmento de texto incorrecto.

Recomendaciones

  • Compruebe que los párrafos estén dispuestos de manera que cada uno tenga más de una frase.
  • Asegúrese de que la puntuación de las frases sea correcta.
  • Asegúrese de no utilizar demasiado las etiquetas <br> y <p> en los párrafos y, en general, evite dividir el cuerpo del artículo.
  • Considere la posibilidad de eliminar de la página del artículo parte del texto que no corresponda al mismo.
Artículo demasiado largo

Explicación

El cuerpo del artículo que hemos extraído de la página HTML parece demasiado largo para ser un artículo informativo. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto. Esto sucede habitualmente con artículos de noticias que incluyen comentarios de los usuarios debajo del propio artículo o con páginas HTML en las que aparece otro contenido además del artículo.

Recomendaciones

Considere la posibilidad de eliminar de la página del artículo parte del texto que no corresponda al mismo. Si la página del artículo contiene comentarios de usuarios, considere una de las siguientes opciones:

  • incluirlos en un marco flotante,
  • extraerlos de forma dinámica con AJAX,
  • mover parte de los comentarios a una página adyacente.
Artículo demasiado corto

Explicación

El cuerpo del artículo que hemos extraído de la página HTML parece contener muy pocas palabras para ser un artículo informativo. Esto se aplica a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que podría ser un fragmento de texto incorrecto.

Recomendaciones

  • Procure organizar sus artículos en párrafos de texto formados por varias frases. Si el contenido del artículo parece contener muy pocas palabras para un artículo informativo, no podremos incluirlo.
  • Asegúrese de que sus artículos tengan más de 80 palabras.
No se encuentra la fecha

Explicación

No hemos podido determinar la fecha de publicación del artículo.

Recomendaciones

Siga las recomendaciones de formato de fecha que se indican a continuación:

  • Incluya una fecha y hora claras en todos los artículos, entre el título y el texto del artículo en una línea aparte de HTML. La fecha debe corresponder a la primera publicación del artículo.
  • Elimine las demás fechas del código HTML de la página del artículo para que el rastreador no las confunda con la fecha de publicación correcta.
  • Si desea utilizar una metaetiqueta de fecha, póngase en contacto con nosotros primero. Las metaetiquetas de fecha deben tener el formato siguiente: <meta name="DC.date.issued" content="AAAA-MM-DD">, donde la fecha se expresa en formato W3C, ya sea con el formato de "fecha completa" (AAAA-MM-DD) o el formato de "fecha completa con horas, minutos y segundos" (AAAA-MM-DDThh:mm:ssTZD) y un sufijo de zona horaria.
  • Cree un sitemap de noticias. La etiqueta <publication_date> nos permitirá seleccionar la fecha correcta de sus artículos.
Fecha demasiado antigua

Explicación

La fecha que hemos determinado para este artículo a partir de una etiqueta <publication_date> del sitemap o de una fecha incluida en la propia página HTML es demasiado antigua.

Recomendaciones

  • El artículo debe tener menos de dos días de antigüedad. Actualmente, solo recopilamos artículos con un máximo de dos días de antigüedad.
  • Siga las recomendaciones de formato de fecha indicadas anteriormente.
Artículo vacío

Explicación

El cuerpo del artículo que hemos extraído de la página HTML parece estar vacío.

Recomendaciones

  • Asegúrese de que el texto completo de cada artículo esté disponible en el código fuente de la página de artículo correspondiente (no insertado en archivos JavaScript ni iframes, por ejemplo).
  • No debe utilizar una etiqueta de estilo en el código fuente de su artículo como "display:none" o "visibility:hidden".
  • Los enlaces a sus artículos deben dirigir directamente a esas páginas en lugar de a una página intermedia con un redireccionamiento de JavaScript.
Error en la extracción

Explicación

No hemos podido extraer el artículo de la página. Se producen errores de extracción cuando no podemos identificar un título, un cuerpo y una marca de tiempo válidos para el artículo. Cuando esto ocurre, elaboramos una lista de las URL que muestran este error para ofrecerle información sobre los motivos por los que algunos artículos pueden no aparecer en Google Noticias.

Recomendaciones

  • Asegúrese de que el título, el cuerpo y la marca de tiempo se puedan rastrear con facilidad (por ejemplo, que estén disponibles como texto y no como imágenes). No obstante, en estos momentos la función de este error es principalmente informativa. Trabajamos de forma activa para mejorar nuestros métodos de extracción a fin de que este error se produzca con menos frecuencia.
  • Envíe un sitemap de noticias.
No se han encontrado frases

Explicación

El cuerpo del artículo que hemos extraído de la página HTML parece no incluir secuencias puntuadas de palabras contiguas. Hemos generado este error para evitar que se incluya lo que parece ser una sección de texto incorrecta.

Recomendaciones

  • Si el artículo no contiene secuencias puntuadas de palabras contiguas, no podremos incluirlo en Google Noticias. Asegúrese de que el texto de sus artículos esté formado por frases y de no utilizar demasiado las etiquetas <br> o <p> en los párrafos.
  • El texto completo de cada uno de sus artículos debe estar disponible en el código fuente de las páginas de esos artículos (en lugar de estar insertado, por ejemplo, en un archivo JavaScript).
  • Los enlaces a sus artículos deben dirigir directamente a esas páginas en lugar de a una página intermedia con un redireccionamiento de JavaScript.
El redireccionamiento lleva a un sitio externo

Explicación

La página del artículo o de la sección redirige a una URL de un dominio diferente.

Recomendaciones

  • Las páginas y los artículos de todas las secciones se deben ubicar en el dominio del sitio incluido en Google Noticias.
  • Si no utiliza redireccionamientos externos, asegúrese de que nadie haya modificado su sitio. Para obtener más información sobre sitios pirateados, consulte esta página.
La página es demasiado grande

Explicación

La longitud de la página del artículo o de la sección supera el máximo permitido.

Recomendaciones

La página HTML de la fuente puede tener un tamaño máximo de 256 KB.

Título no permitido

Explicación

El título que hemos extraído de la página HTML sugiere que el artículo no es informativo.

Recomendaciones

Normalmente, esta incidencia se soluciona añadiendo la etiqueta <title> al título del artículo en la página HTML y repitiendo el título en un lugar destacado de la página, como en una etiqueta <h1>. Para obtener más información sobre los títulos, consulte esta página.

No se encuentra el título

Explicación

No hemos podido extraer un título para el artículo de la página HTML.

Recomendaciones

  • Siga nuestras recomendaciones sobre el formato de los títulos.
  • Para asegurarse de que sus artículos se muestren correctamente en los dispositivos móviles, no incluya números identificadores (que a veces corresponden a claves de acceso) en el texto del enlace de cada título.
Error de descompresión

Explicación

El robot de Google para noticias ha detectado que la página estaba comprimida, pero no ha podido descomprimirla. Este problema puede deberse a un estado erróneo de la red o a una configuración o programación del servidor web incorrecta.

Recomendaciones

Compruebe la red o el servidor web.

Tipo de contenido no admitido

Explicación

La página incluía un tipo de contenido HTTP no admitido por Google Noticias.

Recomendaciones

Los artículos deben tener un atributo "content-type" del tipo "text/html", "text/plain" o "application/xhtml+xml".

¿Te ha sido útil este artículo?