Errores de rastreo específicos de Google Noticias

Para consultar informes de errores específicos de Google Noticias, los editores de noticias deben incluir su sitio en Google Noticias, haber creado una cuenta de Herramientas para webmasters de Google y haber añadido su sitio a esta. Ponte en contacto con nosotros para solicitar la inclusión de tu sitio en Google Noticias. Una vez que hayas hecho esto, sigue los pasos que se indican a continuación:

  • En la Página principal, haz clic en la URL del sitio.
  • En el Panel de control, haz clic en Rastreo > Errores de rastreo.
  • Haz clic en la pestaña Noticias para ver los errores de rastreo de tu contenido de noticias.
  • Los errores de rastreo se organizan en categorías, como "Extracción de artículos " o "Error de título". Al hacer clic en una de estas categorías, se mostrará una lista de URL afectadas y los errores de rastreo que generan.
  • Entre los errores específicos de noticias, se incluyen los siguientes:

    Artículo desproporcionadamente corto

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML es demasiado corto en comparación con otros grupos de texto sin enlaces en la página. Esto se aplica a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

    Recomendaciones

    Los motivos de esta incidencia suelen ser los siguientes:

    • demasiados fragmentos de artículos relacionados (para ayudar a nuestro extractor, recomendamos que permitas los clics en estos fragmentos),
    • funciones como Enviar este artículo a amigos con descripciones demasiado largas (recomendamos que establezcas etiquetas de estilo "display:none" o "visibility:hidden" para que el texto se haga invisible o que escribas los fragmentos de código HTML con JavaScript de forma dinámica),
    • comentarios de usuarios (recomendamos que incluyas los comentarios en un iframe, que los extraigas de forma dinámica con AJAX o que los muevas a una página adyacente).

    Si el error no se soluciona con ninguna de estas opciones, ponte en contacto con nosotros.

    Artículo fragmentado

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece constar de frases aisladas que no se agrupan en párrafos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

    Recomendaciones

    • Comprueba que los párrafos contengan más de una oración.
    • Asegúrate de que las frases estén bien puntuadas.
    • Asegúrate de no utilizar demasiado las etiquetas <br> y <p> en los párrafos y, en general, evita dividir el cuerpo del artículo.
    • Te recomendamos que elimines de la página parte del texto que no corresponda a material informativo.

    Si el error no se soluciona con ninguna de estas opciones, ponte en contacto con nosotros.

    Artículo demasiado largo

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece demasiado largo para ser un artículo de noticias. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto. Entre los motivos habituales se incluyen artículos que contienen comentarios del usuario debajo del artículo o diseños HTML que contienen otro material junto al propio artículo informativo.

    Recomendaciones

    Te recomendamos que elimines de la página parte del texto que no corresponda a material informativo. Si la página del artículo contiene comentarios de usuarios, recomendamos que realices una de las siguientes acciones:

    • incluirlos en un iframe,
    • extraerlos de forma dinámica con AJAX,
    • mover algunos de los comentarios a una página adyacente.

    Si el error no se soluciona con ninguna de estas opciones, ponte en contacto con nosotros.

    Artículo demasiado corto

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece incluir muy pocas palabras para ser un artículo de noticias. Esto se aplica a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

    Recomendaciones

    • Prueba a distribuir los artículos en párrafos de texto formados por varias frases. Si el contenido del artículo parece incluir muy pocas palabras para ser un artículo informativo, no podremos incluirlo.
    • Asegúrate de que tus artículos tengan más de 80 palabras.

    Si el error no se soluciona con ninguna de estas opciones, ponte en contacto con nosotros.

    No se encuentra la fecha

    Explicación

    No hemos podido determinar la fecha de publicación del artículo.

    Recomendaciones

    Sigue las recomendaciones de formato de fecha que se indican a continuación:

    • Indica una fecha y hora específica para cada uno de los artículos entre el título y el texto del artículo en una línea independiente del código HTML. La fecha debe especificar la fecha de la primera publicación del artículo.
    • Elimina las demás fechas del código HTML de la página del artículo para que el rastreador no las confunda con la fecha de publicación correcta.
    • Si quieres utilizar una metaetiqueta de fecha, ponte en contacto con nosotros en primer lugar. Las metaetiquetas de fecha deben tener el formato <meta name="DC.date.issued" content="AAAA-MM-DD">, donde la fecha debe seguir el formato W3C, correspondiente al formato de fecha completa (AAAA-MM-DD) o al formato de fecha completa más horas, minutos y segundos (AAAA-MM-DDThh:mm:ssTZD), con un sufijo de zona horaria.
    • Crea un sitemap de noticias. La etiqueta <publication_date> nos permitirá seleccionar la fecha correcta de tus artículos.

    Fecha demasiado antigua

    Explicación

    La fecha que hemos determinado para este artículo, a partir de una etiqueta <publication_date> del sitemap o por la fecha de la propia página HTML, es demasiado antigua.

    Recomendaciones

    • Asegúrate de que el artículo tenga menos de dos días de antigüedad. Actualmente, solo recopilamos artículos que tengan, como máximo, dos días de antigüedad.
    • Sigue las recomendaciones de formato de fecha indicadas anteriormente.

    Artículo vacío

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece que está vacío.

    Recomendaciones

    • Asegúrate de que el texto completo de cada uno de tus artículos esté disponible en el código fuente de las páginas correspondientes (no insertado en un iframe o en un archivo JavaScript, por ejemplo).
    • Asegúrate de no estar utilizando un estilo en el código fuente de tus artículos como, por ejemplo, "display:none" o "visibility:hidden".
    • Asegúrate de que los enlaces a tus artículos dirijan directamente a las páginas de estos en lugar de a una página intermedia con un redireccionamiento de JavaScript.

    Error en la extracción

    Explicación

    No hemos podido extraer el artículo de la página. Se producen errores de extracción cuando no podemos identificar un título, un cuerpo y una marca de tiempo válidos para el artículo. Cuando esto ocurre, elaboramos una lista de las URL que muestran este error para proporcionarte información relacionada con el motivo por el que algunos artículos no aparecen en Google Noticias.

    Recomendaciones

    • Asegúrate de que el título, el cuerpo y la marca de tiempo se puedan rastrear con facilidad (es decir, que, por ejemplo, estén disponibles como texto y no como imágenes). No obstante, en estos momentos la función de este error es principalmente informativa. Trabajamos de forma activa para mejorar nuestros métodos de extracción a fin de que este error se dé con menos frecuencia.
    • Envía un sitemap de noticias.

    Metaetiqueta de fecha no válida

    Explicación

    La página HTML contiene una etiqueta <meta> que no hemos podido analizar.

    Recomendaciones

    Las etiquetas <meta> deben tener el formato <meta name="DC.date.issued" content="AAAA-MM-DD">, donde la fecha debe seguir el formato W3C (http://www.w3.org/TR/NOTE-datetime), correspondiente al formato de fecha completa (AAAA-MM-DD) o al formato de fecha completa más horas, minutos y segundos (AAAA-MM-DDThh:mm:ss), con sufijos de zona horaria y fracciones opcionales. La fecha debe indicar cuándo se publicó el artículo por primera vez.

    No se han encontrado enlaces

    Explicación

    Googlebot-News no ha encontrado en la página ningún enlace a artículos informativos válidos. Este error es aplicable únicamente a las páginas de secciones de noticias.

    Recomendaciones

    • Asegúrate de que las URL de su artículo contengan al menos un número de tres dígitos, como se especifica en estas instrucciones. De lo contrario, te recomendamos que envíes tus artículos a través de un sitemap de noticias.
    • Asegúrate de que tus artículos estén ubicados en el dominio del sitio incluido en Google Noticias.
    • Comprueba la página que haya generado el error y asegúrate de que incluya enlaces a artículos informativos que se puedan rastrear. Googlebot-News realiza un rastreo óptimo de enlaces HTML, pero no logra rastrear enlaces gráficos o enlaces insertados en JavaScript. Consulta las Directrices para webmasters y las sugerencias para la creación de un sitio que se ajuste a los requisitos de Google para obtener información sobre cómo asegurarte de que los enlaces se puedan rastrear.

    No se han encontrado frases

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece no incluir secuencias puntuadas de palabras contiguas. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

    Recomendaciones

    • Si el artículo no contiene secuencias puntuadas de palabras contiguas, no podremos incluirlo en Google Noticias. Asegúrate de que el texto de tus artículos esté formado por frases y de no utilizar demasiado las etiquetas <br> y <p> en los párrafos.
    • Asegúrate de que el texto completo de cada uno de tus artículos esté disponible en el código fuente de las páginas correspondientes (no insertado en un archivo JavaScript, por ejemplo).
    • Asegúrate de que los enlaces a tus artículos dirijan directamente a las páginas de los artículos, no a una página intermedia con un redireccionamiento de JavaScript.

    Se ha encontrado una etiqueta "Noindex".

    Explicación

    La página HTML del artículo contiene una etiqueta <meta> "noindex" que no permite que Google indexe la página.

    Recomendaciones

    Elimina la etiqueta <meta> "noindex" de las páginas de tus artículos.

    El redireccionamiento lleva a un dominio externo

    Explicación

    La sección o página del artículo redirecciona a una URL de un dominio diferente.

    Recomendaciones

    • Las páginas y los artículos de todas las secciones se deben ubicar en el dominio del sitio incluido en Google Noticias.
    • Si no utilizas redireccionamientos externos, asegúrate de que un tercero no haya modificado el sitio. Más información sobre sitios pirateados

    La página es demasiado grande

    Explicación

    La longitud de la página del artículo o de la sección sobrepasa el tamaño máximo permitido.

    Recomendaciones

    La página de código HTML puede tener un tamaño máximo de 256 KB.

    No se admite el título.

    Explicación

    El título que hemos extraído de la página HTML sugiere que el artículo no es informativo.

    Recomendaciones

    Normalmente, esta incidencia se soluciona añadiendo la etiqueta <title> al título del artículo en la página HTML y repitiendo el título en un lugar destacado de la página, como en una etiqueta <h1>. Más información sobre los títulos

    No se encuentra el título

    Explicación

    No hemos podido extraer un título para el artículo de la página HTML.

    Recomendaciones

    • Sigue nuestras recomendaciones de formato de títulos.
    • Para asegurarte de que tus artículos se muestren correctamente en dispositivos móviles, no incluyas un número inicial (que suele corresponderse con una clave de acceso) en el texto de anclaje del título.

    Error de descompresión

    Explicación

    Googlebot-News ha detectado que la página estaba comprimida, pero no ha podido descomprimirla. Esto puede deberse a un mal estado de la red o a una mala configuración o programación del servidor web.

    Recomendaciones

    Comprueba la red o el servidor web.

    Tipo de contenido no admitido

    Explicación

    La página incluía un tipo de contenido HTTP no admitido por Google Noticias.

    Recomendaciones

    Los artículos deben incluir un tipo de contenido "text/html", "text/plain" o "application/xhtml+xml".

    Los sitemaps de Google Noticias se estructuran mejor como un conjunto fijo y pequeño. Cuando publiques artículos nuevos, actualiza los sitemaps existentes en lugar de crear un nuevo sitemap para ellos. No se recomienda crear sitemaps nuevos con frecuencia (por ejemplo, uno para cada día del calendario).