Errores de rastreo específicos de Google Noticias

Con el fin de ver informes de errores específicos de Google Noticias, los editores de noticias deben incluir su sitio en Google Noticias, disponer de una cuenta de Herramientas para webmasters de Google y tener el sitio incluido en ella. Póngase en contacto con nosotros para solicitar la inclusión en Google Noticias. Una vez que haya completado los procedimientos anteriores, siga los pasos indicados a continuación:

  • En la página principal, haga clic en la URL del sitio.
  • En el panel, haga clic en Rastreo > Errores de rastreo.
  • Haga clic en la pestaña "Noticias" para ver los errores de rastreo relacionados con su contenido de noticias.
  • Los errores de rastreo están organizados en categorías, como "Extracción del artículo" o "Error en el título". Al hacer clic en una categoría se muestra una lista de las URL afectadas y los errores de rastreo que generan.
  • Entre los errores específicos de Google Noticias se incluyen:

    Artículo desproporcionadamente corto

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML es demasiado pequeño en comparación con los otros grupos de texto sin enlaces de la página. Esto se puede aplicar a la mayoría de las páginas que contienen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

    Recomendaciones

    Las causas más habituales de este problema suelen ser:

    • Demasiados fragmentos de artículos relacionados: para ayudar a nuestro extractor, le recomendamos que haga que se pueda hacer clic en esos fragmentos.
    • Funciones como "Enviar este artículo a un amigo" con descripciones largas: tal vez deba establecer un estilo "display:none" o "visibility:hidden" para que el texto sea invisible o escribir las partes de código HTML dinámicamente con JavaScript.
    • Comentarios de usuarios: considere la posibilidad de incluir los comentarios en un iframe, extraerlos de forma dinámica con AJAX o moverlos a una página adyacente.

    Si ninguna de estas opciones resuelve el error, póngase en contacto con nosotros.

    Artículo fragmentado

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece estar formado por frases aisladas no agrupadas en párrafos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

    Recomendaciones

    • Compruebe que los párrafos estén dispuestos de manera que cada uno tenga más de una frase.
    • Asegúrese de que la puntación de las frases sea correcta.
    • Asegúrese de no utilizar demasiadas etiquetas <br> y <p> dentro de cada párrafo y, en general, intente evitar la división del cuerpo del artículo.
    • Considere la posibilidad de eliminar de la página del artículo parte del texto que no corresponda al artículo.

    Si ninguna de estas opciones resuelve el error, póngase en contacto con nosotros.

    Artículo demasiado largo

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece demasiado largo para ser un artículo informativo. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto. Esto sucede habitualmente con artículos de noticias que incluyen comentarios de los usuarios debajo del propio artículo o con páginas HTML en las que aparece otro contenido además del artículo.

    Recomendaciones

    Considere la posibilidad de eliminar de la página del artículo parte del texto que no corresponda al artículo. Si la página del artículo contiene comentarios de usuarios, considere una de las siguientes opciones:

    • incluir los comentarios en un iframe,
    • extraerlos de forma dinámica con AJAX,
    • mover parte de los comentarios a una página adyacente.

    Si ninguna de estas opciones resuelve el error, póngase en contacto con nosotros.

    Artículo demasiado corto

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece contener muy pocas palabras para ser un artículo informativo. Esto se puede aplicar a la mayoría de las páginas que contienen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

    Recomendaciones

    • Procure organizar sus artículos en párrafos de texto integrados por unas cuantas frases. Si el contenido del artículo parece contener muy pocas palabras para un artículo informativo, no podremos incluirlo.
    • Asegúrese de que sus artículos tengan más de 80 palabras.

    Si ninguna de estas opciones resuelve el error, póngase en contacto con nosotros.

    No se encuentra la fecha

    Explicación

    No hemos podido determinar la fecha de publicación del artículo.

    Recomendaciones

    Siga las recomendaciones de formato de fecha que se indican a continuación:

    • Incluya una fecha y hora claras en todos los artículos, entre el título y el texto del artículo en una línea aparte de HTML. La fecha debe corresponder a la primera publicación del artículo.
    • Elimine cualquier otra fecha del texto HTML de la página del artículo para que el rastreador no la confunda con la fecha de publicación correcta.
    • Si desea utilizar una metaetiqueta de fecha, póngase en contacto con nosotros primero. Las metaetiquetas de fecha deben tener el formato siguiente: <meta name="DC.date.issued" content="AAAA-MM-DD">, donde la fecha se escribe con el formato W3C, ya sea en formato de "fecha completa" (AAAA-MM-DD) o la "fecha completa más horas, minutos y segundos" (AAAA-MM-DDThh:mm:ssTZD) con un sufijo de zona horaria.
    • Cree un sitemap de noticias. La etiqueta <publication_date> nos permitirá extraer la fecha correcta para sus artículos.

    La fecha es demasiado antigua.

    Explicación

    La fecha que hemos determinado para este artículo a partir de una etiqueta <publication_date> del sitemap o de una fecha incluida en la propia página HTML es demasiado antigua.

    Recomendaciones

    • Asegúrese de que su artículo tenga menos de dos días de antigüedad. Actualmente, solo recopilamos artículos con un máximo de dos días de antigüedad.
    • Siga las recomendaciones de formato de fecha indicadas anteriormente.

    Artículo vacío

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece estar vacío.

    Recomendaciones

    • Asegúrese de que el texto completo de cada artículo esté disponible en el código fuente de la página de artículo correspondiente (no insertado en archivos JavaScript ni iframes, por ejemplo).
    • Asegúrese de no utilizar una etiqueta de estilo en el código fuente de su artículo como "display:none" o "visibility:hidden".
    • Asegúrese de que los enlaces a sus artículos dirijan directamente a las páginas de sus artículos en lugar de a una página intermedia con un redireccionamiento de JavaScript.

    Error en la extracción

    Explicación

    No hemos podido extraer el artículo de la página. Se producen errores de extracción cuando no podemos identificar un título, un cuerpo y una marca temporal válidos para el artículo. Cuando esto ocurre, elaboramos una lista de las URL que muestran este error para ofrecerle información sobre los motivos por los que algunos artículos pueden no aparecer en Google Noticias.

    Recomendaciones

    • Asegúrese de que el título, el cuerpo y la marca temporal de su artículo se puedan rastrear con facilidad (es decir, que estén disponibles como texto y no como imágenes, por ejemplo); sin embargo, de momento este error tiene una finalidad fundamentalmente informativa. Trabajamos de forma activa para mejorar nuestros métodos de extracción a fin de que este error se produzca con menos frecuencia.
    • Envíe un sitemap de noticias.

    Metaetiqueta de fecha no válida

    Explicación

    La página HTML contiene una metaetiqueta <meta> de fecha que no hemos podido analizar.

    Recomendaciones

    Las metaetiquetas <meta> de fecha deben tener el formato <meta name="DC.date.issued" content="AAAA-MM-DD">, con la fecha expresada de acuerdo con el estándar W3C (http://www.w3.org/TR/NOTE-datetime); se puede utilizar el formato de "fecha completa" (AAAA-MM-DD) o el formato de "fecha completa, más horas, minutos y segundos" (AAAA-MM-DDThh:mm:ss), al que se pueden añadir opcionalmente los sufijos de fracción de segundo y de zona horaria. La fecha debe indicar el momento en que se publicó el artículo por primera vez.

    No se han encontrado enlaces

    Explicación

    Googlebot-News no ha encontrado en la página ningún enlace a artículos informativos válidos. Este error es aplicable únicamente a las páginas de secciones de noticias.

    Recomendaciones

    • Asegúrese de que las URL de artículo contengan por lo menos un número de 3 dígitos tal como se especifica en las directrices siguientes. De lo contrario, piense en la posibilidad de enviar los artículos mediante un sitemap de noticias.
    • Asegúrese de que sus artículos se encuentren dentro del dominio del sitio incluido en Google Noticias.
    • Compruebe la página que generó el error y asegúrese de que incluya enlaces rastreables que dirijan a artículos informativos. Googlebot-News realiza un rastreo óptimo de los enlaces HTML, pero no puede rastrear enlaces de imágenes ni enlaces insertados en JavaScript. Consulte nuestras Directrices para webmasters y los Pasos para conseguir un sitio optimizado para Google para obtener información sobre cómo asegurarse de que los enlaces sean rastreables.

    No se han encontrado frases

    Explicación

    El cuerpo del artículo que hemos extraído de la página HTML parece no incluir secuencias puntuadas de palabras contiguas. Hemos generado este error para evitar que se incluya lo que parece ser una sección de texto incorrecta.

    Recomendaciones

    • Si el artículo no contiene secuencias puntuadas de palabras contiguas, no podremos incluirlo en Google Noticias. Asegúrese de que el texto de sus artículos se componga de frases y de no utilizar demasiadas etiquetas <br> o <p> dentro de los párrafos.
    • Asegúrese de que el texto completo de cada uno de sus artículos esté disponible en el código fuente de las páginas de esos artículos (en lugar de estar insertado, por ejemplo, en un archivo JavaScript).
    • Asegúrese de que los enlaces a sus artículos dirijan directamente a las páginas de sus artículos en lugar de a una página intermedia con un redireccionamiento de JavaScript.

    Se ha encontrado una etiqueta "noindex".

    Explicación

    La página HTML del artículo contiene una metaetiqueta <meta> "noindex" que impide que Google la indexe.

    Recomendaciones

    Elimine la metaetiqueta <meta> "noindex" de sus artículos.

    El redireccionamiento lleva a una ubicación que se encuentra fuera del sitio.

    Explicación

    La página del artículo o de la sección redirige a una URL de un dominio diferente.

    Recomendaciones

    • Todas las páginas de secciones y artículos deben encontrarse dentro del dominio del sitio incluido en Google Noticias.
    • Si no utiliza redireccionamientos externos, asegúrese de que nadie haya modificado su sitio. Para obtener más información sobre sitios pirateados, consulte esta página.

    La página es demasiado grande

    Explicación

    La longitud de la página del artículo o de la sección supera el máximo permitido.

    Recomendaciones

    La página HTML de la fuente puede tener un tamaño máximo de 256 KB.

    Título no permitido

    Explicación

    El título que hemos extraído de la página HTML sugiere que el artículo no es de tipo informativo.

    Recomendaciones

    Este problema se puede solucionar a menudo estableciendo el título del artículo en la etiqueta <title> de la página HTML y repitiéndolo en un lugar destacado de la página HTML (por ejemplo, en una etiqueta <h1>). Para obtener más información sobre los títulos, consulte esta página.

    No se encuentra el título

    Explicación

    No hemos podido extraer un título para el artículo de la página HTML.

    Recomendaciones

    • Siga nuestras recomendaciones sobre el formato de los títulos.
    • Para asegurarse de que sus artículos se muestren correctamente en los dispositivos móviles, no incluya números identificadores (que a veces corresponden a claves de acceso) en el texto del enlace de cada título.

    Se ha producido un error de descompresión.

    Explicación

    Googlebot-News ha detectado que la página estaba comprimida, pero no ha podido descomprimirla. Este problema puede deberse a un estado erróneo de la red o a una configuración o programación del servidor web incorrecta.

    Recomendaciones

    Compruebe la red o el servidor web.

    No se admite el tipo de contenido.

    Explicación

    La página incluía un tipo de contenido HTTP no admitido por Google Noticias.

    Recomendaciones

    Los artículos deben tener un atributo "content-type" del tipo "text/html", "text/plain" o "application/xhtml+xml".

    Los sitemaps de noticias se estructuran mejor como un conjunto fijo y pequeño. Cuando publique nuevos artículos, actualice los sitemaps existentes en lugar de crear un nuevo sitemap para ellos. No es recomendable crear nuevos sitemaps frecuentemente (por ejemplo, uno para cada día del calendario).