Directrices técnicas

Google utiliza un algoritmo informático para rastrear los sitios web de noticias. Para ayudar a nuestro sistema a determinar qué páginas web contienen artículos, tu sitio web debe seguir estas directrices técnicas.

Requisitos que debe cumplir la estructura del sitio web

Google Noticias recomienda a los editores que sigan las directrices de estructura de sitios web que se indican a continuación para poder rastrear correctamente el contenido nuevo.

Páginas de sección permanentes

Si las URL de tus secciones de noticias principales cambian con frecuencia, es posible que Google Noticias no pueda entender tu sitio web. Las URL no permanentes nos impiden rastrear el contenido nuevo, ya que no podemos detectar la URL más reciente que se debe rastrear.

Nuestro rastreador automatizado, el robot de Google para Noticias, es más eficaz cuando no cambian las URL de las secciones de noticias principales. El robot de Google para Noticias realiza un rastreo óptimo de los enlaces HTML, pero No puede rastrear enlaces de imagen ni enlaces insertados en JavaScript. Asegúrate de que los artículos de las páginas de sección solo contengan enlaces HTML.

Además, comprueba que el texto del enlace que dirige a un artículo de las páginas de sección coincida con el titular del artículo y con el título de la página. Si estos requisitos técnicos te suponen un problema, puedes rastrear solo los sitemaps. Si quieres probar a rastrear tu sitio web solo mediante sitemaps, ponte en contacto con nuestro equipo.

Contenido accesible

Nuestro rastreador necesita acceder a tu sitio web para incluir el contenido en Google Noticias. Asegúrate de que los directorios en los que están alojados tus artículos no estén bloqueados por un archivo robots.txt y que no haya metaetiquetas ni especificaciones de encabezado que bloqueen el acceso a los enlaces de tus artículos. Google Noticias utiliza el mismo robot que la Búsqueda web de Google para rastrear, el robot de Google.

  • Consulta el artículo Gestionar el acceso al contenido de tu sitio web si crees que es posible que el archivo robots.txt, las metaetiquetas o las especificaciones del encabezado HTML de tu sitio web estén impidiendo que nuestro rastreador acceda a tu contenido.

Requisitos de idiomas y codificación

Es importante tener en cuenta nuestras directrices sobre idiomas y codificación del contenido de sitios web.

Idioma

Google Noticias no muestra sitios web con artículos que contengan texto en más de un idioma. Nuestro sistema no puede analizar correctamente este tipo de contenido, y esto hace que resulte difícil mostrar el contenido en el idioma correcto.

Si tu sitio web tiene secciones específicas de idioma, como example.com/catalan y example.com/espanol, debes crear publicaciones independientes para cada idioma. Esto garantiza que los usuarios reciban contenido en su idioma. Consulta más información sobre cómo configurar una publicación.

Codificar sitios web

Para obtener los mejores resultados, utiliza la codificación UTF‑8 en tu sitio web. Si quieres consultar más información sobre la codificación, accede a la página www.w3.org.

Requisitos que deben cumplir las páginas de dedicadas a un solo artículo

Para asegurarnos de que solo rastreamos tus artículos de noticias, Google Noticias ha definido varios requisitos para las páginas dedicadas a un solo artículo. Sigue los pasos que se indican a continuación para asegurarte de que cumples las directrices.

URLs de artículos

Las URL de tus artículos son únicas y permanentes:

    • URL únicas: cada página que muestre el texto completo de un artículo debe tener una URL única. No podemos incluir en Google Noticias sitios web que muestren varios artículos asociados a una sola URL, ni sitios web que no incluyan enlaces a páginas dedicadas exclusivamente a cada artículo.

    • URL permanentes: para que nuestros enlaces a artículos funcionen, cada artículo de tu sitio web de noticias debe estar asociado a una URL permanente. No podemos rastrear, por ejemplo, la página www.tusitioweb.com/noticia1.html si muestra una noticia diferente cada día.

Directrices relacionadas con el diseño de las páginas

Asegúrate de que nuestro rastreador automatizado puede identificar fácilmente las horas de publicación y los titulares de tus artículos. Las páginas de tus artículos deben tener formato HTML y el texto del cuerpo no debe estar insertado en JavaScript.

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?