Google rastrea los sitios web de noticias con un algoritmo informático. Para que nuestro sistema pueda determinar cuáles de tus páginas web incluyen artículos, asegúrate de que el sitio cumpla con los siguientes lineamientos técnicos.
Requisitos relacionados con la estructura del sitio
Google Noticias recomienda a los editores que sigan los lineamientos que se indican a continuación relacionados con la estructura del sitio para poder rastrear el contenido nuevo de manera adecuada.
Secciones con páginas permanentes
Si las URL de las secciones de noticias principales cambian con frecuencia, es posible que Google Noticias tenga dificultades para comprender tu sitio. Las URL que no son permanentes impiden que rastreemos contenido nuevo, ya que no podemos detectar la URL más reciente que debe rastrearse.
Nuestro rastreador automático, Googlebot-News, es más eficaz cuando las URL de las secciones de noticias principales se mantienen sin cambios. Googlebot-News rastrea mejor los vínculos HTML. No puede rastrear vínculos de imágenes ni aquellos incorporados en JavaScript. Asegúrate de que los artículos de las páginas de tu sección solo tengan vínculos HTML.
Además, verifica que el texto de hipervínculo que redirecciona a un artículo de las páginas de tu sección coincida con el título del artículo y de la página. Si estos requisitos técnicos te generan inconvenientes, la solución puede ser rastrear solo el mapa del sitio. Si deseas que solo se rastree el mapa del sitio, comunícate con nuestro equipo.
Contenido accesible
Nuestro rastreador necesita acceder a tu sitio para incluir su contenido en Google Noticias. Asegúrate de que los directorios que alojan tus artículos no estén bloqueados por un archivo robots.txt y que las especificaciones del encabezado o las metaetiquetas no bloqueen el acceso a los vínculos de los artículos. Google Noticias rastrea con el robot de Google, el mismo que la Búsqueda web de Google, .
-
Lee el artículo Cómo administrar el acceso a contenido de tu sitio si crees que el archivo robots.txt, las metaetiquetas o las especificaciones del encabezado HTML del sitio están impidiendo que nuestro rastreador acceda al contenido.
Requisitos relacionados con los idiomas y la codificación
Es importante que comprendas nuestros lineamientos sobre los idiomas del contenido y la codificación de tu sitio.
Idioma
Google Noticias no muestra sitios con artículos donde aparecen varios idiomas en un solo artículo. Nuestro sistema no analiza bien el contenido que incluye varios idiomas y que nos dificulta la tarea de garantizar que se muestre el contenido en el idioma correcto.
Si tu sitio tiene secciones en idiomas específicos, como example.com/francés y example.com/inglés, crea publicaciones separadas para cada idioma. De este modo, se garantiza que los usuarios visualicen el contenido en su idioma. Obtén más información sobre cómo configurar una publicación.
Codifica tu sitio
Para obtener los mejores resultados, codifica tu sitio en formato UTF-8. Si quieres obtener más información sobre codificación, visita www.w3.org.
Requisitos para páginas de artículos individuales
A fin de garantizar que solo rastreemos tus artículos de noticias, Google Noticias posee varios lineamientos para las páginas de artículos individuales. Sigue los pasos que se indican a continuación a fin de asegurarte de que cumplas con esos lineamientos.
URL del artículo
Las URL de tus artículos deben ser únicas y permanentes:
-
URL únicas: Cada página que muestre el texto completo de un artículo debe tener una URL única. En Google Noticias, no pueden incluirse sitios que muestren varios artículos bajo una misma URL o que no tengan vínculos a páginas destinadas a cada artículo de manera exclusiva.
- URL permanentes: para garantizar que funcionen nuestros vínculos a los artículos, cada artículo de tu sitio de noticias debe estar asociado con una URL permanente que sea única para cada uno. Por ejemplo, no se podrá rastrear la página www.tusitio.com/noticias1.html si muestra una noticia diferente todos los días.
Importante: No vuelvas a publicar artículos con una URL nueva.
Si más adelante se vuelve a publicar un artículo, su URL no cambiará. Por ejemplo, si se publica inicialmente un artículo en www.example.com/noticias1.html, no se volverá a publicar en www.example.com/noticias2.html. Si en el proceso de cambiar dominios o la estructura del sistema de administración de contenido (CMS) se modifica el patrón de la URL, envíanos las normas de transformación del patrón. Podemos ayudar con estos cambios de patrón.
Lineamientos sobre el diseño de la página
Asegúrate de que nuestro rastreador automático pueda identificar con facilidad los titulares de los artículos y los tiempos de publicación. Las páginas de los artículos deben usar formato HTML y el texto del cuerpo no debe estar incorporado en JavaScript.