Informe Errores de rastreo para sitios web

El informe Errores de rastreo de sitios web ofrece detalles sobre las URL del sitio que Google no ha podido rastrear correctamente o que han devuelto un código de error HTTP.

Abrir el informe Errores de rastreo

 

¿Estás buscando el informe Estado de rastreo para aplicaciones?

 

El informe consta de estas dos secciones principales:

  • Errores del sitio web: esta sección del informe muestra los principales problemas de los últimos 90 días que han impedido al robot de Google acceder a todo el sitio web (haz clic en cualquier casilla para ver el gráfico correspondiente).
     
  • Errores de URL: esta sección enumera los errores específicos que Google ha detectado al intentar rastrear determinados ordenadores, teléfonos o páginas de aplicaciones de Android. Cada sección principal de los informes Errores de URL corresponde a uno de los mecanismos de rastreo que usa Google para acceder a las páginas, y los errores mostrados corresponden a ese tipo de páginas.

Visión general sobre los errores del sitio web

En el caso de un sitio web que funcione correctamente, en la sección Errores del sitio web del informe Errores de rastreo no debería aparecer ningún error (es el caso de la gran mayoría de sitios web que rastreamos). Si Google detecta un número significativo de errores en el sitio web, trataremos de avisarte mediante un mensaje, independientemente del tamaño del sitio web.

Cuando consultes por primera vez la página Errores de rastreo, la sección Errores del sitio web muestra un código de estado rápido junto a cada uno de los tres tipos de error: DNS, conectividad del servidor y exploración de robots.txt. Si los códigos no son una marca de verificación verde, puedes hacer clic en la categoría correspondiente para ver un gráfico de los detalles de rastreo de los últimos 90 días.

Porcentaje de errores elevado

Si el sitio tiene un porcentaje de error del 100% en alguna categoría, es probable que el sitio no esté disponible o que se haya desconfigurado. Esto puede deberse a varias causas que podrías investigar:

  • Comprueba que no se hayan cambiado los permisos para una sección al cambiar la organización del sitio.
  • Si se ha cambiado la organización del sitio, comprueba que los enlaces externos funcionen aún.
  • Revisa cualquier secuencia de comandos nueva para asegurarte de que no falle repetidamente.
  • Asegúrate de que todos los directorios estén presentes y de que no se hayan cambiado de ubicación ni se hayan eliminado por error.
Si no se da ninguna de las situaciones anteriores, el porcentaje de errores podría indicar un pico pasajero o deberse a causas externas, como que alguien haya enlazado a páginas que no existan. Por lo tanto, en este caso, no habría ningún problema. De todos modos, si detectamos una cantidad de errores elevada y poco habitual en el sitio web, te avisaremos para que puedas investigar el motivo.

Porcentaje de errores bajo

Si el sitio tiene menos de un 100% de errores en alguna categoría, podría ser algo provisional o que tu sitio esté sobrecargado o configurado de forma incorrecta. Te recomendamos que investigues estos asuntos más a fondo o que preguntes en nuestro foro al respecto. Es posible que te avisemos aunque el porcentaje de errores general sea muy bajo, ya que, según nuestra experiencia, un sitio web bien configurado no debería tener errores en ninguna categoría.

Tipos de errores del sitio web

Los errores siguientes se exponen en la sección Sitio web del informe:

Errores de DNS

¿Qué son los errores de DNS?

Un error de DNS se produce cuando el robot de Google no puede comunicarse con el servidor DNS, ya sea porque el servidor esté inactivo o porque la asignación de DNS a tu dominio sea incorrecta. Aunque la mayoría de los errores o de las advertencias de DNS no influyen en la capacidad del robot de Google de acceder a un sitio web, pueden ser indicativos de unos valores de latencia elevados que pueden tener repercusiones negativas en los usuarios.

Corregir los errores de DNS

  • Asegúrate de que Google pueda rastrear el sitio web.
    Usa la función Explorar como Google en una página clave como la página principal, Si el contenido de esta página se muestra sin problemas, se supone que Google puede acceder a ella.
  • En caso de errores de DNS persistentes o reiterados, consulta al proveedor de DNS.
    A menudo, el proveedor de DNS es el mismo que el de alojamiento. 
  • Configura el servidor para que devuelva un código de error HTTP, como el 404 o el 500, si no existe un nombre de host.
    Un sitio web como example.com se puede ajustar mediante una configuración de DNS comodín para que responda a las solicitudes de foo.example.com, nombre-inventado.example.com y de cualquier otro subdominio. Esto es útil si un sitio web con contenido generado por el usuario otorga a cada cuenta de usuario su propio dominio (http://nombredeusuario.example.com). Sin embargo, en algunos casos, esta configuración puede provocar que el contenido se duplique de forma innecesaria en los distintos nombres de host, por lo que podría afectar al rastreo del robot de Google.

Lista de errores de DNS

Tipo de error Descripción
Tiempo de espera de DNS agotado

Google no ha podido acceder a tu sitio web porque el servidor DNS no ha reconocido tu nombre de host (como, por ejemplo, www.example.com).

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Comprueba el registro para asegurarte de que el sitio web esté bien configurado y de que el servidor esté conectado a Internet.

Petición de DNS

Google no ha podido acceder a tu sitio web porque el servidor DNS no ha reconocido tu nombre de host (como, por ejemplo, www.example.com).

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Comprueba el registro para asegurarte de que el sitio web esté bien configurado y de que el servidor esté conectado a Internet.

Errores del servidor

¿Qué es un error del servidor?

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido acceder a la URL en cuestión, que se ha agotado el tiempo de espera de la solicitud o que el sitio web estaba ocupado. En consecuencia, el robot de Google se ha visto obligado a abandonar la solicitud. Google no puede acceder a tu sitio web porque el servidor tarda demasiado en responder o porque el sitio web está bloqueando a Google. Por lo tanto, Google se ve obligado a abandonar la solicitud.

Corregir los errores de conectividad del servidor

  • Reduce la carga excesiva de la página para solicitudes de páginas dinámicas.
    Se considera que un sitio web que proporciona el mismo contenido a varias URL publica el contenido de forma dinámica (p. ej., www.example.com/zapatos.php?color=rojo&talla=7 publica el mismo contenido que www.example.com/zapatos.php?talla=7&color=rojo).  Las páginas dinámicas pueden tardar demasiado en responder, lo que provoca problemas de tiempo de espera. También es posible que el servidor devuelva un estado de sobrecarga para pedir al robot de Google que rastree el sitio web más lento. En términos generales, se recomienda que los parámetros sean cortos y se usen con moderación. Si sabes cómo funcionan los parámetros en tu sitio web, puedes indicar a Google cómo debe gestionar estos parámetros.
  • Asegúrate de que el servidor de tu host esté activo y no esté sobrecargado ni mal configurado.
    Si los problemas de tiempo de espera o de respuesta continúan, consulta a tu proveedor de alojamiento y plantéate si debes aumentar la capacidad de gestión de tráfico de tu sitio web.
  • Comprueba que no estés bloqueando a Google por error.
    Es posible que bloquees a Google debido a problemas de sistema, como un error de configuración de DNS, un cortafuegos mal configurado, un sistema de protección DoS o una configuración incorrecta en el sistema de gestión del contenido. Los sistemas de protección desempeñan un papel importante en el alojamiento y se suelen configurar para bloquear automáticamente niveles inusualmente elevados de solicitudes del servidor. Sin embargo, como el robot de Google a menudo hace más solicitudes que un usuario humano, puede activar estos sistemas de protección y hacer que lo bloqueen e impidan que rastree tu sitio web. Para solucionar estos problemas, debes determinar la parte de la infraestructura del sitio web que impide que el acceso del robot de Google y eliminar el bloqueo. Si no tienes control sobre el cortafuegos, deberás ponerte en contacto con tu proveedor de alojamiento.
  • Controla el rastreo y la indexación de los motores de búsqueda de forma adecuada.
    Algunos webmasters impiden que el robot de Google acceda a sus sitios web de forma intencionada (es posible que usen un cortafuegos, como se ha descrito anteriormente). En esos casos, su intención no suele ser impedir completamente el acceso del robot de Google al sitio web, sino que quieren controlar cómo se rastrea y se indexa. Si este fuera el caso, prueba lo siguiente: Si quieres cambiar la frecuencia con la que el robot de Google rastrea tu sitio web, puedes solicitar que cambie su frecuencia de rastreo. Los proveedores de alojamiento también pueden verificar la propiedad de sus direcciones IP.

Errores de conectividad del servidor

Tipo de error Descripción
Tiempo de espera agotado

Se ha excedido el tiempo de espera de respuesta de la solicitud.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema continúa, consulta con tu proveedor de alojamiento.

Cabeceras incompletas

Google ha podido conectar con el servidor, pero se ha interrumpido la conexión antes de que se mandaran cabeceras completas. Vuelve a comprobarlo más tarde.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema continúa, consulta con tu proveedor de alojamiento.

Conexión restablecida

El servidor ha procesado correctamente la solicitud de Google, pero no devuelve ningún contenido porque se ha restablecido la conexión con el servidor. Vuelve a comprobarlo más tarde.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema continúa, consulta con tu proveedor de alojamiento.

Respuesta incompleta

El servidor ha interrumpido la conexión antes de que pudiéramos recibir una respuesta completa, y el cuerpo de la respuesta parece estar truncado.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema continúa, consulta con tu proveedor de alojamiento.

Se ha rechazado la conexión.

Google no ha podido acceder a tu sitio web porque el servidor ha rechazado la conexión. Es posible que tu proveedor de alojamiento esté bloqueando el robot de Google, o que haya un problema en la configuración del cortafuegos.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema continúa, consulta con tu proveedor de alojamiento.

Error de conexión

Google no ha podido conectar con el servidor porque no se puede obtener acceso a la red o no está disponible.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema continúa, consulta con tu proveedor de alojamiento.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, Google puede acceder al sitio web correctamente.

Tiempo de espera de la conexión agotado

Google no ha podido conectar con el servidor.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como el robot de Google devuelve el contenido de la página principal sin ninguna dificultad, se puede asumir que, por lo general, el robot de Google puede acceder al sitio web correctamente.

Comprueba que el servidor esté conectado a Internet. También es posible que el servidor esté sobrecargado o mal configurado. Si el problema continúa, consulta con tu proveedor de alojamiento.

Fallo del archivo robots.txt

¿Qué es un fallo del archivo robots.txt?

Se trata de un error al recuperar el archivo robots.txt de tu sitio web. El robot de Google, antes de rastrear tu sitio web y aproximadamente una vez al día después de hacerlo, recupera tu archivo robots.txt para ver qué páginas no debería estar rastreando. Si tu archivo robots.txt existe pero no se puede acceder a él (es decir, si no devuelve ningún código de estado HTTP 200 o 404), pospondremos nuestro rastreo en lugar de arriesgarnos a rastrear las URL que no quieres que se rastreen. Cuando esto ocurra, el robot de Google volverá al sitio web y lo rastreará tan pronto como se pueda acceder correctamente al archivo robots.txt. Más información sobre el protocolo de exclusión de los archivos robots.txt.

Corregir los errores del archivo robots.txt

  • No siempre es necesario un archivo robots.txt.
    Solo es necesario si tu sitio web incluye contenido que no deseas que los motores de búsqueda indexen. Si quieres que los motores de búsqueda indexen todo el contenido de tu sitio web, no necesitas un archivo robots.txt, ni siquiera uno vacío. Si no tienes un archivo robots.txt, el servidor devolverá un mensaje 404 cuando el robot de Google lo solicite y se seguirá rastreando el sitio web sin problema.
  • Asegúrate de que Google pueda acceder al archivo robots.txt.
    Es posible que tu servidor haya devuelto un error 5xx (problemas de acceso) cuando hemos intentado recuperar tu archivo robots.txt. Comprueba que tu proveedor de alojamiento no esté bloqueando el acceso al robot de Google.  Si dispones de un cortafuegos, asegúrate de que su configuración no esté bloqueando el acceso a Google.

Visión general de los errores de URL

La sección Errores de URL del informe está dividida en categorías que muestran los mil errores de URL más importantes de la categoría en cuestión. No tienes que solucionar todos los errores que encuentres en esta sección, pero es importante que la consultes para comprobar que no haya errores que puedan afectar negativamente a los usuarios y a los rastreadores de Google. Por este motivo, te lo hemos puesto más fácil mostrándote los problemas más importantes en la parte superior en función de factores como el número de errores y de páginas que hacen referencia a la URL. En concreto, te recomendamos que hagas lo siguiente:

  • Soluciona los errores de URL no encontrada de las URL más importantes con redireccionamientos 301. Aunque sea normal que el sitio web tenga errores de URL no encontrada (404), recomendamos solucionar los errores relativos a las páginas importantes que enlacen a otros sitios web, a las URL antiguas del sitemap que ya no existan, a las URL de páginas importantes que estén mal escritas o a las URL de páginas populares que ya no existan. De este modo, tanto Google como los visitantes accederán fácilmente a la información que más te importa.
  • Actualiza tus sitemaps.  Borra de tus sitemaps las URL obsoletas y, si añades sitemaps nuevos para reemplazar los antiguos, asegúrate de eliminar el sitemap antiguo (y no redireccionarlo al nuevo).  
  • Usa redireccionamientos breves y claros.  Si tienes varias URL que redireccionan en secuencia (por ejemplo, páginaA > páginaB > páginaC > páginaD), puede que el robot de Google tenga dificultades para seguir e interpretar la secuencia.  Procura que las secuencias sean cortas.  Obtén más información sobre los errores al seguir las URL
  • Asegúrate de que los enlaces profundos a tus aplicaciones de Android estén bien configurados.  Puedes obtener más información al respecto en el sitio web sobre Indexación de aplicaciones para la Búsqueda de Google.

Consultar los detalles de los errores de URL

Puedes consultarlos de muchas formas:

  • Haz clic en Descargar para obtener una lista con los mil errores más importantes por tipo de rastreador (por ejemplo, para ordenador, smartphone, etc.).
  • Usa el filtro situado sobre la tabla para localizar URL específicas.
  • Consulta los datos del error siguiendo el enlace de cada URL o de cada URI de aplicación.
Los detalles de los errores de URL en ordenadores o teléfonos indican información sobre el estado del error, una lista de páginas que hacen referencia a la URL y un enlace a Explorar como Googlebot para que puedas solucionar los problemas relacionados con la URL en cuestión.

Marcar los errores de URL como solucionados

Cuando hayas solucionado el problema que causaba el error, puedes ocultarlo en la lista. Se puede hacer de elemento en elemento o de forma masiva. Selecciona la casilla situada junto a la URL y haz clic en Marcar como solucionados. La URL se eliminará de la lista.

Si el problema continúa, la URL volverá a aparecer en la lista la próxima vez que Google rastree tu sitio web, aunque lo hayas marcado como solucionado.

Tipos de error de URL

Errores de URL frecuentes
Tipo de error Descripción
Error del servidor

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido acceder a la URL en cuestión, que se ha agotado el tiempo de espera de la solicitud o que el sitio web estaba ocupado. En consecuencia, el robot de Google ha tenido que abandonar la solicitud.

Obtén más información sobre los errores de conectividad del servidor.

Error soft 404

Normalmente, cuando el visitante solicita una página que no existe, el servidor muestra un error 404 (página no encontrada). Este código de respuesta HTTP indica claramente a los navegadores y a los motores de búsqueda que la página no existe. En consecuencia, los motores de búsqueda no rastrean ni indexan el contenido de la página (si lo hubiera).

Un error soft 404 sucede cuando el servidor muestra la página real de una URL que en realidad no existe en tu sitio web. Esto suele suceder cuando el servidor gestiona URL defectuosas o no existentes como URL correctas, por lo que redirecciona al usuario a una página válida, como la página principal o una página 404 personalizada.  

Esto se debe a que los motores de búsqueda pueden invertir mucho tiempo en rastrear e indexar las URL no existentes, y a veces duplicadas, en el sitio web. El hecho de que no se detecten URL reales y exclusivas rápidamente o de que estas no reciban visitas frecuentes podría afectar negativamente al rastreo del sitio web.

Recomendamos configurar el servidor para que siempre muestre un código de error 404 (página no encontrada) o 410 (página no existente) en respuesta a la solicitud de una página no existente. En caso de error 404, puedes mejorar la experiencia del usuario creando una página 404 personalizada. Por ejemplo, puedes crear una página que contenga una lista de tus páginas más populares o un enlace a tu página principal o para enviar comentarios. Sin embargo, debes recordar que no basta con crear una página que muestre un mensaje 404, ya que también se debe devolver el código de respuesta HTTP 404 o 410 correcto.

404

Google descubre contenido siguiendo enlaces que dirigen de una página a otra. Por lo general, se muestra un error de página no encontrada (normalmente, un código de error HTTP 404) cuando el robot de Google intenta visitar una página que no existe, ya sea porque se ha eliminado o se le ha cambiado el nombre sin redireccionar la URL antigua a la nueva página o porque el enlace está mal escrito.

Qué hacer con los errores de página no encontrada

Por lo general, los errores 404 no afectan al ranking de los sitios web en Google y se pueden ignorar tranquilamente. Estos mensajes de error se suelen deber a errores ortotipográficos, a configuraciones incorrectas (por ejemplo, de enlaces generados automáticamente por un sistema de gestión de contenido) o a los crecientes esfuerzos de Google por reconocer y rastrear enlaces en contenido insertado (por ejemplo, JavaScript).  A continuación te indicamos algunas cuestiones que puedes investigar:

  • Comprueba de dónde proceden los enlaces no válidos en la sección Enlaces desde estas páginas, a la que accedes haciendo clic en la URL correspondiente.
  • Arregla o elimina los enlaces que salgan de tu sitio.
  • Captura el tráfico de los enlaces mal escritos en otros sitios con redireccionamientos 301.
    Por ejemplo, el hecho de escribir como (www.example.com/sapatosrojos la URL auténtica www.example.com/zapatosrojos) puede suceder si alguien intenta enlazar con tu sitio y comete una falta de ortografía. En este caso, puedes añadir la URL mal escrita en la configuración de tu servidor y crear un redireccionamiento 301 para corregir la URL. También puedes ponerte en contacto con el webmaster del sitio e indicarle el enlace incorrecto para que lo arregle o lo elimine.

Los errores 404 son completamente normales en la Web (y son aconsejables en muchos sentidos). Probablemente nunca podrás controlar todos los enlaces a tu sitio ni resolver todos los errores 404 que se indican en Search Console. Lo más recomendable es que te limites a comprobar cuáles son las incidencias principales y a solucionarlas si es posible.

Cuándo se debe devolver un código de estado 404

Al eliminar una página de tu sitio web, piensa si el contenido se va trasladar a otra parte o si ese tipo de contenido ya no volverá a incluirse en este. 

  • Cuando muevas contenido a una URL nueva, redirecciona la URL antigua a la nueva. De esta manera, cuando los usuarios accedan a la URL antigua para buscar el contenido en cuestión, se les dirigirá a un contenido relacionado con lo que buscan.
  • Cuando elimines contenido de forma permanente sin sustituirlo por contenido nuevo o relacionado, deja que se muestre un error 404 o 410. Actualmente, Google trata los códigos 410 (No disponible permanentemente) igual que los 404 (Página no encontrada). 

El hecho de devolver un código distinto al 404 o al 410 para una página inexistente (o de redireccionar a los usuarios a otra página, como a la página principal, en lugar de devolver un código 404) puede suponer un problema. Estas páginas se conocen como soft 404 y pueden confundir tanto a los usuarios como a los motores de búsqueda.

Errores 404 inesperados

En la sección "Errores de rastreo" es posible ver errores 404 correspondientes a URL que no sabías que existieran en tu sitio o en la Web. Google podría generar estas URL inesperadas al seguir enlaces en JavaScript, en archivos Flash o en otro tipo de contenido insertado.

Por ejemplo, es posible que tu sitio web utilice el siguiente código para realizar un seguimiento de las descargas de archivos en Google Analytics:


<a href="helloworld.pdf"
  onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
  Hello World PDF</a>

Cuando el robot de Google vea ese código, por ejemplo, podría intentar rastrear la URL http://www.example.com/descargar-helloworld, aunque no sea una página real. En ese caso, el enlace puede mostrarse como un error 404 (página no encontrada) en la función de errores de rastreo de Search Console.

Google intenta detectar y solucionar este tipo de problemas para que no se muestren en la página Errores de rastreo. 

Acceso denegado

Por lo general, Google descubre contenido siguiendo enlaces que dirigen de una página a otra. Para rastrear una página, el robot de Google debe acceder a ella. Si aparecen errores inesperados de acceso denegado, es probable que se deba a una de las siguientes razones:

  • El robot de Google no ha podido acceder a una URL de tu sitio web porque hay que iniciar sesión para ver una parte o la totalidad del contenido de este.
  • El archivo robots.txt impide a Google acceder a todo tu sitio web o a una serie de directorios o de URL.
  • El servidor requiere que los usuarios se autentiquen mediante un proxy o el proveedor de alojamiento está impidiendo que Google acceda a tu sitio web.

Para solucionarlo:

  • Comprueba que el robots.txt funcione según lo previsto y no bloquee a Google. La herramienta Probador de robots.txt te permite ver exactamente cómo interpretará el robot de Google el contenido del archivo robots.txt. El user-agent de Google es el robot de Google. 
  • Usa Explorar como Google para saber cómo ve tu sitio web el robot de Google. Esta herramienta puede resultarte muy útil para solucionar problemas relacionados con el contenido del sitio web o con su visibilidad en los resultados de búsqueda.
URL no seguidas

Los errores de URL no seguidas indican las URL que Google no ha podido seguir de forma completa, además de la causa de ello. A continuación se indican algunas razones por las que es posible que el robot de Google no haya podido seguir las URL de tu sitio web:

Contenido activo, JavaScript y Flash

Algunas funciones como JavaScript, las cookies, los ID de sesión, los marcos, DHTML o Flash pueden hacer más difícil que los motores de búsqueda rastreen el sitio. Comprueba lo siguiente:

  • Utiliza un navegador de texto como Lynx para examinar el sitio, ya que muchos motores de búsqueda ven tu sitio igual que Lynx. Si hay funciones como JavaScript, cookies, ID de sesión, marcos, DHTML o Flash que impidan la visualización de todo tu sitio web en un navegador de texto, es posible que las arañas de motores de búsqueda tengan dificultades para rastrearlo.
  • Mediante la herramienta Explorar como Google se puede comprobar cómo ve exactamente Google el sitio web.
  • Si utilizas páginas dinámicas (por ejemplo, si la URL contiene un carácter ?), tenga en cuenta que no todas las arañas de los motores de búsqueda rastrean páginas dinámicas y estáticas. En términos generales, se recomienda que los parámetros sean cortos y se usen con moderación. Si ya sabes cómo funcionan los parámetros en tu sitio web, puedes indicar a Google cómo debe gestionarlos.

Redireccionamientos

  • Si te encuentras redireccionando continuamente de una página a otra, asegúrate de que se muestre el código de estado HTTP adecuado (301 Trasladada permanentemente).
  • Si es posible, utiliza enlaces absolutos en lugar de relativos. Por ejemplo, al establecer un enlace a otra página del sitio web, enlaza con www.example.com/mipagina.html en lugar de hacerlo solo con mipagina.html.
  • Intenta que se pueda acceder a todas las páginas de tu sitio desde un enlace de texto estático como mínimo. Por lo general, minimiza el número de redireccionamientos necesarios para seguir un enlace de una página a otra.
  • Comprueba que los redireccionamientos dirijan a las páginas correctas. A veces, encontramos redireccionamientos que dirigen a la URL de origen del redireccionamiento (lo que da lugar a un error de bucle) o a URL no válidas.
  • No incluyas URL de redireccionamiento en los sitemaps.
  • Acorta las URL tanto como sea posible. Asegúrate de que no se esté añadiendo automáticamente cierta información (por ejemplo, un ID de sesión) a las URL de redireccionamiento.
  • Asegúrate también de que tu sitio web permita que los robots de búsqueda lo rastreen sin identificadores de sesión ni argumentos que registren su recorrido por el sitio web.
Error de DNS

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido comunicarse con el servidor DNS o que no existen registros para el sitio web en el servidor.

Puedes obtener más información sobre los errores de DNS.

Errores de URL solo en móviles (smartphones)
Error Descripción
Redireccionamientos defectuosos

El error Redireccionamiento defectuoso se muestra en la sección Errores de URL de la página Rastreo > Errores de rastreo que hay en la pestaña Smartphones.

Algunos sitios web usan URL independientes para usuarios de ordenadores y de smartphones, y configuran las páginas para ordenadores de modo que dirijan a los usuarios de smartphones al sitio web para móviles (por ejemplo, m.example.com). Un redireccionamiento defectuoso se produce cuando una página para ordenadores redirige de forma errónea a los usuarios de smartphones a una página para smartphones que no guarda relación con su consulta. Un ejemplo típico de este tipo de error es cuando todas las páginas para ordenadores redirigen a los usuarios de smartphones a la página principal del sitio web optimizado para smartphones. En la siguiente ilustración, se consideran defectuosos los redireccionamientos indicados con una flecha roja:


Este tipo de redireccionamiento interrumpe el flujo de trabajo de los usuarios y puede provocar que abandonen el sitio y busquen cualquier otro. Así pues, cuando nuestros sistemas detectan que los resultados para smartphones redirigen a una página principal, en lugar de a una URL relevante, se envía una nota al usuario junto con los resultados de búsqueda:

Puede que se abra la página principal del sitio web.

El usuario puede acceder al enlace igualmente haciendo clic en Intentar de todas formas. Incluso si el usuario insiste y encuentra la página correcta en el sitio web optimizado para smartphones, un redireccionamiento defectuoso implica que le costará más encontrar tu página en una red de telefonía móvil más lenta. Además de frustrar a los usuarios, los redireccionamientos defectuosos pueden causar problemas en el rastreo, la indexación y los algoritmos de clasificación.

A continuación se indican algunos consejos para ayudarte a crear una experiencia de búsqueda optimizada para móviles y evitar los redireccionamientos defectuosos:

  • Haz unas cuantas búsquedas en el teléfono (o configura tu navegador para que actúe como un smartphone) para comprobar cómo se comporta tu sitio web.
  • Usa las URL de ejemplo proporcionadas en el informe como punto de partida para averiguar el origen exacto del problema en la configuración del servidor.
  • Configura tu servidor para que redirija a los usuarios de smartphones a la URL equivalente de tu sitio web para smartphones.
  • Si una página del sitio web no tiene una versión equivalente para smartphones, mantén a los usuarios en la página para ordenadores y no los redirijas a la página principal del sitio web para smartphones. En este caso, es mejor no hacer nada que hacerlo mal.
  • Ten en cuenta que puedes usar un diseño web adaptable que muestre el mismo contenido tanto a los usuarios de ordenadores como a los de smartphones.
  • Por último, lee nuestras recomendaciones para tener URL independientes para usuarios de ordenadores y de smartphones.
URL bloqueadas para smartphones

El error de bloqueo aparece en la pestaña Smartphone de la sección Errores de URL de la página Rastreo > Errores de rastreo. Si ves el error de bloqueo en una URL de tu sitio web, significa que esta está bloqueada para el robot de Google para smartphones de Google en el archivo robots.txt de tu sitio web.

Este error no solo afecta a los smartphones; las páginas equivalentes para ordenadores también pueden bloquearse. Sin embargo, esto suele indicar que el archivo robots.txt debe modificarse para permitir el rastreo de las URL para smartphones. Cuando se bloquean estas URL, las páginas para móviles no se pueden rastrear y, por este motivo, es posible que no aparezcan en los resultados de búsqueda.

Si obtienes un error de URL bloqueada en el rastreo de las URL de tu sitio web, examina el archivo robots.txt y asegúrate de que no haya secciones de tu sitio web que bloqueen por accidente el rastreo del robot de Google para smartphones.

Para obtener más información, consulta nuestras recomendaciones.

Contenido Flash

El error Contenido Flash se muestra en la sección Errores de URL de la página Rastreo > Errores de rastreo que hay en la pestaña Smartphones.

Nuestros algoritmos indican que las URL de esta sección tienen contenido que se procesa mayoritariamente con Flash. Muchos dispositivos no pueden procesar estas páginas porque iOS o Android 4.1 y versiones posteriores no admiten Flash. Además, para estas URL, los usuarios de estos sistemas operativos reciben el aviso siguiente en los resultados de la Búsqueda de Google:

Utiliza Flash. Puede que no funcione para tu dispositivo.

Te recomendamos que mejores la experiencia móvil de tu sitio web mediante un diseño web adaptable, una práctica recomendada por Google para diseñar sitios optimizados para la búsqueda para todos los dispositivos.  Puedes obtener más información en Conceptos básicos de la Web, un recurso completo sobre el desarrollo web en varios dispositivos.

Independientemente de la opción que utilices para solucionar este problema, asegúrate de permitir que Googlebot acceda a todos los recursos de tu sitio (CSS, JavaScript e imágenes) y no los bloquees con robots.txt ni de otra manera. Nuestros algoritmos necesitan estos archivos externos para detectar la configuración del diseño de tu sitio y procesarla del modo adecuado. Para asegurarte de que nuestros algoritmos de indexación tengan acceso a tu sitio web, utiliza la función Explorar como Google en Search Console.

Errores específicos de Noticias

 

Para consultar informes de errores específicos de Google Noticias, los editores de noticias deben incluir su sitio web en Google Noticias, haber creado una cuenta de Search Console y haber añadido su sitio web en esta. Una vez finalizados estos pasos, sigue los que se indican a continuación en Search Console:

  • En la página principal, haz clic en la URL del sitio web.
  • En el panel de control, haz clic en Rastreo > Errores de rastreo.
  • Haz clic en la pestaña Noticias para ver los errores de rastreo de tu contenido de noticias.
  • Los errores de rastreo se organizan en categorías, como "Extracción de artículos " o "Error de título". Al hacer clic en una de estas categorías, se mostrará una lista de URL afectadas y los errores de rastreo que generan.
Nota: Ten en cuenta que nuestros índices de noticias se compilan mediante algoritmos informáticos. Aunque nos esforzamos por incluir el máximo de contenido posible, no podemos garantizar que incluyamos cada uno de los artículos. Gracias por tu comprensión.
Error Descripción
Artículo desproporcionadamente corto

El cuerpo del artículo que hemos extraído de la página HTML es demasiado corto en comparación con otros grupos de texto sin enlaces en la página. Esto se aplica a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

Los motivos de esta incidencia suelen ser los siguientes:

  • demasiados fragmentos de artículos relacionados (para ayudar a nuestro extractor, recomendamos que permitas los clics en estos fragmentos),
  • funciones como "Enviar este artículo a amigos" con descripciones demasiado largas (recomendamos que establezcas etiquetas del estilo "display:none" o "visibility:hidden" para que el texto se haga invisible o que escribas los fragmentos de código HTML con JavaScript de forma dinámica),
  • comentarios de usuarios (recomendamos que incluyas los comentarios en un iframe, que los extraigas de forma dinámica con AJAX o que los muevas a una página adyacente).
Artículo fragmentado

El cuerpo del artículo que hemos extraído de la página HTML parece constar de frases aisladas que no se agrupan en párrafos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

  • Comprueba que los párrafos contengan más de una oración.
  • Asegúrate de que las frases estén bien puntuadas.
  • Asegúrate de no utilizar demasiado las etiquetas <br> y <p> en los párrafos y, en general, trata de no dividir el cuerpo del artículo.
  • Te recomendamos que elimines de la página parte del texto que no corresponda a material informativo.
Artículo demasiado largo

El cuerpo del artículo que hemos extraído de la página HTML parece demasiado largo para ser un artículo de noticias. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto. Entre los motivos habituales, se incluyen artículos informativos que contienen comentarios de usuarios debajo del artículo o diseños HTML que contienen otro material junto al propio artículo informativo.

Recomendaciones

Te recomendamos que elimines de la página parte del texto que no corresponda a material informativo. Si la página del artículo contiene comentarios de usuarios, recomendamos que realices una de las siguientes acciones:

  • incluirlos en un iframe,
  • extraerlos de forma dinámica con AJAX,
  • mover algunos de los comentarios a una página adyacente.
Artículo demasiado corto

El cuerpo del artículo que hemos extraído de la página HTML parece incluir muy pocas palabras para ser un artículo de noticias. Esto se aplica a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

  • Prueba a distribuir los artículos en párrafos de texto formados por varias frases. Si el contenido del artículo parece incluir muy pocas palabras para ser un artículo informativo, no podremos incluirlo.
  • Asegúrate de que los artículos tengan más de 80 palabras.
No se encuentra la fecha

No hemos podido determinar la fecha de publicación del artículo.

Recomendaciones

Sigue las recomendaciones de formato de fecha que se indican a continuación:

  • Indica una fecha y hora específica para cada uno de los artículos entre el título y el texto del artículo en una línea independiente del código HTML. La fecha debe especificar la fecha de la primera publicación del artículo.
  • Elimina las demás fechas del código HTML de la página del artículo para que el rastreador no las confunda con la fecha de publicación correcta.
  • Si quieres utilizar una metaetiqueta de fecha, ponte en contacto con nosotros en primer lugar. Las metaetiquetas de fecha deben tener el formato siguiente: <meta name="DC.fecha.emisión" content="AAAA-MM-DD">, donde la fecha se expresa en formato W3C, ya sea con el formato "fecha completa" (AAAA-MM-DD) o el formato "fecha completa con horas, minutos y segundos" (AAAA-MM-DDThh:mm:ssTZD) y un sufijo de zona horaria.
  • Crea un sitemap de noticias. La etiqueta <publication_date> nos permitirá seleccionar la fecha correcta de tus artículos.
La fecha es demasiado antigua

La fecha que hemos determinado para este artículo, a partir de una etiqueta publication_date del sitemap o por la fecha de la propia página HTML, es demasiado antigua.

Recomendaciones

  • Asegúrate de que el artículo tenga menos de dos días de antigüedad. Actualmente, solo recopilamos artículos que tengan, como máximo, dos días de antigüedad.
  • Sigue las recomendaciones de formato de fecha indicadas anteriormente.
Artículo vacío

El cuerpo del artículo que hemos extraído de la página HTML parece que está vacío.

Recomendaciones

  • Asegúrate de que el texto completo de cada uno de los artículos esté disponible en el código fuente de las páginas correspondientes (y que, por ejemplo, no esté insertado en un iframe o en un archivo JavaScript).
  • Asegúrate de no estar utilizando un estilo en el código fuente de tus artículos como, por ejemplo, "display:none" o "visibility:hidden".
  • Asegúrate de que los enlaces a tus artículos dirijan directamente a las páginas de estos en lugar de a una página intermedia con un redireccionamiento de JavaScript.
Error en la extracción

No hemos podido extraer el artículo de la página. Se producen errores de extracción cuando no podemos identificar un título, un cuerpo y una marca de tiempo válidos para el artículo. Cuando esto ocurre, elaboramos una lista de las URL que muestran este error para proporcionarte información relacionada con el motivo por el que algunos artículos no aparecen en Google Noticias.

Recomendaciones

  • Asegúrate de que el título, el cuerpo y la marca de tiempo se puedan rastrear con facilidad (es decir, que, por ejemplo, estén disponibles como texto y no como imágenes). No obstante, en estos momentos la función de este error es principalmente informativa. Trabajamos de forma activa para mejorar nuestros métodos de extracción a fin de que este error se dé con menos frecuencia.
  • Envía un sitemap de noticias.
No se han encontrado frases

El cuerpo del artículo que hemos extraído de la página HTML parece no incluir secuencias puntuadas de palabras contiguas. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

  • Si el artículo no contiene secuencias puntuadas de palabras contiguas, no podremos incluirlo en Google Noticias. Asegúrate de que el texto de tus artículos esté formado por frases y de no utilizar demasiado las etiquetas <br> y <p> en los párrafos.
  • El texto completo de cada uno de sus artículos debe estar disponible en el código fuente de las páginas de esos artículos (en lugar de estar insertado, por ejemplo, en un archivo JavaScript).
  • Asegúrate de que los enlaces a tus artículos dirijan directamente a las páginas de los artículos, no a una página intermedia con un redireccionamiento de JavaScript.
El redireccionamiento lleva a un sitio web externo

La sección o página del artículo redirecciona a una URL de un dominio diferente.

Recomendaciones

  • Las páginas y los artículos de todas las secciones se deben ubicar en el dominio del sitio web incluido en Google Noticias.
  • Si no utilizas redireccionamientos externos, asegúrate de que un tercero no haya modificado el sitio web. Obtén más información sobre sitios pirateados.
La página es demasiado grande

La longitud de la página del artículo o de la sección sobrepasa el tamaño máximo permitido.

Recomendación

  • La página de código HTML puede tener un tamaño máximo de 256 KB.
Título no permitido

El título que hemos extraído de la página HTML sugiere que el artículo no es informativo.

Recomendación

  • Frecuentemente, esta incidencia se puede solucionar añadiendo la etiqueta <title> al título del artículo en la página HTML y repitiendo el título en un lugar destacado de la página (por ejemplo, en una etiqueta <h1> ). Obtén más información sobre títulos.
No se encuentra el título

No hemos podido extraer un título para el artículo de la página HTML.

Recomendaciones

  • Sigue nuestras recomendaciones de formato de títulos.
  • Para asegurarte de que tus artículos se muestren correctamente en dispositivos móviles, no incluyas ningún número inicial (que suele corresponderse con una clave de acceso) en el texto de anclaje del título.
Error de descompresión

El robot de Google para Noticias ha detectado que la página estaba comprimida, pero no ha podido descomprimirla. Esto puede deberse a un mal estado de la red o a una mala configuración o programación del servidor web.

Recomendación

  • Comprueba la red o el servidor web.
Tipo de contenido no admitido

La página incluía un tipo de contenido HTTP no admitido por Google Noticias.

Recomendación

  • Los artículos deben incluir un tipo de contenido "text/html", "text/plain" o "application/xhtml+xml".
¿Te ha sido útil este artículo?