Informe "Errores de rastreo" (sitios web)

Los errores de rastreo de sitios web pueden impedir que tu página aparezca en los resultados de búsqueda

El informe Errores de rastreo de sitios web proporciona información sobre las URL de un sitio web que Google no ha podido rastrear correctamente o que han devuelto un código de error HTTP.

Abrir el informe "Errores de rastreo"

 

¿Estás buscando el informe "Estado de rastreo" de aplicaciones móviles?

 

El informe consta de estas dos secciones principales:

  • Errores del sitio web: en esta sección del informe se indican los principales problemas que han impedido al robot de Google acceder a todo tu sitio web durante los últimos 90 días. Haz clic en cualquier casilla para ver el gráfico correspondiente.
     
  • Errores de URL: en esta sección se muestran los errores concretos que Google ha detectado al intentar rastrear determinadas páginas para ordenadores o teléfonos. Cada apartado principal de la sección "Errores de URL" corresponde a los diferentes mecanismos de rastreo que usa Google para acceder a las páginas, por lo que los errores que se enumeran en ellas se corresponden con el tipo de página pertinente.

Descripción general de los errores de sitios web

En la sección Errores del sitio web del informe "Errores de rastreo" de un sitio web que funcione correctamente, no debería aparecer ningún error (es el caso de la gran mayoría de los sitios web que rastreamos). Si Google detecta un número significativo de errores en el sitio web, trataremos de avisarte mediante un mensaje, independientemente del tamaño del sitio web.

Cuando consultes por primera vez la página Errores de rastreo, la sección Errores del sitio web muestra un código de estado rápido junto a cada uno de los tres tipos de error: DNS, conectividad del servidor y exploración de robots.txt. Si los códigos no son una marca de verificación verde, puedes hacer clic en la categoría correspondiente para ver un gráfico de los detalles de rastreo de los últimos 90 días.

Porcentaje de errores elevado

Si el sitio tiene un porcentaje de errores del 100% en alguna categoría, es probable que el sitio no esté disponible o que se haya desconfigurado. Esto puede deberse a varias causas que podrías investigar:

  • Comprueba que no se hayan cambiado los permisos para una sección al cambiar la organización del sitio.
  • Si se ha cambiado la organización del sitio, comprueba que los enlaces externos funcionen aún.
  • Revisa cualquier secuencia de comandos nueva para asegurarte de que no falle repetidamente.
  • Asegúrate de que todos los directorios estén presentes y de que no se hayan cambiado de ubicación ni se hayan eliminado por error.
Si no se da ninguna de las situaciones anteriores, el porcentaje de errores podría deberse a un pico pasajero o a causas externas (por ejemplo, alguien ha enlazado a páginas que no existen). En este caso, es posible que no haya ningún problema. Aun así, si detectamos una cantidad de errores elevada y poco habitual en tu sitio web, te avisaremos para que puedas investigarlos.

Porcentaje de errores bajo

Si tu sitio web tiene un porcentaje de errores menor al 100% en alguna categoría, es posible que se trate de una condición temporal. Sin embargo, también puede deberse a que esté sobrecargado o mal configurado. Te recomendamos que investigues los errores más a fondo o que preguntes sobre ellos en nuestro foro. Puede que te avisemos aunque el porcentaje de errores general sea muy bajo, ya que en nuestra experiencia un sitio web bien configurado no debería tener errores en ninguna categoría.

Tipos de errores de sitios web

En la sección Sitio web del informe, pueden mostrarse los siguientes errores:

Errores de DNS

¿Qué son los errores de DNS?

Un error de DNS se produce cuando el robot de Google no puede comunicarse con el servidor DNS, ya sea porque el servidor esté inactivo o porque la asignación de DNS a tu dominio sea incorrecta. Aunque la mayoría de los errores o de las advertencias de DNS no influyen en la capacidad del robot de Google de acceder a un sitio web, pueden ser indicativos de unos valores de latencia elevados que pueden tener repercusiones negativas en los usuarios.

Corregir los errores de DNS

  • Asegúrate de que Google pueda rastrear el sitio web.
    Usa la función Explorar como Google en una página clave como la página principal, Si el contenido de esta página se muestra sin problemas, se supone que Google puede acceder a ella.
  • En caso de errores de DNS persistentes o reiterados, consulta al proveedor de DNS.
    A menudo, el proveedor de DNS es el mismo que el de alojamiento. 
  • Configura el servidor para que devuelva un código de error HTTP, como el 404 o el 500, si no existe un nombre de host.
    Por ejemplo, en un sitio web, como example.com, se puede utilizar una configuración de DNS comodín para responder a las solicitudes de cualquier subdominio (por ejemplo foo.example.com o nombreinventado.example.com). Esta configuración resulta útil en los sitios web con contenido generado por usuarios que proporcionen un dominio propio (http://nombredeusuario.example.com) a todas las cuentas. Sin embargo, al utilizar esta opción, es posible que en algunos casos el contenido se duplique de forma innecesaria en diferentes nombres de host, lo que podría afectar al rastreo del robot de Google.

Lista de errores de DNS

Tipo de error Descripción
Tiempo de espera de DNS agotado

Google no ha podido acceder al sitio web porque el servidor DNS no ha respondido a la solicitud a tiempo.

Para comprobar si el robot de Google puede rastrear el sitio web, utiliza Explorar como Google. Si esta herramienta devuelve el contenido de la página principal sin problemas, es probable que Google pueda acceder al sitio web correctamente.

Ponte en contacto con el registrador para asegurarte de que el sitio web esté bien configurado y de que el servidor esté conectado a Internet.

Petición de DNS

Google no ha podido acceder a tu sitio web porque el servidor DNS no ha reconocido tu nombre de host (como, por ejemplo, www.example.com).

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Comprueba el registro para asegurarte de que el sitio web esté bien configurado y de que el servidor esté conectado a Internet.

Errores del servidor

¿Qué es un error del servidor?

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido acceder a la URL en cuestión, que se ha agotado el tiempo de espera de la solicitud o que el sitio web estaba ocupado. En consecuencia, el robot de Google ha tenido que abandonar la solicitud.

Corregir los errores de conectividad del servidor

  • Reduce la carga excesiva de la página para solicitudes de páginas dinámicas.
    Se considera que un sitio web que muestra el mismo contenido en diferentes URL publica el contenido de forma dinámica (p. ej. si www.example.com/zapatos.php?color=rojo&talla=38 publica el mismo contenido que www.example.com/zapatos.php?talla=38&color=rojo).  Las páginas dinámicas pueden tardar demasiado en responder, lo que provoca problemas de tiempo de espera. También es posible que el servidor devuelva un estado de sobrecarga para pedir al robot de Google que rastree el sitio web más despacio. En términos generales, se recomienda que los parámetros sean cortos y se usen con moderación. Si sabes cómo funcionan los parámetros en tu sitio web, puedes indicar a Google cómo debe gestionar estos parámetros.
  • Asegúrate de que el servidor de tu host esté activo y no esté sobrecargado ni mal configurado.
    Si los problemas de tiempo de espera o de respuesta continúan, consulta a tu proveedor de alojamiento y plantéate si debes aumentar la capacidad de gestión de tráfico de tu sitio web.
  • Comprueba que no estés bloqueando a Google por error.
    Es posible que bloquees a Google debido a problemas de sistema, como un error de configuración de DNS, un cortafuegos mal configurado, un sistema de protección DoS o una configuración incorrecta en el sistema de gestión del contenido. Los sistemas de protección desempeñan un papel importante en el alojamiento y se suelen configurar para bloquear automáticamente niveles inusualmente elevados de solicitudes del servidor. Sin embargo, como el robot de Google suele hacer más solicitudes que un usuario humano, puede activar estos sistemas de protección y hacer que lo bloqueen e impidan que rastree tu sitio web. Para solucionar estos problemas, debes determinar qué parte de la infraestructura del sitio web impide el acceso del robot de Google y eliminar el bloqueo. Si no tienes control sobre el cortafuegos, deberás ponerte en contacto con tu proveedor de alojamiento.
  • Controla el rastreo y la indexación de los motores de búsqueda de forma adecuada.
    Algunos webmasters impiden que el robot de Google acceda a sus sitios web de forma intencionada (es posible que usen un cortafuegos, como se ha descrito anteriormente). En esos casos, su intención no suele ser impedir completamente el acceso del robot de Google al sitio web, sino que quieren controlar cómo se rastrea y se indexa. Si este fuera el caso, prueba lo siguiente: Si quieres cambiar la frecuencia con la que el robot de Google rastrea tu sitio web, puedes solicitar que cambie su frecuencia de rastreo. Los proveedores de alojamiento también pueden verificar la propiedad de sus direcciones IP.

Errores de conectividad del servidor

Tipo de error Descripción
Tiempo de espera agotado

Se ha excedido el tiempo de espera de respuesta de la solicitud.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Cabeceras incompletas

Google ha podido conectar con el servidor, pero se ha interrumpido la conexión antes de que se mandaran cabeceras completas. Vuelve a comprobarlo más tarde.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Conexión restablecida

El servidor ha procesado correctamente la solicitud de Google, pero no devuelve ningún contenido porque se ha restablecido la conexión con el servidor. Vuelve a comprobarlo más tarde.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Respuesta incompleta

El servidor ha interrumpido la conexión antes de que pudiéramos recibir una respuesta completa, y el cuerpo de la respuesta parece estar truncado.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Se ha rechazado la conexión.

Google no ha podido acceder a tu sitio web porque el servidor ha rechazado la conexión. Es posible que tu proveedor de alojamiento esté bloqueando el robot de Google, o que haya un problema en la configuración del cortafuegos.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Error de conexión

Google no ha podido conectar con el servidor porque no se puede obtener acceso a la red o no está disponible.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Tiempo de espera de la conexión agotado

Google no ha podido conectar con el servidor.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si dicha herramienta devuelve el contenido de la página principal sin ninguna dificultad, se supone que, por lo general, el robot de Google puede acceder al sitio web correctamente.

Comprueba que el servidor esté conectado a Internet. También es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, ponte en contacto con tu proveedor de alojamiento.

Sin respuesta

Google ha podido conectar con el servidor, pero la conexión se ha cortado antes de que este enviara datos.

Para comprobar si el robot de Google puede rastrear el sitio web, utiliza Explorar como Google. Si esta herramienta devuelve el contenido de la página principal sin problemas, es probable que el robot de Google pueda acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, ponte en contacto con tu proveedor de alojamiento.

Fallo del archivo robots.txt

¿Qué es un fallo del archivo robots.txt?

Se trata de un error al recuperar el archivo robots.txt de tu sitio web. El robot de Google, antes de rastrear tu sitio web y aproximadamente una vez al día después de hacerlo, recupera tu archivo robots.txt para ver qué páginas no debería estar rastreando. Si tu archivo robots.txt existe pero no se puede acceder a él (es decir, si no devuelve ningún código de estado HTTP 200 o 404), pospondremos nuestro rastreo en lugar de arriesgarnos a rastrear las URL que no quieres que se rastreen. Cuando esto ocurra, el robot de Google volverá al sitio web y lo rastreará tan pronto como se pueda acceder correctamente al archivo robots.txt. Más información sobre el protocolo de exclusión de los archivos robots.txt

Corregir los errores del archivo robots.txt

  • No siempre es necesario un archivo robots.txt.
    Solo es necesario si tu sitio web incluye contenido que no deseas que los motores de búsqueda indexen. Si quieres que los motores de búsqueda indexen todo el contenido de tu sitio web, no necesitas un archivo robots.txt, ni siquiera uno vacío. Si no tienes un archivo robots.txt, el servidor devolverá un mensaje 404 cuando el robot de Google lo solicite y se seguirá rastreando el sitio web sin problema.
  • Asegúrate de que Google pueda acceder al archivo robots.txt.
    Es posible que tu servidor haya devuelto un error 5xx (problemas de acceso) cuando se ha intentado recuperar el archivo robots.txt. Comprueba que el proveedor de alojamiento no bloquee el acceso al robot de Google y que, si tienes un cortafuegos, su configuración también permite que el robot tenga acceso.

Descripción general de los errores de URL

La sección "Errores de URL" del informe está dividida en categorías que muestran los mil errores de URL más importantes de la categoría en cuestión. No tienes que solucionar todos los errores que encuentres en esta sección, pero es importante que la consultes regularmente para comprobar que no haya ninguno que pueda afectar negativamente a los usuarios y a los rastreadores de Google. Por este motivo, te hemos facilitado la tarea mostrando los problemas más importantes en la parte superior, en función de factores como el número de errores y de páginas que hacen referencia a la URL. Te recomendamos realizar las siguientes acciones:

  • Soluciona los errores de página no encontrada de las URL más importantes mediante redireccionamientos 301. Aunque sea normal que el sitio web tenga errores de URL no encontrada (404), recomendamos solucionar los errores relativos a las páginas importantes que enlacen a otros sitios web, a las URL antiguas del sitemap que ya no existan, a las URL de páginas importantes que estén mal escritas o a las URL de páginas populares que ya no existan. De este modo, tanto Google como los visitantes accederán fácilmente a la información que más te importa.
  • Actualiza tus sitemaps.  Borra de tus sitemaps las URL obsoletas y, si añades sitemaps nuevos para reemplazar los antiguos, asegúrate de eliminar el sitemap antiguo (y no redireccionarlo al nuevo).  
  • Usa redireccionamientos breves y claros.  Si tienes varias URL que redireccionan en secuencia (por ejemplo, páginaA > páginaB > páginaC > páginaD), puede que el robot de Google tenga dificultades para seguir e interpretar la secuencia.  Procura que las secuencias sean cortas.  Obtén más información sobre los errores al seguir las URL.

Consultar los detalles de los errores de URL

Puedes consultarlos de muchas formas:

  • Haz clic en Descargar para obtener una lista de los mil errores más importantes del tipo de rastreador que estés utilizando (por ejemplo, para ordenadores o smartphones).
  • Usa el filtro situado sobre la tabla para buscar URL concretas.
  • Consulta los detalles del error siguiendo el enlace de cada URL o de cada URI de aplicación.
Los detalles de los errores de URLs para ordenadores o teléfonos muestran información sobre el estado del error, una lista de páginas que hacen referencia a la URL y un enlace a Explorar como Google para que puedas solucionar los problemas de la URL en cuestión.

Marcar los errores de URL como solucionados

Cuando hayas solucionado el problema que causaba el error, puedes ocultarlo para que no se muestre en la lista; se puede hacer en bloque o uno por uno. Para eliminar URLs de la lista, selecciona la casilla situada junto a la URL que quieras y, a continuación, haz clic en Marcar como solucionada. Ten en cuenta que esta función es solo para facilitarte la tarea de gestionarlos; si el rastreador de Google vuelve a detectar el error en el siguiente rastreo de tu sitio web, la URL aparecerá de nuevo en la lista.

Tipos de error de URL

Errores de URL frecuentes
Tipo de error Descripción
Error del servidor

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido acceder a la URL en cuestión, que se ha agotado el tiempo de espera de la solicitud o que el sitio web estaba ocupado. En consecuencia, el robot de Google ha tenido que abandonar la solicitud.

Obtén más información sobre los errores de conectividad del servidor.

Error soft 404

Normalmente, cuando el visitante solicita una página que no existe, el servidor muestra un error 404 (página no encontrada). Este código de respuesta HTTP indica claramente a los navegadores y a los motores de búsqueda que la página no existe. En consecuencia, los motores de búsqueda no rastrean ni indexan el contenido de la página (si lo hubiera).

Un error soft 404 sucede cuando el servidor muestra la página real de una URL que en realidad no existe en tu sitio web. Esto suele suceder cuando el servidor gestiona URL defectuosas o no existentes como URL correctas, por lo que redirecciona al usuario a una página válida, como la página principal o una página 404 personalizada.  

Esto se debe a que los motores de búsqueda pueden invertir mucho tiempo en rastrear e indexar las URL no existentes, y a veces duplicadas, en el sitio web. El hecho de que no se detecten URL reales y exclusivas rápidamente o de que estas no reciban visitas frecuentes podría afectar negativamente al rastreo del sitio web.

Si tu página ha desaparecido completamente y no la puedes reemplazar, te recomendamos que configures el servidor para que siempre muestre un código de error 404 (página no encontrada) o 410 (página no existente) en respuesta a la solicitud de una página no existente. En caso de error 404, puedes mejorar la experiencia del usuario creando una página 404 personalizada. Por ejemplo, puedes crear una página que contenga una lista de tus páginas más populares o un enlace a tu página principal o para enviar comentarios. Sin embargo, debes recordar que no basta con crear una página que muestre un mensaje 404, ya que también se debe devolver el código de respuesta HTTP 404 o 410 correcto.

404

El robot de Google ha solicitado una URL que no existe en el sitio web.

Corregir los errores 404

La mayoría de los errores 404 no afectan a la clasificación de tu sitio web en Google, por lo que puedes ignorarlos tranquilamente. Estos mensajes de error se suelen deber a errores ortotipográficos, a configuraciones incorrectas o a los crecientes esfuerzos de Google por reconocer y rastrear enlaces en contenido insertado (por ejemplo, JavaScript). A continuación te indicamos algunas cuestiones que te ayudarán a investigar y corregir errores 404:

  1. Decide si vale la pena. Muchos, si no la mayoría, de los errores 404 no son tan importantes como para que valga la pena corregirlos. Ordena los errores 404 por prioridad y corrige los que realmente debas solucionar. Puedes pasar por alto los demás, ya que este tipo de error no perjudica ni al índice ni al posicionamiento de tu sitio web. A continuación, te mostramos los motivos por los que no es necesario corregirlos todos:
    • Si se trata de una página eliminada que no tiene reemplazo ni equivalente, debe devolverse un error 404.
    • Si se trata de una URL incorrecta generada por una secuencia de comandos o que nunca ha existido en tu sitio web, es muy probable que no debas preocuparte por ello. Puede que te moleste verla en el informe, pero no es necesario corregirla, salvo si se trata de un enlace que se escribe incorrectamente con frecuencia. A continuación tienes más información al respecto.
  2. Consulta de dónde provienen los enlaces no válidos. Haz clic en una URL para ver de dónde provienen los enlaces de estas páginas. En función de si el enlace está en tu sitio web o en un sitio web de terceros, debes seguir estos pasos:
    1. Corrige los enlaces que provienen de tu sitio web y que dirigen a páginas que no existen, o bien elimínalos si procede.
      • Si el contenido se ha movido, añade una URL de redireccionamiento.
      • Si has eliminado el contenido de forma permanente sin la intención de reemplazarlo por contenido relacionado y más reciente, deja que la antigua URL devuelva un error 404 o 410. Actualmente, Google trata los errores 410 (No disponible permanentemente) del mismo modo que los 404 (Página no encontrada). El hecho de devolver un código distinto al 404 o al 410 para una página inexistente (o de redireccionar a los usuarios a otra página, como a la página principal, en lugar de devolver un código 404) puede suponer un problema. Estas páginas se conocen como errores 404 leves y pueden confundir tanto a los usuarios como a los motores de búsqueda.
      • Si la URL es desconocida, es posible que veas puntualmente errores 404 de direcciones URL que nunca han existido en tu sitio web. El robot de Google podría generar estas URL inesperadas al seguir enlaces en JavaScript, en archivos Flash o en otro tipo de contenido insertado o que posiblemente solo existe en un sitemap. Por ejemplo, es posible que tu sitio web utilice un código parecido al siguiente para realizar un seguimiento de las descargas de archivos en Google Analytics:
        <a href="helloworld.pdf"
          onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
          Hello World PDF</a>

        Cuando el robot de Google vea ese código, es posible que intente rastrear la URL http://www.example.com/download-helloworld, aunque no sea una página real. En ese caso, el enlace puede mostrarse como un error 404 (página no encontrada) en el informe Errores de rastreo. Google está trabajando para evitar este tipo de error de rastreo, que no tiene ningún efecto sobre el rastreo ni la clasificación de tu sitio web.

    2. Corrige los enlaces mal escritos en otros sitios con redireccionamientos 301. Por ejemplo, el hecho de escribir como (www.example.com/sapatosrojos la URL auténtica www.example.com/zapatosrojos) probablemente se deba a que alguien ha enlazado con tu sitio web y ha cometido una falta de ortografía. En este caso, se puede capturar la URL mal escrita si se crea un redireccionamiento 301 a la URL correcta. También puedes ponerte en contacto con el webmaster del sitio web con el enlace incorrecto y pedirle que lo modifique o lo retire.
  3. Ignora el resto de errores. No crees contenido falso ni redirijas desde tu página principal, ni uses un archivo robot.txt para bloquear estas URL, puesto que todas estas opciones dificultan el reconocimiento y el correcto procesamiento de la estructura de tu sitio web. Estos errores se conocen como errores 404 leves. Ten en cuenta que, al hacer clic en Este problema está corregido en el informe Errores de rastreo solo se oculta temporalmente el error 404, que se mostrará de nuevo cada vez que Google intente rastrear la URL.Una vez que Google haya rastreado una URL correctamente, puede que intente hacerlo de forma indefinida. Al crear un redireccionamiento del tipo 300, se retrasará el intento para volver a rastrear, posiblemente durante mucho tiempo.  Ten en cuenta que enviar una solicitud de eliminación de URL mediante la herramienta correspondiente no eliminará el error de este informe.

Si no reconoces una URL de tu sitio web, puedes ignorarla. Estos errores suceden cuando alguien navega a una URL que no existe en tu sitio web; puede que alguien escribiera incorrectamente una URL en el navegador o que la URL del enlace estuviera mal escrita. Sin embargo, es posible que te interese descubrir alguna de estas URL mal escritas como se describe en la lista anterior.

Acceso denegado

Por lo general, Google descubre contenido siguiendo enlaces que dirigen de una página a otra. Para rastrear una página, el robot de Google debe acceder a ella. Si aparecen errores inesperados de acceso denegado, es probable que se deba a una de las siguientes razones:

  • El robot de Google no ha podido acceder a una URL de tu sitio web porque es obligatorio iniciar sesión para ver una parte o la totalidad del contenido.
  • Tu servidor requiere que los usuarios se autentiquen mediante un proxy o tu proveedor de alojamiento está impidiendo que Google acceda a tu sitio web.

Para solucionarlo:

  • Comprueba que el robots.txt funcione según lo previsto y no bloquee a Google. La herramienta Probador de robots.txt te permite ver exactamente cómo interpretará el robot de Google el contenido del archivo robots.txt. El user-agent de Google es el robot de Google. 
  • Usa Explorar como Google para saber cómo ve tu sitio web el robot de Google. Esta herramienta puede resultarte muy útil para solucionar problemas relacionados con el contenido del sitio web o con su visibilidad en los resultados de búsqueda.
URL no seguidas

Los errores de URL no seguidas indican las URL que Google no ha podido seguir de forma completa, además de la causa de ello. A continuación se indican algunas razones por las que es posible que el robot de Google no haya podido seguir las URL de tu sitio web:

Contenido activo, JavaScript y Flash

Algunas funciones como JavaScript, las cookies, los ID de sesión, los marcos, DHTML o Flash pueden hacer más difícil que los motores de búsqueda rastreen el sitio. Comprueba lo siguiente:

  • Utiliza un navegador de texto como Lynx para examinar el sitio, ya que muchos motores de búsqueda ven tu sitio igual que Lynx. Si hay funciones como JavaScript, cookies, ID de sesión, marcos, DHTML o Flash que impidan la visualización de todo tu sitio web en un navegador de texto, es posible que las arañas de motores de búsqueda tengan dificultades para rastrearlo.
  • Mediante la herramienta Explorar como Google se puede comprobar cómo ve exactamente Google el sitio web.
  • Si utilizas páginas dinámicas (por ejemplo, si la URL contiene un carácter ?), tenga en cuenta que no todas las arañas de los motores de búsqueda rastrean páginas dinámicas y estáticas. En términos generales, se recomienda que los parámetros sean cortos y se usen con moderación. Si ya sabes cómo funcionan los parámetros en tu sitio web, puedes indicar a Google cómo debe gestionarlos.

Redireccionamientos

  • Si tienes que crear redireccionamientos continuamente, asegúrate de que se muestre el código de estado HTTP pertinente (301 Movido permanentemente).
  • Si es posible, utiliza enlaces absolutos en lugar de relativos. Por ejemplo, al establecer un enlace a otra página del sitio web, enlaza con www.example.com/mipagina.html en lugar de hacerlo solo con mipagina.html.
  • Intenta que se pueda acceder a todas las páginas de tu sitio desde un enlace de texto estático como mínimo. Por lo general, minimiza el número de redireccionamientos necesarios para seguir un enlace de una página a otra.
  • Comprueba que los redireccionamientos dirijan a las páginas correctas. A veces, encontramos redireccionamientos que dirigen a la URL de origen del redireccionamiento (lo que da lugar a un error de bucle) o a URL no válidas.
  • No incluyas URL de redireccionamiento en los sitemaps.
  • Acorta las URL tanto como sea posible. Asegúrate de que no se esté añadiendo automáticamente cierta información (por ejemplo, un ID de sesión) a las URL de redireccionamiento.
  • Asegúrate también de que tu sitio web permita que los robots de búsqueda lo rastreen sin identificadores de sesión ni argumentos que registren su recorrido por el sitio web.
Error de DNS

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido comunicarse con el servidor DNS o que no existen registros para el sitio web en el servidor.

Puedes obtener más información sobre los errores de DNS.

Errores de URL solo en móviles (smartphones)
Error Descripción
Redireccionamientos defectuosos

El error Redireccionamiento defectuoso se muestra en la sección Errores de URL de la página Rastreo > Errores de rastreo que hay en la pestaña Smartphones.

Algunos sitios web usan URL independientes para usuarios de ordenadores y de smartphones, y configuran las páginas para ordenadores de modo que dirijan a los usuarios de smartphones al sitio web para móviles (por ejemplo, m.example.com). Un redireccionamiento defectuoso se produce cuando una página para ordenadores redirige de forma errónea a los usuarios de smartphones a una página para smartphones que no guarda relación con su consulta. Un ejemplo típico de este tipo de error es cuando todas las páginas para ordenadores redirigen a los usuarios de smartphones a la página principal del sitio web optimizado para smartphones. En la siguiente ilustración, se consideran defectuosos los redireccionamientos indicados con una flecha roja:


Este tipo de redireccionamiento interrumpe el flujo de trabajo de los usuarios y puede provocar que abandonen el sitio y busquen cualquier otro.

A continuación se indican algunos consejos para ayudarte a crear una experiencia de búsqueda optimizada para móviles y evitar los redireccionamientos defectuosos:

  • Haz unas cuantas búsquedas en el teléfono (o configura tu navegador para que actúe como un smartphone) para comprobar cómo se comporta tu sitio web.
  • Usa las URL de ejemplo proporcionadas en el informe como punto de partida para averiguar el origen exacto del problema en la configuración del servidor.
  • Configura tu servidor para que redirija a los usuarios de smartphones a la URL equivalente de tu sitio web para smartphones.
  • Si una página del sitio web no tiene una versión equivalente para smartphones, mantén a los usuarios en la página para ordenadores y no los redirijas a la página principal del sitio web para smartphones. En este caso, es mejor no hacer nada que hacerlo mal.
  • Ten en cuenta que puedes usar un diseño web adaptable que muestre el mismo contenido tanto a los usuarios de ordenadores como a los de smartphones.
  • Por último, lee nuestras recomendaciones para tener URL independientes para usuarios de ordenadores y de smartphones.
URL bloqueadas para smartphones

El error de bloqueo aparece en la pestaña Smartphone de la sección Errores de URL de la página Rastreo > Errores de rastreo. Si ves el error de bloqueo en una URL de tu sitio web, significa que esta está bloqueada para el robot de Google para smartphones de Google en el archivo robots.txt de tu sitio web.

Este error no solo afecta a los smartphones; las páginas equivalentes para ordenadores también pueden bloquearse. Sin embargo, esto suele indicar que el archivo robots.txt debe modificarse para permitir el rastreo de las URL para smartphones. Cuando se bloquean estas URL, las páginas para móviles no se pueden rastrear y, por este motivo, es posible que no aparezcan en los resultados de búsqueda.

Si obtienes un error de URL bloqueada en el rastreo de las URL de tu sitio web, examina el archivo robots.txt y asegúrate de que no haya secciones de tu sitio web que bloqueen por accidente el rastreo del robot de Google para smartphones.

Para obtener más información, consulta nuestras recomendaciones.

Contenido Flash

El error Contenido Flash se muestra en la sección Errores de URL de la página Rastreo > Errores de rastreo que hay en la pestaña Smartphones.

Nuestros algoritmos indican que las URL de esta sección tienen contenido que se procesa mayoritariamente con Flash. Muchos dispositivos no pueden procesar estas páginas porque iOS o Android 4.1 y versiones posteriores no admiten Flash.

Te recomendamos que mejores la experiencia móvil de tu sitio web mediante un diseño web adaptable, una práctica recomendada por Google para diseñar sitios optimizados para la búsqueda para todos los dispositivos.  Puedes obtener más información en Conceptos básicos de la Web, un recurso completo sobre el desarrollo web en varios dispositivos.

Independientemente de la opción que utilices para solucionar este problema, asegúrate de permitir que Googlebot acceda a todos los recursos de tu sitio (CSS, JavaScript e imágenes) y no los bloquees con robots.txt ni de otra manera. Nuestros algoritmos necesitan estos archivos externos para detectar la configuración del diseño de tu sitio y procesarla del modo adecuado. Para asegurarte de que nuestros algoritmos de indexación tengan acceso a tu sitio web, utiliza la función Explorar como Google en Search Console.

 
¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?