Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal

Informe "Errores de rastreo" (sitios web)

Los errores de rastreo de sitios web pueden impedir que tu página aparezca en los resultados de búsqueda

El informe Errores de rastreo de sitios web proporciona información sobre las URL de un sitio web que Google no ha podido rastrear correctamente o que han devuelto un código de error HTTP.

Abrir el informe "Errores de rastreo"

 

¿Estás buscando el informe "Estado de rastreo" de aplicaciones móviles?

 

El informe consta de estas dos secciones principales:

  • Errores del sitio web: en esta sección del informe se indican los principales problemas que han impedido al robot de Google acceder a todo tu sitio web durante los últimos 90 días. Haz clic en cualquier casilla para ver el gráfico correspondiente.
     
  • Errores de URL: en esta sección se muestran los errores concretos que Google ha detectado al intentar rastrear determinadas páginas para ordenadores o teléfonos. Cada apartado principal de la sección "Errores de URL" corresponde a los diferentes mecanismos de rastreo que usa Google para acceder a las páginas, por lo que los errores que se enumeran en ellas se corresponden con el tipo de página pertinente.

Descripción general de los errores de sitios web

En la sección Errores del sitio web del informe "Errores de rastreo" de un sitio web que funcione correctamente, no debería aparecer ningún error (es el caso de la gran mayoría de los sitios web que rastreamos). Si Google detecta un número significativo de errores en el sitio web, trataremos de avisarte mediante un mensaje, independientemente del tamaño del sitio web.

Cuando consultes por primera vez la página Errores de rastreo, la sección Errores del sitio web muestra un código de estado rápido junto a cada uno de los tres tipos de error: DNS, conectividad del servidor y exploración de robots.txt. Si los códigos no son una marca de verificación verde, puedes hacer clic en la categoría correspondiente para ver un gráfico de los detalles de rastreo de los últimos 90 días.

Porcentaje de errores elevado

Si el sitio tiene un porcentaje de errores del 100% en alguna categoría, es probable que el sitio no esté disponible o que se haya desconfigurado. Esto puede deberse a varias causas que podrías investigar:

  • Comprueba que no se hayan cambiado los permisos para una sección al cambiar la organización del sitio.
  • Si se ha cambiado la organización del sitio, comprueba que los enlaces externos funcionen aún.
  • Revisa cualquier secuencia de comandos nueva para asegurarte de que no falle repetidamente.
  • Asegúrate de que todos los directorios estén presentes y de que no se hayan cambiado de ubicación ni se hayan eliminado por error.
Si no se da ninguna de las situaciones anteriores, el porcentaje de errores podría deberse a un pico pasajero o a causas externas (por ejemplo, alguien ha enlazado a páginas que no existen). En este caso, es posible que no haya ningún problema. Aun así, si detectamos una cantidad de errores elevada y poco habitual en tu sitio web, te avisaremos para que puedas investigarlos.

Porcentaje de errores bajo

Si tu sitio web tiene un porcentaje de errores menor al 100% en alguna categoría, es posible que se trate de una condición temporal. Sin embargo, también puede deberse a que esté sobrecargado o mal configurado. Te recomendamos que investigues los errores más a fondo o que preguntes sobre ellos en nuestro foro. Puede que te avisemos aunque el porcentaje de errores general sea muy bajo, ya que en nuestra experiencia un sitio web bien configurado no debería tener errores en ninguna categoría.

Tipos de errores de sitios web

En la sección Sitio web del informe, pueden mostrarse los siguientes errores:

Errores de DNS

¿Qué son los errores de DNS?

Un error de DNS se produce cuando el robot de Google no puede comunicarse con el servidor DNS, ya sea porque el servidor esté inactivo o porque la asignación de DNS a tu dominio sea incorrecta. Aunque la mayoría de los errores o de las advertencias de DNS no influyen en la capacidad del robot de Google de acceder a un sitio web, pueden ser indicativos de unos valores de latencia elevados que pueden tener repercusiones negativas en los usuarios.

Corregir los errores de DNS

  • Asegúrate de que Google pueda rastrear el sitio web.
    Usa la función Explorar como Google en una página clave como la página principal, Si el contenido de esta página se muestra sin problemas, se supone que Google puede acceder a ella.
  • En caso de errores de DNS persistentes o reiterados, consulta al proveedor de DNS.
    A menudo, el proveedor de DNS es el mismo que el de alojamiento. 
  • Configura el servidor para que devuelva un código de error HTTP, como el 404 o el 500, si no existe un nombre de host.
    Por ejemplo, en un sitio web, como example.com, se puede utilizar una configuración de DNS comodín para responder a las solicitudes de cualquier subdominio (por ejemplo foo.example.com o nombreinventado.example.com). Esta configuración resulta útil en los sitios web con contenido generado por usuarios que proporcionen un dominio propio (http://nombredeusuario.example.com) a todas las cuentas. Sin embargo, al utilizar esta opción, es posible que en algunos casos el contenido se duplique de forma innecesaria en diferentes nombres de host, lo que podría afectar al rastreo del robot de Google.

Lista de errores de DNS

Tipo de error Descripción
Tiempo de espera de DNS agotado

Google no ha podido acceder al sitio web porque el servidor DNS no ha respondido a la solicitud a tiempo.

Para comprobar si el robot de Google puede rastrear el sitio web, utiliza Explorar como Google. Si esta herramienta devuelve el contenido de la página principal sin problemas, es probable que Google pueda acceder al sitio web correctamente.

Ponte en contacto con el registrador para asegurarte de que el sitio web esté bien configurado y de que el servidor esté conectado a Internet.

Petición de DNS

Google no ha podido acceder a tu sitio web porque el servidor DNS no ha reconocido tu nombre de host (como, por ejemplo, www.example.com).

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Comprueba el registro para asegurarte de que el sitio web esté bien configurado y de que el servidor esté conectado a Internet.

Errores del servidor

¿Qué es un error del servidor?

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido acceder a la URL en cuestión, que se ha agotado el tiempo de espera de la solicitud o que el sitio web estaba ocupado. En consecuencia, el robot de Google ha tenido que abandonar la solicitud.

Corregir los errores de conectividad del servidor

  • Reduce la carga excesiva de la página para solicitudes de páginas dinámicas.
    Se considera que un sitio web que muestra el mismo contenido en diferentes URL publica el contenido de forma dinámica (p. ej. si www.example.com/zapatos.php?color=rojo&talla=38 publica el mismo contenido que www.example.com/zapatos.php?talla=38&color=rojo).  Las páginas dinámicas pueden tardar demasiado en responder, lo que provoca problemas de tiempo de espera. También es posible que el servidor devuelva un estado de sobrecarga para pedir al robot de Google que rastree el sitio web más despacio. En términos generales, se recomienda que los parámetros sean cortos y se usen con moderación. Si sabes cómo funcionan los parámetros en tu sitio web, puedes indicar a Google cómo debe gestionar estos parámetros.
  • Asegúrate de que el servidor de tu host esté activo y no esté sobrecargado ni mal configurado.
    Si los problemas de tiempo de espera o de respuesta continúan, consulta a tu proveedor de alojamiento y plantéate si debes aumentar la capacidad de gestión de tráfico de tu sitio web.
  • Comprueba que no estés bloqueando a Google por error.
    Es posible que bloquees a Google debido a problemas de sistema, como un error de configuración de DNS, un cortafuegos mal configurado, un sistema de protección DoS o una configuración incorrecta en el sistema de gestión del contenido. Los sistemas de protección desempeñan un papel importante en el alojamiento y se suelen configurar para bloquear automáticamente niveles inusualmente elevados de solicitudes del servidor. Sin embargo, como el robot de Google suele hacer más solicitudes que un usuario humano, puede activar estos sistemas de protección y hacer que lo bloqueen e impidan que rastree tu sitio web. Para solucionar estos problemas, debes determinar qué parte de la infraestructura del sitio web impide el acceso del robot de Google y eliminar el bloqueo. Si no tienes control sobre el cortafuegos, deberás ponerte en contacto con tu proveedor de alojamiento.
  • Controla el rastreo y la indexación de los motores de búsqueda de forma adecuada.
    Algunos webmasters impiden que el robot de Google acceda a sus sitios web de forma intencionada (es posible que usen un cortafuegos, como se ha descrito anteriormente). En esos casos, su intención no suele ser impedir completamente el acceso del robot de Google al sitio web, sino que quieren controlar cómo se rastrea y se indexa. Si este fuera el caso, prueba lo siguiente: Si quieres cambiar la frecuencia con la que el robot de Google rastrea tu sitio web, puedes solicitar que cambie su frecuencia de rastreo. Los proveedores de alojamiento también pueden verificar la propiedad de sus direcciones IP.

Errores de conectividad del servidor

Tipo de error Descripción
Tiempo de espera agotado

Se ha excedido el tiempo de espera de respuesta de la solicitud.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Cabeceras incompletas

Google ha podido conectar con el servidor, pero se ha interrumpido la conexión antes de que se mandaran cabeceras completas. Vuelve a comprobarlo más tarde.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Conexión restablecida

El servidor ha procesado correctamente la solicitud de Google, pero no devuelve ningún contenido porque se ha restablecido la conexión con el servidor. Vuelve a comprobarlo más tarde.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Respuesta incompleta

El servidor ha interrumpido la conexión antes de que pudiéramos recibir una respuesta completa, y el cuerpo de la respuesta parece estar truncado.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Se ha rechazado la conexión.

Google no ha podido acceder a tu sitio web porque el servidor ha rechazado la conexión. Es posible que tu proveedor de alojamiento esté bloqueando el robot de Google, o que haya un problema en la configuración del cortafuegos.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Error de conexión

Google no ha podido conectar con el servidor porque no se puede obtener acceso a la red o no está disponible.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, consulta con tu proveedor de alojamiento.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si Explorar como Google devuelve el contenido de la página principal sin ninguna dificultad, se puede considerar que, por lo general, Google puede acceder al sitio web correctamente.

Tiempo de espera de la conexión agotado

Google no ha podido conectar con el servidor.

Para comprobar si el robot de Google puede rastrear actualmente el sitio web, puedes utilizar la herramienta Explorar como Google. Si dicha herramienta devuelve el contenido de la página principal sin ninguna dificultad, se supone que, por lo general, el robot de Google puede acceder al sitio web correctamente.

Comprueba que el servidor esté conectado a Internet. También es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, ponte en contacto con tu proveedor de alojamiento.

Sin respuesta

Google ha podido conectar con el servidor, pero la conexión se ha cortado antes de que este enviara datos.

Para comprobar si el robot de Google puede rastrear el sitio web, utiliza Explorar como Google. Si esta herramienta devuelve el contenido de la página principal sin problemas, es probable que el robot de Google pueda acceder al sitio web correctamente.

Es posible que el servidor esté sobrecargado o mal configurado. Si el problema persiste, ponte en contacto con tu proveedor de alojamiento.

Fallo del archivo robots.txt

¿Qué es un fallo del archivo robots.txt?

Se trata de un error al recuperar el archivo robots.txt de tu sitio web. El robot de Google, antes de rastrear tu sitio web y aproximadamente una vez al día después de hacerlo, recupera tu archivo robots.txt para ver qué páginas no debería estar rastreando. Si tu archivo robots.txt existe pero no se puede acceder a él (es decir, si no devuelve ningún código de estado HTTP 200 o 404), pospondremos nuestro rastreo en lugar de arriesgarnos a rastrear las URL que no quieres que se rastreen. Cuando esto ocurra, el robot de Google volverá al sitio web y lo rastreará tan pronto como se pueda acceder correctamente al archivo robots.txt. Más información sobre el protocolo de exclusión de los archivos robots.txt

Corregir los errores del archivo robots.txt

  • No siempre es necesario un archivo robots.txt.
    Solo es necesario si tu sitio web incluye contenido que no deseas que los motores de búsqueda indexen. Si quieres que los motores de búsqueda indexen todo el contenido de tu sitio web, no necesitas un archivo robots.txt, ni siquiera uno vacío. Si no tienes un archivo robots.txt, el servidor devolverá un mensaje 404 cuando el robot de Google lo solicite y se seguirá rastreando el sitio web sin problema.
  • Asegúrate de que Google pueda acceder al archivo robots.txt.
    Es posible que tu servidor haya devuelto un error 5xx (problemas de acceso) cuando se ha intentado recuperar el archivo robots.txt. Comprueba que el proveedor de alojamiento no bloquee el acceso al robot de Google y que, si tienes un cortafuegos, su configuración también permite que el robot tenga acceso.

Descripción general de los errores de URL

La sección "Errores de URL" del informe está dividida en categorías que muestran los mil errores de URL más importantes de la categoría en cuestión. No tienes que solucionar todos los errores que encuentres en esta sección, pero es importante que la consultes regularmente para comprobar que no haya ninguno que pueda afectar negativamente a los usuarios y a los rastreadores de Google. Por este motivo, te hemos facilitado la tarea mostrando los problemas más importantes en la parte superior, en función de factores como el número de errores y de páginas que hacen referencia a la URL. Te recomendamos realizar las siguientes acciones:

  • Soluciona los errores de página no encontrada de las URL más importantes mediante redireccionamientos 301. Aunque sea normal que el sitio web tenga errores de URL no encontrada (404), recomendamos solucionar los errores relativos a las páginas importantes que enlacen a otros sitios web, a las URL antiguas del sitemap que ya no existan, a las URL de páginas importantes que estén mal escritas o a las URL de páginas populares que ya no existan. De este modo, tanto Google como los visitantes accederán fácilmente a la información que más te importa.
  • Actualiza tus sitemaps.  Borra de tus sitemaps las URL obsoletas y, si añades sitemaps nuevos para reemplazar los antiguos, asegúrate de eliminar el sitemap antiguo (y no redireccionarlo al nuevo).  
  • Usa redireccionamientos breves y claros.  Si tienes varias URL que redireccionan en secuencia (por ejemplo, páginaA > páginaB > páginaC > páginaD), puede que el robot de Google tenga dificultades para seguir e interpretar la secuencia.  Procura que las secuencias sean cortas.  Obtén más información sobre los errores al seguir las URL.

Consultar los detalles de los errores de URL

Puedes consultarlos de muchas formas:

  • Haz clic en Descargar para obtener una lista de los mil errores más importantes del tipo de rastreador que estés utilizando (por ejemplo, para ordenadores o smartphones).
  • Usa el filtro situado sobre la tabla para buscar URL concretas.
  • Consulta los detalles del error siguiendo el enlace de cada URL o de cada URI de aplicación.
Los detalles de los errores de URLs para ordenadores o teléfonos muestran información sobre el estado del error, una lista de páginas que hacen referencia a la URL y un enlace a Explorar como Google para que puedas solucionar los problemas de la URL en cuestión.

Marcar los errores de URL como solucionados

Cuando hayas solucionado el problema que causaba el error, puedes ocultarlo para que no se muestre en la lista; se puede hacer en bloque o uno por uno. Para eliminar URLs de la lista, selecciona la casilla situada junto a la URL que quieras y, a continuación, haz clic en Marcar como solucionada. Ten en cuenta que esta función es solo para facilitarte la tarea de gestionarlos; si el rastreador de Google vuelve a detectar el error en el siguiente rastreo de tu sitio web, la URL aparecerá de nuevo en la lista.

Tipos de error de URL

Errores de URL frecuentes
Tipo de error Descripción
Error del servidor

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido acceder a la URL en cuestión, que se ha agotado el tiempo de espera de la solicitud o que el sitio web estaba ocupado. En consecuencia, el robot de Google ha tenido que abandonar la solicitud.

Obtén más información sobre los errores de conectividad del servidor.

Error soft 404

Normalmente, cuando el visitante solicita una página que no existe, el servidor muestra un error 404 (página no encontrada). Este código de respuesta HTTP indica claramente a los navegadores y a los motores de búsqueda que la página no existe. En consecuencia, los motores de búsqueda no rastrean ni indexan el contenido de la página (si lo hubiera).

Un error soft 404 sucede cuando el servidor muestra la página real de una URL que en realidad no existe en tu sitio web. Esto suele suceder cuando el servidor gestiona URL defectuosas o no existentes como URL correctas, por lo que redirecciona al usuario a una página válida, como la página principal o una página 404 personalizada.  

Esto se debe a que los motores de búsqueda pueden invertir mucho tiempo en rastrear e indexar las URL no existentes, y a veces duplicadas, en el sitio web. El hecho de que no se detecten URL reales y exclusivas rápidamente o de que estas no reciban visitas frecuentes podría afectar negativamente al rastreo del sitio web.

Si tu página ha desaparecido completamente y no la puedes reemplazar, te recomendamos que configures el servidor para que siempre muestre un código de error 404 (página no encontrada) o 410 (página no existente) en respuesta a la solicitud de una página no existente. En caso de error 404, puedes mejorar la experiencia del usuario creando una página 404 personalizada. Por ejemplo, puedes crear una página que contenga una lista de tus páginas más populares o un enlace a tu página principal o para enviar comentarios. Sin embargo, debes recordar que no basta con crear una página que muestre un mensaje 404, ya que también se debe devolver el código de respuesta HTTP 404 o 410 correcto.

404

El robot de Google ha solicitado una URL que no existe en el sitio web.

Corregir los errores 404

La mayoría de los errores 404 no afectan a la clasificación de tu sitio web en Google, por lo que puedes ignorarlos tranquilamente. Estos mensajes de error se suelen deber a errores ortotipográficos, a configuraciones incorrectas o a los crecientes esfuerzos de Google por reconocer y rastrear enlaces en contenido insertado (por ejemplo, JavaScript). A continuación te indicamos algunas cuestiones que te ayudarán a investigar y corregir errores 404:

  1. Decide si vale la pena. Muchos, si no la mayoría, de los errores 404 no son tan importantes como para que valga la pena corregirlos. Ordena los errores 404 por prioridad y corrige los que realmente debas solucionar. Puedes pasar por alto los demás, ya que este tipo de error no perjudica ni al índice ni al posicionamiento de tu sitio web. A continuación, te mostramos los motivos por los que no es necesario corregirlos todos:
    • Si se trata de una página eliminada que no tiene reemplazo ni equivalente, debe devolverse un error 404.
    • Si se trata de una URL incorrecta generada por una secuencia de comandos o que nunca ha existido en tu sitio web, es muy probable que no debas preocuparte por ello. Puede que te moleste verla en el informe, pero no es necesario corregirla, salvo si se trata de un enlace que se escribe incorrectamente con frecuencia. A continuación tienes más información al respecto.
  2. Consulta de dónde provienen los enlaces no válidos. Haz clic en una URL para ver de dónde provienen los enlaces de estas páginas. En función de si el enlace está en tu sitio web o en un sitio web de terceros, debes seguir estos pasos:
    1. Corrige los enlaces que provienen de tu sitio web y que dirigen a páginas que no existen, o bien elimínalos si procede.
      • Si el contenido se ha movido, añade una URL de redireccionamiento.
      • Si has eliminado el contenido de forma permanente sin la intención de reemplazarlo por contenido relacionado y más reciente, deja que la antigua URL devuelva un error 404 o 410. Actualmente, Google trata los errores 410 (No disponible permanentemente) del mismo modo que los 404 (Página no encontrada). El hecho de devolver un código distinto al 404 o al 410 para una página inexistente (o de redireccionar a los usuarios a otra página, como a la página principal, en lugar de devolver un código 404) puede suponer un problema. Estas páginas se conocen como errores 404 leves y pueden confundir tanto a los usuarios como a los motores de búsqueda.
      • Si la URL es desconocida, es posible que veas puntualmente errores 404 de direcciones URL que nunca han existido en tu sitio web. El robot de Google podría generar estas URL inesperadas al seguir enlaces en JavaScript, en archivos Flash o en otro tipo de contenido insertado o que posiblemente solo existe en un sitemap. Por ejemplo, es posible que tu sitio web utilice un código parecido al siguiente para realizar un seguimiento de las descargas de archivos en Google Analytics:
        <a href="helloworld.pdf"
          onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
          Hello World PDF</a>

        Cuando el robot de Google vea ese código, es posible que intente rastrear la URL http://www.example.com/download-helloworld, aunque no sea una página real. En ese caso, el enlace puede mostrarse como un error 404 (página no encontrada) en el informe Errores de rastreo. Google está trabajando para evitar este tipo de error de rastreo, que no tiene ningún efecto sobre el rastreo ni la clasificación de tu sitio web.

    2. Corrige los enlaces mal escritos en otros sitios con redireccionamientos 301. Por ejemplo, el hecho de escribir como (www.example.com/sapatosrojos la URL auténtica www.example.com/zapatosrojos) probablemente se deba a que alguien ha enlazado con tu sitio web y ha cometido una falta de ortografía. En este caso, se puede capturar la URL mal escrita si se crea un redireccionamiento 301 a la URL correcta. También puedes ponerte en contacto con el webmaster del sitio web con el enlace incorrecto y pedirle que lo modifique o lo retire.
  3. Ignora el resto de errores. No crees contenido falso ni redirijas desde tu página principal, ni uses un archivo robot.txt para bloquear estas URL, puesto que todas estas opciones dificultan el reconocimiento y el correcto procesamiento de la estructura de tu sitio web. Estos errores se conocen como errores 404 leves. Ten en cuenta que, al hacer clic en Este problema está corregido en el informe Errores de rastreo solo se oculta temporalmente el error 404, que se mostrará de nuevo cada vez que Google intente rastrear la URL.Una vez que Google haya rastreado una URL correctamente, puede que intente hacerlo de forma indefinida. Al crear un redireccionamiento del tipo 300, se retrasará el intento para volver a rastrear, posiblemente durante mucho tiempo.  Ten en cuenta que enviar una solicitud de eliminación de URL mediante la herramienta correspondiente no eliminará el error de este informe.

Si no reconoces una URL de tu sitio web, puedes ignorarla. Estos errores suceden cuando alguien navega a una URL que no existe en tu sitio web; puede que alguien escribiera incorrectamente una URL en el navegador o que la URL del enlace estuviera mal escrita. Sin embargo, es posible que te interese descubrir alguna de estas URL mal escritas como se describe en la lista anterior.

Acceso denegado

Por lo general, Google descubre contenido siguiendo enlaces que dirigen de una página a otra. Para rastrear una página, el robot de Google debe acceder a ella. Si aparecen errores inesperados de acceso denegado, es probable que se deba a una de las siguientes razones:

  • El robot de Google no ha podido acceder a una URL de tu sitio web porque es obligatorio iniciar sesión para ver una parte o la totalidad del contenido.
  • Tu servidor requiere que los usuarios se autentiquen mediante un proxy o tu proveedor de alojamiento está impidiendo que Google acceda a tu sitio web.

Para solucionarlo:

  • Comprueba que el robots.txt funcione según lo previsto y no bloquee a Google. La herramienta Probador de robots.txt te permite ver exactamente cómo interpretará el robot de Google el contenido del archivo robots.txt. El user-agent de Google es el robot de Google. 
  • Usa Explorar como Google para saber cómo ve tu sitio web el robot de Google. Esta herramienta puede resultarte muy útil para solucionar problemas relacionados con el contenido del sitio web o con su visibilidad en los resultados de búsqueda.
URL no seguidas

Los errores de URL no seguidas indican las URL que Google no ha podido seguir de forma completa, además de la causa de ello. A continuación se indican algunas razones por las que es posible que el robot de Google no haya podido seguir las URL de tu sitio web:

Contenido activo, JavaScript y Flash

Algunas funciones como JavaScript, las cookies, los ID de sesión, los marcos, DHTML o Flash pueden hacer más difícil que los motores de búsqueda rastreen el sitio. Comprueba lo siguiente:

  • Utiliza un navegador de texto como Lynx para examinar el sitio, ya que muchos motores de búsqueda ven tu sitio igual que Lynx. Si hay funciones como JavaScript, cookies, ID de sesión, marcos, DHTML o Flash que impidan la visualización de todo tu sitio web en un navegador de texto, es posible que las arañas de motores de búsqueda tengan dificultades para rastrearlo.
  • Mediante la herramienta Explorar como Google se puede comprobar cómo ve exactamente Google el sitio web.
  • Si utilizas páginas dinámicas (por ejemplo, si la URL contiene un carácter ?), tenga en cuenta que no todas las arañas de los motores de búsqueda rastrean páginas dinámicas y estáticas. En términos generales, se recomienda que los parámetros sean cortos y se usen con moderación. Si ya sabes cómo funcionan los parámetros en tu sitio web, puedes indicar a Google cómo debe gestionarlos.

Redireccionamientos

  • Si tienes que crear redireccionamientos continuamente, asegúrate de que se muestre el código de estado HTTP pertinente (301 Movido permanentemente).
  • Si es posible, utiliza enlaces absolutos en lugar de relativos. Por ejemplo, al establecer un enlace a otra página del sitio web, enlaza con www.example.com/mipagina.html en lugar de hacerlo solo con mipagina.html.
  • Intenta que se pueda acceder a todas las páginas de tu sitio desde un enlace de texto estático como mínimo. Por lo general, minimiza el número de redireccionamientos necesarios para seguir un enlace de una página a otra.
  • Comprueba que los redireccionamientos dirijan a las páginas correctas. A veces, encontramos redireccionamientos que dirigen a la URL de origen del redireccionamiento (lo que da lugar a un error de bucle) o a URL no válidas.
  • No incluyas URL de redireccionamiento en los sitemaps.
  • Acorta las URL tanto como sea posible. Asegúrate de que no se esté añadiendo automáticamente cierta información (por ejemplo, un ID de sesión) a las URL de redireccionamiento.
  • Asegúrate también de que tu sitio web permita que los robots de búsqueda lo rastreen sin identificadores de sesión ni argumentos que registren su recorrido por el sitio web.
Error de DNS

Cuando veas este tipo de error de URL, quiere decir que el robot de Google no ha podido comunicarse con el servidor DNS o que no existen registros para el sitio web en el servidor.

Puedes obtener más información sobre los errores de DNS.

Errores de URL solo en móviles (smartphones)
Error Descripción
Redireccionamientos defectuosos

El error Redireccionamiento defectuoso se muestra en la sección Errores de URL de la página Rastreo > Errores de rastreo que hay en la pestaña Smartphones.

Algunos sitios web usan URL independientes para usuarios de ordenadores y de smartphones, y configuran las páginas para ordenadores de modo que dirijan a los usuarios de smartphones al sitio web para móviles (por ejemplo, m.example.com). Un redireccionamiento defectuoso se produce cuando una página para ordenadores redirige de forma errónea a los usuarios de smartphones a una página para smartphones que no guarda relación con su consulta. Un ejemplo típico de este tipo de error es cuando todas las páginas para ordenadores redirigen a los usuarios de smartphones a la página principal del sitio web optimizado para smartphones. En la siguiente ilustración, se consideran defectuosos los redireccionamientos indicados con una flecha roja:


Este tipo de redireccionamiento interrumpe el flujo de trabajo de los usuarios y puede provocar que abandonen el sitio y busquen cualquier otro.

A continuación se indican algunos consejos para ayudarte a crear una experiencia de búsqueda optimizada para móviles y evitar los redireccionamientos defectuosos:

  • Haz unas cuantas búsquedas en el teléfono (o configura tu navegador para que actúe como un smartphone) para comprobar cómo se comporta tu sitio web.
  • Usa las URL de ejemplo proporcionadas en el informe como punto de partida para averiguar el origen exacto del problema en la configuración del servidor.
  • Configura tu servidor para que redirija a los usuarios de smartphones a la URL equivalente de tu sitio web para smartphones.
  • Si una página del sitio web no tiene una versión equivalente para smartphones, mantén a los usuarios en la página para ordenadores y no los redirijas a la página principal del sitio web para smartphones. En este caso, es mejor no hacer nada que hacerlo mal.
  • Ten en cuenta que puedes usar un diseño web adaptable que muestre el mismo contenido tanto a los usuarios de ordenadores como a los de smartphones.
  • Por último, lee nuestras recomendaciones para tener URL independientes para usuarios de ordenadores y de smartphones.
URL bloqueadas para smartphones

El error de bloqueo aparece en la pestaña Smartphone de la sección Errores de URL de la página Rastreo > Errores de rastreo. Si ves el error de bloqueo en una URL de tu sitio web, significa que esta está bloqueada para el robot de Google para smartphones de Google en el archivo robots.txt de tu sitio web.

Este error no solo afecta a los smartphones; las páginas equivalentes para ordenadores también pueden bloquearse. Sin embargo, esto suele indicar que el archivo robots.txt debe modificarse para permitir el rastreo de las URL para smartphones. Cuando se bloquean estas URL, las páginas para móviles no se pueden rastrear y, por este motivo, es posible que no aparezcan en los resultados de búsqueda.

Si obtienes un error de URL bloqueada en el rastreo de las URL de tu sitio web, examina el archivo robots.txt y asegúrate de que no haya secciones de tu sitio web que bloqueen por accidente el rastreo del robot de Google para smartphones.

Para obtener más información, consulta nuestras recomendaciones.

Contenido Flash

El error Contenido Flash se muestra en la sección Errores de URL de la página Rastreo > Errores de rastreo que hay en la pestaña Smartphones.

Nuestros algoritmos indican que las URL de esta sección tienen contenido que se procesa mayoritariamente con Flash. Muchos dispositivos no pueden procesar estas páginas porque iOS o Android 4.1 y versiones posteriores no admiten Flash.

Te recomendamos que mejores la experiencia móvil de tu sitio web mediante un diseño web adaptable, una práctica recomendada por Google para diseñar sitios optimizados para la búsqueda para todos los dispositivos.  Puedes obtener más información en Conceptos básicos de la Web, un recurso completo sobre el desarrollo web en varios dispositivos.

Independientemente de la opción que utilices para solucionar este problema, asegúrate de permitir que Googlebot acceda a todos los recursos de tu sitio (CSS, JavaScript e imágenes) y no los bloquees con robots.txt ni de otra manera. Nuestros algoritmos necesitan estos archivos externos para detectar la configuración del diseño de tu sitio y procesarla del modo adecuado. Para asegurarte de que nuestros algoritmos de indexación tengan acceso a tu sitio web, utiliza la función Explorar como Google en Search Console.

Errores específicos de Noticias

 

Para consultar los informes de errores específicos de Google Noticias, los editores de noticias deben incluir su sitio web en Google Noticias y tener una cuenta de Search Console a la que hayan añadido su sitio web. Una vez finalizados estos pasos, sigue los que se indican a continuación en Search Console:

  • En la página principal, haz clic en la URL del sitio web.
  • En el panel de control, haz clic en Rastreo > Errores de rastreo.
  • Haz clic en la pestaña Noticias para ver los errores de rastreo de tu contenido de noticias.
  • Los errores de rastreo se organizan en categorías, como "Extracción de artículos " o "Error de título". Al hacer clic en una de ellas, se mostrará una lista de URL afectadas y los errores de rastreo que estas generan. Ten en cuenta que, al rastrear los enlaces de las páginas que has enviado para que se incluyan en Google Noticias, es posible que Google busque errores de noticias en otras páginas de tu sitio web. Este tipo de error solo debe resolverse si aparece en las páginas que quieras incluir en Google Noticias.
Nuestros índices de noticias se generan mediante algoritmos informáticos, por lo que, aunque queremos incluir el máximo de contenido posible, no podemos garantizar que se muestren todos tus artículos. Gracias por tu comprensión.
Error Descripción
Artículo desproporcionadamente corto

El cuerpo del artículo que hemos extraído de la página HTML es demasiado corto en comparación con otros grupos de texto sin enlaces en la página. Esto se aplica a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

Los motivos de esta incidencia suelen ser los siguientes:

  • Demasiados fragmentos de artículos relacionados (para ayudar a nuestro extractor, recomendamos que permitas los clics en estos fragmentos)
  • Funciones como "Enviar este artículo a amigos" con descripciones demasiado largas (recomendamos que establezcas etiquetas del estilo "display:none" o "visibility:hidden" para que el texto se haga invisible o que escribas los fragmentos de código HTML con JavaScript de forma dinámica)
  • Comentarios de usuarios (recomendamos que incluyas los comentarios en un iframe, que los extraigas de forma dinámica con AJAX o que los muevas a una página adyacente)
Artículo fragmentado

El cuerpo del artículo que hemos extraído de la página HTML parece constar de frases aisladas que no se agrupan en párrafos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

  • Comprueba que los párrafos contengan más de una oración.
  • Asegúrate de que las frases estén bien puntuadas.
  • Asegúrate de no utilizar demasiado las etiquetas <br> y <p> en los párrafos y, en general, trata de no dividir el cuerpo del artículo.
  • Te recomendamos que elimines de la página parte del texto que no corresponda a material informativo.
Artículo demasiado largo

El cuerpo del artículo que hemos extraído de la página HTML parece demasiado largo para ser un artículo de noticias. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto. Entre los motivos habituales, se incluyen artículos informativos que contienen comentarios de usuarios debajo del artículo o diseños HTML que contienen otro material junto al propio artículo informativo.

Recomendaciones

Te recomendamos que elimines de la página parte del texto que no corresponda a material informativo. Si la página del artículo contiene comentarios de usuarios, recomendamos que realices una de las siguientes acciones:

  • Incluirlos en un iframe.
  • Extraerlos de forma dinámica con AJAX.
  • Mover algunos de los comentarios a una página adyacente.
Artículo demasiado corto

El cuerpo del artículo que hemos extraído de la página HTML parece incluir muy pocas palabras para ser un artículo de noticias. Esto se aplica a la mayoría de las páginas que incluyen contenido multimedia o resúmenes de noticias en lugar de artículos informativos completos. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

  • Prueba a distribuir los artículos en párrafos de texto formados por varias frases. Si el contenido del artículo parece incluir muy pocas palabras para ser un artículo informativo, no podremos incluirlo.
  • Asegúrate de que los artículos tengan más de 80 palabras.
No se encuentra la fecha

No hemos podido determinar la fecha de publicación del artículo.

Recomendaciones

Sigue las recomendaciones de formato de fecha que se indican a continuación:

  • Indica una fecha y hora específica para cada uno de los artículos entre el título y el texto del artículo en una línea independiente del código HTML. La fecha debe especificar la fecha de la primera publicación del artículo.
  • Elimina las demás fechas del código HTML de la página del artículo para que el rastreador no las confunda con la fecha de publicación correcta.
  • Si quieres utilizar una metaetiqueta de fecha, ponte en contacto con nosotros en primer lugar. Las metaetiquetas de fecha deben tener el formato siguiente: <meta name="DC.fecha.emisión" content="AAAA-MM-DD">, donde la fecha se expresa en formato W3C, ya sea con el formato "fecha completa" (AAAA-MM-DD) o el formato "fecha completa con horas, minutos y segundos" (AAAA-MM-DDThh:mm:ssTZD) y un sufijo de zona horaria.
  • Crea un sitemap de noticias. La etiqueta <publication_date> nos permitirá seleccionar la fecha correcta de tus artículos.
La fecha es demasiado antigua

La fecha que hemos determinado para este artículo, a partir de una etiqueta publication_date del sitemap o por la fecha de la propia página HTML, es demasiado antigua.

Recomendaciones

  • Asegúrate de que el artículo tenga menos de dos días de antigüedad. Actualmente, solo recopilamos artículos que tengan, como máximo, dos días de antigüedad.
  • Sigue las recomendaciones de formato de fecha indicadas anteriormente.
Artículo vacío

El cuerpo del artículo que hemos extraído de la página HTML parece que está vacío.

Recomendaciones

  • Asegúrate de que el texto completo de cada uno de los artículos esté disponible en el código fuente de las páginas correspondientes (y que, por ejemplo, no esté insertado en un iframe o en un archivo JavaScript).
  • Asegúrate de no estar utilizando un estilo en el código fuente de tus artículos como, por ejemplo, "display:none" o "visibility:hidden".
  • Asegúrate de que los enlaces a tus artículos dirijan directamente a las páginas de estos en lugar de a una página intermedia con un redireccionamiento de JavaScript.
Error en la extracción

No hemos podido extraer el artículo de la página. Se producen errores de extracción cuando no podemos identificar un título, un cuerpo y una marca de tiempo válidos para el artículo. Cuando esto ocurre, elaboramos una lista de las URL que muestran este error para proporcionarte información relacionada con el motivo por el que algunos artículos no aparecen en Google Noticias.

Recomendaciones

  • Asegúrate de que el título, el cuerpo y la marca de tiempo se puedan rastrear con facilidad (es decir, que, por ejemplo, estén disponibles como texto y no como imágenes). No obstante, en estos momentos la función de este error es principalmente informativa. Trabajamos de forma activa para mejorar nuestros métodos de extracción a fin de que este error se dé con menos frecuencia.
  • Envía un sitemap de noticias.
No se han encontrado frases

El cuerpo del artículo que hemos extraído de la página HTML parece no incluir secuencias puntuadas de palabras contiguas. Hemos generado este error para evitar que se incluya lo que parece ser un fragmento de texto incorrecto.

Recomendaciones

  • Si el artículo no contiene secuencias puntuadas de palabras contiguas, no podremos incluirlo en Google Noticias. Asegúrate de que el texto de tus artículos esté formado por frases y de no utilizar demasiado las etiquetas <br> y <p> en los párrafos.
  • El texto completo de cada uno de sus artículos debe estar disponible en el código fuente de las páginas de esos artículos (en lugar de estar insertado, por ejemplo, en un archivo JavaScript).
  • Asegúrate de que los enlaces a tus artículos dirijan directamente a las páginas de los artículos, no a una página intermedia con un redireccionamiento de JavaScript.
El redireccionamiento lleva a un sitio web externo

La sección o página del artículo redirecciona a una URL de un dominio diferente.

Recomendaciones

  • Las páginas y los artículos de todas las secciones se deben ubicar en el dominio del sitio web incluido en Google Noticias.
  • Si no utilizas redireccionamientos externos, asegúrate de que un tercero no haya modificado el sitio web. Obtén más información sobre sitios pirateados.
La página es demasiado grande

La longitud de la página del artículo o de la sección sobrepasa el tamaño máximo permitido.

Recomendación

  • La página de código HTML puede tener un tamaño máximo de 256 KB.
Título no permitido

El título que hemos extraído de la página HTML sugiere que el artículo no es informativo.

Recomendación

  • Frecuentemente, esta incidencia se puede solucionar añadiendo la etiqueta <title> al título del artículo en la página HTML y repitiendo el título en un lugar destacado de la página (por ejemplo, en una etiqueta <h1> ). Obtén más información sobre títulos.
No se encuentra el título

No hemos podido extraer un título para el artículo de la página HTML.

Recomendaciones

  • Sigue nuestras recomendaciones de formato de títulos.
  • Para asegurarte de que tus artículos se muestren correctamente en dispositivos móviles, no incluyas ningún número inicial (que suele corresponderse con una clave de acceso) en el texto de anclaje del título.
Error de descompresión

El robot de Google para Noticias ha detectado que la página estaba comprimida, pero no ha podido descomprimirla. Esto puede deberse a un mal estado de la red o a una mala configuración o programación del servidor web.

Recomendación

  • Comprueba la red o el servidor web.
Tipo de contenido no admitido

La página incluía un tipo de contenido HTTP no admitido por Google Noticias.

Recomendación

  • Los artículos deben incluir contenido del tipo "text/html", "text/plain" o "application/xhtml+xml".
¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?