Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal
true

Usar Explorar como Google para Sitios Web

La herramienta Explorar como Google te permite probar cómo rastrea o procesa Google una URL en tu sitio web. Puedes utilizar Explorar como Google para ver si el robot de Google puede acceder a una página de tu sitio web, cómo la procesa y si tiene bloqueado algún recurso de la página, como imágenes o secuencias de comandos. Esta herramienta simula la ejecución de un rastreo y procesamiento de una página de la forma en que lo hace Google normalmente, y es útil para depurar problemas de rastreo en el sitio web.

Abrir Explorar como Google para Sitios Web

Para las aplicaciones móviles, utiliza la herramienta equivalente Explorar como Google para Aplicaciones.

Ejecutar una exploración

  1. En el cuadro de texto, introduce el componente de ruta de una URL del sitio web que quieras que obtenga el robot de Google, relacionado con la raíz del sitio. Si dejas este cuadro de texto en blanco, se explorará la página raíz del sitio web. Por ejemplo, si la propiedad actual es http://example.com, una solicitud para tiendas/indiana/1234.html exploraría http://example.com/tiendas/indiana/1234.html.
    Restricciones de la exploración:
    • Las URL que se pueden explorar se limitan al sitio web actual. Por ejemplo, si la propiedad actual de Search Console es http://example.com, no se puede explorar una URL desde https://example.com o http://m.example.com.
    • Con la exploración no se envían cookies, información de inicio de sesión ni otras informaciones de estado.
    • La exploración no sigue redireccionamientos. Si quieres explorar una página con un redireccionamiento, tendrás que seguirla manualmente como se indica en la descripción del estado de exploración "Redireccionado" que encontrarás más abajo.
  2. También puedes realizar la exploración como un tipo de robot de Google determinado. Esto afecta al rastreador que hace la exploración y también al procesamiento de una solicitud Explorar y procesar. Tienes a tu disposición los tipos siguientes:
    1. Escritorio [predeterminado].
      • Para los sitios web, utiliza el rastreador del robot de Google.
      • Para las noticias, utiliza el rastreador del robot de Google (no el robot de Google para Noticias).
      • Para las imágenes, utiliza el rastreador del robot de Google para Imágenes.
      • Para los vídeos, utiliza el rastreador del robot de Google para vídeos.
      • Para las páginas con el código de AdSense, utiliza el rastreador de Google AdSense.
      • Para las páginas de destino de los anuncios, utiliza el rastreador de Google AdsBot.
    2. Móvil: smartphone
      • Actual: utiliza la versión actual (pronto se sustituirá) de Google para smartphones.
      • Próximo: utiliza la última versión del rastreador de Google para smartphones.
  3. Haz clic en Obtener o en Obtener y procesar:
    • Obtener: se obtiene una URL especificada del sitio web y se muestra la respuesta HTTP. No requiere ni ejecuta recursos asociados (como imágenes o secuencias de comandos) en la página. Esta operación es relativamente rápida, y puedes utilizarla para comprobar o depurar la conectividad de redes dudosas o problemas de seguridad del sitio web, y para ver si la solicitud se completa satisfactoriamente o da error.
    • Explorar y procesar: se explora una URL especificada del sitio web, se muestra la respuesta HTTP y también se procesa la página de acuerdo con una plataforma especificada (escritorio o smartphone). Con esta operación se solicitan y ejecutan todos los recursos de la página (como imágenes y secuencias de comandos). Puedes utilizarla para detectar diferencias visuales entre la forma en que el robot de Google ve tu página y la forma en que lo hace un usuario.
  4. La solicitud se añadirá a la tabla del historial de exploración con el estado "Pendiente". Cuando la solicitud haya finalizado, en la fila se mostrará si se ha ejecutado o no correctamente, además de otra información básica. Haz clic en cualquier fila de exploración de la tabla que no haya dado error para obtener más información sobre la solicitud, incluyendo encabezados y datos de respuestas HTTP sin procesar y, para Explorar y procesar, una lista de los recursos bloqueados y una visualización de la página procesada.
  5. Si la solicitud se completa satisfactoriamente y hace menos de cuatro horas, puedes hacer que Google rastree de nuevo y posiblemente vuelva a indexar la página explorada, así como cualquier página enlazada con la página explorada, si lo deseas.

Tienes una cuota semanal de 500 exploraciones. Cuando te acerques a tu límite, recibirás una notificación en la página.

Estado de obtención de las solicitudes

La tabla del historial de exploración de la página principal muestra las últimas 100 solicitudes de exploración. Para acceder a los detalles de una recuperación finalizada, haz clic en la fila correspondiente de la tabla del historial de exploración. Se pueden mostrar los siguientes estados de exploración:

  • Finalizado: Google ha contactado satisfactoriamente con tu sitio web, ha rastreado tu página y puede obtener todos los recursos que figuran en ella. Haz clic en la fila de la tabla para ver más detalles sobre los resultados de la exploración.
  • Parcial: Google ha recibido una respuesta de tu sitio web y ha explorado la URL, pero no ha podido acceder a todos los recursos que figuraban en ella porque estaban bloqueados por el archivo robots.txt. Si solo se trata de una exploración, ejecuta Explorar y procesar. Examina la página procesada para comprobar si se han bloqueado recursos importantes que puedan impedir a Google analizar debidamente el significado de la página. Si se han bloqueado recursos importantes, desbloquéalos en tus archivos robots.txt. Para los recursos bloqueados por archivos robots.txt que no te pertenezcan, contacta con los propietarios del sitio de los recursos y pídeles que desbloqueen dichos recursos para el robot de Google. Consulta la lista de descripciones de errores de exploración de recursos.
  • Redireccionado: El servidor ha respondido con un redireccionamiento. La herramienta Explorar como Google no sigue los redireccionamientos. Aunque el rastreador real de Google sigue los redireccionamientos, la herramienta Explorar como Google no lo hace. Debes seguir los redireccionamientos manualmente:
    • Si el redireccionamiento lleva a la misma propiedad, la herramienta muestra un botón que permite seguir rápidamente el redireccionamiento rellenando el cuadro de exploración con una URL de redireccionamiento.
    • Si la URL redirige a otra propiedad tuya, puedes hacer clic en "Seguir" para que el cuadro URL se rellene automáticamente. A continuación, copia la URL, cambia de vista al sitio nuevo y pega la URL en el cuadro de exploración.
    Puedes inspeccionar la respuesta HTTP desde la página de detalles de exploración para ver detalles del redireccionamiento. Localiza el código de error HTTP para obtener más información. Los redireccionamientos los puede activar el servidor, las metaetiquetas o el código JavaScript de la propia página.
  • Tipo de error específico… Cualquiera de los errores de exploración de tipo de recurso también se puede aplicar a una solicitud de exploración para la página completa y se puede mostrar en la columna de estado. Por ejemplo: No se ha encontrado o No se ha podido acceder.

Errores de exploración de recursos

Si el estado de la solicitud de exploración es Parcial, haz clic en la solicitud para abrir la página de detalles de solicitud. La tabla de la página mostrará todos los errores encontrados. Generalmente, los errores se deben al bloqueo de recursos en la página. En una solicitud de exploración pueden darse los siguientes errores de recursos:

Lista de errores de exploración de recursos
Estado Explicación Notas y pasos siguientes

No se encuentra

No se encuentra el recurso (códigos de respuesta HTTP 404 o 410 HTTP).

Este error indica que es posible que se muestre el código de error HTTP 404 cuando se accede a tu página con un navegador web.

No se ha autorizado

El robot de Google no está autorizado a acceder a la página (por ejemplo, si en la página se debe introducir una contraseña).

Este error indica que es posible que se muestre el código de error HTTP 403 cuando se accede a tu página con un navegador web.

No se ha encontrado el DNS

Google no pudo recuperar el recurso porque no se ha encontrado el nombre de dominio.

Asegúrate de haber escrito correctamente tu nombre de dominio (por ejemplo, www.example.com) para que Google pueda encontrar el servidor de tu sitio web.

Bloqueado

El host del recurso está bloqueando el acceso al robot de Google mediante un archivo robots.txt.

Los recursos bloqueados pueden afectar a cómo interpreta Google la página y a la clasificación de esta en consultas específicas. Además, los recursos bloqueados se clasifican según su nivel de Gravedad, que calcula en qué medida afecta dicho recurso a la forma de interpretar la página por parte de Google:

  • Baja: el recurso que falta tiene poco efecto sobre el procesamiento de la página.
  • Media: el recurso que falta afecta algo al procesamiento de la página. Examina la página obtenida para comprobar si las omisiones o las diferencias respecto a la página real son suficientemente importantes como para que afecten a la forma en que Google la interpreta.
  • Alta: el recurso que falta afecta de manera significativa al procesamiento de la página y probablemente cambie la manera en que Google la indexa.
  • -- (guion doble): el error no corresponde a un recurso bloqueado.

Para solucionar este error, actualiza el archivo robots.txt. Si la dirección de la propiedad se encuentra en la raíz de tu dominio (por ejemplo, en www.example.com, y no en www.example.com/mi_sitio/), puedes usar la herramienta de pruebas de robots.txt para diagnosticar por qué Google tiene bloqueada la URL.

No se puede acceder a robots.txt

El robot de Google no puede acceder al archivo robots.txt del host del recurso. Cuando esto sucede, Google no carga ningún recurso de dicho host.

Para resolver este problema, consulta los artículos del Centro de Ayuda sobre cómo crear y probar los archivos robots.txt.

No se puede acceder

El host del recurso ha tardado demasiado en responder o ha rechazado la solicitud.

Comprueba que el servidor esté en funcionamiento.

No se puede acceder temporalmente

1) Actualmente, Explorar como Google no puede obtener la dirección URL porque el servidor ha tardado mucho en responder.

O

2) Explorar como Google ha cancelado la exploración porque se han realizado demasiadas solicitudes consecutivas al servidor para diferentes URL.

Ten en cuenta que la URL no está fuera del alcance de todo Google, sino solo de la herramienta de simulación Explorar como Google.

Error

Un error no especificado ha impedido que Google complete la exploración.

Si este error vuelve a producirse, te pedimos que lo publiques en el Foro de Ayuda para Webmasters.
¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?