Informe de estado de cobertura del índice

Este informe muestra qué páginas se han indexado y cómo puedes hacer que se incluyan en el índice las demás.

 

ABRIR INFORME DE COBERTURA DEL ÍNDICE

 

Utilizar este informe

Te será más fácil entender este informe si antes has leído el artículo sobre cómo funciona la Búsqueda de Google.

En este informe puedes ver el estado de la indexación de todas las URL que ha visitado o intentado visitar Google en tu propiedad. En la página de resumen se muestran los resultados de todas esas URL agrupadas por estado (error, advertencia o válidas) y por el motivo de ese estado, como por ejemplo, No se ha podido encontrar la URL enviada (404). Haz clic en una fila de la tabla para ver todas las URL que compartan mismo estado y motivo y consultar más información sobre lo que les ocurre.

Vista de resumen

En los informes de nivel superior se muestra el estado de indexación de todas las páginas de tu sitio web que Google ha intentado rastrear, agrupadas por estado y motivo.

Qué puedes encontrar

  • Lo ideal es que la cantidad de páginas indexadas correctamente aumente a medida que crece tu sitio web.
  • Si detectas que hay un pico de errores de indexación, puede deberse a que has hecho cambios en tu plantilla que han introducido errores nuevos o a que has enviado un sitemap con URLs que no pueden rastrearse (por ejemplo, porque están bloqueadas mediante un archivo robots.txt o una directiva "noindex", o porque se requiere iniciar sesión para acceder a ellas). Haz clic en el problema que quieras e inspecciona una página para saber cuál es el error.
  • Si detectas que disminuye el total de páginas indexadas, pero no se indican los errores correspondientes, es posible que se trate de páginas que no has querido enviar para que se indexen y que has bloqueado, ya sea mediante un archivo robots.txt, con una directiva "noindex" o requiriendo autenticación. Echa un vistazo a las URL excluidas para encontrar el pico que corresponda a la disminución de tus páginas.
  • Si tienes más páginas excluidas que válidas, consulta los motivos por los que se han excluido. Lo más habitual es que se deba a alguna de estas razones:
    • Un archivo robots.txt está impidiendo que Google rastree gran parte de las secciones de tu sitio web.
    • Tu sitio web tiene muchas páginas duplicadas, normalmente porque utiliza parámetros para filtrar u ordenar colecciones muy habituales, como por ejemplo, tipo=vestido, orden=precio o color=verde. Si se da el caso de que esas páginas muestran el mismo contenido pero filtrado u ordenado de forma distinta, deben excluirse.

Ver más abajo consejos adicionales sobre cómo solucionar problemas

Qué no podrás encontrar

  • No esperes que todas las URL de tu sitio web estén indexadas. Tu objetivo es que se indexe una versión de cada página, la canónica. En este informe, todas las páginas duplicadas o alternativas se han clasificado como excluidas, puesto que tienen prácticamente el mismo contenido que la página canónica. Si es el caso, no debes preocuparte, ya que quiere decir que hemos encontrado la página canónica y la hemos indexado. En la herramienta de inspección de URLs puedes consultar cuál es la versión canónica de cualquier URL.
  • Si estás incluyendo contenido nuevo, ten en cuenta que a Google tardará en indexar la página nueva, aunque le llevará menos tiempo si envías una solicitud de indexación.

Estado

Las páginas pueden tener uno de los siguientes estados generales:

  • Error: no se ha indexado la página. Puedes obtener más información sobre los errores y sobre cómo corregirlos en las descripciones de los tipos de error correspondientes. Deberías resolver estos problemas lo más rápido posible.
  • Advertencia: la página está indexada, o lo estaba hasta hace poco, pero tiene algún problema que debes tener en cuenta.
  • Excluidas: no se ha incluido la página en el índice, pero no creemos que sea un error. La página puede estar en proceso de indexación o puede que la hayas excluido intencionadamente (por ejemplo, mediante una directiva noindex), por lo que todo iría según lo previsto.
  • Válidas: se ha indexado la página.

Motivo

Cada estado (válidas, advertencia, error, excluidas) tiene un motivo concreto. Los datos de la tabla están agrupados por motivo y cada fila puede describir una o varias URL. Consulta las descripciones incluidas más abajo para conocer los distintos tipos de estado y saber cómo gestionarlos.

Validación

Se trata del estado de validación de un problema concreto. Debes dar prioridad a los problemas cuya validación tenga errores o no se haya iniciado.

Acerca de la validación

Una vez que hayas corregido todos los casos de un problema en tu sitio web, puedes pedir a Google que valide tus cambios. Si ya no se detecta ningún caso más, se considera que el problema está corregido y se sitúa en la parte inferior de la tabla de estado. En Search Console se registra el estado de validación general de los problemas, así como el de los casos concretos. Cuando se hayan solucionado todos los casos de un problema, este se considera corregido. Puedes consultar los estados que se registran en las secciones Estados de validación de problemas y Estados de validación de casos.

Más información sobre el tiempo de vida de un problema

El tiempo de vida empieza la primera vez que se detecta un problema en tu sitio web y termina una vez transcurridos 90 días desde que se corrige el último caso. Si pasados estos 90 días no se registran casos nuevos, el problema se quita del historial de informes.

La fecha en que se detecta por primera vez un problema no cambia durante el tiempo de vida de ese problema en concreto. Por tanto, ocurre lo siguiente:

  • Si se corrigen todos los casos de un problema, pero se detecta un caso nuevo a los 15 días, se vuelve a abrir el problema con la misma fecha de detección.
  • Si el mismo problema se detecta 91 días después de corregirse el último caso, como el problema ya se había cerrado, se registra como si fuera nuevo y la fecha de detección pasa a ser la del día actual.

Flujo de validación básico

A continuación se describe a grandes rasgos el proceso que tiene lugar cuando se hace clic en Validar corrección para revisar un problema. Este proceso puede durar varios días; recibirás notificaciones sobre su progreso por correo electrónico.

  1. Al hacer clic en Validar corrección, Search Console comprueba inmediatamente algunas páginas.
    • Si se sigue detectando el problema en cuestión en cualquiera de las páginas que se comprueban, la validación finaliza y el estado no cambia.
    • Si las páginas no tienen el error, la validación continúa y pasa a tener el estado Iniciada. Si durante este proceso se encuentran otros problemas, se registran en el tipo de error pertinente y se siguen validando las páginas.
  2. Search Console vuelve a rastrear solo la lista de URL en las que se ha detectado el problema, no todo el sitio web. Las URL que se comprueban quedan registradas en el historial de validación, al que puede accederse desde la página de detalles del problema.
  3. Cuando se comprueba una URL, puede ocurrir lo siguiente:
    1. Si no se detecta el problema que se valida, el estado de validación del caso en concreto pasa a ser Correcto. Si se trata del primer caso que se comprueba en el proceso de validación, el estado del problema cambia a Tiene buena pinta.
    2. Si ya no se puede acceder a la URL, el estado de validación del caso cambia a Otros, que no se considera un estado de error.
    3. Si se sigue detectando el caso, el estado del problema cambia a Error y el proceso de validación finaliza. Si se descubre el mismo problema en otra página mediante un rastreo habitual, se considera un caso nuevo.
  4. Una vez comprobadas todas las URL con errores y advertencias, si no se encuentra ningún caso, el estado del problema pasa a ser Correcto. Importante: Aunque el número de páginas afectadas sea 0 y el estado cambie a Correcto, se seguirá mostrando la gravedad original del problema (Error o Advertencia).

Google puede descubrir que has corregido casos de un problema aunque no hagas clic en "Iniciar validación". Si detecta que los has solucionado todos durante un rastreo habitual, el estado del problema será "N/D" en el informe.

¿Cuándo se considera que se ha corregido un problema de una URL o un elemento?

Se considera que se ha solucionado un problema de una URL o un elemento cuando se cumple alguna de las siguientes condiciones:

  • No se detecta el problema al rastrear la página. En el caso de los errores de etiquetas AMP, puede ser porque has corregido las etiquetas o bien porque las has retirado (si no son obligatorias). Durante un proceso de validación, el problema tendrá el estado "Correcto".
  • Si Google no puede acceder a la página por cualquier motivo (por ejemplo, porque la has retirado, has usado una directiva "noindex" o se requiere autenticación), el problema se considera corregido en esa URL. Durante un proceso de validación, tendrá el estado "Otros".

Nueva validación

Si no puede completarse una validación, puedes hacer clic en Volver a validar para comprobar otra vez todos los casos no solucionados, así como todos los nuevos que se hayan descubierto durante un rastreo habitual.

Debes esperar a que termine un ciclo de validación antes de solicitar otro, incluso si has corregido algunos problemas durante el actual.

Los casos que se han validado (con el estado Correcto) o a los que ya no puede accederse (con el estado Otros) no vuelven a comprobarse y se quitan del historial al hacer clic en Volver a validar.

Historial de validación

Para ver el progreso de una solicitud de validación, haz clic en el enlace de datos de validación de la página de detalles del problema.

En los informes de AMP y Estado del índice, las entradas del historial de validación se agrupan por URL. En los informes Usabilidad móvil y Resultado enriquecido, por su parte, se agrupan por URL y elemento de datos estructurados, según determine el valor Name. El estado de validación se aplica al problema específico que se está examinando. Puede que un problema esté etiquetado como "Aprobado" en una página, pero que otros figuren como "Fallido", "Pendiente" u "Otro".

Estados de validación de problemas

Un problema puede tener los siguientes estados de validación:

  • No iniciado: hay páginas con casos de este problema que no has intentado validar. Pasos siguientes:
    1. Haz clic en el problema para obtener más información sobre el error. Con la prueba de AMP, puedes revisar las distintas páginas para consultar ejemplos reales del error. Si la prueba de AMP no muestra ningún error en la página, es porque lo has corregido después de que Google lo encontrara y generara el informe.
    2. Para consultar los datos de la regla que se ha infringido, haz clic en "Más información", en la página de detalles del error.
    3. En la tabla, haz clic en una fila de URL de ejemplo para obtener información sobre ese error en concreto.
    4. Corrige las páginas afectadas y, a continuación, haz clic en Validar corrección para que Google vuelva a rastrearlas. Google te avisará del progreso de la validación. Ten paciencia, ya que la validación puede tardar desde unos pocos días hasta aproximadamente dos semanas. 
  • Iniciada: has iniciado un intento de validación y todavía no se ha encontrado ningún caso del problema. Paso siguiente: A medida que avance la validación, Google te enviará notificaciones en las que se te indicará qué debes hacer, si es que tienes que hacer algo.
  • Tiene buena pinta: has iniciado un intento de validación y, hasta el momento, se han corregido todos los casos del problema que se han comprobado. Siguiente paso: No tienes que hacer nada. A medida que avance la validación, Google te enviará notificaciones en las que se te indicará qué debes hacer.
  • Correcto: no se ha detectado ningún caso conocido del problema o la URL afectada ya no está disponible. Para que se muestre este estado, tienes que haber hecho clic en "Validar corrección", ya que si los casos desaparecen sin que solicites que validemos las correcciones, el estado es N/D. Siguiente paso: No tienes que hacer nada más.
  • N/D: Google ha descubierto que el problema se ha corregido en todas las URL sin que hayas intentado validar las correcciones en ningún momento. Siguiente paso: No tienes que hacer nada más.
  • Error: has hecho clic en "Validar" y el problema todavía está presente en un número determinado de páginas. Pasos siguientes: Corrige el problema y vuelve a validar las correcciones.

Estados de validación de casos

Una vez que hayas solicitado una validación, se asigna uno de los siguientes estados a cada caso conocido de un problema concreto (en los informes "Estado del índice" no se usan los estados Correcto ni Otros):

  • Pendientes de validación: el caso en cuestión se ha añadido a la cola para validarse. La última vez que Google lo comprobó, todavía existía.
  • Correcto: Google ha comprobado el caso y ya no existe. Este estado solo puede aparecer si has hecho clic en Validar expresamente para revisarlo.
  • Error: Google ha comprobado el caso y todavía existe. Este estado solo puede aparecer si has hecho clic en Validar expresamente para revisarlo.
  • Otros: Google no ha podido acceder a la URL en que se ha detectado el caso o, si se trata de datos estructurados, no ha podido encontrar el elemento en cuestión. Se considera equivalente al estado Correcto.

Es posible que una misma URL tenga diferentes estados que se correspondan a problemas distintos; por ejemplo, si en una página se detectan dos problemas, X e Y, el problema X puede tener el estado de validación Correcto, y el Y, el estado Pendiente.

Filtro desplegable de descubrimiento de URLs

Con el filtro desplegable situado sobre el gráfico, puedes mostrar resultados de indexación según el mecanismo usado para descubrir una URL. Pueden indicarse los siguientes valores:

  • Todas las páginas conocidas (predeterminado): se muestran todas las URL que ha descubierto Google, independientemente del método.
  • Todas las páginas enviadas: se muestran solo las páginas que se han enviado mediante sitemaps, ya sea con Search Console o pings de sitemap.
  • URL de un sitemap concreto: se muestran solo las URL de un sitemap determinado que se haya enviado mediante Search Console. Si se trata de un índice de sitemaps, se muestran las URL de todos los sitemaps incluidos.

Se considera que una URL se ha enviado mediante un sitemap aunque también se haya descubierto a través de otro mecanismo, como el rastreo orgánico desde otra página.

Vista de detalles

Al hacer clic en una fila de la página de resumen, aparecerás en la vista de detalles de esa combinación de estado y motivo. En esa página, haz clic en Más información para ver más datos del problema seleccionado.

En el gráfico aparecen las páginas afectadas a lo largo del tiempo.

En la tabla se muestra una lista de ejemplo de páginas afectadas por ese problema:

  • Para abrir una URL de la tabla, haz clic en el enlace   situado en una fila.
  • Para inspeccionar una URL de la tabla, haz clic en el icono Inspeccionar Buscar situado en una fila.
  • Una vez corregidos los errores o advertencias todas las veces que salgan, puedes pedir a Google que valide tus cambios.

Si detectas que en una URL se marca un problema que ya has corregido, es posible que lo resolvieras después del último rastreo de Google. En estos casos, comprueba la fecha del rastreo más reciente, confirma que has corregido el problema y solicita que se vuelva a indexar la URL.

 

Compartir el informe

Para compartir los detalles de un problema, haz clic en el botón Compartir de la página. Las personas que obtengan el enlace solo pueden acceder a esta página y a las páginas de los historiales de validación del problema en cuestión. Con el enlace no se puede acceder a otras páginas de tu recurso ni permite al usuario compartido realizar ninguna acción en tu propiedad o cuenta. Puedes revocar el acceso a la página en cualquier momento inhabilitando su uso compartido.

Solucionar problemas

Picos de errores

Si ves que el total de errores se dispara de repente, sigue estos pasos:

  1. Prueba a encontrar correspondencias entre el total de errores de indexación o de páginas indexadas y el minigráfico de errores concretos; al hacerlo, puedes descubrir qué problemas afectan a la cantidad de errores o páginas indexadas.
  2. Corrige errores:
    1. En la tabla de URL, estas están ordenadas en función de la gravedad del error, de la cantidad de páginas afectadas y de si están en proceso de validación. Te recomendamos que resuelvas los problemas en el orden predeterminado.
    2. Busca filas de problemas cuyo minigráfico coincida en cierta medida con algún pico del gráfico superior.
    3. Haz clic en la fila de un error para entrar en su página de detalles. Para saber cómo gestionar un tipo de error concreto, lee su descripción.
    4. Corrige un error todas las veces que aparezca y solicita que se validen las correcciones haciendo clic en Validar corrección, en el desglose de cada motivo. Más información sobre la validación
    5. Recibirás notificaciones a medida que avance el proceso de validación. No obstante, puedes consultar su estado al cabo de unos días para ver si ha disminuido el número de errores.
  3. Quita de vez en cuando el filtro de URL excluidas, ordénalas por el número de páginas afectadas y analízalas en busca de problemas.

Encontrar el estado de indexación de una URL concreta

Si quieres saber el estado de indexación de una URL concreta, puedes hacerlo mediante la herramienta de inspección de URLs, aunque no puedes buscar ni filtrar por URL en el informe "Cobertura del índice".
Corregir los errores del servidor
Los errores del servidor se producen porque el robot de Google no ha podido acceder a tu URL, se ha agotado el tiempo de espera de la solicitud o el sitio web estaba ocupado. En consecuencia, el robot de Google ha tenido que descartar la solicitud.

Probar la conectividad del servidor

Con la herramienta de inspección de URLs, comprueba si puedes reproducir los errores del servidor que aparecen en el informe de estado de cobertura del índice.

Corregir los errores de conectividad del servidor

  • Reduce la carga excesiva de la página para solicitudes de páginas dinámicas.
    Se considera que los sitios web que muestran el mismo contenido en varias URL sirven contenido de forma dinámica (por ejemplo, si www.example.com/zapatos.php?color=rojo&talla=38 muestra el mismo contenido que www.example.com/zapatos.php?talla=38&color=rojo).  Las páginas dinámicas pueden tardar demasiado en responder, lo que provoca problemas de tiempo de espera. También es posible que el servidor devuelva un estado de sobrecarga para pedir al robot de Google que rastree el sitio web más despacio. Por lo general, recomendamos que las listas de parámetros sean cortas y se usen solo de vez en cuando. Si sabes cómo funcionan los parámetros de tu sitio web, puedes indicar a Google cómo debe gestionar estos parámetros.
  • Asegúrate de que el servidor de tu host esté activo y no esté sobrecargado ni mal configurado.
    Si los problemas de tiempo de espera o de respuesta continúan, consulta a tu proveedor de alojamiento y plantéate si debes aumentar la capacidad de gestión de tráfico de tu sitio web.
  • Comprueba que no estés bloqueando a Google por error.
    Es posible que bloquees a Google debido a problemas de sistema, como un error de configuración de DNS, un cortafuegos mal configurado, un sistema de protección DoS o una configuración incorrecta en el sistema de gestión del contenido. Los sistemas de protección desempeñan un papel importante en el alojamiento y se suelen configurar para bloquear automáticamente niveles inusualmente elevados de solicitudes del servidor. Sin embargo, como el robot de Google suele hacer más solicitudes que un usuario humano, puede activar estos sistemas de protección y hacer que lo bloqueen e impidan que rastree tu sitio web. Para solucionar estos problemas, debes determinar qué parte de la infraestructura del sitio web impide el acceso del robot de Google y eliminar el bloqueo. Si no tienes control sobre el cortafuegos, deberás ponerte en contacto con tu proveedor de alojamiento.
  • Controla el rastreo y la indexación de los motores de búsqueda de forma adecuada.
    Algunos webmasters impiden que el robot de Google acceda a sus sitios web de forma intencionada (es posible que usen un cortafuegos, como se ha descrito anteriormente). En esos casos, su intención no suele ser impedir completamente el acceso del robot de Google al sitio web, sino que quieren controlar cómo se rastrea y se indexa. Si es el caso, prueba lo siguiente:
Corregir los errores 404

Por lo general, recomendamos que solo corrijas las páginas que muestren un error 404, no las que estén excluidas, aunque también devuelvan un código 404. Las primeras son URL que has pedido expresamente a Google que indexe, mientras que las otras son URL que Google ha descubierto mediante otro mecanismo.

A continuación, se muestra cómo gestionar los errores 404:

  1. Decide si vale la pena. En muchos casos, por no decir en la mayoría de ellos, arreglar los errores 404 no merece la pena porque este tipo de error no perjudica ni al índice ni al posicionamiento de tu sitio web.
    • Si es una URL enviada, vale la pena corregir el error.
    • Si se trata de una página eliminada que no tiene reemplazo ni equivalente, debe devolverse un error 404. Estos códigos 404 tardan aproximadamente un mes en dejar de aparecer en el informe.
    • Si se trata de una URL incorrecta generada por una secuencia de comandos o que nunca ha existido en tu sitio web, es muy probable que no debas preocuparte por ella. Aunque no te guste verla en el informe, no es necesario corregirla, salvo si se trata de un enlace que se escribe incorrectamente con frecuencia. Más abajo puedes consultar información adicional al respecto. Los errores 404 tardarán aproximadamente un mes en dejar de mostrarse en el informe.
  2. Si has enviado la URL para que se indexe y su estado es Error, sigue estos pasos:
    1. Haz clic en el icono situado junto a la URL Buscar y consulta la información que aparece en el apartado Detección para inspeccionar la URL y saber desde dónde la enviaste. Si es necesario, actualiza el sitemap.
    2. Si el contenido se ha movido, añade una redirección.
    3. Si has eliminado contenido de forma permanente sin la intención de reemplazarlo por otro relacionado y más reciente, deja que la antigua URL devuelva un error 404 o 410. Actualmente, Google trata los errores 410 (No disponible permanentemente) del mismo modo que los 404 (Página no encontrada). Si al llegar a una página se devuelve un código distinto al 404 o al 410 o se redirige a los usuarios a otra página, puede que acabe dando algún problema. Estas páginas se denominan errores soft 404 y pueden confundir tanto a los usuarios como a los buscadores.
    4. Si la URL es desconocida, es posible que en ocasiones veas errores 404 de URLs que nunca han estado en tu sitio web. Estos errores pueden producirse cuando alguien accede a una URL que no existe en tu sitio web, ya sea porque la haya introducido incorrectamente en el navegador o porque la URL de ese enlace estuviera mal escrita. Si este error ocurre con mucha frecuencia, quizá te interese crear una redirección.
      También es posible que el robot de Google haya generado estas URL inesperadas al seguir enlaces en JavaScript, en archivos Flash o en otro tipo de contenido insertado o que posiblemente solo existe en un sitemap. Por ejemplo, es posible que tu sitio web utilice un código parecido al incluido a continuación para hacer un seguimiento de las descargas de archivos en Google Analytics:
      <a href="holamundo.pdf"
        onClick="_gaq.push(['_trackPageview','/descargar-hola-mundo']);">
        Hola Mundo PDF</a>

      Cuando el robot de Google vea ese código, es posible que intente rastrear la URL http://www.example.com/descargar-hola-mundo, aunque no sea una página real. En ese caso, el enlace puede que aparezca como error 404 (página no encontrada) en el informe Errores de rastreo. Google está intentando que no se produzcan este tipo de errores de rastreo, que no tiene ningún efecto sobre el rastreo ni sobre el posicionamiento de tu sitio web.

  3. No crees contenido falso, incluyas redirecciones a tu página principal ni uses un archivo robot.txt para bloquear errores 404, puesto que todos estos métodos dificultan que se reconozca y procese la estructura de tu sitio web correctamente. Estos errores se denominan errores soft 404.Una vez que Google haya rastreado una URL correctamente, puede que intente hacerlo de forma indefinida. Al crear una redirección de tipo 300, se retrasará el siguiente intento de rastreo, posiblemente mucho tiempo. Ten en cuenta que el error no desaparecerá de este informe, aunque se envíe una solicitud de eliminación de URL mediante la herramienta correspondiente.

Preguntas frecuentes

¿Por qué mi página o mi sitio web no están indexados aún?

Si tu sitio web es reciente, debes saber que es posible que Google tarde un poco en encontrarlo y rastrearlo.

  1. Para que Google tenga más información sobre una página nueva, puedes enviar un sitemap o una solicitud de rastreo de página, o Google debe encontrar un enlace a tu página en otro lugar.
  2. Puede que Google tarde unas semanas en rastrear algunas o todas las URL de tu sitio web una vez que las ha detectado.

Aunque envíes directamente una solicitud de rastreo, la indexación no se aplica al instante.

No quiero indexar mi página y esta aparece en el índice.

Google puede indexar cualquier URL que encuentre, a no ser que incluyas una directiva noindex en la página o la hayas bloqueado temporalmente; Google puede encontrar una página de muchas maneras diferentes, como por ejemplo, a través de un enlace que alguien haya publicado en otro sitio web.

  1. Si quieres bloquear tu página para que no aparezca en los resultados de la Búsqueda de Google, puedes usar una directiva noindex o requerir que se inicie sesión para poder acceder a ella.
  2. Si quieres retirar tu página de los resultados de la Búsqueda de Google aunque Google ya la haya encontrado, debes seguir estos pasos.

¿Por qué no se ha indexado de nuevo mi sitio web últimamente?

Google vuelve a indexar las páginas según una serie de criterios, incluida la frecuencia con la que cree que cambia la página. Si tu sitio web no lo hace a menudo, es posible que su frecuencia de actualización sea más lenta, aunque no supondría un problema si las páginas siguen siendo iguales. Si crees que tu sitio debería rastrearse de nuevo, pide a Google que lo vuelva a rastrear.

¿Se puede volver a rastrear mi página o mi sitio web?

Solicita a Google que vuelva a rastrearlo.

¿Por qué se han excluido tantas páginas de mi sitio web?

Consulta los motivos de exclusión que se describen en el informe "Cobertura del índice". La mayoría de las exclusiones se deben a alguno de estos motivos:

  • Un archivo robots.txt está impidiendo que Google rastree gran parte de las secciones de tu sitio web. Con la herramienta de inspección de URLs, puedes confirmar si el problema es este.
  • Tu sitio web tiene muchas páginas duplicadas, normalmente porque utiliza parámetros para filtrar u ordenar colecciones muy habituales, como por ejemplo, tipo=vestido, orden=precio o color=verde. Estas páginas se etiquetarán como "duplicadas" o "alternativas" en el informe "Cobertura del índice".
  • La URL indicada redirige a otra URL y la primera no está indexada, aunque la segunda sí lo está.

Google no puede acceder a mi sitemap

Comprueba que tu sitemap no esté bloqueado por un archivo robots.txt, que sea válido y que esté usando la URL adecuada en tu entrada del archivo robots.txt o en el informe "Sitemaps" que hayas enviado. Prueba la URL del sitemap mediante una herramienta de prueba de sitemaps, que está disponible al público. 

¿Por qué Google sigue rastreando una página que ya he retirado?

Google sigue rastreando todas las URL conocidas, aunque devuelvan errores 4XX durante un tiempo, por si se trata de errores temporales. El único caso en el que no se rastreará una URL es cuando devuelva una directiva noindex.

Para que no veas una lista cada vez mayor de errores 404, el informe "Cobertura del índice" muestra solo las URL que hayan devuelto estos errores durante el último mes.

Puedo ver mi página, ¿por qué Google no?

Con la herramienta de inspección de URLs, puedes probar si Google puede ver la página publicada. Si no puede, debería aparecer por qué motivo; en el caso de que sí pueda, es probable que el problema se deba a que el error de acceso se haya solucionado después del último rastreo. Ejecuta un rastreo de la página publicada con la herramienta de inspección de URLs y solicita que se indexe.

La herramienta de inspección de URLs no muestra ningún problema, pero el informe "Cobertura del índice" sí, ¿cómo es posible?

Puede que el error se haya corregido después de que Google rastreara la URL por última vez. Comprueba la fecha del último rastreo, que debería indicarse en la página de detalles de la URL del informe "Cobertura del índice" o en la vista de la versión indexada de la herramienta de inspección de URLs, y determina si has corregido algún error desde que la última vez que se rastreó la página.

Motivos de un estado

A continuación se explican los motivos por los que puede haberse aplicado cada estado a tus páginas.

"Enviado" y "No enviado"

Si en los motivos de indexación se muestra la palabra "Enviado", significa que has pedido explícitamente a Google mediante un sitemap que incluya las URL en cuestión en el índice. Si aparece la etiqueta "No enviado", significa que Google ha detectado la URL (por ejemplo, a través de un enlace en otra página) y que no está incluida en ninguno de los sitemaps indexados.

Error


No se han indexado las páginas con errores.


Error del servidor (5xx): tu servidor ha devuelto un error 5xx cuando se ha solicitado la página. Consulta la sección Corregir los errores del servidor.

Error de redirección: la URL ha dado un error de redirección. Podría ser por alguno de los siguientes motivos: la cadena de redirección era demasiado larga; se trataba de un bucle de redirección; la URL de redirección superaba la longitud de URL máxima, o bien había una URL incorrecta o vacía en la cadena de redirección.

robots.txt ha bloqueado la URL enviada: has enviado la página para indexarla, pero está bloqueada por un archivo robots.txt. Prueba la página con el Probador de robots.txt.

La URL enviada contiene la etiqueta "noindex": has enviado la página para indexarla, pero tiene una directiva "noindex" en una metaetiqueta o en una respuesta HTTP. Si quieres incluirla en el índice, retira la etiqueta o el encabezado HTTP.

La URL enviada devuelve un soft 404: has enviado la página para indexarla, pero el servidor ha devuelto lo que parece ser un error soft 404.

La URL enviada devuelve una solicitud no autorizada (401): has enviado la página para indexarla, pero Google ha obtenido una respuesta 401 (no autorizada). Retira los requisitos de autorización de la página o permite que el robot de Google acceda a tus páginas verificando su identidad.

No se ha podido encontrar la URL enviada (404): has enviado una URL que no existe para indexarla. Consulta la sección Corregir los errores 404.

La URL enviada tiene un problema de rastreo: has enviado la página para indexarla, pero Google ha encontrado un error de rastreo que no puede clasificarse en ninguna de las categorías anteriores. Prueba a depurar tu página con la herramienta de inspección de URLs.

Advertencia


Es posible que las páginas con advertencias necesiten tu atención y, dependiendo del resultado concreto, puede que no se hayan indexado.


Se ha indexado aunque un archivo robots.txt la ha bloqueado: la página se ha incluido en el índice aun estando bloqueada por un archivo robots.txt. Google siempre sigue las indicaciones de estos archivos; no obstante, si hay enlaces a la página en otros sitios web, la indexará. No consideramos que sea un error porque no estamos seguros de si pretendes bloquear la página para que no aparezca en los resultados de búsqueda. Si quieres bloquearlarobots.txt no es el mecanismo adecuado; para impedir que se indexe, usa una directiva "noindex" o prohíbe que usuarios anónimos accedan a ella requiriendo que se autentiquen. Puedes averiguar qué regla bloquea la página con el Probador de robots.txt. Debido al archivo robots.txt, es probable que los fragmentos de esta página que se muestran en los resultados de búsqueda no sean óptimos. Si no quieres que la página esté bloqueada, desbloquéala en tu archivo robots.txt.

Válidas


Las páginas cuyo estado sea "Válidas" están indexadas.

Enviada e indexada: has enviado la URL para indexarla y se ha incluido en el índice.

Indexada, no enviada en sitemap: Google ha descubierto la URL y la ha indexado. Te recomendamos que envíes todas las URL importantes mediante un sitemap.

Excluidas


Estas páginas no suelen estar indexadas y creemos que debe seguir siendo así, ya sea porque son duplicados de páginas indexadas, porque algún mecanismo de tu sitio web impide que se indexen o por algún otro motivo que consideremos oportuno.


Excluidas por la etiqueta "noindex": al intentar indexar la página, Google ha encontrado una directiva "noindex" y, por lo tanto, no la ha incluido en su índice. Si esta era tu intención, perfecto. En caso contrario, quita esa directiva.

Bloqueada por una herramienta para retirar páginas: en estos momentos, la página está bloqueada por una solicitud de retirada de URLs. Si has verificado la propiedad de tu sitio web, puedes consultar con la herramienta para retirar URLs quién ha solicitado quitarla. Estas solicitudes tienen una vigencia de unos 90 días a partir de la fecha en que se retiró. Transcurrido este periodo, es posible que el robot de Google vuelva a rastrear e indexar la página, aunque no hayas enviado una solicitud para que lo haga. Si no quieres que se indexe, usa una directiva "noindex", exige una autorización para acceder a la página o retírala directamente.

Bloqueada por robots.txt: se ha impedido con un archivo robots.txt que el robot de Google acceda a la página. Puedes comprobarlo con el Probador de robots.txt. Ten en cuenta que es posible que se indexe la página por otros medios. Si Google encuentra información sobre la página sin cargarla, puede que la incluya en el índice, aunque esta situación no suele darse. Para asegurarte de que Google no indexe páginas, no las bloquees mediante un archivo robots.txt; usa una directiva "noindex".

Bloqueada por una solicitud no autorizada (401): el robot de Google no ha podido acceder a la página debido a una solicitud de autorización (respuesta 401). Para que pueda rastrearla, quita los requisitos de autorización o permite que acceda a tu página.

Anomalía en el rastreo: se ha producido una anomalía sin determinar al obtener la URL, lo que podría implicar un código de respuesta 4xx o 5xx. Prueba a obtener la página con la herramienta de inspección de URLs para ver si se detecta algún problema en este proceso. La página no se ha llegado a indexar.

Rastreada: actualmente sin indexar. Google ha rastreado la página, pero no la ha indexado. Es posible que se indexe más adelante; no tienes que volver a solicitar que se rastree esta URL.

Descubierta: actualmente sin indexar. Google ha encontrado la página, pero todavía no la ha rastreado porque en el momento de hacerlo el sitio web estaba sobrecargado, así que Google ha tenido que aplazar el rastreo. Por este motivo, en el informe no aparece la fecha del rastreo más reciente.

Página alternativa con etiqueta canónica adecuada: la página es un duplicado de otra que Google considera canónica y, además, redirige correctamente a esa página. No tienes que hacer nada más.

Duplicada: el usuario no ha indicado ninguna versión canónica. La página tiene algún duplicado, pero no se ha indicado que ninguno sea la versión canónica. Creemos que esta página no es la canónica. Deberías indicar cuál es la versión canónica de esta página de forma explícita. Si inspeccionas esta URL, se muestra la canónica que ha seleccionado Google.

Duplicada: Google ha elegido una versión canónica diferente a la del usuario. Se ha indicado que esta página es la canónica de un conjunto de páginas, pero Google considera que debería serlo otra URL. Google no ha indexado esta página, sino la que considera canónica. Te recomendamos que indiques explícitamente que esta página es un duplicado de la URL canónica. Esta página se ha descubierto sin que se haya presentado una solicitud explícita para rastrearla. Si inspeccionas esta URL, podrás ver cuál es la URL canónica según Google.

No se ha encontrado (404): la página ha devuelto un error 404 al solicitarse. Google no ha descubierto esta URL a través de una solicitud explícita ni de un sitemap. Es posible que Google la haya encontrado siguiendo un enlace ubicado en otro sitio web, o que la página se haya eliminado en algún momento. Es probable que el robot de Google siga intentando rastrear esta URL durante un tiempo, ya que no puedes indicar a este robot que olvide permanentemente una URL, pero sí que se rastreará cada vez con menos frecuencia. Las respuestas 404 no son un problema si se devuelven de manera intencionada. Si has trasladado la página, usa una redirección 301 que lleve a la ubicación nueva. Consulta la sección Corregir los errores 404.

Se ha retirado la página por una reclamación legal: la página se ha quitado del índice debido a una reclamación legal.

Página con redirección: la URL es una redirección, por lo que no se ha añadido al índice.

Soft 404: la solicitud de la página devuelve lo que consideramos que es una respuesta soft 404, es decir, se indica a los usuarios que la página no se ha encontrado, pero no se muestra directamente un código de respuesta 404. Te recomendamos que devuelvas este código de respuesta en las páginas que no se encuentren de verdad, o bien que añadas más información a la página para que sepamos que no se trata de una respuesta soft 404. Más información

Duplicada: la URL enviada no se ha seleccionado como canónica. La URL forma parte de un conjunto de URL duplicadas en las que no se ha indicado explícitamente que alguna de ellas es canónica. Has solicitado expresamente que se indexe esta URL, pero como es un duplicado y Google considera que otra URL debería ser la canónica, no se ha indexado; la URL canónica seleccionada por Google es la que se ha indexado. Solo se indexan las URL canónicas de los conjuntos de duplicados. La diferencia entre este estado y el estado "Google eligió una página canónica diferente a la del usuario" es que, en este caso, has solicitado que se indexe la URL de forma explícita. Si inspeccionas esta URL, se muestra la canónica que ha seleccionado Google.

 

Problemas conocidos

A continuación se indican los problemas que se han detectado en esta versión beta de la nueva versión de Search Console. No es necesario que nos informes de ninguno de ellos, pero sí nos gustaría recibir tus comentarios sobre funciones u otros problemas que detectes. Puedes enviárnoslos con la opción de comentarios de la barra de navegación.

  • Los datos de indexación no se actualizan cada día, por lo que pueden tener varios días de retraso. Además, algunos puntos de datos se interpolan.
  • En los gráficos debería incluirse información de los últimos 90 días, aunque es posible que en estos momentos se muestren menos datos. 
  • En el filtro desplegable de sitemaps se incluyen solo los enviados mediante Search Console o directivas robots.txt.
  • Estamos perfilando la lista de estados, por lo que es posible que cambie más adelante y, por ejemplo, en los elementos que se consideran errores se separen los diferentes tipos de respuesta (4xx/5xx).
¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?