¿Cómo funciona la Búsqueda de Google?

Más información sobre cómo descubrimos, rastreamos y publicamos páginas web

¿Cómo funciona Google? En este artículo ofrecemos una respuesta corta y una larga a esta pregunta.

Recibimos información de muchas fuentes diferentes, incluidas las siguientes: 

  • Páginas web
  • Contenido enviado por usuarios, como el que nos envían en Google My Business o Maps
  • Libros escaneados
  • Bases de datos públicas en Internet
  • Muchas otras fuentes

Sin embargo, en este artículo nos centramos en las páginas web.

Respuesta corta

Seguimos tres pasos básicos para generar resultados de páginas web:

Rastreo

El primer paso es averiguar qué páginas existen en la Web. Como no hay ningún registro central con todas las páginas web, tenemos que buscar páginas nuevas constantemente y añadirlas a nuestra lista de páginas conocidas. Este proceso de descubrimiento se denomina "rastreo".

Conocemos algunas páginas porque ya las hemos rastreado en algún momento; pero otras las encontramos al seguir enlaces de páginas conocidas que nos llevan a ellas. También se pueden descubrir páginas cuando los propietarios de sitios web nos facilitan la lista de sus páginas, es decir, un sitemap, para que las rastreemos. También es posible que las plataformas de alojamiento web gestionado, como Wix o Blogger, nos soliciten que rastreemos las páginas nuevas o actualizadas.

Para mejorar el rastreo de tu sitio web, sigue estos consejos:

  • Si haces cambios en una única página, puedes enviarnos una URL concreta.
  • Consigue que haya enlaces a tu página web en páginas que ya conozcamos. No obstante, ten en cuenta que no seguiremos los enlaces que estén en anuncios, por los que hayas pagado para que se incluyan en otros sitios web, los que aparezcan en comentarios ni los que infrinjan las directrices para webmasters de Google.
  • Si solicitas que rastreemos solo una página web, márcala como tu página principal para que la consideremos la más importante de tu sitio web. Si quieres que rastreemos todo el sitio web, comprueba que todas tus páginas web contienen un buen sistema de navegación en el que hay enlaces a todas las secciones y páginas web importantes de tu sitio web para que tanto los usuarios como nuestros rastreadores podamos desplazarnos de forma fácil.

 

No aceptamos pagos para rastrear sitios web con mayor frecuencia ni para mejorar su posicionamiento. Si alguien te dice lo contrario, se equivoca.

Indexación

Después de descubrir una página, intentamos interpretar su contenido. Este proceso se denomina "indexación". Analizamos el contenido de la página, catalogamos sus archivos de imagen y vídeo y tratamos de entenderla. Toda esta información se guarda en el índice de Google, una enorme base de datos almacenada en muchísimos ordenadores.

Para mejorar la indexación de tu página, sigue estos consejos:

  • Crea títulos de página cortos y que tengan significado.
  • Utiliza encabezados de página que reflejen el tema principal.
  • Transmite el contenido con texto en lugar de imágenes. Podemos interpretar algunos vídeos e imágenes, pero no con la misma facilidad con la que entendemos el texto. Como mínimo, incluye texto alternativo u otros atributos en tus vídeos e imágenes, según corresponda.

Publicación (y posicionamiento)

Cuando los usuarios introducen sus consultas, intentamos encontrar la respuesta más pertinente en nuestro índice en función de muchos factores. Tratamos de determinar las respuestas de mayor calidad y tenemos en cuenta muchos aspectos, como la ubicación, el idioma y el dispositivo de los usuarios (ordenador o teléfono), para averiguar qué resultado ofrecerá la mejor experiencia de usuario y la respuesta más adecuada. Por ejemplo, si un usuario de Barcelona busca "talleres de reparación de bicicletas", obtendrá respuestas diferentes a los de usuarios de Hong Kong que hagan la misma consulta. No aceptamos pagos para mejorar el posicionamiento de páginas web; esta clasificación se hace automáticamente.

Para mejorar la publicación y el posicionamiento, sigue estos consejos:

Respuesta larga

¿Quieres obtener más información? Te la mostramos a continuación:

Respuesta larga

 

Rastreo

El rastreo es el proceso mediante el cual el robot de Google descubre páginas nuevas y actualizadas para añadirlas al índice de Google.

Utilizamos una enorme cantidad de ordenadores para obtener (o "rastrear") miles de millones de páginas de la Web. El programa encargado de recuperar este contenido es el robot de Google, también conocido simplemente como robot o araña. El robot de Google utiliza un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.

El proceso de rastreo de Google empieza con una lista de direcciones URL de páginas web generada a partir de procesos de rastreo anteriores y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que el robot de Google visita cada uno de estos sitios web, detecta enlaces en sus páginas y los añade a la lista de páginas para rastrear. Los sitios web nuevos, los cambios en los que ya conocemos y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.

¿Cómo encuentra Google una página?

Podemos encontrar páginas de muchas maneras diferentes, como las siguientes:

  • Seguir enlaces de otros sitios web o páginas.
  • Leer sitemaps.

¿Cómo sabe Google qué páginas no debe rastrear?

  • No rastreamos las páginas bloqueadas en archivos robots.txt, pero es posible que las indexemos si hay enlaces a ellas en otras páginas. Podemos deducir el contenido de una página si tenemos un enlace que lleve a ella, así como indexarla sin analizar su contenido.
  • No podemos rastrear las páginas a las que no se puede acceder de forma anónima, por lo que, si una página requiere iniciar sesión o cuenta con otras medidas de autorización, no se podrá rastrear.
  • Rastreamos con menos frecuencia las páginas que ya hayan sido rastreadas y se consideren duplicadas de otra página.

Mejorar el rastreo

Con estas técnicas, nos ayudarás a descubrir las páginas adecuadas de tu sitio web:

Indexación

El robot de Google procesa todas las páginas que rastrea para generar un índice masivo con todas las palabras que ve junto con su ubicación en cada página. Además, procesa la información incluida en etiquetas y atributos de contenido clave, como las etiquetas <title> y los atributos alternativos. Si bien el robot de Google puede analizar muchos tipos de contenido, no puede analizarlos todos, incluido el de algunos archivos de rich media.

Entre los procesos de rastreo y de indexación determinamos si una página es una versión duplicada o canónica de otra. Si consideramos que la página es un duplicado, se rastreará con mucha menos frecuencia.

Ten en cuenta que Google no indexa ninguna página que contenga una directiva noindex, ya sea en su encabezado o en una etiqueta. Sin embargo, tiene que poder ver esta directiva para no rastrear una página; por lo que es posible que la indexe, aun sin visitarla, si está bloqueada por un archivo robots.txt, requiere iniciar sesión o está bloqueada de algún otro modo.

Mejorar la indexación

Existen muchas técnicas para ayudarnos a entender mejor el contenido de tus páginas:

Publicación de resultados

Cuando los usuarios introducen sus consultas, nuestro sistema busca en el índice páginas que coincidan con ellas y muestra los resultados que considera más relevantes. Para determinar esta relevancia, el sistema tiene en cuenta más de 200 factores. Trabajamos constantemente para mejorar nuestro algoritmo. La experiencia de usuario es uno de los factores que tenemos en cuenta al elegir y clasificar resultados, por lo que te recomendamos que tus páginas se carguen rápidamente y estén optimizadas para móviles.

Mejorar el servicio

  • Si tus resultados van dirigidos a usuarios en ubicaciones concretas o que hablen determinados idiomas, puedes indicarnos tus preferencias.
  • Asegúrate de que tus páginas se carguen rápidamente y estén optimizadas para móviles.
  • Sigue las directrices para webmasters; de este modo, evitarás errores habituales y mejorarás el posicionamiento de tu sitio web.
  • Valora la opción de implementar funciones de resultados de búsqueda en tu sitio web, como tarjetas de recetas o de artículos.
  • Implementa AMP para que tus páginas se carguen más rápido en dispositivos móviles. Algunas páginas AMP también pueden aparecer en funciones de búsqueda adicionales, como el carrusel Noticias destacadas.
  • Mejoramos nuestro algoritmo constantemente, así que en lugar de tratar de averiguar sus criterios y diseñar tu página en consecuencia, crea contenido de calidad y actualizado que resulte interesante a los usuarios y sigue nuestras directrices.

Respuesta todavía más larga

Consulta una respuesta aún más elaborada a la pregunta "¿Cómo funciona la Búsqueda de Google? (con imágenes y vídeos).

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?