¿Cómo funciona la Búsqueda de Google?

Más información sobre cómo descubrimos, rastreamos y publicamos páginas web

¿Cómo funciona Google? En este artículo ofrecemos una respuesta corta y una larga a esta pregunta.

Obtenemos información de muchas fuentes diferentes, como las siguientes: 

  • Páginas web
  • Contenido enviado por usuarios, como el que nos envían en Google My Business o Maps
  • Libros escaneados
  • Bases de datos públicas en Internet
  • Muchas otras fuentes

Sin embargo, en este artículo nos centramos en las páginas web.

Respuesta corta

Seguimos tres pasos básicos para generar resultados de páginas web:

Rastreo

El primer paso es averiguar qué páginas existen en la Web. Como no hay ningún registro central con todas las páginas web, tenemos que buscar páginas nuevas constantemente y añadirlas a nuestra lista de páginas conocidas. Este proceso de descubrimiento se denomina "rastreo".

Conocemos algunas páginas porque ya las hemos rastreado antes; otras las encontramos al seguir enlaces presentes en páginas conocidas que nos llevan a páginas nuevas. Estos dos métodos no son los únicos: también descubrimos páginas cuando los propietarios de sitios web nos facilitan una lista de sus páginas (sitemap) para que las rastreemos. También es posible que las plataformas de alojamiento web gestionado, como Wix o Blogger, nos soliciten que rastreemos las páginas nuevas o actualizadas.

Para mejorar el rastreo de tu sitio web, sigue estos consejos:

  • Si haces cambios en una única página, puedes enviarnos una URL concreta.
  • Consigue que haya enlaces a tu página web en páginas que ya conozcamos. No obstante, ten en cuenta que no seguiremos los enlaces que estén en anuncios, los que hayas pagado para que se incluyan en otros sitios web, los que aparezcan en comentarios ni ningún otro enlace que no cumpla las directrices para webmasters de Google.

 

No aceptamos pagos para rastrear sitios web con mayor frecuencia ni para mejorar su posicionamiento. Si alguien te dice lo contrario, se equivoca.

Indexación

Después de descubrir una página, intentamos interpretar su contenido. Este proceso se denomina "indexación". Analizamos el contenido de la página, catalogamos los archivos de imagen y vídeo insertados en ella y tratamos de entenderla. Toda esta información se almacena en el índice de Google, una enorme base de datos almacenada en muchísimos ordenadores.

Para mejorar la indexación de tu página, sigue estos consejos:

  • Crea títulos de página cortos y que tengan significado.
  • Utiliza encabezados de página que reflejen el tema principal.
  • Transmite el contenido con texto en lugar de imágenes. Podemos interpretar algunos vídeos e imágenes, pero no con la misma facilidad con la que entendemos el texto. Como mínimo, anota tus vídeos e imágenes con texto alternativo y otros atributos según corresponda.

Publicación (y posicionamiento)

Cuando los usuarios introducen sus consultas, intentamos encontrar la respuesta más pertinente en nuestro índice en función de muchos factores. Tratamos de determinar las respuestas de mayor calidad y tenemos en cuenta muchos aspectos, como la ubicación, el idioma y el dispositivo de los usuarios (ordenador o teléfono), para averiguar qué resultado ofrecerá la mejor experiencia de usuario y la respuesta más adecuada. Por ejemplo, si un usuario de Barcelona busca "talleres de reparación de bicicletas", obtendrá respuestas diferentes a los usuarios de Hong Kong que hagan la misma consulta. No aceptamos pagos para mejorar el posicionamiento de páginas web; esta clasificación se hace automáticamente.

Para mejorar la publicación y el posicionamiento, sigue estos consejos:

Respuesta larga

¿Quieres información más completa? Sigue leyendo:

Respuesta larga

 

Rastreo

El rastreo es el proceso mediante el cual el robot de Google descubre páginas nuevas y actualizadas para añadirlas al índice de Google.

Utilizamos una enorme cantidad de ordenadores para obtener (o "rastrear") miles de millones de páginas de la Web. El programa encargado de recuperar este contenido es el robot de Google, también conocido simplemente como robot o araña. El robot de Google utiliza un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.

El proceso de rastreo de Google empieza con una lista de direcciones URL de páginas web generada a partir de procesos de rastreo anteriores y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que el robot de Google visita cada uno de estos sitios web, detecta enlaces en sus páginas y los añade a la lista de páginas para rastrear. Los sitios web nuevos, los cambios en los que ya conocemos y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.

¿Cómo encuentra Google una página?

Podemos encontrar páginas de muchas maneras diferentes, como las siguientes:

  • Seguir enlaces de otros sitios web o páginas.
  • Leer sitemaps.

¿Cómo sabe Google qué páginas no debe rastrear?

  • No rastreamos las páginas bloqueadas en archivos robots.txt, pero es posible que las indexemos si hay enlaces a ellas en otras páginas. Podemos deducir el contenido de una página a través de un enlace que lleve a ella e indexarla sin analizar su contenido.
  • No podemos rastrear las páginas a las que no se puede acceder de manera anónima. Si una página requiere iniciar sesión o cuenta con otras medidas de autorización, no podrá rastrearse.

Mejorar el rastreo

Con estas técnicas, nos ayudarás a descubrir las páginas adecuadas de tu sitio web:

Indexación

El robot de Google procesa todas las páginas que rastrea para generar un índice masivo con todas las palabras que ve junto con su ubicación en cada página. Además, también procesa información incluida en etiquetas y atributos de contenido clave, como las etiquetas <title> y los atributos "alt". El robot de Google puede analizar muchos tipos de contenido, pero no todos (por ejemplo, el contenido de algunos archivos de rich media).

Ten en cuenta que el robot no rastrea ninguna página que tenga una directiva noindex (encabezado o etiqueta). Sin embargo, tiene que poder ver esta directiva para no rastrear una página; si la página está bloqueada por un archivo robots.txt, requiere iniciar sesión o está bloqueada de otro modo, es posible que la indexe aunque no la haya visitado.

Mejorar la indexación

Existen muchas técnicas para ayudarnos a entender mejor el contenido de tus páginas:

  • Si no quieres que rastreemos ni encontremos determinadas páginas, ocúltalas con una directiva noindex. No uses este método en las páginas que ya estén bloqueadas por robots.txt; de lo contrario, no veremos la directiva noindex y es posible que acabemos indexando la página de todos modos.
  • Utiliza datos estructurados.
  • Sigue las directrices para webmasters de Google.
  • Lee nuestra Guía de SEO para obtener más consejos.

Publicación de resultados

Cuando los usuarios introducen sus consultas, nuestro sistema busca en el índice páginas que coincidan con ellas y muestra los resultados que considera más relevantes. Para determinar esta relevancia, el sistema tiene en cuenta más de 200 factores. Trabajamos constantemente para mejorar nuestro algoritmo. La experiencia de usuario es uno de los factores que consideramos al elegir y clasificar resultados, por lo que te recomendamos que tus páginas se carguen rápidamente y estén optimizadas para móviles.

Mejorar la publicación

  • Si tus resultados van dirigidos a usuarios en ubicaciones concretas o que hablen determinados idiomas, puedes indicarnos tus preferencias.
  • Asegúrate de que tus páginas se carguen rápidamente y estén optimizadas para móviles.
  • Sigue las directrices para webmasters; de este modo, evitarás errores habituales y mejorarás el posicionamiento de tu sitio web.
  • Valora la opción de implementar funciones de resultados de búsqueda en tu sitio web, como tarjetas de recetas o de artículos.
  • Implementa AMP para que tus páginas se carguen más rápido en dispositivos móviles. Algunas páginas AMP también pueden aparecer en funciones de búsqueda adicionales, como el carrusel Noticias destacadas.
  • Mejoramos nuestro algoritmo constantemente, así que en lugar de tratar de averiguar sus criterios y diseñar tu página en consecuencia, crea contenido de calidad y actualizado que resulte interesante a los usuarios y sigue nuestras directrices.

Respuesta todavía más larga

Consulta una respuesta aún más elaborada a la pregunta "¿Cómo funciona la Búsqueda de Google? (con imágenes y vídeos).

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?