Cómo funciona Búsqueda de Google

Averigua cómo descubre, rastrea y publica las páginas web Google

Cuando te sientas frente al ordenador y haces una búsqueda en Google, obtienes prácticamente al instante una lista de resultados de la Web. ¿Qué sistemas utiliza Google para encontrar páginas web que coincidan con su consulta y para determinar el orden de los resultados de búsqueda?

Para explicarlo de forma sencilla, realizar una búsqueda en la Web es como consultar un libro muy extenso en el que un índice exhaustivo nos indica exactamente la ubicación de cada elemento. Cuando efectúas una búsqueda en Google, nuestros programas consultan nuestro índice para decidir qué resultados de búsqueda son los más relevantes y mostrártelos.

Estos son los tres procesos principales mediante los que se proporcionan los resultados de búsqueda:

Rastreo

El rastreo es el proceso mediante el que el robot de Google descubre páginas nuevas y actualizadas y las añade al índice de Google.

Utilizamos una enorme cantidad de equipos informáticos para obtener (o "rastrear") miles de millones de páginas de la Web. El programa encargado de recuperar este contenido es el robot de Google, también conocido simplemente como robot o araña. El robot de Google utiliza un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.

El proceso de rastreo de Google empieza con una lista de direcciones URL de páginas web generada a partir de procesos de rastreo anteriores y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que el robot de Google visita cada uno de estos sitios web, detecta enlaces en sus páginas y los añade a la lista de páginas para rastrear. Los sitios nuevos, los cambios en los existentes y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.

Google no acepta retribuciones económicas para rastrear un sitio con mayor frecuencia y separa el servicio de búsqueda del programa de generación de ingresos AdWords.

Indexación

El robot de Google procesa todas las páginas que rastrea para compilar un índice masivo de todas las palabras que ve junto con su ubicación en cada página. Además, también procesa la información incluida en las etiquetas y los atributos de contenido clave, como las etiquetas "title" y los atributos "alt". El robot de Google puede procesar muchos tipos de contenido, pero hay ciertos tipos que no puede procesar, como el contenido de algunos archivos de soportes interactivos y páginas dinámicas.

Publicación de resultados

Cuando un usuario introduce una consulta, nuestro sistema busca en el índice las páginas que coinciden con esa consulta y muestra los resultados que considera más relevantes para el usuario. La relevancia se determina a partir de más de 200 factores, y uno de ellos es la clasificación PageRank de una página en particular. Este parámetro representa la importancia que Google asigna a una página en función de los enlaces procedentes de otras páginas web. Dicho con otras palabras, cada enlace a una página de tu sitio incluido en otro sitio añade valor al PageRank de tu sitio. No todos los enlaces son iguales: Google se esfuerza en mejorar el servicio que ofrece al usuario identificando los enlaces fraudulentos y otras prácticas que influyen negativamente en los resultados de búsqueda. Los mejores tipos de enlaces son los que se crean por la calidad del contenido.

Para que tu sitio consiga una buena posición en las páginas de resultados, es importante asegurarse de que Google pueda rastrearlo e indexarlo correctamente. En nuestras directrices para webmasters destacamos algunas de las prácticas recomendadas para evitar errores comunes y mejorar la clasificación del sitio.

Las funciones Quizás quisiste decir y Autocompletar de Google están diseñadas para que los usuarios puedan ahorrar tiempo al mostrar términos relacionados, errores ortográficos habituales y consultas populares. Al igual que los resultados de búsqueda de google.com, las palabras clave que utilizan estas funciones se generan de forma automática a través de nuestros rastreadores web y algoritmos de búsqueda. Solo mostramos estas predicciones cuando consideramos que pueden ahorrar tiempo a los usuarios. Si un sitio está bien clasificado con respecto a una palabra clave, se debe a que hemos determinado mediante algoritmos que su contenido es más relevante para la consulta del usuario.