Usuarios principiantes
¿Cómo funciona la Búsqueda de Google?
¿Cómo funciona Google? En este artículo ofrecemos una respuesta corta y una larga a esta pregunta.
Recibimos información de muchas fuentes diferentes, incluidas las siguientes:
- Páginas web
- Contenido enviado por usuarios, como el que nos envían en Google My Business o Maps
- Libros escaneados
- Bases de datos públicas en Internet
- Muchas otras fuentes
Sin embargo, en este artículo nos centramos en las páginas web.
Respuesta corta
Seguimos tres pasos básicos para generar resultados de páginas web:
Rastreo
El primer paso es averiguar qué páginas existen en la Web. Como no hay ningún registro central con todas las páginas web, tenemos que buscar páginas nuevas constantemente y añadirlas a nuestra lista de páginas conocidas. Este proceso de descubrimiento se denomina "rastreo".
Conocemos algunas páginas porque ya las hemos rastreado en algún momento; pero otras las encontramos al seguir enlaces de páginas conocidas que nos llevan a ellas. También se pueden descubrir páginas cuando los propietarios de sitios web nos facilitan la lista de sus páginas, es decir, un sitemap, para que las rastreemos. También es posible que las plataformas de alojamiento web gestionado, como Wix o Blogger, nos soliciten que rastreemos las páginas nuevas o actualizadas.
Para mejorar el rastreo de tu sitio web, sigue estos consejos:
- Si haces cambios en una única página, puedes enviarnos una URL concreta.
- Consigue que haya enlaces a tu página web en páginas que ya conozcamos. No obstante, ten en cuenta que no seguiremos los enlaces que estén en anuncios, por los que hayas pagado para que se incluyan en otros sitios web, los que aparezcan en comentarios ni los que infrinjan las directrices para webmasters de Google.
- Si solicitas que rastreemos solo una página web, márcala como tu página principal para que la consideremos la más importante de tu sitio web. Si quieres que rastreemos todo el sitio web, comprueba que todas tus páginas web contienen un buen sistema de navegación en el que hay enlaces a todas las secciones y páginas web importantes de tu sitio web para que tanto los usuarios como nuestros rastreadores podamos desplazarnos de forma fácil.
Indexación
Después de descubrir una página, intentamos interpretar su contenido. Este proceso se denomina "indexación". Analizamos el contenido de la página, catalogamos sus archivos de imagen y vídeo y tratamos de entenderla. Toda esta información se guarda en el índice de Google, una enorme base de datos almacenada en muchísimos ordenadores.
Para mejorar la indexación de tu página, sigue estos consejos:
- Crea títulos de página cortos y que tengan significado.
- Utiliza encabezados de página que reflejen el tema principal.
- Transmite el contenido con texto en lugar de imágenes. Podemos interpretar algunos vídeos e imágenes, pero no con la misma facilidad con la que entendemos el texto. Como mínimo, incluye texto alternativo u otros atributos en tus vídeos e imágenes, según corresponda.
Publicación (y posicionamiento)
Cuando los usuarios introducen sus consultas, intentamos encontrar la respuesta más pertinente en nuestro índice en función de muchos factores. Tratamos de determinar las respuestas de mayor calidad y tenemos en cuenta muchos aspectos, como la ubicación, el idioma y el dispositivo de los usuarios (ordenador o teléfono), para averiguar qué resultado ofrecerá la mejor experiencia de usuario y la respuesta más adecuada. Por ejemplo, si un usuario de Barcelona busca "talleres de reparación de bicicletas", obtendrá respuestas diferentes a los de usuarios de Hong Kong que hagan la misma consulta. No aceptamos pagos para mejorar el posicionamiento de páginas web; esta clasificación se hace automáticamente.
Para mejorar la publicación y el posicionamiento, sigue estos consejos:
- Haz que tu página se cargue rápidamente y optimízala para móviles.
- Añade contenido útil y mantenlo actualizado.
- Sigue las directrices para webmasters de Google; de este modo, te aseguras de ofrecer una buena experiencia de usuario.
- Lee más consejos y prácticas recomendadas en nuestra Guía de optimización en buscadores (SEO) para principiantes.
- Consulta más información al respecto, incluidas las directrices que facilitamos a nuestros evaluadores de calidad para asegurarnos de que mostramos buenos resultados.
Respuesta larga
¿Quieres obtener más información? Te la mostramos a continuación:
Rastreo
El rastreo es el proceso mediante el cual el robot de Google descubre páginas nuevas y actualizadas para añadirlas al índice de Google.
Utilizamos una enorme cantidad de ordenadores para obtener (o "rastrear") miles de millones de páginas de la Web. El programa encargado de recuperar este contenido es el robot de Google, también conocido simplemente como robot o araña. El robot de Google utiliza un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.
El proceso de rastreo de Google empieza con una lista de direcciones URL de páginas web generada a partir de procesos de rastreo anteriores y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que el robot de Google visita cada uno de estos sitios web, detecta enlaces en sus páginas y los añade a la lista de páginas para rastrear. Los sitios web nuevos, los cambios en los que ya conocemos y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.
¿Cómo encuentra Google una página?
Podemos encontrar páginas de muchas maneras diferentes, como las siguientes:
- Seguir enlaces de otros sitios web o páginas.
- Leer sitemaps.
¿Cómo sabe Google qué páginas no debe rastrear?
- No rastreamos las páginas bloqueadas en archivos robots.txt, pero es posible que las indexemos si hay enlaces a ellas en otras páginas. Podemos deducir el contenido de una página si tenemos un enlace que lleve a ella, así como indexarla sin analizar su contenido.
- No podemos rastrear las páginas a las que no se puede acceder de forma anónima, por lo que, si una página requiere iniciar sesión o cuenta con otras medidas de autorización, no se podrá rastrear.
- Rastreamos con menos frecuencia las páginas que ya hayan sido rastreadas y se consideren duplicadas de otra página.
Mejorar el rastreo
Con estas técnicas, nos ayudarás a descubrir las páginas adecuadas de tu sitio web:
- Envía un sitemap.
- Envía solicitudes de rastreo de páginas concretas.
- Usa rutas de URL sencillas, descriptivas y lógicas de tus páginas y proporciona enlaces internos claros y directos.
- Si empleas parámetros de URL en la navegación de tu sitio web (por ejemplo, para indicar el país de los usuarios en un sitio web de compras internacional), infórmanos de los parámetros importantes con la herramienta de parámetros de URL.
- Utiliza robots.txt de forma adecuada. Indícanos en este archivo qué páginas quieres que conozcamos o que rastreemos en primer lugar para proteger la carga de tu servidor; no lo uses para evitar que determinado material aparezca en el índice de Google.
- Apunta a las versiones de tus páginas en otros idiomas con hreflang.
- Identifica claramente las páginas canónicas y las páginas alternativas.
- Consulta tu cobertura de rastreo y del índice en el informe de cobertura del índice.
Indexación
El robot de Google procesa todas las páginas que rastrea para generar un índice masivo con todas las palabras que ve junto con su ubicación en cada página. Además, procesa la información incluida en etiquetas y atributos de contenido clave, como las etiquetas <title>
y los atributos alternativos. Si bien el robot de Google puede analizar muchos tipos de contenido, no puede analizarlos todos, incluido el de algunos archivos de rich media.
Entre los procesos de rastreo y de indexación determinamos si una página es una versión duplicada o canónica de otra. Si consideramos que la página es un duplicado, se rastreará con mucha menos frecuencia.
Ten en cuenta que Google no indexa ninguna página que contenga una directiva noindex, ya sea en su encabezado o en una etiqueta. Sin embargo, tiene que poder ver esta directiva para no rastrear una página; por lo que es posible que la indexe, aun sin visitarla, si está bloqueada por un archivo robots.txt, requiere iniciar sesión o está bloqueada de algún otro modo.
Mejorar la indexación
Existen muchas técnicas para ayudarnos a entender mejor el contenido de tus páginas:
- Si no quieres que rastreemos ni encontremos determinadas páginas, ocúltalas con una directiva noindex. No uses este método en las páginas que ya estén bloqueadas por robots.txt; de lo contrario, no veremos la directiva noindex y es posible que acabemos indexando la página.
- Utiliza datos estructurados.
- Sigue las directrices para webmasters de Google.
- Lee nuestra Guía de SEO para obtener más consejos.
Publicación de resultados
Cuando los usuarios introducen sus consultas, nuestro sistema busca en el índice páginas que coincidan con ellas y muestra los resultados que considera más relevantes. Para determinar esta relevancia, el sistema tiene en cuenta más de 200 factores. Trabajamos constantemente para mejorar nuestro algoritmo. La experiencia de usuario es uno de los factores que tenemos en cuenta al elegir y clasificar resultados, por lo que te recomendamos que tus páginas se carguen rápidamente y estén optimizadas para móviles.
Mejorar el servicio
- Si tus resultados van dirigidos a usuarios en ubicaciones concretas o que hablen determinados idiomas, puedes indicarnos tus preferencias.
- Asegúrate de que tus páginas se carguen rápidamente y estén optimizadas para móviles.
- Sigue las directrices para webmasters; de este modo, evitarás errores habituales y mejorarás el posicionamiento de tu sitio web.
- Valora la opción de implementar funciones de resultados de búsqueda en tu sitio web, como tarjetas de recetas o de artículos.
- Implementa AMP para que tus páginas se carguen más rápido en dispositivos móviles. Algunas páginas AMP también pueden aparecer en funciones de búsqueda adicionales, como el carrusel Noticias destacadas.
- Mejoramos nuestro algoritmo constantemente, así que en lugar de tratar de averiguar sus criterios y diseñar tu página en consecuencia, crea contenido de calidad y actualizado que resulte interesante a los usuarios y sigue nuestras directrices.
Respuesta todavía más larga
Consulta una respuesta aún más elaborada a la pregunta "¿Cómo funciona la Búsqueda de Google? (con imágenes y vídeos).