Lorsque vous effectuez une recherche sur Google, une liste de résultats provenant des quatre coins du Web vous est présentée presque instantanément. Comment procédons-nous pour trouver les pages qui correspondent à votre requête, et déterminer l'ordre des résultats de recherche ?
Globalement, on peut se représenter la recherche Web comme la consultation d'un livre gigantesque dont l'index très volumineux permet de connaître l'emplacement exact de chaque élément. Lorsque vous effectuez une recherche Google, nos programmes vérifient notre index afin de vous présenter les résultats de recherche les plus pertinents.
Les trois processus clés permettant de vous renvoyer les résultats de recherche sont les suivants :
- Exploration : connaissons-nous votre site ? Pouvons-nous le trouver ?
- Indexation : pouvons-nous indexer votre site ?
- Présentation : le site comporte-t-il du contenu utile et de qualité correspondant à la recherche de l'internaute ?
Exploration
Lors de l'exploration, le robot Googlebot recherche des pages mises à jour ou nouvelles à ajouter dans l'index Google.
Nous utilisons un nombre impressionnant d'ordinateurs pour extraire (ou explorer) des milliards de pages Web. Le programme qui gère cette extraction s'appelle Googlebot (également désigné par "robot" ou "robot d'indexation" ; "spider" en anglais). Googlebot utilise un processus d'exploration basé sur des algorithmes ; nos programmes informatiques déterminent les sites à explorer, la fréquence d'exploration et le nombre de pages à extraire de chaque site.
Le processus d'exploration de Google consiste dans un premier temps à établir une liste des URL de pages Web, générée à partir des explorations précédentes et auxquelles s'ajoutent les données sitemap fournies par les webmasters. Au cours des visites de ces sites Web, Googlebot détecte les liens figurant sur chacune des pages et les ajoute à sa liste des pages à explorer. Les nouveaux sites, les modifications de sites existants et les liens rompus sont répertoriés et utilisés pour mettre à jour l'index Google.
Google n'accepte aucun paiement pour explorer un site plus fréquemment et sépare distinctement toute activité consacrée à la recherche Google du service AdWords, qui génère des revenus.
Indexation
Googlebot traite chacune des pages explorées afin de compiler un index volumineux, répertoriant tous les termes rencontrés ainsi que leur emplacement sur chaque page. Nous traitons également les informations incluses dans les balises de contenu et les attributs principaux, notamment les balises Title et les attributs ALT. Googlebot peut traiter de nombreux types de contenus, mais pas tous. Par exemple, il lui est impossible d'analyser le contenu de fichiers rich media ou de pages dynamiques.
Présentation des résultats
Lorsqu'un internaute saisit une requête, nos ordinateurs recherchent les pages correspondantes dans l'index, et renvoient les résultats les plus pertinents selon nous. Pour déterminer la pertinence d'une page, plus de 200 facteurs sont pris en compte, l'un deux étant le classement PageRank. PageRank évalue l'importance d'une page en fonction des liens provenant d'autres sites et renvoyant à ladite page. En d'autres termes, tous les liens figurant sur d'autres sites et pointant vers l'une de vos pages sont pris en compte pour établir le classement PageRank de votre site. Tous les liens ne sont pas équivalents : Google s'efforce d'identifier les liens de spam et les autres pratiques nuisant à la qualité des résultats de recherche. Les meilleurs liens sont ceux obtenus grâce à la qualité de votre contenu.
Pour obtenir un bon classement dans les résultats de recherche, il est important que votre site soit correctement exploré et indexé par Google. Nos consignes aux webmasters répertorient quelques bonnes pratiques à appliquer pour éviter des erreurs courantes et améliorer le classement de votre site.
Les fonctionnalités Google telles que les suggestions orthographiques et la saisie semi-automatique ont été conçues pour faire gagner du temps aux internautes en affichant les termes associés à la recherche, les fautes d'orthographe courantes et les requêtes les plus populaires. À l'instar des résultats de recherche google.fr, les mots clés utilisés par ces fonctionnalités sont créés automatiquement par nos robots d'exploration et algorithmes de recherche. Ces prédictions ne s'affichent que lorsque nous pensons qu'elles peuvent faire gagner du temps à l'internaute. Si un site est bien classé pour un mot clé donné, cela signifie que nous avons déterminé, grâce à un algorithme, que son contenu est pertinent par rapport à la requête de l'internaute.
