Como a Pesquisa Google funciona

Saiba como o Google descobre, rastreia e veicula páginas da Web

Como o Google funciona? Descubra a seguir em uma versão curta e outra longa.

O Google reúne informações de muitos locais diferentes, incluindo: 

  • páginas da Web;
  • conteúdo enviado pelo usuário, como envios ao Google Meu Negócio e ao Google Maps;
  • livros digitalizados;
  • bancos de dados públicos na Internet;
  • e muitas outras fontes.

No entanto, esse conteúdo se concentra nas páginas da Web.

A versão curta

O Google segue três etapas básicas para gerar resultados a partir de páginas da Web:

Rastreamento

A primeira etapa é descobrir quais páginas existem na Web. Não há um registro central de todas as páginas da Web. Por isso, o Google precisa pesquisar constantemente novas páginas e adicioná-las à própria lista de páginas conhecidas. Esse processo de descoberta é chamado de rastreamento.

Algumas páginas são conhecidas porque já foram rastreadas pelo Google. Outras são descobertas quando o Google segue um link de uma página conhecida para uma nova. Além disso, algumas páginas são descobertas quando o proprietário de um site envia uma lista delas (um sitemap) para o Google rastrear. Com um host da Web gerenciado, como o Wix ou o Blogger, você pode solicitar ao Google que rastreie todas as suas páginas novas ou atualizadas.

Para melhorar o rastreamento do seu site:

  • em alterações em uma única página, você pode enviar um URL individual ao Google;
  • vincule sua página à outra que o Google já conhece. No entanto, é importante saber que os links em anúncios, em comentários e os que são pagos em um site diferente, bem como outros que não estejam em conformidade com as Diretrizes para webmasters do Google, não serão seguidos.

 

O Google não aceita pagamento para rastrear um site com mais frequência nem para atribuir a ele uma classificação mais alta. Se alguém disser a você algo diferente, essa informação estará errada.

Indexação

Depois que uma página é descoberta, o Google tenta identificar o conteúdo dela. Esse processo é chamado de indexação. O Google analisa o conteúdo da página, cataloga arquivos de imagens e vídeos incorporados e tenta identificar sobre o que ela trata. Essa informação fica registrada no índice do Google, um grande banco de dados armazenado em uma quantidade enorme de computadores.

Para melhorar a indexação da sua página:

  • crie títulos de páginas curtos e significativos;
  • use cabeçalhos que expressem o assunto da página;
  • use texto em vez de imagens para expressar o conteúdo publicado. O Google pode entender algumas imagens e vídeos, mas identifica melhor textos. Se for o caso, use anotações com um texto alternativo e outros atributos em vídeos e imagens, conforme apropriado.

Veiculação (e classificação)

Quando o usuário faz uma consulta, o Google tenta encontrar a resposta mais relevante no próprio índice com base em vários fatores. O Google tenta determinar as respostas mais adequadas e de qualidade mais alta, bem como avaliar outras considerações que fornecerão a melhor experiência do usuário. Para isso, leva em conta aspectos, como localização, idioma e dispositivo (computador ou smartphone). Por exemplo, em uma pesquisa por "oficinas de conserto de bicicletas", os resultados seriam diferentes para um usuário de Paris e outro de Hong Kong. O Google não aceita pagamento para atribuir aos sites uma classificação mais alta. A classificação é feita de maneira programática.

Para melhorar sua veiculação e classificação:

A versão longa

Quer mais informações? Veja o tópico a seguir.

A versão longa

 

Rastreamento

O rastreamento é o processo pelo qual o Googlebot descobre páginas novas e atualizadas para serem incluídas no índice do Google.

Nós usamos um grande conjunto de computadores para buscar (ou “rastrear”) bilhões de páginas na Web. O programa que faz a busca é chamado de Googlebot (também conhecido como robô, bot ou indexador). O Googlebot usa um processo de algoritmos: programas de computador que determinam quais sites devem ser rastreados, com que frequência e quantas páginas devem ser buscadas em cada site.

O processo de rastreamento do Google começa com uma lista de URLs de páginas da Web gerada a partir de processos anteriores de rastreamento e aumentada com dados do sitemap fornecidos por webmasters. Conforme o Googlebot visita cada um desses sites, ele detecta os links de cada página e os inclui na lista de páginas a serem rastreadas. Novos sites, alterações em sites existentes e links inativos serão detectados e usados para atualizar o índice do Google.

Como o Google encontra uma página?

O Google usa várias técnicas para encontrar uma página, como:

  • seguir links de outros sites ou páginas;
  • ler sitemaps.

Como o Google identifica quais páginas não devem ser rastreadas?

  • As páginas bloqueadas no robots.txt não serão rastreadas. No entanto, elas ainda poderão ser indexadas caso estejam vinculadas a outra página. O Google pode inferir o conteúdo da página usando um link que leva até ela e indexar a página sem analisar o que está publicado.
  • O Google não pode rastrear páginas indisponíveis a um usuário anônimo. Por isso, qualquer exigência de login ou outra proteção por autorização impedirá o rastreamento da página.

Como melhorar seu rastreamento

Use estas técnicas para ajudar o Google a descobrir as páginas corretas do seu site:

Indexação

O Googlebot processa todas as páginas que ele rastreia para compilar um imenso índice com todas as palavras encontradas e a localização de cada uma delas. Além disso, processamos informações incluídas nos principais atributos e tags de conteúdo, como tags <title> e atributos alternativos. O Googlebot pode processar muitos tipos de conteúdo, mas não todos. Por exemplo, não podemos processar o conteúdo de alguns arquivos rich media.

Páginas com uma diretiva noindex (título ou tag) não são rastreadas. No entanto, a diretiva deve ficar visível. Caso a página esteja bloqueada por um arquivo robots.txt, uma página de login ou outro dispositivo, talvez ela seja indexada, mesmo não tendo sido acessada pelo Google.

Como melhorar sua indexação

Existem muitas técnicas para melhorar a capacidade do Google de entender o conteúdo da sua página:

Resultados da veiculação

Quando um usuário faz uma consulta, nossas máquinas pesquisam o índice de páginas correspondentes e retornam os resultados mais relevantes para ele. A relevância é determinada por mais de 200 fatores, e trabalhamos de maneira contínua para melhorar nosso algoritmo. O Google considera a experiência do usuário na escolha e classificação dos resultados para garantir que a página tenha carregamento rápido e seja otimizada para dispositivos móveis.

Como melhorar sua veiculação

Uma versão ainda mais longa

Você pode encontrar uma versão ainda mais longa sobre como a Pesquisa Google funciona aqui, com fotos e vídeos.

Este artigo foi útil para você?
Como podemos melhorá-lo?