Jak działa wyszukiwarka Google

Jak Google znajduje, indeksuje i wyświetla strony internetowe

Chcesz się dowiedzieć, jak działa Google? Poniżej znajdziesz krótkie wyjaśnienie, a dalej długi opis.

Google uzyskuje informacje z wielu różnych źródeł. Są to: 

  • strony internetowe,
  • treści przesłane przez użytkowników do Google Moja Firma i Map,
  • skany książek,
  • publiczne bazy danych w internecie
  • i wiele innych.

Tu omawiamy strony internetowe.

Krótka wersja

Tworzenie wyników wyszukiwania ze stron internetowych składa się z trzech etapów:

Skanowanie

Pierwszy krok to zdobycie informacji o tym, jakie strony istnieją w internecie. Nie ma centralnego rejestru wszystkich stron internetowych, dlatego Google musi nieustannie szukać nowych stron i dodawać je do listy tych, które są już znane. Taki proces nazywa się skanowaniem.

Niektóre strony są już znane, bo Google udało się zindeksować je wcześniej. O istnieniu nowych stron Google dowiaduje się, śledząc linki ze znanych stron. Inne strony udaje się znaleźć dzięki listom stron (mapom witryn) przesłanym przez właścicieli witryn. Jeśli korzystasz z zarządzanego dostawcy hostingu witryn, takiego jak Wix czy Blogger, może on przekazywać Google informacje o potrzebie zeskanowania zaktualizowanych lub nowych, utworzonych przez Ciebie stron.

Aby skanowanie Twoich stron działało możliwie najlepiej:

 

Google nie przyjmuje opłat za częstsze skanowanie stron ani poprawę ich pozycji w rankingu. Jeśli ktoś twierdzi inaczej, po prostu się myli.

Indeksowanie

Po znalezieniu strony Google stara się rozpoznać jej tematykę. Taki proces nazywa się indeksowaniem. Google analizuje treści na stronie, kataloguje jej obrazy i filmy i próbuje zrozumieć, o czym ona jest. Takie informacje są przechowywane w indeksie Google, czyli w olbrzymiej bazie danych zapisanej na bardzo wielu komputerach.

Aby usprawnić indeksowanie swojej witryny:

  • Twórz krótkie, zrozumiałe tytuły stron.
  • Używaj nagłówków stron, które wskazują ich temat.
  • Staraj się przekazywać treść za pomocą tekstu, a nie obrazów. Co prawda Google potrafi rozpoznawać niektóre obrazy i filmy, ale nie tak dobrze jak tekst. Staraj się, by filmyobrazy miały co najmniej tekst zastępczy i w razie potrzeby inne atrybuty.

Wyświetlanie wyników (i pozycja w rankingu)

Gdy użytkownik wpisze zapytanie, Google stara się znaleźć najbardziej trafną odpowiedź, sprawdzając swój indeks i biorąc przy tym pod uwagę wiele czynników. Google stara się wybrać odpowiedzi o najwyższej jakości, czyli uwzględnia wiele czynników, które pomagają określić największą przydatność danej odpowiedzi dla użytkownika, np. lokalizację, język czy typ urządzenia (komputer lub telefon). Dzięki temu zapytanie „naprawa rowerów” powoduje wyświetlenie innych wyników użytkownikowi w Warszawie niż w Hongkongu. Google nie przyjmuje opłat, by umieszczać strony wyżej w rankingu. Określanie pozycji w rankingu odbywa się automatycznie.

Aby strona częściej pojawiała się w wynikach wyszukiwania i miała lepszą pozycję w rankingu:

Długa wersja

Chcesz dowiedzieć się więcej? Czytaj dalej:

Długa wersja

 

Skanowanie

Skanowanie to proces, podczas którego Googlebot wykrywa nowe i zaktualizowane strony, by dodać je do indeksu Google.

Do skanowania („pobierania”) miliardów stron internetowych używamy ogromnej liczby komputerów. Aplikacją odpowiedzialną za te czynności jest Googlebot (zwany także robotem, botem lub pająkiem). Googlebot stosuje proces algorytmiczny: programy komputerowe decydują o tym, które witryny są skanowane, jak często ma się to odbywać oraz ile stron ma być pobieranych z każdej witryny.

Proces skanowania z indeksowaniem rozpoczyna się od listy URL-i stron internetowych wygenerowanej na podstawie wcześniejszych wyników i zmodyfikowanej przy użyciu danych pochodzących z map witryn dostarczanych przez webmasterów. Gdy Googlebot odwiedza te witryny, wykrywa linki na poszczególnych stronach i dodaje je do listy stron do zindeksowania. Nowe witryny, zmiany w istniejących witrynach oraz nieaktualne linki są rejestrowane i informacje te służą do aktualizacji indeksu Google.

Jak Google znajduje strony?

Google korzysta z wielu metod, w tym:

  • otwiera linki w witrynach lub na stronach,
  • odczytuje mapy witryn.

Skąd Google wie, jakich stron nie skanować?

  • Strony zawarte w plikach robots.txt nie są skanowane, ale mogą zostać zindeksowane, jeśli prowadzą do nich linki z innych stron. Google może wywnioskować zawartość strony na podstawie prowadzącego do niej linku i zindeksować ją bez analizowania jej treści.
  • Google nie skanuje stron, których nie może otworzyć anonimowy użytkownik. Sprawia to, że strony zabezpieczone procesem uwierzytelniania lub logowania nie są skanowane.

Usprawnianie skanowania stron

Aby pomóc Google w znajdowaniu odpowiednich stron w Twojej witrynie, stosuj te metody:

Indeksowanie

Googlebot przetwarza każdą z zeskanowanych stron, tworząc olbrzymi indeks wszystkich występujących na nich słów i ich umiejscowienia na tych stronach. Dodatkowo przetwarza informacje zawarte w tagach zawierających słowa kluczowe i atrybutach, takich jak tagi <title> i atrybuty alt. Googlebot może przetwarzać wiele rodzajów treści, choć nie wszystkie. Na przykład nie może przetwarzać niektórych plików multimedialnych.

Zwróć uwagę, że Googlebot nie indeksuje stron z dyrektywą noindex (w nagłówku lub tagu). Jednak dyrektywa ta musi być dla niego widoczna – jeśli strona jest blokowana przy użyciu pliku robots.txt, strony logowania lub urządzenia, może zostać zindeksowana, nawet jeśli bot jej nie odwiedzi.

Usprawnianie indeksowania stron

Jest wiele metod, które pomagają Google rozpoznać treści na stronie:

Wyświetlanie wyników

Gdy użytkownik wpisuje zapytanie, nasze komputery wyszukują w indeksie pasujące strony, a następnie zwracają wyniki uznane za najtrafniejsze. Trafność jest określana na podstawie ponad 200 czynników – nieustannie pracujemy nad ulepszeniem naszych algorytmów. Wybierając wyniki i ustalając ich pozycję w rankingu, Google bierze pod uwagę przede wszystkim ich przydatność dla użytkownika, dlatego postaraj się, by Twoja strona szybko się ładowała i była zoptymalizowana pod kątem urządzeń mobilnych.

Usprawnianie wyświetlania stron

  • Jeśli Twoja strona jest przeznaczona dla użytkowników w określonych lokalizacjach lub używających konkretnych języków, powiadom Google o swoich ustawieniach.
  • Upewnij się, że Twoja strona szybko się ładuje i jest zoptymalizowana pod kątem urządzeń mobilnych.
  • Przestrzegaj wskazówek dla webmasterów, by uniknąć typowych błędów i poprawić pozycję witryny w rankingu.
  • Rozważ dodanie funkcji wyników wyszukiwania, np. z kartami zawierającymi przepisy lub artykuły.
  • Stosuj standard AMP, by strony ładowały się szybciej na urządzeniach mobilnych. Niektóre strony AMP mogą też być używane w dodatkowych funkcjach wyszukiwania, np. w karuzeli najważniejszych artykułów.
  • Algorytm Google podlega ciągłym usprawnieniom, dlatego nie zalecamy prób rozszyfrowywania go ani dostosowywania do niego stron. Po prostu skup się na tworzeniu treści, które będą miały wysoką jakość i będą przydatne dla użytkowników. Przestrzegaj też wskazówek dla webmasterów.

Jeszcze dłuższa wersja

Wersja zawierająca jeszcze więcej informacji o działaniu wyszukiwarki Google jest tutaj (znajdziesz tam też obrazy i filmy).

Czy ten artykuł był pomocny?
Jak możemy ją poprawić?