Uproszczenie struktury URL-i

Struktura URL-i witryny powinna być jak najprostsza. Warto rozważyć uporządkowanie treści w taki sposób, by URL-e były logicznie skonstruowane i czytelne dla użytkowników (jeśli to możliwe, używaj zrozumiałych słów zamiast długich numerów identyfikacyjnych). Jeśli użytkownik szuka na przykład informacji o lotnictwie, URL w postaci http://pl.wikipedia.org/wiki/lotnictwo z pewnością pomoże zdecydować, czy warto kliknąć dany link. URL typu http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 będzie postrzegany jako znacznie mniej atrakcyjny.

Warto zastanowić się nad stosowaniem w URL-ach znaków przestankowych. Adres http://www.example.com/zielona-sukienka.html jest dla nas znacznie bardziej przydatny niż http://www.example.com/zielonasukienka.html. Zalecamy używanie w URL-ach myślników (-) zamiast podkreśleń (_).

Zbyt złożone URL-e, a szczególnie takie, które zawierają wiele parametrów, mogą sprawiać problemy robotom indeksującym ze względu na dużą liczbę URL-i odsyłających do takich samych lub podobnych treści witryny. W związku z tym Googlebot może zwiększać obciążenie łącza lub mieć problemy z indeksowaniem całej zawartości witryny.

Najczęstsze przyczyny tego problemu

Zbyt duża liczba URL-i może być wynikiem różnych sytuacji. Mogą to być na przykład:

  • Addytywne filtrowanie zbioru elementów. Wiele witryn wyświetla ten sam zbiór elementów lub wyników wyszukiwania na kilka różnych sposobów, pozwalając użytkownikowi filtrować wyświetlane elementy w zależności od wybranych kryteriów (na przykład: pokaż mi hotele na plaży). Jeśli witryna dopuszcza addytywne łączenie filtrów (przykład: hotele na plaży z centrum fitness), liczba URL-i (widoków danych) w witrynie rośnie lawinowo. Tworzenie dużej liczby nieznacznie zmodyfikowanych list hoteli jest niepotrzebne, ponieważ Googlebotowi wystarczy niewielka liczba list, na podstawie których będzie n w stanie dotrzeć do strony każdego hotelu. Na przykład:
    • Zwracanie listy wszystkich tanich hoteli:
      http://www.example.com/wyniki-wyszukiwania-hoteli.jsp?Ne=292&N=461
    • Zwracanie listy wszystkich tanich hoteli na plaży:
      http://www.example.com/wyniki-wyszukiwania-hoteli.jsp?Ne=292&N=461+4294967240
    • Zwracanie listy wszystkich tanich hoteli na plaży z centrum fitness:
      http://www.example.com/wyniki-wyszukiwania-hoteli.jsp?Ne=292&N=461+4294967240+4294967270

  • Dynamiczne generowanie dokumentów. Może to prowadzić do nieznacznych zmian treści dokumentów w zależności od stanu licznika, daty, godziny lub wyświetlanych reklam.

  • Problematyczne parametry w URL-ach. Identyfikatory sesji mogą na przykład prowadzić do tworzenia ogromnej liczby duplikatów stron i zwiększenia liczby URL-i.

  • Parametry sortowania. Witryny niektórych dużych sklepów internetowych pozwalają sortować te same towary na wiele sposobów, co prowadzi do powstania bardzo dużej liczby URL-i. Na przykład:
    http://www.example.com/wyniki?rodzaj_wyszukiwania=wyszukiwanie_plikow_wideo&zapytanie=tpb&sortowanie_wedlug=trafnosc
       &przeszukiwana_kategoria=25
  • Nieistotne parametry w URL-ach, określające na przykład, z jakiej witryny przychodzi dany internauta. Na przykład:
    http://www.example.com/szukaj/bez_naglowkow?klik=6EE2BF1AF6A3D705D5561B7C3564D9C2&stronaKlikniecia=
       OPDStrona+Produktu&kat=79
    http://www.example.com/dyskusja/watek.php?idstronywywolujacej=249406&idwatku=535913
    http://www.example.com/produkty/produkty.asp?N=200063&Ne=500955&ref=ecie%2Cpecie&Cn=Akcesoria.

  • Problemy związane z kalendarzem. Kalendarz generowany dynamicznie może zawierać linki do przyszłych i wcześniejszych dat bez żadnych ograniczeń. Na przykład:
    http://www.example.com/kalendarz.php?d=13&m=8&y=2011
    http://www.example.com/kalendarz/cgi?2008&miesiac=sty

  • Niedziałające linki względne. Niedziałające linki względne często powodują tworzenie nieskończenie dużej przestrzeni. Przyczyną tego problemu są często powtarzające się fragmenty ścieżek. Na przykład:
    http://www.example.com/index.shtml/dyskusja/kategoria/szkola/061121/html/wywiad/
      kategoria/zdrowie/070223/html/kategoria/biznes/070302/html/kategoria/spolecznosc/070413/html/FAQ.htm
Sposób rozwiązania problemu

Aby uniknąć potencjalnych problemów ze strukturą URL-i, zalecamy podjęcie poniższych działań:

  • Rozważ użycie pliku robots.txt, by zablokować dostęp Googlebota do problematycznych URL-i. Zazwyczaj blokuje się dynamiczne URL-e, takie jak adresy generujące wyniki wyszukiwania oraz adresy tworzące nieskończenie dużą przestrzeń do indeksowania, np. kalendarze. Użycie w pliku robots.txt wyrażeń regularnych pozwala łatwo zablokować dużą liczbę URL-i.

  • Gdy tylko jest to możliwe, unikaj stosowania identyfikatorów sesji w URL-ach. Rozważ zastąpienie ich plikami cookie. Więcej informacji znajdziesz we Wskazówkach dla webmasterów.

  • Gdy tylko jest to możliwe, skracaj URL-e, usuwając niepotrzebne parametry.

  • Jeśli w witrynie jest kalendarz z nieograniczonym zakresem dat, dodaj atrybut nofollow do linków prowadzących do dynamicznie tworzonych przyszłych stron kalendarza.

  • Sprawdź, czy w witrynie nie ma niedziałających linków względnych.
Czy to było pomocne?
Jak możemy ją poprawić?