Semplifica il più possibile la struttura degli URL

La struttura di URL di un sito deve essere il più semplice possibile. Puoi organizzare i tuoi contenuti in modo tale che gli URL siano strutturati in modo logico e intellegibile per gli utenti (se possibile, utilizza parole significative anziché lunghi ID). Ad esempio, se cerchi informazioni sull'aviazione, un URL come http://it.wikipedia.org/wiki/Aviazione ti consentirà di decidere se fare clic o meno su quel link. Un URL come http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 è molto meno interessante per gli utenti.

Negli URL utilizza la punteggiatura. L'URL http://www.example.com/green-dress.html è molto più utile di http://www.example.com/greendress.html. Ti consigliamo di utilizzare i trattini (-) invece dei caratteri di sottolineatura (_) negli URL.

Gli URL estremamente complessi, in particolare quelli contenenti più parametri, possono causare problemi ai crawler creando numeri eccessivamente elevati di URL che puntano a contenuti identici o simili sul tuo sito. Di conseguenza, Googlebot potrebbe utilizzare molta più larghezza di banda del necessario o non essere in grado di indicizzare completamente tutti i contenuti del sito.

Cause comuni del problema

Un numero molto elevato e ingiustificato di URL può avere molteplici cause. Queste includono:

  • Filtri additivi di un gruppo di elementi. Molti siti forniscono visualizzazioni diverse dello stesso gruppo di elementi o risultati di ricerca. Spesso, infatti, consentono all'utente di filtrare il gruppo in base a criteri definiti (ad esempio, mostrami hotel vicino alla spiaggia). Quando i filtri possono essere combinati per addizione (ad esempio: hotel vicino alla spiaggia e con centro fitness), il numero di URL (visualizzazioni di dati) nei siti aumenta a dismisura. La creazione di un numero elevato di elenchi di hotel leggermente diversi è ridondante, in quanto Googlebot ha bisogno di vedere solo pochi elenchi per raggiungere la pagina di ciascun hotel. Ad esempio:
    • Proprietà alberghiere a "tariffe vantaggiose":
      http://www.example.com/risultati-ricerca-hotel.jsp?Ne=292&N=461
    • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia:
      http://www.example.com/risultati-ricerca-hotel.jsp?Ne=292&N=461+4294967240
    • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia e con un centro fitness:
      http://www.example.com/risultati-ricerca-hotel.jsp?Ne=292&N=461+4294967240+4294967270

  • Generazione dinamica di documenti. Questa operazione può comportare leggere modifiche, a causa di contatori, orario o pubblicità.

  • Parametri problematici nell'URL. Gli ID sessione, ad esempio, possono creare enormi quantità di duplicati e un numero molto elevato di URL.

  • Parametri di ordinamento. Alcuni siti di shopping di grandi dimensioni forniscono più modalità di ordinamento degli stessi articoli e ciò comporta un notevole aumento del numero di URL. Ad esempio:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
       &search_category=25
  • Parametri irrilevanti nell'URL, come parametri di referral. Ad esempio:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
       OPD+Product+Page&cat=79
    http://www.example.com/discussione/mostrathread.php?referrerid=249406&threadid=535913
    http://www.example.com/prodotti/prodotti.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessori.

  • Problemi del calendario. Un calendario generato dinamicamente può creare link a date passate e future senza restrizioni sulle date di inizio e di fine. Ad esempio:
    http://www.example.com/calendario.php?d=13&m=8&y=2011
    http://www.example.com/calendario/cgi?2008&month=gen

  • Link relativi inaccessibili. I link relativi inaccessibili sono spesso causa di spazi infiniti. Questo problema si verifica soprattutto quando vi sono elementi del percorso ripetuti. Ad esempio:
    http://www.example.com/index.shtml/discussione/categoria/scuola/061121/html/intervista/
      categoria/salute/070223/html/categoria/business/070302/html/categoria/community/070413/html/FAQ.htm



  •  
  •  
Procedura per risolvere il problema

Per evitare potenziali problemi con la struttura degli URL, ti consigliamo di procedere nel seguente modo:

  • Valuta l'utilizzo di un file robots.txt per bloccare l'accesso di Googlebot a URL che presentano problemi. In genere, si tratta di bloccare gli URL dinamici, come quelli che generano i risultati di ricerca, o gli URL che possono creare spazi infiniti, come i calendari. L'utilizzo di espressioni regolari nel file robots.txt ti consente di bloccare facilmente un numero elevato di URL.

  • Cerca di non utilizzare ID sessione negli URL, ove possibile. Sostituiscili con i cookie. Consulta le nostre Istruzioni per i webmaster per ulteriori informazioni.

  • Cerca di ridurre la lunghezza degli URL, se possibile, eliminando i parametri non necessari.

  • Se il tuo sito include un calendario infinito, aggiungi un attributo nofollow ai link alle pagine future del calendario create in modo dinamico.

  • Verifica l'eventuale presenza di link relativi inaccessibili nel sito.