La struttura di URL di un sito deve essere il più semplice possibile. Puoi organizzare i tuoi contenuti facendo sì che gli URL siano strutturati in modo logico e intelligibile per gli utenti (se possibile, utilizza parole leggibili anziché numeri ID lunghi). Ad esempio, se cerchi informazioni sull'aviazione, un URL come http://it.wikipedia.org/wiki/Aviazione ti consentirà di decidere se fare clic o meno su quel link. Un URL come http://www.esempio.it/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 è molto meno interessante per gli utenti.
Negli URL utilizza la punteggiatura. L'URL http://www.esempio.it/abito-verde.html è molto più utile di http://www.esempio.it/abitoverde.html. Ti consigliamo di utilizzare i trattini (-) invece dei caratteri di sottolineatura (_) nell'URL.
Gli URL estremamente complessi, in particolare quelli contenenti più parametri, possono causare problemi ai crawler creando numeri eccessivamente elevati di URL che puntano a contenuti identici o simili sul tuo sito. Di conseguenza, Googlebot potrebbe utilizzare molta più larghezza di banda del necessario o non essere in grado di indicizzare completamente tutti i contenuti del sito.
Cause comuni del problemaUn numero molto elevato e ingiustificato di URL può avere molteplici cause. Tra queste, segnaliamo ad esempio:
- Filtri additivi di un gruppo di elementi Molti siti forniscono visualizzazioni diverse dello stesso gruppo di elementi o risultati di ricerca. Spesso, infatti, consentono all'utente di filtrare il gruppo in base a criteri definiti (ad esempio, mostrami hotel vicino alla spiaggia). Quando i filtri possono essere combinati in modo additivo (ad esempio, hotel vicino alla spiaggia e con centro fitness), il numero di URL (visualizzazioni dei dati) nel sito aumenta a dismisura. La creazione di un numero elevato di elenchi di hotel leggermente diversi è ridondante, in quanto Googlebot ha bisogno di vedere solo pochi elenchi per raggiungere la pagina di ciascun hotel. Ad esempio:
- Proprietà alberghiere a "tariffe vantaggiose":
http://www.esempio.it/hotel-risultati-ricerca.jsp?Ne=292&N=461
- Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia:
http://www.esempio.it/hotel-risultati-ricerca.jsp?Ne=292&N=461+4294967240
- Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia e con un centro fitness:
http://www.esempio.it/hotel-risultati-ricerca.jsp?Ne=292&N=461+4294967240+4294967270
- Proprietà alberghiere a "tariffe vantaggiose":
- Generazione dinamica dei documenti. Questa operazione può comportare leggere modifiche, a causa di contatori, orario o pubblicità.
- Parametri problematici nell'URL.Gli ID di sessione, ad esempio, possono creare enormi quantità di duplicati e un numero molto elevato di URL.
- Parametri di ordinamento.Alcuni siti di shopping di grandi dimensioni forniscono più modalità di ordinamento degli stessi elementi e ciò comporta un notevole aumento del numero di URL. Ad esempio:
http://www.esempio.it/risultati?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- Parametri irrilevanti nell'URL, tipo parametri di referral.Ad esempio:
http://www.esempio.it/ricerca/nointestazioni?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPagina=OPD+Prodotto+Pagina&cat=79
http://www.esempio.it/discussione/mostrathread.php?idreferrer=249406&threadid=535913
http://www.esempio.it/prodotti/prodotti.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessori.
- Problemi del calendario.Un calendario generato dinamicamente può creare link a date passate e future senza restrizioni sulle date di inizio e di fine. Ad esempio:
http://www.esempio.it/calendario.php?d=13&m=8&y=2011
http://www.esempio.it/calendario/cgi?2008&mese=gen
- Link relativi inaccessibili.I link relativi inaccessibili sono spesso causa di spazi infiniti. Questo problema si verifica soprattutto quando vi sono elementi del percorso ripetuti. Ad esempio:
http://www.esempio.it/index.shtml/discussione/categoria/scuola/061121/html/intervista/categoria/salute/070223/html/categoria/business/070302/html/categoria/community/070413/html/FAQ.htm
Per evitare potenziali problemi con la struttura degli URL, ti consigliamo di procedere nel seguente modo:
- Prendi in considerazione l'utilizzo di un file robots.txt per bloccare l'accesso di Googlebot a URL che presentano problemi. In genere, si tratta di bloccare gli URL dinamici, come quelli che generano i risultati di ricerca, o gli URL che possono creare spazi infiniti, come i calendari. L'utilizzo di espressioni regolari nel file robots.txt ti consente di bloccare facilmente un numero elevato di URL.
- Cerca di non utilizzare ID di sessione negli URL, ove possibile. Sostituiscili con i cookie. Consulta le nostre Istruzioni per i webmaster per ulteriori informazioni.
- Cerca di ridurre la lunghezza degli URL, se possibile, eliminando i parametri non necessari.
- Se il tuo sito include un calendario infinito, aggiungi un attributo "nofollow" ai link per creare dinamicamente le pagine future del calendario.
- Verifica l'eventuale presenza di link relativi inaccessibili nel sito.
