Consolidare URL duplicati

Definire una pagina canonica per pagine simili o duplicate

Riepilogo

Se sul tuo sito è presente una singola pagina accessibile da più URL o sono presenti diverse pagine con contenuti simili (ad esempio, una pagina con una versione per dispositivi mobili e una per computer desktop), devi indicare espressamente a Google quale URL è da considerarsi rilevante (canonico) per la pagina. Se non indichi espressamente l'URL canonico, Google ne sceglierà uno al posto tuo o li considererà entrambi dello stesso peso, con possibili comportamenti indesiderati, come illustrato nella sezione successiva.

Tieni presente che, nonostante ti sia consigliato di designare una pagina canonica per le versioni o gli URL duplicati, Google potrebbe, in base all'algoritmo, scegliere un'altra pagina come canonica per diversi motivi, tra cui rendimento e contenuti.

Perché il mio sito dovrebbe includere pagine duplicate o con contenuti simili?

Esistono motivi validi per cui un sito può avere URL diversi che indirizzano a una stessa pagina oppure pagine duplicate o molto simili che indirizzano a URL diversi. Ecco i più comuni:

  • Per supportare più tipi di dispositivi:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • Per attivare gli URL dinamici per elementi come parametri di ricerca o ID di sessione:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • Se il sistema del blog salva automaticamente più URL quando viene inserito uno stesso post in più sezioni:
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • Se il server è configurato per pubblicare gli stessi contenuti per le varianti www/non www e/o http/https:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • Se i contenuti proposti in un blog da distribuire in syndication su altri siti vengono copiati in parte o per intero su tali domini:
    https://news.example.com/green-dresses-for-every-day-155672.html (post in syndication) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (post originale)
Maggiori dettagli
Questa sezione fornisce informazioni dettagliate sul concetto di canonicalizzazione che potresti non ritenere essenziali. In questo caso, sentiti libero di saltare la sezione; se invece ti interessa approfondire l'argomento, continua a leggere.
Quando indicizza un sito, Googlebot prova a identificare gli argomenti trattati in ciascuna pagina. Se trova più pagine su uno stesso sito che all'apparenza riguardano uno stesso argomento, Googlebot sceglie la pagina che considera più completa e utile, contrassegnandola come canonica. La pagina canonica viene sottoposta a scansione con maggiore regolarità rispetto alle pagine duplicate, che vengono sottoposte a scansione meno frequentemente per risparmiare sul budget di scansione del sito. Quindi, se non comunichi a Googlebot la pagina canonica e, nel frattempo, decidi di utilizzarne un'altra, potresti sprecare tempo aggiornando una pagina che Googlebot non indicizzerà molto spesso né restituirà nei risultati di ricerca.
Per quel che concerne la valutazione di contenuti e qualità, Google utilizza le pagine canoniche come punto di riferimento assoluto per i contenuti del tuo sito e il risultato della Ricerca Google indirizzerà sempre alla pagina canonica, a meno che una delle pagine duplicate sia espressamente più adatta alla query dell'utente: ad esempio, il risultato di ricerca potrebbe indirizzare a una pagina per dispositivi mobili se l'utente utilizza un dispositivo di questo tipo, anche se la pagina canonica designata è quella per computer desktop.
Google sceglie la pagina canonica in base a vari fattori (o segnali) come, ad esempio, la pubblicazione o meno della pagina attraverso http o https, il dominio preferito dichiarato dall'utente, la qualità della pagina, la presenza dell'URL in una Sitemap e qualsiasi etichettatura di tipo "rel=canonical". Non puoi forzare Google a scegliere una particolare pagina canonica, tuttavia puoi influenzarne la decisione utilizzando una o più delle tecniche illustrate in questo articolo.

Perché è importante scegliere una pagina canonica

Esistono diversi motivi per cui conviene scegliere espressamente una pagina canonica in un insieme di pagine duplicate o simili:

  • Per specificare l'URL da mostrare nei risultati di ricerca. Potresti preferire che gli utenti raggiungano la tua pagina sugli abiti in verde tramite https://www.example.com/dresses/green/greendress.html anziché https://example.com/dresses/cocktail?gclid=ABCD.
  • Per consolidare i segnali associati ai link per pagine simili o duplicate. Consente ai motori di ricerca di consolidare le informazioni in loro possesso in merito ai singoli URL (ad esempio, link che rimandano a tali URL) in un unico URL preferito. Ciò significa che i link presenti in altri siti che rimandano a http://example.com/dresses/cocktail?gclid=ABCD vengono consolidati con i link che rimandano a https://www.example.com/dresses/green/greendress.html.
  • Per semplificare il monitoraggio delle metriche relative a un singolo prodotto/argomento. La presenza di URL diversi rende più complicato ricevere metriche consolidate per un contenuto specifico.
  • Per gestire i contenuti distribuiti in syndication. Se distribuisci in syndication i contenuti per pubblicarli su altri domini, ti conviene consolidare il ranking delle pagine con il tuo URL preferito.
  • Per evitare di dedicare tempo alla scansione di pagine duplicate. Per ottimizzare la scansione del sito, è preferibile che Googlebot sottoponga a scansione pagine nuove (o aggiornate), anziché le versioni per computer desktop e per dispositivi mobili di una stessa pagina.

URL considerati canonici (o duplicati) da Google

Utilizza il rapporto Stato dell'indicizzazione per stabilire quali URL sono considerati canonici e quali duplicati. Le pagine duplicate verranno contrassegnate come escluse, mentre le pagine canoniche verranno contrassegnate come valide.

Cerca gli URL validi contraddistinti da "Indicizzata; potresti contrassegnarla come canonica" per determinare quali pagine indicare espressamente come canoniche.

Cerca gli URL esclusi contraddistinti da "Google ha scelto una pagina canonica diversa da quella specificata dall'utente" per determinare, nell'insieme di pagine, quali siano quelle scelte come canoniche da Google e non da te.

Designare una pagina canonica

Esistono diversi modi per designare la pagina canonica in un insieme di pagine duplicate, in base all'utilizzo:

Metodo Descrizione
Linee guida generali Segui queste linee guida per tutti i metodi di canonicalizzazione.
Designare un dominio preferito

Utilizza Search Console per designare come canonici gli URL su un dominio rispetto alle rispettive controparti su un altro dominio. Ad esempio, example.com al posto di www.example.com. Utilizza questo metodo solo quando sono presenti due siti simili che differiscono solo in base al sottodominio. Non utilizzarlo per siti di controparte del tipo http/https.

Pro:

  • Molto facile da implementare, gestire e modificare.
  • Utile se disponi di siti identici su domini diversi.

Contro:

  • Funziona solo a livello granulare del dominio e le pagine devono avere percorsi e nomi identici per essere considerate duplicate.
  • Consente solo un'unica mappatura da pagina a pagina per pagine con lo stesso percorso.
Tag <link> rel=canonical

Aggiungi nel codice per tutte le pagine duplicate un tag <link> che indirizza alla pagina canonica.

Pro:

  • Può mappare un numero infinito di pagine duplicate.

Contro:

  • Può aumentare la dimensione della pagina.
  • Può complicare la gestione della mappatura su siti di grandi dimensioni o siti in cui gli URL subiscono frequenti modifiche.
  • Funziona solo per le pagine HTML, non per i file (ad es., i PDF). In tali circostanze, puoi utilizzare l'intestazione HTTP rel=canonical.
Intestazione HTTP rel=canonical

Invia un'intestazione rel=canonical nella pagina di risposta.

Pro:

  • Non aumenta la dimensione della pagina.
  • Può mappare un numero infinito di pagine duplicate.

Contro:

  • Può complicare la gestione della mappatura su siti di grandi dimensioni o siti in cui gli URL subiscono frequenti modifiche.
Sitemap

Designa le pagine canoniche in una Sitemap.

Pro:

  • Facile da implementare e gestire, soprattutto su siti di grandi dimensioni.

Contro:

  • Googlebot deve sempre comunque identificare le pagine duplicate per tutte le pagine canoniche dichiarate nella Sitemap.
  • Segnalazione meno efficace per Googlebot rispetto alla tecnica di mappatura con rel=canonical.
Reindirizzamento 301 Utilizza i reindirizzamenti 301 per indicare a Googlebot che un URL reindirizzato è una versione migliore dell'URL prestabilito. Adotta questo metodo solo quando rendi obsoleta una pagina duplicata.
Variante AMP Se una delle varianti è una pagina AMP, è necessario seguire le linee guida delle pagine AMP per designare la pagina canonica e la variante AMP.

 

Ti invitiamo a utilizzare uno di questi metodi, anche se nessuno è obbligatorio. Se non indichi un URL canonico, provvederemo a identificare quello che a nostro parere è la versione migliore.

Linee guida generali

Per tutti i metodi di canonicalizzazione, attieniti alle seguenti linee guida generali.

Linee guida generali
  • Non utilizzare il file robots.txt per la canonicalizzazione.
  • Non utilizzare lo strumento per la rimozione di URL per la canonicalizzazione perché rimuove tutte le versioni di un URL dalla ricerca.
  • Non designare URL diversi come canonici per una stessa pagina (ad esempio, un URL in una Sitemap e un altro URL per la stessa pagina utilizzando rel="canonical").
  • Non utilizzare noindex per impedire la selezione di una pagina canonica. Questa istruzione ha lo scopo di escludere la pagina dall'indice, non di gestire la scelta di una pagina canonica. 
  • Non designare una pagina canonica utilizzando i tag hreflang. Designa una pagina canonica in una stessa lingua o nella migliore lingua sostitutiva, qualora non esista una pagina canonica per la stessa lingua.

Preferire HTTPS a HTTP per gli URL canonici

Per le pagine canoniche, Google preferisce le pagine HTTPS alle pagine HTTP equivalenti, ad eccezione dei casi in cui esistano problemi o segnali contrastanti come i seguenti:

  • Il certificato SSL della pagina HTTPS non è valido.
  • La pagina HTTPS contiene dipendenze non protette (oltre alle immagini).
  • La pagina HTTPS reindirizza gli utenti a o tramite una pagina HTTP.
  • La pagina HTTPS contiene un link rel="canonical" alla pagina HTTP.

Anche se i nostri sistemi preferiscono, per impostazione predefinita, le pagine HTTPS alle pagine HTTP, puoi assicurarti che venga applicata tale preferenza svolgendo una delle seguenti azioni:

  • Aggiungi reindirizzamenti dalla pagina HTTP alla pagina HTTPS.
  • Aggiungi un link rel="canonical" che rimanda dalla pagina HTTP alla pagina HTTPS.
  • Implementa HSTS.

Per evitare che Google imposti erroneamente come canonica la pagina HTTP, ti conviene evitare le seguenti prassi:

  • I certificati SSL non validi e i reindirizzamenti da HTTPS a HTTP ci portano a preferire HTTP. L'implementazione di HSTS non può sostituire questa forte preferenza.
  • L'inserimento nella Sitemap o in voci hreflang della pagina HTTP anziché della versione HTTPS.
  • L'implementazione del certificato SSL/TLS per la variante host sbagliata: ad esempio, example.com che fornisce il certificato per www.example.com.  Il certificato deve corrispondere all'URL del sito completo oppure essere un certificato con caratteri jolly che sia possibile utilizzare per diversi sottodomini di un dominio.

Chiedere a Google di ignorare i parametri dinamici

Utilizza Gestione parametri per segnalare a Googlebot eventuali parametri da ignorare durante la scansione. Se ignori alcuni parametri puoi ridurre i contenuti duplicati nell'indice di Google e semplificare la scansione del sito. Ad esempio, se indichi di ignorare il parametro sessionid, Googlebot considererà i seguenti due URL duplicati:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

Metodi specifici

Scegli uno dei seguenti metodi per designare un URL canonico per URL duplicati o pagine duplicate/simili.

Segui le linee guida generali illustrate precedentemente per tutti i metodi.

Impostare un dominio preferito

Utilizza Search Console per segnalare a Google la versione dell'URL del sito da designare come canonica per il dominio:

  • https://www.example.com
  • https://example.com

Se imposti come dominio preferito https://example.com, Google tratterà URL o pagine simili su www.example.com come duplicati di pagine su example.com.

Per informazioni dettagliate, leggi l'articolo Impostare il dominio preferito.

Utilizzare il tag link rel="canonical"

Puoi utilizzare un tag <link> nell'intestazione della pagina per segnalare quando una pagina è un duplicato di un'altra.

Ipotizza di volere designare https://example.com/dresses/green-dresses come URL canonico, anche se questi contenuti sono accessibili da diversi URL. Designa questo URL come canonico, procedendo nel seguente modo:

  1. Contrassegna tutte le pagine duplicate con un elemento link rel="canonical". Aggiungi un elemento <link> con l'attributo rel="canonical" alla sezione <head> delle pagine duplicate, indirizzando a una pagina canonica come la seguente:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. Se la pagina canonica è associata a una variante per dispositivi mobili, aggiungi un link rel="alternate", indirizzando alla versione per dispositivi mobili della pagina:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. Aggiungi eventuali tag hreflang o altri reindirizzamenti appropriati per la pagina.

Utilizza percorsi assoluti, anziché percorsi relativi con l'elemento link rel="canonical".

Utilizza questa struttura: https://www.example.com/dresses/green/greendresss.html
Non questa struttura: /dresses/green/greendress.html
Utilizzare l'intestazione HTTP rel="canonical"

Se puoi configurare il tuo server, puoi utilizzare le intestazioni HTTP rel="canonical" (al posto dei tag HTML) per designare l'URL canonico per i documenti non HTML, come i file PDF.

Ad esempio, se mostri un file PDF attraverso più URL, puoi restituire un'intestazione HTTP rel="canonical" come la seguente per gli URL duplicati per indicare a Googlebot quale sia l'URL canonico per il file PDF:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

Al momento, Google supporta questo metodo solo per i risultati di Ricerca Google.

Utilizza percorsi assoluti, anziché percorsi relativi con l'elemento link rel="canonical". Vale a dire:
Utilizza questa struttura: http://www.example.com/downloads/white-paper.pdf
Non questa struttura: /downloads/white-paper.pdf
Utilizzare una Sitemap

Scegli un URL canonico per ognuna delle tue pagine e inviali in una Sitemap. Tutte le pagine elencate in una Sitemap vengono suggerite come canoniche, ma sarà Googlebot a decidere quali, se presenti, siano duplicate, in base alla somiglianza dei contenuti.

Google non garantisce che considererà gli URL della Sitemap come canonici, ma è comunque un metodo semplice per definire URL canonici per siti di grandi dimensioni. Inoltre, le Sitemap sono utili per segnalare a Google quali pagine reputi più importanti sul tuo sito.

Non includere pagine non canoniche in una Sitemap. Se utilizzi una Sitemap, inserisci solo URL canonici.

Utilizzare i reindirizzamenti 301 per URL ritirati

Utilizza questo metodo se vuoi eliminare pagine duplicate esistenti, ma devi garantire una transizione graduale prima dell'effettivo ritiro di URL obsoleti.

Supponiamo che sia possibile accedere alla tua pagina in diversi modi:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Scegli uno di questi URL come URL canonico e utilizza i reindirizzamenti 301 per inviare il traffico dagli altri URL all'URL preferito. Un reindirizzamento 301 lato server è il modo migliore per assicurarsi che utenti e motori di ricerca siano indirizzati alla pagina corretta. Il codice di stato 301 indica che una pagina è stata spostata definitivamente in una nuova posizione.

Hai trovato utile questo articolo?
Come possiamo migliorare l'articolo?