URL パラメータと重複コンテンツ
重要度の低いページのバリエーションに URL パラメータを使用したり(color=red
と color=green
など)、異なる URL でも基本的に同じコンテンツを表示できるパラメータを使用したりしている場合(example.com/shirts?style=polo,long-sleeve
と example.com/shirts?style=polo&style=long-sleeve
)、Google のクロールの効率が落ちてしまうことがあります。
以下の URL の例では、相違点がパラメータのみのため、実質的に重複したコンテンツが表示されます。
URL | 説明 |
---|---|
https://example.com/products/women/dresses/green.html | 静的な非パラメータ化ページ。 |
https://example.com/products/women?category=dresses&color=green | URL に category と color というパラメータが含まれており、非パラメータ化ページと同じコンテンツが配信される。 |
https://example.com/products/women/dresses/green.html?limit=20&sessionid=123 | URL に、結果の数を制限するパラメータと、ユーザーのセッション ID が含まれており、非パラメータ化ページと同じコンテンツが配信される。 |
サイトにこのような URL パラメータが数多く含まれている場合は、URL パラメータ ツールを使用することで重複 URL のクロールを軽減できる可能性があります。
特定のパラメータを含む URL のクロールをブロックする
重複ページのクロールを防ぐため、Google が、特定のパラメータ、または特定の値が含まれたパラメータを含む URL をクロールしないように設定できます。
要件
サイトが以下の要件をすべて満たしている場合にのみ、URL パラメータ ツールの使用をおすすめします。
- サイトのページ数が 1,000 を超えていること、および
- URL パラメータのみが異なる大量の重複ページ(たとえば:
example.com?product=green_dress
とexample.com?type=dress&color=green
)が Googlebot によってインデックス登録されているのがログに残っていること
使用方法
特定のパラメータを含むサイトをクロールする際の Google の動作を指定できます。パラメータに対する動作はプロパティ全体に適用されます。あるパラメータに対するクロール動作を特定の URL やサイトのブランチに限定することはできません。
URL パラメータ ツールを使用するには:
- サイトが上記の要件を満たしていることを確認します。
- URL パラメータ ツールを開きます。
- 既存のパラメータを編集するか、[パラメータを追加] をクリックして新しいパラメータを作成します。このツールでは大文字と小文字が区別されます。URL に表示されているパラメータ名をそのまま入力してください。
- URL パラメータがページのコンテンツに影響するかどうかを指定します:
- いいえ: ページのコンテンツには影響されない: このパラメータは、ページのコンテンツの見え方には影響しません。このタイプのパラメータは、ページの訪問数や参照 URL をトラッキングするために使用されることがありますが、ページのコンテンツそのものには影響しません。たとえば、
sessionID
やuserName
などがあります。こうしたパラメータ値のみが異なる URL が数多く検出されると、Google はそのうちの 1 つの URL のみをクロールします。Google では、こうしたタイプのパラメータを検出しようとはしますが、ログからパッシブ パラメータが正しく識別されていないとわかっている場合は、ここで指定できます。 - はい: ページのコンテンツが変更、並べ替え、絞り込みされる: パラメータによってページのコンテンツが変更されることがあります。たとえば、
brand
、gender
、country
、またはsortorder
などがあります。アクティブ パラメータを設定する際は、まずパラメータの目的を選択します。- 並べ替え(
sort=price_ascending
など): コンテンツが表示される順序を変更します。 - 絞り込み(
t-shirt_size=XS
など): ページに表示されるコンテンツを絞り込みます。 - 指定(
store=women
など): ページに表示されるコンテンツの基本的なクラスを指定します。ここで具体的なアイテムを指定し、このコンテンツにアクセスする方法が他にない場合は、[すべての URL] を選択してください。 - 翻訳(
lang=fr
など): コンテンツの翻訳版を表示します。パラメータを使用して別の言語を表示する場合は、このツールを使ってコンテンツをブロックするのではなく、ページの言語バリエーションを示す hreflang を使用して、Google が翻訳版をクロールできるようにすることをおすすめします。 - ページ指定(
page=2
など): 長いリストや記事内の特定のページを表示します。
- このパラメータを含む URL のうち、Googlebot でクロールする URL を選択してください。 次に、このパラメータを含む URL をクロールするときの Google の動作を指定するオプションを選択します:
- Googlebot に判断させる: 既知のパラメータでは、この項目がデフォルトで設定されています。パラメータの動作が不明な場合、またはサイトの部分によってパラメータの動作が変わる場合に選択します。Googlebot がサイトを解析して、パラメータの最適な処理方法を決定します。
- すべての URL: このパラメータを含む URL をブロックしないよう Google に指示します。このパラメータに一意の値が設定されている URL には重複コンテンツがないと判断されます。たとえば、
productid
パラメータを含む URL にこのタイプの設定を実装した場合、http://www.example.com/dresses/real.htm?productid=1202938
とhttp://www.example.com/dresses/real.htm?productid=5853729
は、productid
パラメータに異なる値が設定されているため、Google はまったく異なる URL であると自動的に判断します。 - 値が指定されている URL のみ: URL パラメータが指定した値に設定されている URL のみをクロールするよう Google に指示します。パラメータ値が異なる URL はクロールされません。この設定は、同じ内容のコンテンツの表示順位を変えるためにパラメータ値を使用している場合に特に有用です。たとえば、
http://www.example.com/dresses/real.htm?sort=price_high
とhttp://www.example.com/dresses/real.htm?sort=price_low
に同じコンテンツがあるとします。その場合、この設定を使用して、sort=price_low
となっている URL のみをクロールするよう Googlebot に指示し、重複コンテンツのクロールを防ぐことができます。 - クロールしない: 特定のパラメータを含む URL をクロールしないよう Google に指示します。Google は指定されたパラメータを含む URL をクロールしません。たとえば、
pricefrom
やpriceto
(例:http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5&pricefrom=10&priceto=1000
)といったパラメータを含む URL をクロールしないよう Google に指示することで、すでにhttp://www.examples.com/search?category=shoe&brand=nike&color=red&size=5
にある重複コンテンツの余分なクロールを防ぐことができます。
- 並べ替え(
- いいえ: ページのコンテンツには影響されない: このパラメータは、ページのコンテンツの見え方には影響しません。このタイプのパラメータは、ページの訪問数や参照 URL をトラッキングするために使用されることがありますが、ページのコンテンツそのものには影響しません。たとえば、
- URL に複数のパラメータを使用しているサイトについては、複数のパラメータを含む URL の管理についての記事をご覧ください。
- ルールは他のプロパティに継承されることがあります。詳しくは、「パラメータ ルールの継承」についての項目をご覧ください。
パラメータ ルールの継承
http と https とでプロパティが異なる場合、または親プロパティと子プロパティが異なる場合(たとえば example.com と example.com/fr/、または example.com と m.example.com など)は、パラメータの設定がプロパティ間で次のように継承されることがあります:
- http / https: http または https のいずれかのプロパティにのみルールがある場合、そのルールは両方に適用されます。両方のプロパティで独自のルールが定義されている場合は、それぞれのルールのみが適用されます。
- 親 / 子: 親プロパティ(example.com)にパラメータ ルールがある場合、パラメータ ルールを持たない子プロパティ(example.com/fr/)に親のルールが継承されます。子プロパティにパラメータ ルールがある場合は、そのルールのみが適用されます。サブドメイン(m.example.com)は親ドメイン(example.com)の子と見なされます。
複数のパラメータを含む URL の管理
1 つの URL に複数の URL パラメータが含まれている場合は、パラメータごとに別々にクロール設定を指定できます。1 つの URL に管理対象のパラメータが複数含まれている場合、Google は次のルールに基づいてその URL をクロールするかどうかを判断します。
条件が厳しいパラメータ設定を優先する。
たとえば、次のような 3 つの URL パラメータと、それぞれの Google クロール設定があるとします。
パラメータ | パラメータのクロール設定 |
---|---|
shopping-category |
このパラメータを含む URL をすべてクロールする |
sort-by |
value = production-year の URL のみをクロールする |
sort-order |
value = asc の URL のみをクロールする |
例 1
http://www.example.com?shopping-category=shoes&sort-by=size&sort-order=asc
sort-by
パラメータが production-year
に設定されていないため、URL に有効な sort-order
値(asc
)が含まれている場合でも、Google はこの URL をクロールしません。
例 2
http://www.example.com?shopping-category=DVD-movies&sort-by=production-year&sort-order=asc
sort-by
と sort-order
値が許可されている設定と一致するため、Google はこの URL をクロールできます。
例 3
http://www.example.com/shoes/33453
http://www.example.com?country=fr
上記の URL にはフラグが付けられたパラメータがないため、Google は両方の URL をクロールできます。