パラメータ化された重複コンテンツのクロールをブロックする

URL パラメータ ツールの使用条件と使い方

URL パラメータと重複コンテンツ

重要度の低いページのバリエーションに URL パラメータを使用したり(color=redcolor=green など)、異なる URL でも基本的に同じコンテンツを表示できるパラメータを使用したりしている場合(example.com/shirts?style=polo,long-sleeveexample.com/shirts?style=polo&style=long-sleeve)、Google のクロールの効率が落ちてしまうことがあります。

以下の URL の例では、相違点がパラメータのみのため、実質的に重複したコンテンツが表示されます。

URL 説明
https://example.com/products/women/dresses/green.html 静的な非パラメータ化ページ。
https://example.com/products/women?category=dresses&color=green URL に categorycolor というパラメータが含まれており、非パラメータ化ページと同じコンテンツが配信される。
https://example.com/products/women/dresses/green.html?limit=20&sessionid=123 URL に、結果の数を制限するパラメータと、ユーザーのセッション ID が含まれており、非パラメータ化ページと同じコンテンツが配信される。

サイトにこのような URL パラメータが数多く含まれている場合は、URL パラメータ ツールを使用することで重複 URL のクロールを軽減できる可能性があります。

重要: サイトでパラメータを使用せず、異なる URL に重複コンテンツを配信している場合は、このページで説明されているようにクロールをブロックするのではなく、正規ページを定義する必要があります。

特定のパラメータを含む URL のクロールをブロックする

重複ページのクロールを防ぐため、Google が、特定のパラメータ、または特定の値が含まれたパラメータを含む URL をクロールしないように設定できます。

要件

サイトが以下の要件をすべて満たしている場合にのみ、URL パラメータ ツールの使用をおすすめします。

  • サイトのページ数が 1,000 を超えていること、および
  • URL パラメータのみが異なる大量の重複ページ(たとえば: example.com?product=green_dressexample.com?type=dress&color=green)が Googlebot によってインデックス登録されているのがログに残っていること
不適切な使用に関する警告
 
サイトが上記の要件を満たしていて、SEO の経験が豊富である場合にのみ、URL パラメータ ツールの使用をおすすめします。URL パラメータ ツールの使い方が不適切な場合、Google がサイト上の重要なページを無視してしまうおそれがあります。さらに、無視されたページについて警告や通知をお届けすることはありません。このツールを不適切に使用したり、不必要に使用したりしている人が多いため、十分にご注意ください。このツールを正しく使用しているかどうかわからない場合は、ご利用にならないことをおすすめします。

使用方法

特定のパラメータを含むサイトをクロールする際の Google の動作を指定できます。パラメータに対する動作はプロパティ全体に適用されます。あるパラメータに対するクロール動作を特定の URL やサイトのブランチに限定することはできません。

URL パラメータ ツールを使用するには:

  1. サイトが上記の要件を満たしていることを確認します。
  2. URL パラメータ ツールを開きます
  3. 既存のパラメータを編集するか、[パラメータを追加] をクリックして新しいパラメータを作成します。このツールでは大文字と小文字が区別されます。URL に表示されているパラメータ名をそのまま入力してください。
  4. URL パラメータがページのコンテンツに影響するかどうかを指定します:
    • いいえ: ページのコンテンツには影響されない: このパラメータは、ページのコンテンツの見え方には影響しません。このタイプのパラメータは、ページの訪問数や参照 URL をトラッキングするために使用されることがありますが、ページのコンテンツそのものには影響しません。たとえば、sessionIDuserName などがあります。こうしたパラメータ値のみが異なる URL が数多く検出されると、Google はそのうちの 1 つの URL のみをクロールします。Google では、こうしたタイプのパラメータを検出しようとはしますが、ログからパッシブ パラメータが正しく識別されていないとわかっている場合は、ここで指定できます。
    • はい: ページのコンテンツが変更、並べ替え、絞り込みされる: パラメータによってページのコンテンツが変更されることがあります。たとえば、brandgendercountry、または sortorder などがあります。アクティブ パラメータを設定する際は、まずパラメータの目的を選択します。
      • 並べ替えsort=price_ascending など): コンテンツが表示される順序を変更します。
      • 絞り込みt-shirt_size=XS など): ページに表示されるコンテンツを絞り込みます。
      • 指定store=women など): ページに表示されるコンテンツの基本的なクラスを指定します。ここで具体的なアイテムを指定し、このコンテンツにアクセスする方法が他にない場合は、[すべての URL] を選択してください。
      • 翻訳lang=fr など): コンテンツの翻訳版を表示します。パラメータを使用して別の言語を表示する場合は、このツールを使ってコンテンツをブロックするのではなく、ページの言語バリエーションを示す hreflang を使用して、Google が翻訳版をクロールできるようにすることをおすすめします。
      • ページ指定page=2 など): 長いリストや記事内の特定のページを表示します。
         
      • このパラメータを含む URL のうち、Googlebot でクロールする URL を選択してください。 次に、このパラメータを含む URL をクロールするときの Google の動作を指定するオプションを選択します:
        • Googlebot に判断させる: 既知のパラメータでは、この項目がデフォルトで設定されています。パラメータの動作が不明な場合、またはサイトの部分によってパラメータの動作が変わる場合に選択します。Googlebot がサイトを解析して、パラメータの最適な処理方法を決定します。
        • すべての URL: このパラメータを含む URL をブロックしないよう Google に指示します。このパラメータに一意の値が設定されている URL には重複コンテンツがないと判断されます。たとえば、productid パラメータを含む URL にこのタイプの設定を実装した場合、http://www.example.com/dresses/real.htm?productid=1202938http://www.example.com/dresses/real.htm?productid=5853729 は、productid パラメータに異なる値が設定されているため、Google はまったく異なる URL であると自動的に判断します。
        • 値が指定されている URL のみ: URL パラメータが指定した値に設定されている URL のみをクロールするよう Google に指示します。パラメータ値が異なる URL はクロールされません。この設定は、同じ内容のコンテンツの表示順位を変えるためにパラメータ値を使用している場合に特に有用です。たとえば、http://www.example.com/dresses/real.htm?sort=price_highhttp://www.example.com/dresses/real.htm?sort=price_low に同じコンテンツがあるとします。その場合、この設定を使用して、sort=price_low となっている URL のみをクロールするよう Googlebot に指示し、重複コンテンツのクロールを防ぐことができます。
        • クロールしない: 特定のパラメータを含む URL をクロールしないよう Google に指示します。Google は指定されたパラメータを含む URL をクロールしません。たとえば、pricefrompriceto(例: http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5&pricefrom=10&priceto=1000)といったパラメータを含む URL をクロールしないよう Google に指示することで、すでに http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5 にある重複コンテンツの余分なクロールを防ぐことができます。
  5. URL に複数のパラメータを使用しているサイトについては、複数のパラメータを含む URL の管理についての記事をご覧ください。
  6. ルールは他のプロパティに継承されることがあります。詳しくは、「パラメータ ルールの継承」についての項目をご覧ください。

パラメータ ルールの継承

http と https とでプロパティが異なる場合、または親プロパティと子プロパティが異なる場合(たとえば example.com と example.com/fr/、または example.com と m.example.com など)は、パラメータの設定がプロパティ間で次のように継承されることがあります:

  • http / https: http または https のいずれかのプロパティにのみルールがある場合、そのルールは両方に適用されます。両方のプロパティで独自のルールが定義されている場合は、それぞれのルールのみが適用されます。
  • 親 / 子: 親プロパティ(example.com)にパラメータ ルールがある場合、パラメータ ルールを持たない子プロパティ(example.com/fr/)に親のルールが継承されます。子プロパティにパラメータ ルールがある場合は、そのルールのみが適用されます。サブドメイン(m.example.com)は親ドメイン(example.com)の子と見なされます。

複数のパラメータを含む URL の管理

1 つの URL に複数の URL パラメータが含まれている場合は、パラメータごとに別々にクロール設定を指定できます。1 つの URL に管理対象のパラメータが複数含まれている場合、Google は次のルールに基づいてその URL をクロールするかどうかを判断します。

条件が厳しいパラメータ設定を優先する。

たとえば、次のような 3 つの URL パラメータと、それぞれの Google クロール設定があるとします。

パラメータ パラメータのクロール設定
shopping-category このパラメータを含む URL をすべてクロールする
sort-by value = production-year の URL のみをクロールする
sort-order value = asc の URL のみをクロールする

 

例 1

http://www.example.com?shopping-category=shoes&sort-by=size&sort-order=asc

sort-by パラメータが production-year に設定されていないため、URL に有効な sort-order 値(asc)が含まれている場合でも、Google はこの URL をクロールしません。

例 2

http://www.example.com?shopping-category=DVD-movies&sort-by=production-year&sort-order=asc

sort-bysort-order 値が許可されている設定と一致するため、Google はこの URL をクロールできます。

例 3

http://www.example.com/shoes/33453

http://www.example.com?country=fr

上記の URL にはフラグが付けられたパラメータがないため、Google は両方の URL をクロールできます。

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。