検索
検索をクリア
検索終了
Google アプリ
メインメニュー

重複するコンテンツ

一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。多くの場合、偽装を意図したものではありません。悪意のない重複するコンテンツの例には、以下のものがあります。

  • 通常ページと携帯デバイス用の簡易ページの両方を生成するディスカッション フォーラム
  • 複数の異なる URL で表示またはリンクされる商品ページ
  • ウェブページの印刷用バージョン

ほとんど同じコンテンツの複数のページがサイトに含まれる場合、優先する URL を Google に指定する方法(「正規化」と呼びます)は複数あります。詳しくは、正規化についての記事をご覧ください。

しかし、検索エンジンのランキング操作やトラフィックの増大を意図して、コンテンツが複数ドメインにまたがって複製されていることもあります。この種の偽装行為は、ユーザーが検索結果で実質的に同じコンテンツを何度も見ることになり、利便性の低下につながります。

Google は、固有の情報を持つページをインデックスに登録して表示するよう努めています。たとえば、記事ごとに「通常」バージョンのサイトと「印刷」バージョンのサイトがあり、どちらも noindex メタタグでブロックされていない場合、Google はどちらか一方を選択して登録します。ごくまれなケースとして、Google でのランキングの操作やユーザーへの偽装を意図した重複コンテンツが表示される可能性が認識された場合も、Google では関係するサイトのインデックス登録とランキングに対して適切な調整を行います。その場合、該当するサイトはランキングが低下するか、Google インデックスから完全に削除されて検索結果に表示されなくなる可能性があります。

重複するコンテンツに関する事前の対策を行い、ユーザーに意図したとおりのコンテンツが表示されるようにするための手順を以下に示します。

  • 301 を使用する: サイトの構造を変更した場合は、.htaccess ファイルで 301 リダイレクト(「RedirectPermanent」)を使用して、ユーザー、Googlebot、他のスパイダーを適切にリダイレクトします(Apache の場合は .htaccess ファイルを使用し、IIS の場合は管理コンソールを使用します)。

  • 一貫性を保つ: 内部リンクの一貫性を保つようにします。たとえば、http://www.example.com/page/http://www.example.com/pagehttp://www.example.com/page/index.htm の中から、どれか 1 つに絞ってリンクします。

  • トップレベル ドメインを使用する: Google で文書の最も適切なバージョンが表示されるよう、国別のコンテンツを扱う場合は可能な限りトップレベル ドメインを使用します。たとえば、http://www.example.de を使用すると、http://www.example.com/dehttp://de.example.com よりもドイツを対象としたコンテンツが含まれることを Google で認識できる可能性が高くなります。

  • シンジケーションは注意して行う: コンテンツを他のサイトにシンジケーション提供している場合、あなたの判断とは無関係に、Google で最適と判断されたバージョンが常に表示されます。ただし、コンテンツがシンジケーション提供される各サイトに元記事へのリンクを含めることは有効です。また、シンジケーション提供したコンテンツを使用するユーザーに、提供先のサイト上のバージョンがインデックスに登録されないよう、noindex メタタグで検索エンジンをブロックするように依頼することもできます。

  • Search Console を使用して、インデックスの作成を希望するサイトを Google に伝える: 使用するドメイン(たとえば http://www.example.com または http://example.com)を Google に伝えることができます。

  • 定型文の繰り返しをできるだけ少なくする: たとえば、著作権に関する説明をすべてのページの下部に表示する代わりに、短い要約文を組み込んで詳細情報のページにリンクするようにします。また、パラメータ処理ツールを使用して、URL パラメータの処理方法を Google に指定することもできます。

  • スタブを公開しないようにする: ユーザーは「空」のページが表示されることを好みません。そのため、可能な限りプレースホルダを使用しないでください。たとえば、実際のコンテンツがまだ存在しないページは公開しません。プレースホルダ ページを作成した場合は noindex メタタグを使用して、これらのページがインデックスに登録されないようにしてください。

  • コンテンツ管理システムについて理解する: コンテンツがウェブサイトで表示される仕組みをよく理解しておきます。ブログやフォーラムなどのシステムでは、同じコンテンツが複数のフォーマットで表示されることがよくあります。たとえば、ブログのエントリは、ブログのホームページ、アーカイブ ページ、同じラベルを持つ他のエントリのページに表示されることがあります。

  • 類似するコンテンツをできるだけ少なくする: 類似するページが多数存在する場合は、各ページに内容を追加するか、または 1 つにまとめます。たとえば、旅行サイトで 2 つの都市を別々のページで紹介しているが、ページ内の情報は同じである場合は、両方の都市を紹介する 1 つのページにまとめるか、各ページに内容を追加して、それぞれの都市に関する独自のコンテンツを含めます。

Google は、ウェブサイト上の重複コンテンツに対するクローラ アクセスを禁止することは、robots.txt ファイルかその他の手段かにかかわらず、おすすめしていません。重複コンテンツを含むページをクロールできないと検索エンジンではそれらの URL が同じコンテンツを指していることを自動検出できないため、このような URL を独立した個別のページとして効率的に処理する必要があります。それよりも、重複コンテンツの URL について、検索エンジンによるクロールを許可する一方で、rel="canonical" リンク要素、URL パラメータ処理ツール、または 301 リダイレクトを使用して重複としてマークする方が適切です。重複コンテンツが原因でウェブサイトのクロールの頻度が高くなりすぎる場合は、Search Console でクロール速度の設定を調整することもできます。

サイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の根拠とはなりません。重複するコンテンツが問題になっていて、上記のアドバイスが適用されていない場合、Google の検索結果に表示されるコンテンツのバージョンは Google で選択されます。

しかし、偽装行為を行ったことが確認され、サイトが Google の検索結果から除外された場合は、サイトを注意深く確認してください。サイトが検索結果から削除された場合は、ウェブマスター向けガイドラインで詳細をご確認ください。変更を加え、サイトが Google のウェブマスター向けガイドライン(品質に関するガイドライン)に準拠していることを確認できたら、再審査用にサイトを送信します。

まれに、コンテンツを無断でホストしている外部サイトの URL が Google のアルゴリズムで選択されることがあります。別のサイトが著作権法に違反してご自分のコンテンツを複製しているとお考えの場合は、そのサイトの管理者に連絡して削除をリクエストすることをおすすめします。さらに、デジタル ミレニアム著作権法に基づく通知を提出することによって、権利侵害にあたるページを Google の検索結果から除外するよう Google にリクエストできます。

この記事は役に立ちましたか?