検索
検索をクリア
検索終了
Google アプリ
メインメニュー

正規 URL を使用する

この記事では、正規 URL を使用して、複数の URL 構造から、またはシンジケーションによって表示されるコンテンツのリンクまたはランキングのシグナルを改善する方法について説明します。

コンテンツ管理やオンライン ショッピング システムの世界では、同じコンテンツに複数の URL からアクセスできるようになっているのが一般的です。コンテンツ シンジケーションを利用すると、別の URL やドメイン全体にコンテンツを配信することも簡単に行えます。次に例を示します:

ユーザー セッションや検索設定により、同じ商品ページに複数の動的 URL が生成される。
https://www.example.com/products?category=dresses&color=green

https://example.com/dresses/cocktail?gclid=ABCD 

https://www.example.com/dresses/green/greendress.html
複数の項目下に同じ投稿を配置したため、ブログシステムにより複数の URL が自動的に保存される。
https://blog.example.com/dresses/green-dresses-are-awesome/

https://blog.example.com/green-things/green-dresses-are-awesome/
サーバーの設定により、www サブドメインまたは http プロトコルの場合は同じコンテンツが配信される。
http://example.com/green-dresses

https://example.com/green-dresses

http://www.example.com/green-dresses
他サイトへのシンジケート用に提供したブログのコンテンツの一部またはすべてが、他サイトのドメインでレプリケートされる。
https://news.example.com/green-dresses-for-every-day-155672.html(シンジケートされた投稿)

https://blog.example.com/dresses/green-dresses-are-awesome/3245/(元の投稿)

このようなシステムでは、コンテンツの作成や配信を簡単に行える一方で、ユーザーが検索エンジンを使用してページにアクセスする場合にいくつかの課題が発生します。次に例を示します:

  • 重複する、または類似のコンテンツのリンクのシグナルの統合: これにより、検索エンジンが個々の URL に関する情報(それらの URL へのリンクなど)を 1 つの URL に統合できるようになります。つまり他のサイトからの http://example.com/dresses/cocktail?gclid=ABCD へのリンクを、https://www.example.com/dresses/green/greendress.html へのリンクに統合できます。
  • 1 つの商品またはトピックのトラッキング指標: URL が複数あると、特定のコンテンツについて指標を統合することはさらに難しくなります。
  • ユーザーに表示する URL の決定: 緑のワンピースの商品ページをユーザーに表示する際の URL として、https://example.com/dresses/cocktail?gclid=ABCD ではなく https://www.example.com/dresses/green/greendress.html を指定します。
  • シンジケート コンテンツの解決:  他のドメインで公開するコンテンツをシンジケートする場合、使用する URL にページ ランキングを統合する必要があります。

上記の問題を解決するには、複数の URL からアクセスできるコンテンツ(または同等のコンテンツ)に対して正規 URL を定義することをおすすめします。Google 検索ではさまざまな方法でこれを定義できます。

上記のうちどの方法もおすすめですが、必須ではありません。正規 URL を指定しない場合、Google では、最も良いと判断するバージョンまたは URL を正規 URL とします。

正規化を目的として robots.txt ファイルを使用しないでください
正規化を目的として URL 削除ツールを使用しないでください。URL 削除ツールではすべてのバージョンの URL が検索結果から削除されます。
同じページの正規 URL として複数の異なる URL を指定しないでください(同じページに対し、サイトマップで指定した URL とは異なる URL を rel="canonical" を使用して指定するなど)。

優先ドメインを設定する

ドメインについて、使用するサイトの URL のバージョンを Google に通知できます。

  • https://www.example.com
  • https://example.com

使用するドメインを https://example.com に設定すると、https://www.example.com へのリンクは https://example.com へのリンクとまったく同様に扱われます。

詳しくは使用するドメインの設定をご覧ください。

使用する URL を rel="canonical" リンク要素で指定する

複数の URL からこのコンテンツにアクセスできるものの、使用する URL を http://blog.example.com/dresses/green-dresses-are-awesome/ にしたい場合は、次の方法で検索エンジンにこのことを通知できます。

  • 正規のページとそれ以外の非正規のページすべてを rel="canonical" リンク要素でマークアップします。
    <link> 要素を属性 rel="canonical" とともにこれらのページの <head> セクションに追加します。
    <link rel="canonical" href="https://blog.example.com/dresses/green-dresses-are-awesome" />

    これにより、緑のワンピースに関する投稿へのアクセスに使用する URL を指定できるため、検索結果にこの URL 構造が表示される可能性が高くなります(注: Google ではこのような指定に配慮するよう努めますが、必ずしもこのとおりになると保証することはできません)。

エラーの回避策: rel="canonical" リンク要素では、相対パスではなく絶対パスを使用します。

適切な構造:  https://www.example.com/dresses/green/greendresss.html
不適切な構造: /dresses/green/greendress.html

同じコンテンツに対して使用する URL をサイトマップで設定する

各ページについて、正規 URL(優先的な URL)をサイトマップで送信して、Google にサイトの構成情報を知らせます。

サイトマップで送信した URL が使用されることを保証することはできませんが、サイトマップを送信すると、サイト内の最も重要なページに関する情報を Google に提供できます。

正規以外の URL には 301 リダイレクトを使用する

次のように、同じページに複数の方法でアクセスできるようになっている場合は、

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

URL の 1 つを優先的な(正規の)リンク先として設定し、301 リダイレクトを使用して、優先的に使用する URL に他の URL からのトラフィックを送信することをおすすめします。サーバー側での 301 リダイレクトは、ユーザーや検索エンジンを正しいページに確実に誘導するのに最善の方法です。ステータス コード 301 は、ページが別の場所に完全に移転したことを意味します。

動的パラメータの処理方法を指定する

パラメータ処理を使用して、無視するパラメータを Google に通知します。特定のパラメータを無視することで、Google のインデックス内でコンテンツの重複を減らし、サイトをクロールしやすくできます。たとえば、パラメータ sessionid を無視するように指定すると、Google は https://www.example.com/dresses/green.php?sessionid=273749https://www.example.com/dresses/green.php と同じものとして処理します。

HTTP ヘッダーで正規 URL を指定する

サーバーを設定する権限がある場合は、rel="canonical" という HTTP ヘッダー(リンク先は英語)を使用して HTML ドキュメントや他のファイル(PDF など)の正規 URL を指定することができます。例として、トラッキングなどを目的として、同じ PDF に次のようにさまざまな URL からアクセスできるようになっているとします。

https://www.example.com/downloads/white-paper.pdf
https://www.example.com/downloads/partner-1/white-paper.pdf
https://www.example.com/downloads/partner-2/white-paper.pdf
https://www.example.com/downloads/partner-3/white-paper.pdf

この場合は、次のように rel="canonical" HTTP ヘッダーを使用すると、この PDF ファイルの正規 URL を Google に示すことができます。

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

現在 Google では、これらのリンクヘッダー要素をウェブ検索でのみサポートしています。

正規 URL として HTTP よりも HTTPS を優先的に使用する

Google では、正規 URL として HTTP ページよりも HTTPS ページを優先的に使用します。ただし、以下のようにシグナルが競合する場合は例外です。

  • HTTPS ページに無効な SSL 証明書が含まれている。
  • HTTPS ページに安全でない依存関係が含まれている。
  • HTTPS ページが robot.txt でブロックされている(HTTP ページはブロックされていない)。
  • HTTPS ページで、ユーザーを HTTP ページに(または HTTP ページ経由で)リダイレクトしている。
  • HTTPS ページに HTTP ページへの rel="canonical" リンクが含まれている。
  • HTTPS ページに noindex ロボット メタタグが含まれている。

Google のシステムでは、デフォルトで HTTP ページよりも HTTPS ページを優先的に使用しますが、以下のいずれかの方法により確実に優先することができます。

  • 301、302、javaScript、またはメタタグで HTTP ページから HTTPS ページにリダイレクトする。
  • HTTP ページから HTTPS ページへの rel="canonical" リンクを追加する。
  • HSTS を実装する。

Google が誤って HTTP ページを正規 URL にするのを防ぐには、以下の点にご注意ください。

  • 不適切な SSL 証明書や HTTPS から HTTP へのリダイレクトが原因で HTTP が強力に優先されることがあります。この優先は、HSTS を実装しても上書きできません。
  • サイトマップや hreflang エントリに、HTTPS バージョンではなく HTTP バージョンを含めるのは避けてください。
  • SSL や TLS の証明書を実装する際に、類似する誤ったホストで実装しないようにしてください(たとえば example.com で www.example.com の証明書を配信しない)。証明書はサイト URL と完全に一致させるか、ドメイン内の複数のサブドメインで使用できるワイルドカード証明書にします。
robots.txt ファイルでリソースをブロックする場合は、リソースの HTTP バージョンと HTTPS バージョンの両方をブロックするようにしてください。

 

 

この記事は役に立ちましたか?