دمج عناوين URL المكررة

تعريف صفحة أساسية لصفحات مشابهة أو مكررة

ملخّص

إنْ أمكن الوصول إلى صفحة واحدة عن طريق عناوين URL متعددة أو صفحات مختلفة تتضمن محتوى مماثلاً (على سبيل المثال، صفحة تحتوي على إصدار للجوَّال وإصدار لسطح المكتب معًا)، يجب أن تخبر Google بوضوح بأن عنوان URL موثوق (أساسي) لتلك الصفحة. وإذا لم تقم بذلك على نحو واضح، سيحدد محرك البحث Google الخيار المناسب نيابة عنك، وقد يعتبر الخيارين متساويين في الترجيح، ما قد يؤدي إلى سلوك غير مرغوب فيه، كما هو موضح في القسم التالي.

إننا نوصي بتحديد صفحة أساسية لعناوين URL أو الإصدارات المكررة، ولكن تجدر الإشارة إلى أن محرك البحث Google قد يختار خوارزميًا صفحة مختلفة باعتبارها صفحة أساسية لأسباب مختلفة مثل الأداء أو المحتوى.

لماذا تنشأ لديّ صفحات مشابهة/مكررة؟

هناك أسباب وجيهة تجعل موقعك يحتوي على عناوين URL مختلفة تشير إلى الصفحة نفسها، أو يشتمل على صفحات مكررة أو مشابهة جدًا في عناوين URL مختلفة. وفي ما يلي الأكثر شيوعًا منها:

  • التوافق مع أنواع الأجهزة المتعددة:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • تفعيل عناوين URL الديناميكية لعناصر مثل معلمات البحث أو معرِّفات الجلسات:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • إنْ كان نظام مدونتك يحفظ عناوين URL متعددة تلقائيًا عندما يتم وضع المشاركة ذاتها ضمن أقسام متعددة.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • إنْ تم تكوين الخادم لعرض المحتوى ذاته للمتغيرات المزوَّدة بالبادئة www أو بدونها، أو التي تتضمن http/https:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • إنْ تم نسخ المحتوى الذي تقدمه على مدونة لاقتباسه على مواقع أخرى في هذه النطاقات جزئيًا أو كليًا.
    https://news.example.com/green-dresses-for-every-day-155672.html (المشاركة المُقتبَسة) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (المشاركة الأصلية)
التفاصيل الدقيقة
ربما تمثّل هذه التفاصيل الدقيقة معلومات إضافية حول تحديد عنوان URL الأساسي زائدة عما تحتاج إلى معرفته، لذلك لا تتردد في تخطيها، ولكننا سنقدمها تحسّبًا لوجود رغبة لديك في هذا النوع من التفاصيل.
عندما يفهرس Googlebot أحد المواقع، فإنه يحاول تحديد الموضوعات التي يتم تناولها في كل صفحة. وإذا عثر Googlebot على صفحات متعددة على الموقع ذاته تبدو أنها متماثلة، فإنه يختار الصفحة التي يعتقد أنها الأكثر اكتمالاً ونفعًا، ويميزها على أنها أساسية. وسيتم الزحف إلى الصفحة الأساسية بشكلٍ منتظم، بينما يتم الزحف إلى النُسَخ المكررة بوتيرة أقل من أجل توفير ميزانية الزحف على موقعك؛ لذلك إذا لم تحدّد الصفحة الأساسية لـ Googlebot، وقررتَ أن صفحة مختلفة هي الصفحة الأساسية، ربما تبذل جهدًا زائدًا في تحديث صفحة لن يفهرسها Googlebot أو يعرضها في نتائج البحث كثيرًا.
يستخدم محرك البحث Google الصفحات الأساسية في موقعك باعتبارها قاعدة الذهب لمحتوى موقعك، طوال تقييم المحتوى والجودة، وعادةً ما تشير نتيجة بحث Google إلى الصفحة الأساسية، إلا إذا كانت إحدى النُسخ المكررة تناسب بوضوح طلب بحث المستخدم على نحو أفضل: على سبيل المثال، ستشير نتيجة البحث إلى صفحة الجوَّال إذا كان المستخدم يستخدم جهاز جوَّال، حتى إذا تم تمييز صفحة سطح المكتب باعتبارها أساسية.
يختار محرك البحث Google الصفحة الأساسية استنادًا إلى عدد من العوامل (أو الإشارات)، مثل ما إذا كان يتم عرض الصفحة عبر http أو https والنطاق المُفضَّل المُعلَن من قِبَل المستخدم وجودة الصفحة ووجود عنوان URL في خريطة موقع، بالإضافة إلى أيّ تسمية "rel=canonical"؛ مع العلم بأنه لا يمكنك فرض خيار الصفحة الأساسية من Google، ولكن يمكنك التأثير في الاختيار باستخدام أسلوب واحد أو أكثر من الأساليب المعروضة هنا.

وجه الأهمية

هناك عدد من الأسباب التي تجعلك ترغب في الاختيار الصريح لصفحة أساسية في مجموعة من الصفحات المكررة/المشابهة:

  • لتحديد عنوان URL الذي تريد أن يشاهده الأشخاص في نتائج البحث، ربما تفضل أن يصل الأشخاص إلى صفحة منتج الفساتين الخضراء عبر https://www.example.com/dresses/green/greendress.html بدلاً من https://example.com/dresses/cocktail?gclid=ABCD.
  • لدمج إشارات الروابط للصفحات المشابهة أو المكررة. وذلك يساعد محركات البحث أن تتاح لها إمكانية دمج المعلومات المتوفرة لديها عن عناوين URL الفردية (مثل الروابط المؤدية إليها) في عنوان URL واحد مفضّل. وهذا يعني أن الروابط الصادرة من مواقع أخرى والمؤدية إلى http://example.com/dresses/cocktail?gclid=ABCD يتم دمجها مع الروابط المؤدية إلى https://www.example.com/dresses/green/greendress.html.
  • لتبسيط مقاييس التتبع لمنتج واحد/موضوع واحد. مع وجود مجموعة متنوعة من عناوين URL، يكون الأمر أكثر صعوبة للحصول على مقاييس مدمجة لنوع محدد من المحتوى.
  • لإدارة المحتوى المُقتبَس. في حالة اقتباس المحتوى التابع لك لنشره في نطاقات أخرى، يمكنك دمج ترتيب الصفحة مع عنوان URL المفضل لديك.
  • لتجنب قضاء وقت في الزحف على الصفحات المكررة؛ فأنت تريد من Googlebot تحقيق أقصى استفادة من موقعك، لذا فمن الأفضل له أن يقضي الوقت في الزحف إلى صفحات جديدة (أو مُحدَّثة) على موقعك، بدلاً من الزحف إلى إصدارات سطح المكتب والجوَّال من الصفحات ذاتها.

ما عنوان URL الذي تعتبره Google أساسيًا (أو مكررًا)؟

استخدم تقرير حالة الفهرس لتحديد عناوين URL التي تُعتبَر أساسية أو مكررة. وسيتم تمييز النُسخ المكررة على أنها مُستبَعدة؛ بينما يتم تمييز الصفحات الأساسية على أنها صالحة.

ابحث عن عناوين URL الصالحة التي تحمل علامة "تمت فهرسة الصفحة؛ يمكنك تمييزها كصفحة أساسية" لمعرفة الصفحات التي يمكنك بشكل واضح تمييزها باعتبارها صفحات أساسية.

ابحث عن عناوين URL المُستبَعدة التي تحمل علامة "اختار محرك بحث Google صفحة أساسية بخلاف اختيار المستخدم" لمعرفة المواضع التي اخترت فيها أنت ومحرك البحث Google صفحات أساسية مختلفة في مجموعة.

تحديد صفحة أساسية

هناك بعض الطرق المختلفة لتحديد الصفحة الأساسية بين مجموعة مكررة، بناءً على استخدامك:

الطريقة الوصف
الإرشادات العامة اتبع هذه الإرشادات مع جميع طرق تحديد عنوان URL الأساسي.
تحديد النطاق المفضل

استخدم Search Console لتحديد عناوين URL على نطاق ما باعتبارها أساسية مقارنة بنظرائها على نطاق آخر. على سبيل المثال، example.com بدلاً من www.example.com. ولا تلجأ إلى ذلك إلا عندما يكون لديك موقعان متشابهان يختلفان في النطاق الفرعي فقط. ولكن لا تستخدم هذه الطريقة مع المواقع المناظرة بتنسيق http/https.

الإيجابيات:

  • السهولة الفائقة في التنفيذ والإدارة والتغيير
  • الاستخدام في حالات وجود مواقع متطابقة على نطاقات مختلفة.

السلبيات:

  • عدم الجدوى إلا في حالات دقة النطاق، إلى جانب ضرورة احتواء الصفحات على مسارات وأسماء متطابقة تعتبر نُسخًا مكررة.
  • تفعيل تعيين واحد فقط بأسلوب صفحة إلى صفحة في ما يخص الصفحات المُسماة للمسارات المتطابقة.
علامة rel=canonical <link>

أضف علامة <link> في الشفرة لجميع الصفحات المكررة، مع الإشارة إلى الصفحة الأساسية.

الإيجابيات:

  • إمكانية تعيين عدد غير محدود من الصفحات المكررة.

السلبيات:

  • إمكانية الإضافة إلى حجم الصفحة.
  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الكبيرة، أو المواقع التي تتغير فيها عناوين URL كثيرًا.
  • عدم الجدوى إلا مع صفحات HTML، وليس مع ملفات على شاكلة ملفات PDF. وفي مثل هذه الحالات، يمكنك استخدام رأس HTTP التي تتضمن السمة rel=canonical.
رأس HTTP التي تتضمن السمة rel=canonical

أرسل رأس rel=canonical في استجابة صفحتك.

الإيجابيات:

  • عدم زيادة حجم الصفحة.
  • إمكانية تعيين عدد غير محدود من الصفحات المكررة.

السلبيات:

  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الكبيرة، أو المواقع التي تتغير فيها عناوين URL كثيرًا.
ملف Sitemap

حدّد صفحاتك الأساسية في ملف sitemap.

الإيجابيات:

  • من السهل القيام به والحفاظ عليه، وخاصةً على المواقع الكبيرة.

السلبيات:

  • لا يزال يجب على Googlebot تحديد النسخة المكررة المرتبطة بأي صفحات أساسية تعلنها في خريطة الموقع.
  • إشارة أقل قوة إلى Googlebot مقارنة بأسلوب تعيين rel=canonical.
إعادة التوجيه 301 استخدم عمليات إعادة التوجيه 301 لإخبار Googlebot بأن عنوان URL مُحدَّد مُعاد توجيهه يمثل إصدارًا أفضل لعنوان URL مُعيَّن، ولكن لا تستخدمها إلا عند إنهاء العمل بصفحة مكررة معيَّنة.
متغير AMP إذا كان أحد المتغيرات عبارة عن صفحة AMP، ستحتاج إلى اتباع إرشادات AMP للإشارة إلى الصفحة الأساسية ومتغير AMP.

 

نوصيك باستخدام أي من هذه الطرق، ولكن تجدر الإشارة إلى أنها جميعًا لا تُعد إلزامية. إذا لم تحدد عنوان URL أساسيًا، سنحدّد ما نعتقد أنه أفضل إصدار أو عنوان URL.

الإرشادات العامة

بالنسبة إلى جميع طرق تحديد عنوان URL الأساسي، اتّبع هذه الإرشادات العامة.

الإرشادات العامة
  • لا تستخدم ملف robots.txt لأغراض متعلقة بتحديد عناوين URL الأساسية.
  • لا تستخدم أداة إزالة عناوين URL لأغراض متعلقة بتحديد عناوين URL الأساسية: لأنها تزيل كل إصدارات عنوان URL من البحث.
  • لا تحدّد عناوين URL مختلفة كعناوين أساسية للصفحة ذاتها باستخدام أساليب تحديد عناوين URL الأساسية ذاتها أو الأساليب المختلفة عنها (على سبيل المثال، لا تحدّد عنوان URL في خريطة موقع، ولكن حدّد عنوان URL مختلفًا للصفحة ذاتها باستخدام rel="canonical").
  • لا تستخدم noindex كوسيلة لمنع اختيار صفحة أساسية. ويهدف هذا التوجيه إلى استبعاد الصفحة من الفهرس، وليس لإدارة اختيار الصفحة الأساسية. 
  • حدِّد صفحة أساسية أثناء استخدام علامات hreflang. وحدِّد صفحة أساسية باللغة ذاتها أو حدِّد أفضل لغة بديلة ممكنة إذا لم تتوفر صفحة أساسية للغة ذاتها.

تفضيل HTTPS عن HTTP لعناوين URL الأساسية

يفضِّل محرك البحث Google صفحات HTTPS عن صفحات HTTP المكافئة عند استخدام صفحات أساسية، باستثناء عندما تكون هناك مشاكل أو إشارات متضاربة مثل ما يلي:

  • تتضمن صفحة HTTPS شهادة طبقة مقابس آمنة (SSL) غير صالحة.
  • تحتوي صفحة HTTPS على تبعيات غير آمنة (بخلاف الصور).
  • تعيد صفحة HTTPS توجيه المستخدمين إلى صفحة HTTP أو عبرها.
  • تتضمن صفحة HTTPS رابطًا يشتمل على سمة rel="canonical"‎ ويؤدي إلى صفحة HTTP.

على الرغم من أن أنظمتنا تفضّل صفحات HTTPS عن صفحات HTTP بشكل افتراضي، يمكنك التأكد من حدوث ذلك عن طريق تنفيذ أي من الإجراءات التالية:

  • إضافة عمليات إعادة توجيه من صفحة HTTP إلى صفحة HTTPS.
  • إضافة رابط يتضمن السمة rel="canonical"‎ من صفحة HTTP إلى صفحة HTTPS.
  • تنفيذ HSTS.

لمنع محرك البحث Google من جعل صفحة HTTP صفحة أساسية بشكلٍ خاطئ، يجب تجنب الممارسات التالية:

  • تجعلنا شهادات طبقة المقابس الآمنة (SSL) غير الصالحة وعمليات إعادة التوجيه من HTTPS إلى HTTP نفضل صفحة HTTP إلى حد كبير جدًا. ولا يمكن أن يلغي تنفيذ HSTS هذا التفضيل القوي.
  • تضمين صفحة HTTP في ملف Sitemap أو إدخالات hreflang بدلاً من إصدار HTTPS.
  • تنفيذ شهادة طبقة المقابس الآمنة (SSL) / طبقة النقل الآمنة (TLS) لمتغير المضيف الخاطئ: على سبيل المثال، يعرض example.com الشهادة لـ www.example.com.  ويجب أن تتطابق الشهادة مع عنوان URL الكامل للموقع أو أن تكون شهادة أحرف بدل يمكن استخدامها لنطاقات فرعية متعددة في أحد النطاقات.

إخبار محرك البحث Google بتجاهل المعلمات الديناميكية

استخدم التعامل مع المعلِّمات لإخبار محرك البحث Google بأية معلِّمات يجب تجاهلها أثناء الزحف. وقد يؤدي تجاهل معلِّمات مُعيَّنة إلى تقليل نسبة المحتوى المكرر في فهرس Google، ما يزيد من إمكانية الزحف إلى موقعك. على سبيل المثال، إنْ حددت أن المعلمة sessionid يجب أن يتم تجاهلها، فسيعتبر Googlebot عنواني URL عنوانين مكررين:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

طرق معيّنة

اختر واحدة من الطرق التالية لتحديد عنوان URL أساسي لعناوين URL مكررة أو صفحات مكررة/مشابهة.

تأكد من اتّباع الإرشادات العامة أعلاه لجميع الطرق.

تعيين نطاق مفضل

استخدم Search Console لإخبار محرك البحث Google بإصدار عنوان URL لموقعك الذي تفضله أن يكون أساسيًا لنطاقك:

  • https://www.example.com
  • https://example.com

إنْ عيّنت نطاقك المفضل ليكون https://example.com، فإن محرك البحث Google سيتعامل مع عناوين URL أو الصفحات على www.example.com كنُسخ مكررة من الصفحات على example.com.

اطلع على تعيين النطاق المفضل للحصول على تفاصيل.

استخدام علامة رابط rel="canonical"

يمكنك استخدام علامة <link> في رأس الصفحة للإشارة إلى أن الصفحة هي نسخة مكررة من صفحة أخرى.

لنفترض أنك تريد أن يكون https://example.com/dresses/green-dresses عنوان URL الأساسي، على الرغم من أن هناك مجموعة متنوعة من عناوين URL يمكنها الوصول إلى هذا المحتوى. يمكنك الإشارة إلى عنوان URL هذا كعنوان أساسي باتّباع الخطوات التالية:

  1. تمييز جميع الصفحات المكررة بعنصر الرابط rel="canonical". أضف عنصر <link> يتضمن السمة rel="canonical" إلى القسم <head> في الصفحات المكررة، مع الإشارة إلى الصفحة الأساسية، على النحو التالي:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. إن احتوت الصفحة الأساسية على متغير جوَّال، فأضف رابط rel="alternate" إليه، مع الإشارة إلى إصدار الجوَّال للصفحة:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. أضف أي علامة hreflang أو عمليات إعادة التوجيه الأخرى المناسبة للصفحة.

استخدم المسارات المطلقة بدلاً من المسارات النسبية باستخدام عنصر الرابط rel="canonical"؛

استخدم هذه البنية:  https://www.example.com/dresses/green/greendresss.html
وليس هذه البنية: /dresses/green/greendress.html
استخدام رأس HTTP التي تتضمن السمة rel="canonical"

إنْ كان بإمكانك تهيئة الخادم، يمكنك استخدام رؤوس HTTP التي تتضمن السمة rel="canonical" (بدلاً من علامات HTML) للإشارة إلى عنوان URL الأساسي للمستندات التي ليست بتنسيق HTML، مثل ملفات PDF.

على سبيل المثال، إن عرضت ملف PDF خلال عناوين URL متعددة، يمكنك الرجوع إلى رأس HTTP التي تتضمن السمة rel="canonical" على النحو التالي لعناوين URL المكررة لإخبار Googlebot بعنوان URL الأساسي لملف PDF:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

يدعم محرك البحث Google حاليًا هذه الطريقة لنتائج بحث الويب فقط.

استخدم المسارات المطلقة بدلاً من المسارات النسبية باستخدام عنصر الرابط rel="canonical"؛ والمقصود:
استخدم هذه البنية:  http://www.example.com/downloads/white-paper.pdf
وليس هذه البنية: /downloads/white-paper.pdf
استخدام خريطة موقع

اختر عنوان URL أساسيًا لكل صفحة من صفحاتك واذكره في ملف sitemap. وتكون جميع الصفحات المُدرَجة في ملف sitemap مقترحة باعتبارها صفحات أساسية؛ وسوف يقرر Googlebot أيّ الصفحات مكررة (إن وجدت صفحات مكررة)، استنادًا إلى تشابه المحتوى.

نحن لا نضمن أننا سنعتبر عناوين URL لخريطة الموقع أساسية، ولكنها طريقة بسيطة لتعريف العناوين الأساسية لموقع كبير، وتُعَد ملفات sitemap طريقة مفيدة لإخبار محرك البحث Google بالصفحات التي تعتبرُها تتسم بالأهمية الكبرى على موقعك.

لا تُضمِّن صفحات غير أساسية في ملف sitemap. وعند استخدام ملف sitemap، حدِّد عناوين URL الأساسية فقط في خريطة الملف.

استخدام عمليات إعادة التوجيه 301 لعناوين URL المُستبعَدة

استخدم هذه الطريقة عندما تريد التخلص من الصفحات المكررة الحالية، ولكنك تحتاج إلى ضمان انتقال سلس قبل أن تستبعد عناوين URL القديمة.

لنفترض أن صفحتك يمكن الوصول إليها من خلال عدة طرق:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

اختر أحد عناوين URL هذه باعتباره عنوان URL الأساسي، واستخدم عمليات إعادة التوجيه 301 لإرسال الزيارات من عناوين URL الأخرى إلى عنوان URL المفضل. وتُعد طريقة إعادة التوجيه 301 من جانب الخادم أفضل طريقة لضمان توجيه المستخدمين ومحركات البحث إلى الصفحة الصحيحة. يعني رمز الحالة 301 أنه تم نقل إحدى الصفحات إلى مكان جديد بشكل دائم.

هل كانت هذه المقالة مفيدة؟
كيف يمكننا تحسينها؟