دمج عناوين URL المكرّرة

تعريف صفحة أساسية بالنسبة إلى صفحات مشابهة أو مكرّرة

إذا كان لديك صفحة واحدة يمكن الوصول إليها عن طريق عناوين URL مكرّرة أو كان لديك صفحات مختلفة تتضمن محتوى مماثلاً (على سبيل المثال، صفحة تحتوي على إصدار للجوَّال وإصدار لسطح المكتب معًا)، يرى Google تلك الصفحات كإصدارات متكرّرة للصفحة نفسها. سيختار Google عنوان URL واحدًا ليكون الإصدار الأساسي وتقوم بالزحف إلى هذا العنوان، وستُعد جميع عناوين URL الأخرى عناوين مكررة ويتم الزحف إليها بمعدل أقل. 

وإذا لم تخبر Google بعنوان URL الأساسي بوضوح، سيحدِّد هو الخيار المناسب نيابة عنك أو قد يعتبر الخيارين على قدم المساواة، ما قد يؤدي إلى سلوك غير مرغوب فيه كما هو موضّح في القسم التالي: لماذا يتعيّن عليّ اختيار عنوان URL أساسي؟

ما المقصود بعنوان URL الأساسي؟
عنوان URL الأساسي هو عنوان URL للصفحة التي لدى Google انطباع بأنها الأهم بين مجموعة من الصفحات المكرّرة على موقعك الإلكتروني. وعلى سبيل المثال، إذا كان لديك عناوين URL لنفس الصفحة (مثل: example.com?dress=1234 وexample.com/dresses/1234)، سيختار Google عنوان URL واحدًا فقط بصفته أساسيًا. وجدير بالذكر أن هذا الأمر ينطبق على الصفحات المماثلة وليست المتطابقة تمامًا فقط. ومن الوارد أن يكون عنوان URL الأساسي على نطاق مختلف عن الصفحة المكرّرة.
مزيد من التفاصيل
عندما يفهرس Googlebot موقعًا إلكترونيًا، يحاول تحديد المحتوى الأساسي في كل صفحة. وإذا عثر Googlebot على صفحات مكرّرة على الموقع ذاته تبدو أنها متماثلة، يختار الصفحة التي يعتقد أنها الأكثر اكتمالاً ونفعًا ويميّزها على أنها أساسية. وسيزحف Google إلى الصفحة الأساسية بشكلٍ منتظم، بينما يزحف إلى النُسَخ المكرّرة بوتيرة أقل للتخفيف من حمل الزحف على موقعك.
يختار محرك البحث Google الصفحة الأساسية استنادًا إلى عدد من العوامل (أو الإشارات) مثل ما إذا كان يتم عرض الصفحة من خلال http أو https والنطاق المُفضَّل الذي حدّده المستخدم وجودة الصفحة وظهور عنوان URL على خريطة الموقع، بالإضافة إلى أيّ تسمية "rel=canonical"؛ ويمكنك تحديد الصفحة التي تفضّلها لمحرك البحث Google بالطرق السابقة ولكنه لأسباب مختلفة قد يختار صفحة أساسية غير التي حدّدتها.
يستخدم Google الصفحات الأساسية باعتبارها المصادر الرئيسية لتقييم المحتوى والجودة. وعادةً ما تشير نتيجة بحث Google إلى الصفحة الأساسية إلا إذا كان من الواضح أن إحدى النُسخ المكرّرة تناسب المستخدم على نحو أفضل: على سبيل المثال، من المحتمل أن تشير نتيجة البحث إلى صفحة الجوَّال إذا كان الجهاز المُستخدم هو الجوّال حتى إذا تم تمييز صفحة سطح المكتب باعتبارها أساسية.

لماذا يحتوي موقعي الإلكتروني على صفحات مشابهة/مكرّرة؟

هناك أسباب وجيهة تجعل موقعك يحتوي على عناوين URL مختلفة تشير إلى الصفحة نفسها، أو يشتمل على صفحات مكررة أو مشابهة جدًا في عناوين URL مختلفة. وفي ما يلي الأكثر شيوعًا منها:

  • التوافق مع أنواع الأجهزة المتعددة:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • تفعيل عناوين URL الديناميكية لعناصر مثل معلمات البحث أو معرِّفات الجلسات:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • إنْ كان نظام مدونتك يحفظ عناوين URL متعددة تلقائيًا عندما يتم وضع المشاركة ذاتها ضمن أقسام متعددة.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • إنْ تم تكوين الخادم لعرض المحتوى ذاته للمتغيرات المزوَّدة بالبادئة www أو بدونها، أو التي تتضمن http/https:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • إنْ تم نسخ المحتوى الذي تقدمه على مدونة لاقتباسه على مواقع أخرى في هذه النطاقات جزئيًا أو كليًا.
    https://news.example.com/green-dresses-for-every-day-155672.html (المشاركة المُقتبَسة) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (المشاركة الأصلية)

لماذا يتعين عليّ اختيار عنوان URL أساسي؟

هناك عدد من الأسباب التي تجعلك ترغب في الاختيار الصريح لصفحة أساسية في مجموعة من الصفحات المكررة/المشابهة:

  • لتحديد عنوان URL الذي تريد أن يشاهده الأشخاص في نتائج البحث، ربما تفضل أن يصل الأشخاص إلى صفحة منتج الفساتين الخضراء عبر https://www.example.com/dresses/green/greendress.html بدلاً من https://example.com/dresses/cocktail?gclid=ABCD.
  • لدمج إشارات الروابط للصفحات المشابهة أو المكررة. وذلك يساعد محركات البحث أن تتاح لها إمكانية دمج المعلومات المتوفرة لديها عن عناوين URL الفردية (مثل الروابط المؤدية إليها) في عنوان URL واحد مفضّل. وهذا يعني أن الروابط الصادرة من مواقع أخرى والمؤدية إلى http://example.com/dresses/cocktail?gclid=ABCD يتم دمجها مع الروابط المؤدية إلى https://www.example.com/dresses/green/greendress.html.
  • لتبسيط مقاييس التتبع لمنتج واحد/موضوع واحد. مع وجود مجموعة متنوعة من عناوين URL، يكون الأمر أكثر صعوبة للحصول على مقاييس مدمجة لنوع محدد من المحتوى.
  • لإدارة المحتوى المُقتبَس. في حالة اقتباس المحتوى التابع لك لنشره في نطاقات أخرى، يمكنك دمج ترتيب الصفحة مع عنوان URL المفضل لديك.
  • لتجنُّب قضاء وقت في الزحف على الصفحات المكرّرة؛ فأنت تريد من Googlebot تحقيق أقصى استفادة من موقعك الإلكتروني، لذا فمن الأفضل له أن يقضي الوقت في الزحف إلى صفحات جديدة (أو مُحدَّثة) على موقعك، بدلاً من الزحف إلى إصدارات سطح المكتب والجوَّال من الصفحات ذاتها.

ما عنوان URL الذي يعتبره Google أساسيًا؟

يمكنك استخدام أداة فحص عنوان URL لمعرفة الصفحة التي يعتبرها Google أساسية. ولاحظ أنه حتى في حال تحديد صفحة أساسية بوضوح، قد يختار Google صفحة أساسية مختلفة لأسباب متعددة، مثل الأداء أو المحتوى.

تحديد صفحة أساسية

هناك بعض الطرق المختلفة لتحديد الصفحة الأساسية بين مجموعة مكررة، بناءً على استخدامك:

الطريقة الوصف
الإرشادات العامة اتبع هذه الإرشادات مع جميع طرق تحديد عنوان URL الأساسي.
تحديد النطاق المفضل

استخدم Search Console لتحديد عناوين URL على نطاق ما باعتبارها أساسية مقارنة بنظرائها على نطاق آخر. على سبيل المثال، example.com بدلاً من www.example.com. ولا تلجأ إلى ذلك إلا عندما يكون لديك موقعان متشابهان يختلفان في النطاق الفرعي فقط. ولكن لا تستخدم هذه الطريقة مع المواقع المناظرة بتنسيق http/https.

الإيجابيات:

  • السهولة الفائقة في التنفيذ والإدارة والتغيير
  • الاستخدام في حالات وجود مواقع متطابقة على نطاقات مختلفة.

السلبيات:

  • عدم الجدوى إلا في حالات دقة النطاق، إلى جانب ضرورة احتواء الصفحات على مسارات وأسماء متطابقة تعتبر نُسخًا مكررة.
  • تفعيل تعيين واحد فقط بأسلوب صفحة إلى صفحة في ما يخص الصفحات المُسماة للمسارات المتطابقة.
علامة rel=canonical <link>

أضف علامة <link> في الشفرة لجميع الصفحات المكررة، مع الإشارة إلى الصفحة الأساسية.

الإيجابيات:

  • إمكانية تعيين عدد غير محدود من الصفحات المكررة.

السلبيات:

  • إمكانية الإضافة إلى حجم الصفحة.
  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الكبيرة، أو المواقع التي تتغير فيها عناوين URL كثيرًا.
  • عدم الجدوى إلا مع صفحات HTML، وليس مع ملفات على شاكلة ملفات PDF. وفي مثل هذه الحالات، يمكنك استخدام رأس HTTP التي تتضمن السمة rel=canonical.
رأس HTTP التي تتضمن السمة rel=canonical

أرسل رأس rel=canonical في استجابة صفحتك.

الإيجابيات:

  • عدم زيادة حجم الصفحة.
  • إمكانية تعيين عدد غير محدود من الصفحات المكررة.

السلبيات:

  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الكبيرة، أو المواقع التي تتغير فيها عناوين URL كثيرًا.
ملف Sitemap

حدّد صفحاتك الأساسية في ملف sitemap.

الإيجابيات:

  • من السهل القيام به والحفاظ عليه، وخاصةً على المواقع الكبيرة.

السلبيات:

  • لا يزال يجب على Googlebot تحديد النسخة المكررة المرتبطة بأي صفحات أساسية تعلنها في خريطة الموقع.
  • إشارة أقل قوة إلى Googlebot مقارنة بأسلوب تعيين rel=canonical.
إعادة التوجيه 301 استخدم عمليات إعادة التوجيه 301 لإخبار Googlebot بأن عنوان URL مُحدَّد مُعاد توجيهه يمثل إصدارًا أفضل لعنوان URL مُعيَّن، ولكن لا تستخدمها إلا عند إنهاء العمل بصفحة مكررة معيَّنة.
متغير AMP إذا كان أحد المتغيرات عبارة عن صفحة AMP، ستحتاج إلى اتباع إرشادات AMP للإشارة إلى الصفحة الأساسية ومتغير AMP.

 

نوصيك باستخدام أي من هذه الطرق، ولكن تجدر الإشارة إلى أنها جميعًا لا تُعد إلزامية. إذا لم تحدد عنوان URL أساسيًا، سنحدّد ما نعتقد أنه أفضل إصدار أو عنوان URL.

الإرشادات العامة

بالنسبة إلى جميع طرق تحديد عنوان URL الأساسي، اتّبع هذه الإرشادات العامة.

الإرشادات العامة
  • لا تستخدم ملف robots.txt لأغراض تتعلّق بتحديد عناوين URL الأساسية.
  • لا تستخدم أداة إزالة عناوين URL لأغراض تتعلّق بتحديد عناوين URL الأساسية لأنها تزيل كل إصدارات عنوان URL من البحث.
  • لا تحدّد عناوين URL مختلفة كعناوين أساسية للصفحة ذاتها باستخدام أساليب تحديد عناوين URL الأساسية ذاتها أو أساليب مختلفة عنها (على سبيل المثال، لا تحدّد عنوان URL في خريطة الموقع وعنوان URL مختلفًا للصفحة ذاتها باستخدام rel="canonical")
  • لا تستخدم العلامة الوصفية noindex كوسيلة لمنع اختيار صفحة أساسية. ويهدف هذا التوجيه إلى استبعاد الصفحة من الفهرس، وليس لإدارة اختيار الصفحة الأساسية. 
  • حدِّد صفحة أساسية أثناء استخدام علامات hreflang. وحدِّد صفحة أساسية باللغة ذاتها أو حدِّد أفضل لغة بديلة ممكنة إذا لم تتوفر صفحة أساسية للغة ذاتها.

  • أنشئ روابط إلى عنوان URL الأساسي وليس عنوان URL المكرّر أثناء الربط بموقعك الإلكتروني. وهذا الربط الدائم بعنوان URL الذي تعتبره أساسيًا يساعد Google على استيعاب تفضيلاتك.

تفضيل HTTPS عن HTTP لعناوين URL الأساسية

يفضِّل محرك البحث Google صفحات HTTPS عن صفحات HTTP المكافئة عند استخدام صفحات أساسية، باستثناء عندما تكون هناك مشاكل أو إشارات متضاربة مثل ما يلي:

  • تتضمن صفحة HTTPS شهادة طبقة مقابس آمنة (SSL) غير صالحة.
  • تحتوي صفحة HTTPS على تبعيات غير آمنة (بخلاف الصور).
  • تعيد صفحة HTTPS توجيه المستخدمين إلى صفحة HTTP أو عبرها.
  • تتضمن صفحة HTTPS رابطًا يشتمل على سمة rel="canonical"‎ ويؤدي إلى صفحة HTTP.

على الرغم من أن أنظمتنا تفضّل صفحات HTTPS عن صفحات HTTP بشكل افتراضي، يمكنك التأكد من حدوث ذلك عن طريق تنفيذ أي من الإجراءات التالية:

  • إضافة عمليات إعادة توجيه من صفحة HTTP إلى صفحة HTTPS.
  • إضافة رابط يتضمن السمة rel="canonical"‎ من صفحة HTTP إلى صفحة HTTPS.
  • تنفيذ HSTS.

لمنع محرك البحث Google من جعل صفحة HTTP صفحة أساسية بشكلٍ خاطئ، يجب تجنب الممارسات التالية:

  • تجعلنا شهادات طبقة المقابس الآمنة (SSL) غير الصالحة وعمليات إعادة التوجيه من HTTPS إلى HTTP نفضل صفحة HTTP إلى حد كبير جدًا. ولا يمكن أن يلغي تنفيذ HSTS هذا التفضيل القوي.
  • تضمين صفحة HTTP في ملف Sitemap أو إدخالات hreflang بدلاً من إصدار HTTPS.
  • تنفيذ شهادة طبقة المقابس الآمنة (SSL) / طبقة النقل الآمنة (TLS) لمتغير المضيف الخاطئ: على سبيل المثال، يعرض example.com الشهادة لـ www.example.com.  ويجب أن تتطابق الشهادة مع عنوان URL الكامل للموقع الإلكتروني أو أن تكون شهادة أحرف بدل يمكن استخدامها لنطاقات فرعية متعددة في أحد النطاقات.

للمستخدمين المتقدمين فقط: إخبار محرك البحث Google بتجاهل المعلِّمات الديناميكية

يمكنك استخدام ميزة التعامل مع المعلِّمات لإخبار Googlebot بأي معلِّمات يجب تجاهلها أثناء الزحف. وقد يؤدي تجاهل معلِّمات مُعيَّنة إلى تقليل نسبة المحتوى المكرر في فهرس Google، ما يزيد من إمكانية الزحف إلى موقعك. على سبيل المثال، إنْ حددت أن المعلمة sessionid يجب أن يتم تجاهلها، فسيعتبر Googlebot عنواني URL عنوانين مكررين:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

طُرق معيّنة

اختر واحدة من الطرق التالية لتحديد عنوان URL أساسي لعناوين URL مكررة أو صفحات مكررة/مشابهة.

تأكد من اتّباع الإرشادات العامة أعلاه لجميع الطرق.

تعيين نطاق مفضل

استخدم Search Console لإخبار محرك البحث Google بإصدار عنوان URL لموقعك الذي تفضله أن يكون أساسيًا لنطاقك:

  • https://www.example.com
  • https://example.com

إنْ عيّنت نطاقك المفضل ليكون https://example.com، فإن محرك البحث Google سيتعامل مع عناوين URL أو الصفحات على www.example.com كنُسخ مكررة من الصفحات على example.com.

اطلع على تعيين النطاق المفضل للحصول على تفاصيل.

استخدام علامة رابط rel="canonical"

يمكنك استخدام علامة <link> في رأس الصفحة للإشارة إلى الحالة التي تكون فيها الصفحة نسخة مكررة من صفحة أخرى.

لنفترض أنك تريد أن يكون https://example.com/dresses/green-dresses عنوان URL الأساسي، على الرغم من أن هناك مجموعة متنوعة من عناوين URL يمكنها الوصول إلى هذا المحتوى. يمكنك الإشارة إلى عنوان URL هذا كعنوان أساسي باتّباع الخطوات التالية:

  1. ميِّز جميع الصفحات المكرّرة باستخدام عنصر الرابط rel="canonical". يُمكنك إضافة عنصر <link> يتضمن السمة rel="canonical" إلى القسم <head> في الصفحات المكرّرة، مع الإشارة إلى الصفحة الأساسية، على النحو التالي:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. إذا احتوت الصفحة الأساسية على صيغة مخصصة للجوَّال، أضِف رابط rel="alternate" إليها، مع الإشارة إلى إصدار الجوَّال للصفحة:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. أضِف أي علامة hreflang أو عمليات إعادة توجيه أخرى مناسبة للصفحة.

استخدِم المسارات المطلقة وليس المسارات النسبية باستخدام عنصر الرابط rel="canonical".

استخدم هذه البنية:  https://www.example.com/dresses/green/greendresss.html
وليس هذه البنية: /dresses/green/greendress.html
استخدام رأس HTTP التي تتضمن السمة rel="canonical"

إذا كان بإمكانك تهيئة الخادم، يمكنك استخدام رؤوس HTTP التي تتضمن السمة rel="canonical" (بدلاً من علامات HTML) للإشارة إلى عنوان URL الأساسي للمستندات التي ليست بتنسيق HTML مثل ملفات PDF.

على سبيل المثال، إن عرضت ملف PDF خلال عناوين URL متعددة، يمكنك الرجوع إلى رأس HTTP التي تتضمن السمة rel="canonical" على النحو التالي لعناوين URL المكررة لإخبار Googlebot بعنوان URL الأساسي لملف PDF:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

يدعم محرك البحث Google حاليًا هذه الطريقة لنتائج بحث الويب فقط.

استخدِم المسارات المطلقة وليس المسارات النسبية باستخدام عنصر الرابط rel="canonical". والمقصود:
استخدم هذه البنية:  http://www.example.com/downloads/white-paper.pdf
وليس هذه البنية: /downloads/white-paper.pdf
استخدام خريطة موقع

اختر عنوان URL أساسيًا لكل صفحة من صفحاتك واذكره في ملف sitemap. وتكون جميع الصفحات المُدرَجة في ملف sitemap مقترحة باعتبارها صفحات أساسية؛ وسوف يقرر Googlebot أيّ الصفحات مكررة (إن وجدت صفحات مكررة)، استنادًا إلى تشابه المحتوى.

نحن لا نضمن أننا سنعتبر عناوين URL لخريطة الموقع أساسية، ولكنها طريقة بسيطة لتعريف العناوين الأساسية لموقع كبير، وتُعَد ملفات sitemap طريقة مفيدة لإخبار محرك البحث Google بالصفحات التي تعتبرُها تتسم بالأهمية الكبرى على موقعك.

لا تُضمِّن صفحات غير أساسية في ملف sitemap. وعند استخدام ملف sitemap، حدِّد عناوين URL الأساسية فقط في خريطة الملف.

استخدام عمليات إعادة التوجيه 301 لعناوين URL المُستبعَدة

استخدم هذه الطريقة عندما تريد التخلص من الصفحات المكررة الحالية، ولكنك تحتاج إلى ضمان انتقال سلس قبل أن تستبعد عناوين URL القديمة.

لنفترض أن صفحتك يمكن الوصول إليها من خلال عدة طرق:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

اختر أحد عناوين URL هذه باعتباره عنوان URL الأساسي، واستخدم عمليات إعادة التوجيه 301 لإرسال الزيارات من عناوين URL الأخرى إلى عنوان URL المفضل. وتُعد طريقة إعادة التوجيه 301 من جانب الخادم أفضل طريقة لضمان توجيه المستخدمين ومحركات البحث إلى الصفحة الصحيحة. يعني رمز الحالة 301 أنه تم نقل إحدى الصفحات إلى مكان جديد بشكل دائم.

إذا كنت مشتركًا في خدمة استضافة مواقع ويب، يمكنك البحث عن وثائقها المتعلقة بإعداد عمليات إعادة التوجيه 301.

هل كانت هذه المقالة مفيدة؟
كيف يمكننا تحسينها؟