دمج عناوين URL المكرّرة

تعريف صفحة أساسية بالنسبة إلى صفحات مشابهة أو مكرّرة

إذا كان لديك صفحة واحدة يمكن الوصول إليها عن طريق عناوين URL مكرّرة أو كان لديك صفحات مختلفة تتضمن محتوى مماثلاً (على سبيل المثال، صفحة تحتوي على إصدار للجوَّال وإصدار لسطح المكتب معًا)، يرى Google تلك الصفحات كإصدارات متكرّرة للصفحة نفسها. سيختار Google عنوان URL واحدًا ليكون الإصدار الأساسي وتقوم بالزحف إلى هذا العنوان، وستُعد جميع عناوين URL الأخرى عناوين مكررة ويتم الزحف إليها بمعدل أقل. 

وإذا لم تخبر Google بعنوان URL الأساسي بوضوح، سيحدِّد هو الخيار المناسب نيابة عنك أو قد يعتبر الخيارين على قدم المساواة، ما قد يؤدي إلى سلوك غير مرغوب فيه كما هو موضّح في القسم التالي: لماذا يتعيّن عليّ اختيار عنوان URL أساسي؟

ما المقصود بعنوان URL الأساسي؟
عنوان URL الأساسي هو عنوان URL للصفحة التي يرى محرك البحث Google أنها الأهمّ من بين مجموعة من الصفحات المكرّرة على موقعك الإلكتروني. على سبيل المثال، إذا كان لديك عناوين URL للصفحة نفسها (مثل: example.com?dress = 1234 وexample.com/dresses/1234)، يختار Google عنوان URL واحدًا فقط بصفته أساسيًا. وتجدر الإشارة إلى أن هذا الأمر ينطبق على الصفحات المماثلة والمتطابقة تمامًا على حد سواء، أي أن التغييرات البسيطة في ترتيب صفحات القوائم أو فلترتها لا تجعل الصفحة فريدة (مثل، الترتيب بحسب السعر أو الفلترة بحسب لون العنصر).
ومن الوارد أن يكون عنوان URL الأساسي على نطاق مختلف عن ذلك الخاص بصفحة مكرَّرة.
مزيد من التفاصيل
عندما يفهرس Googlebot موقعًا إلكترونيًا، يحاول تحديد المحتوى الأساسي في كل صفحة. وإذا عثر Googlebot على صفحات مكرّرة على الموقع ذاته تبدو أنها متماثلة، يختار الصفحة التي يعتقد أنها الأكثر اكتمالاً ونفعًا ويميّزها على أنها أساسية. وسيزحف Google إلى الصفحة الأساسية بشكلٍ منتظم، بينما يزحف إلى النُسَخ المكرّرة بوتيرة أقل للتخفيف من حمل الزحف على موقعك.
ويختار محرك البحث Google الصفحة الأساسية استنادًا إلى عدد من العوامل (أو الإشارات) مثل ما إذا كان يتم عرض الصفحة من خلال http أو https وجودة الصفحة ووجود عنوان URL في ملف Sitemap، بالإضافة إلى أيّ تصنيف "rel=canonical". ويمكنك تحديد الصفحة التي تفضّلها لمحرك البحث Google بالطرق السابقة ولكنه لأسباب مختلفة قد يختار صفحة أساسية غير التي حدّدتها.
لا تُعَد نُسَخ اللغات المختلفة لصفحة واحدة نُسخًا مُكررة إلّا إذا كان المحتوى الرئيسي بنفس اللغة (أي إذا لم تتمّ ترجمة سوى الرأس والتذييل وغيرهما من النصوص غير المُهمة وظلّ المَتن كما هو، حينئذٍ تُعَد الصفحات مكرَّرة).
يستخدِم "محرك البحث Google" الصفحات الأساسية باعتبارها المصادر الرئيسية لتقييم المحتوى والجودة. وعادةً ما تشير نتيجة بحث Google إلى الصفحة الأساسية إلا إذا كان من الواضح أن إحدى النُسخ المكرّرة تناسب المستخدم على نحو أفضل: على سبيل المثال، من المحتمل أن تشير نتيجة البحث إلى صفحة الجوَّال إذا كان الجهاز المُستخدم هو الجوّال حتى إذا تم تمييز صفحة سطح المكتب باعتبارها أساسية.

لماذا يحتوي موقعي الإلكتروني على صفحات مشابهة/مكرّرة؟

هناك أسباب وجيهة تجعل موقعك يحتوي على عناوين URL مختلفة تشير إلى الصفحة نفسها، أو يشتمل على صفحات مكررة أو مشابهة جدًا في عناوين URL مختلفة. وفي ما يلي الأكثر شيوعًا منها:

  • التوافق مع أنواع الأجهزة المتعددة:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • تفعيل عناوين URL الديناميكية لعناصر مثل معلمات البحث أو معرِّفات الجلسات:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • إنْ كان نظام مدونتك يحفظ عناوين URL متعددة تلقائيًا عندما يتم وضع المشاركة ذاتها ضمن أقسام متعددة.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • إنْ تم تكوين الخادم لعرض المحتوى ذاته للمتغيرات المزوَّدة بالبادئة www أو بدونها، أو التي تتضمن http/https:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • إنْ تم نسخ المحتوى الذي تقدمه على مدونة لاقتباسه على مواقع أخرى في هذه النطاقات جزئيًا أو كليًا.
    https://news.example.com/green-dresses-for-every-day-155672.html (المشاركة المُقتبَسة) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (المشاركة الأصلية)

لماذا يتعين عليّ اختيار عنوان URL أساسي؟

هناك عدد من الأسباب التي تجعلك ترغب في الاختيار الصريح لصفحة أساسية في مجموعة من الصفحات المكررة/المشابهة:

  • لتحديد عنوان URL الذي تريد أن يشاهده الأشخاص في نتائج البحث، ربما تفضل أن يصل الأشخاص إلى صفحة منتج الفساتين الخضراء عبر https://www.example.com/dresses/green/greendress.html بدلاً من https://example.com/dresses/cocktail?gclid=ABCD.
  • لدمج إشارات الروابط للصفحات المشابهة أو المكررة. وذلك يساعد محركات البحث أن تتاح لها إمكانية دمج المعلومات المتوفرة لديها عن عناوين URL الفردية (مثل الروابط المؤدية إليها) في عنوان URL واحد مفضّل. وهذا يعني أن الروابط الصادرة من مواقع أخرى والمؤدية إلى http://example.com/dresses/cocktail?gclid=ABCD يتم دمجها مع الروابط المؤدية إلى https://www.example.com/dresses/green/greendress.html.
  • لتبسيط مقاييس التتبع لمنتج واحد/موضوع واحد. مع وجود مجموعة متنوعة من عناوين URL، يكون الأمر أكثر صعوبة للحصول على مقاييس مدمجة لنوع محدد من المحتوى.
  • لإدارة المحتوى المُقتبَس. في حالة اقتباس المحتوى التابع لك لنشره في نطاقات أخرى، يمكنك دمج ترتيب الصفحة مع عنوان URL المفضل لديك.
  • لتجنُّب قضاء وقت في الزحف على الصفحات المكرّرة؛ فأنت تريد من Googlebot تحقيق أقصى استفادة من موقعك الإلكتروني، لذا فمن الأفضل له أن يقضي الوقت في الزحف إلى صفحات جديدة (أو مُحدَّثة) على موقعك، بدلاً من الزحف إلى إصدارات سطح المكتب والجوَّال من الصفحات ذاتها.

ما عنوان URL الذي يعتبره Google أساسيًا؟

يمكنك استخدام أداة فحص عنوان URL لمعرفة الصفحة التي يعتبرها Google أساسية. وتجدر الإشارة إلى أنه حتى في حال تحديد صفحة أساسية بوضوح، قد يختار Google صفحة أساسية مختلفة لأسباب متعددة، مثل الأداء أو المحتوى.

تحرّي الخلل وإصلاحه

إذا كان عنوان URL الأساسي في موقع لا تملكه، لن تتمكّن من الاطّلاع على أي من الزيارات في الصفحة المكرّرة. في ما يلي بعض الأسباب الشائعة لوجود عنوان أساسي في موقع منفصل:
  • تحديد الصيغ المختلفة للغة على نحو غير سليم: إذا كانت لديك عدة مواقع ويب تعرض محتوى متماثلاً إلى حد كبير وتمت أقلمته ليتناسب مع مستخدمين مختلفين حول العالم، تأكَّد من اتّباع إرشاداتنا بشأن المواقع الإلكترونية المأقلَمة.
  • علامات الصفحة الأساسية غير الصحيحة: قد تستخدم بعض أنظمة إدارة المحتوى أو مكونات أنظمة إدارة المحتوى الإضافية أساليب تحديد عنوان URL الأساسي بشكل غير صحيح للإشارة إلى عناوين URL على مواقع إلكترونية خارجية. لذلك، عليك التحقق من المحتوى التابع لك لمعرفة إن كان الأمر كذلك. إذا كان موقعك يشير إلى إعداد مفضّل غير متوقع لعنوان URL أساسي، وهو ما قد يحدث نتيجة للاستخدام غير الصحيح لعلامات rel="canonical" أو عملية إعادة توجيه 301، عليك حل هذه المشكلة مباشرةً.
  • الضبط غير الصحيح للخوادم: قد تؤدي بعض إعدادات الضبط غير الصحيحة للاستضافة إلى اختيار غير متوقّع لعنوان URL عبر النطاق. مثل:
    • قد تتم تهيئة خادم ما بشكل خاطئ فيعرض محتوى من a.com كاستجابة لطلب عرض عنوان URL على b.com.
    • قد يعرض خادمان مختلفان على الويب صفحات soft 404 متطابقة يتعذّر على محرك البحث Google تحديدها كصفحات تحتوي على أخطاء.
  • الاختراق باستخدام البرامج الضارة: تُدخِل بعض الهجمات على المواقع الإلكترونية رموزًا تؤدي إلى عرض إعادة توجيه 301 عبر HTTP أو تُدرِج عنصر رابط rel=”canonical” عبر النطاقات في قسم <head> بتنسيق HTML أو في رأس HTTP، وعادةً ما يتم التوجيه إلى عنوان URL يستضيف محتوى ضارًا أو غير مرغوب فيه. وفي هذه الحالات، قد تختار الخوارزميات التي نستخدمها عنوان URL الضار أو غير المرغوب فيه بدلاً من عنوان URL في الموقع الإلكتروني الذي تم اختراقه.
  • موقع ويب مُحاكي: في بعض الحالات النادرة، قد تختار الخوارزميات التي نستخدمها عنوان URL من موقع إلكتروني خارجي يستضيف المحتوى التابع لك بدون إذنك. إذا كنت تعتقد أن هناك موقع ويب آخر يعرض نسخة من المحتوى الذي تقدمه بما يشكّل انتهاكًا لقانون حقوق الطبع والنشر، يمكنك الاتصال بمضيف الموقع الإلكتروني لطلب إزالة هذا المحتوى. بالإضافة إلى ذلك، يمكنك أن تطلب من Google إزالة الصفحة التي تمثل انتهاكًا من نتائج البحث من خلال تقديم طلب بموجب قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية.

تحديد صفحة أساسية

هناك بعض الطرق المختلفة لتحديد الصفحة الأساسية بين مجموعة مكررة، بناءً على استخدامك:

الطريقة الوصف
الإرشادات العامة اتّبِع هذه الإرشادات مع جميع أساليب تحديد عنوان URL الأساسي.
علامة rel=canonical <link>

أضف علامة <link> في الشفرة لجميع الصفحات المكررة، مع الإشارة إلى الصفحة الأساسية.

الإيجابيات:

  • إمكانية تعيين عدد غير محدود من الصفحات المكررة.

السلبيات:

  • إمكانية الإضافة إلى حجم الصفحة.
  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الكبيرة، أو المواقع التي تتغير فيها عناوين URL كثيرًا.
  • عدم الجدوى إلا مع صفحات HTML، وليس مع ملفات على شاكلة ملفات PDF. وفي مثل هذه الحالات، يمكنك استخدام رأس HTTP التي تتضمن السمة rel=canonical.
رأس HTTP التي تتضمن السمة rel=canonical

أرسل رأس rel=canonical في استجابة صفحتك.

الإيجابيات:

  • عدم زيادة حجم الصفحة.
  • إمكانية تعيين عدد غير محدود من الصفحات المكررة.

السلبيات:

  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الكبيرة، أو المواقع التي تتغير فيها عناوين URL كثيرًا.
ملف Sitemap

حدّد صفحاتك الأساسية في ملف sitemap.

الإيجابيات:

  • من السهل القيام به والحفاظ عليه، وخاصةً على المواقع الكبيرة.

السلبيات:

  • لا يزال يجب على Googlebot تحديد النسخة المكررة المرتبطة بأي صفحات أساسية تعلنها في خريطة الموقع.
  • إشارة أقل قوة إلى Googlebot مقارنة بأسلوب تعيين rel=canonical.
إعادة التوجيه 301 استخدم عمليات إعادة التوجيه 301 لإخبار Googlebot بأن عنوان URL مُحدَّد مُعاد توجيهه يمثل إصدارًا أفضل لعنوان URL مُعيَّن، ولكن لا تستخدمها إلا عند إنهاء العمل بصفحة مكررة معيَّنة.
متغير AMP إذا كان أحد المتغيرات عبارة عن صفحة AMP، ستحتاج إلى اتباع إرشادات AMP للإشارة إلى الصفحة الأساسية ومتغير AMP.

 

نوصيك باستخدام أي من هذه الطرق، ولكن تجدر الإشارة إلى أنها جميعًا لا تُعد إلزامية. إذا لم تحدد عنوان URL أساسيًا، سنحدّد ما نعتقد أنه أفضل إصدار أو عنوان URL.

الإرشادات العامة

بالنسبة إلى جميع طرق تحديد عنوان URL الأساسي، اتّبع هذه الإرشادات العامة.

الإرشادات العامة
  • لا تستخدم ملف robots.txt لأغراض متعلقة بتحديد عنوان URL الأساسي.
  • لا تستخدم أداة إزالة عناوين URL لتحديد عنوان URL الأساسي: لأنها تزيل كل إصدارات عنوان URL من البحث.
  • لا تحدِّد عناوين URL مختلفة كعناوين أساسية للصفحة ذاتها باستخدام أساليب تحديد عنوان URL الأساسي ذاتها أو أساليب مختلفة عنها (على سبيل المثال، لا تحدِّد عنوان URL في ملف Sitemap وعنوان URL مختلف للصفحة ذاتها باستخدام rel="canonical").
  • لا تستخدِم العلامة الوصفية noindex بصفتها وسيلة لمنع اختيار صفحة أساسية. ويهدف هذا التوجيه إلى استبعاد الصفحة من الفهرس، وليس لإدارة اختيار الصفحة الأساسية. 
  • حدِّد صفحة أساسية عند استخدام علامات hreflang. وحدِّد صفحة أساسية باللغة ذاتها أو حدِّد أفضل لغة بديلة ممكنة إذا لم تتوفر صفحة أساسية للغة ذاتها.

  • أنشئ روابط إلى عنوان URL الأساسي وليس عنوان URL المكرّر أثناء الربط بموقعك الإلكتروني. وهذا الربط الدائم بعنوان URL الذي تعتبره أساسيًا يساعد Google على استيعاب تفضيلاتك.

تفضيل HTTPS عن HTTP لعناوين URL الأساسية

يفضِّل محرك البحث Google صفحات HTTPS عن صفحات HTTP المكافئة عند استخدام صفحات أساسية، باستثناء عندما تكون هناك مشاكل أو إشارات متضاربة مثل ما يلي:

  • تتضمن صفحة HTTPS شهادة طبقة مقابس آمنة (SSL) غير صالحة.
  • تحتوي صفحة HTTPS على تبعيات غير آمنة (بخلاف الصور).
  • تعيد صفحة HTTPS توجيه المستخدمين إلى صفحة HTTP أو عبرها.
  • تتضمن صفحة HTTPS رابطًا يشتمل على سمة rel="canonical"‎ ويؤدي إلى صفحة HTTP.

على الرغم من أن أنظمتنا تفضّل صفحات HTTPS عن صفحات HTTP بشكل افتراضي، يمكنك التأكد من حدوث ذلك عن طريق تنفيذ أي من الإجراءات التالية:

  • إضافة عمليات إعادة توجيه من صفحة HTTP إلى صفحة HTTPS.
  • إضافة رابط يتضمن السمة rel="canonical"‎ من صفحة HTTP إلى صفحة HTTPS.
  • تنفيذ HSTS.

لمنع محرك البحث Google من جعل صفحة HTTP صفحة أساسية بشكلٍ خاطئ، يجب تجنب الممارسات التالية:

  • تجعلنا شهادات طبقة المقابس الآمنة (SSL) غير الصالحة وعمليات إعادة التوجيه من HTTPS إلى HTTP نفضل صفحة HTTP إلى حد كبير جدًا. ولا يمكن أن يلغي تنفيذ HSTS هذا التفضيل القوي.
  • تضمين صفحة HTTP في ملف Sitemap أو إدخالات hreflang بدلاً من إصدار HTTPS.
  • تنفيذ شهادة طبقة المقابس الآمنة (SSL) / طبقة النقل الآمنة (TLS) لمتغير المضيف الخاطئ: على سبيل المثال، يعرض example.com الشهادة لـ www.example.com.  ويجب أن تتطابق الشهادة مع عنوان URL الكامل للموقع الإلكتروني أو أن تكون شهادة أحرف بدل يمكن استخدامها لنطاقات فرعية متعددة في أحد النطاقات.

للمستخدمين المتقدمين فقط: إخبار محرك البحث Google بتجاهل المعلِّمات الديناميكية

يمكنك استخدام ميزة التعامل مع المعلِّمات لإخبار Googlebot بأي معلِّمات يجب تجاهلها أثناء الزحف. وقد يؤدي تجاهل معلِّمات مُعيَّنة إلى تقليل نسبة المحتوى المكرر في فهرس Google، ما يزيد من إمكانية الزحف إلى موقعك. على سبيل المثال، إنْ حددت أن المعلمة sessionid يجب أن يتم تجاهلها، فسيعتبر Googlebot عنواني URL عنوانين مكررين:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

طُرق معيّنة

اختر واحدة من الطرق التالية لتحديد عنوان URL أساسي لعناوين URL مكررة أو صفحات مكررة/مشابهة.

تأكَّد من اتّباع الإرشادات العامة أعلاه لجميع الطرق.

استخدام علامة رابط rel="canonical"

يمكنك استخدام علامة <link> في رأس الصفحة للإشارة إلى الحالة التي تكون فيها الصفحة نسخة مكررة من صفحة أخرى.

لنفترض أنك تريد أن يكون https://example.com/dresses/green-dresses عنوان URL الأساسي، على الرغم من أن هناك مجموعة متنوعة من عناوين URL يمكنها الوصول إلى هذا المحتوى. يمكنك الإشارة إلى عنوان URL هذا كعنوان أساسي باتّباع الخطوات التالية:

  1. تحديد جميع الصفحات المكرّرة باستخدام عنصر الرابط rel="canonical". يمكنك إضافة عنصر <link> يتضمن السمة rel="canonical" إلى القسم <head> في الصفحات المكرّرة، للإشارة إلى الصفحة الأساسية، على النحو التالي:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. إذا احتوت الصفحة الأساسية على صيغة مخصّصة للأجهزة الجوّالة، أضِف رابط rel="alternate" إليها، للإشارة إلى إصدار الصفحة المخصّص للأجهزة الجوّالة:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. أضِف أي علامة hreflang أو عمليات إعادة توجيه أخرى مناسبة للصفحة.

استخدِم المسارات الأساسية بدلاً من المسارات المنتسبة من خلال عنصر الرابط rel="canonical".

استخدم هذه البنية:  https://www.example.com/dresses/green/greendresss.html
وليس هذه البنية: /dresses/green/greendress.html
استخدام رأس HTTP التي تتضمن السمة rel="canonical"

إذا كان بإمكانك ضبط الخادم، يمكنك استخدام رؤوس HTTP التي تتضمن السمة rel="canonical" (بدلاً من علامات HTML) للإشارة إلى عنوان URL الأساسي للمستندات التي ليست بتنسيق HTML مثل ملفات PDF.

على سبيل المثال، إن عرضت ملف PDF خلال عناوين URL متعددة، يمكنك الرجوع إلى رأس HTTP التي تتضمن السمة rel="canonical" على النحو التالي لعناوين URL المكررة لإخبار Googlebot بعنوان URL الأساسي لملف PDF:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

يدعم محرك البحث Google حاليًا هذه الطريقة لنتائج بحث الويب فقط.

استخدِم المسارات الأساسية بدلاً من المسارات المنتسبة من خلال عنصر الرابط rel="canonical". والمقصود:
استخدم هذه البنية:  http://www.example.com/downloads/white-paper.pdf
وليس هذه البنية: /downloads/white-paper.pdf
استخدام خريطة موقع

اختر عنوان URL أساسيًا لكل صفحة من صفحاتك واذكره في ملف sitemap. وتكون جميع الصفحات المُدرَجة في ملف sitemap مقترحة باعتبارها صفحات أساسية؛ وسوف يقرر Googlebot أيّ الصفحات مكررة (إن وجدت صفحات مكررة)، استنادًا إلى تشابه المحتوى.

نحن لا نضمن أننا سنعتبر عناوين URL لخريطة الموقع أساسية، ولكنها طريقة بسيطة لتعريف العناوين الأساسية لموقع كبير، وتُعَد ملفات sitemap طريقة مفيدة لإخبار محرك البحث Google بالصفحات التي تعتبرُها تتسم بالأهمية الكبرى على موقعك.

لا تُضمِّن صفحات غير أساسية في ملف sitemap. وعند استخدام ملف sitemap، حدِّد عناوين URL الأساسية فقط في خريطة الملف.

استخدام عمليات إعادة التوجيه 301 لعناوين URL المُستبعَدة

استخدم هذه الطريقة عندما تريد التخلص من الصفحات المكررة الحالية، ولكنك تحتاج إلى ضمان انتقال سلس قبل أن تستبعد عناوين URL القديمة.

لنفترض أن صفحتك يمكن الوصول إليها من خلال عدة طرق:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

اختر أحد عناوين URL هذه باعتباره عنوان URL الأساسي، واستخدم عمليات إعادة التوجيه 301 لإرسال الزيارات من عناوين URL الأخرى إلى عنوان URL المفضل. وتُعد طريقة إعادة التوجيه 301 من جانب الخادم أفضل طريقة لضمان توجيه المستخدمين ومحركات البحث إلى الصفحة الصحيحة. يعني رمز الحالة 301 أنه تم نقل إحدى الصفحات إلى مكان جديد بشكل دائم.

إذا كنت مشتركًا في خدمة استضافة مواقع ويب، يمكنك البحث عن وثائقها المتعلقة بإعداد عمليات إعادة التوجيه 301.

هل كان ذلك مفيدًا؟
كيف يمكننا تحسينها؟