آلية عمل "بحث Google"

الاطّلاع على كيفية عثور محرك البحث Google على صفحات الويب والزحف إليها وعرضها

كيف يعمل "بحث Google"؟ إليك نسخة مختصرة ونسخة مفصّلة عن آلية عمل "بحث Google".

يجمع محرك البحث Google معلومات من مصادر مختلفة، بما في ذلك: 

  • صفحات الويب
  • المحتوى الذي يرسله المستخدمون، مثل المعلومات التي يسجّلونها في "نشاطي التجاري على Google" و"خرائط"
  • المسح الضوئي للكتب
  • قواعد البيانات العامة على الإنترنت
  • العديد من المصادر الأخرى

على أي حال، تركّز هذه المقالة على صفحات الويب.

نبذة مختصرة عن كيفية عمل "بحث Google"

تتّبع Google ثلاث خطوات أساسية لعرض نتائج من صفحات ويب:

الزحف

الخطوة الأولى هي التعرّف على الصفحات المنشورة على الويب. ليس هناك سجل مركزي يضم جميع صفحات الويب، لذا على محرك البحث Google أن يبحث باستمرار عن صفحات جديدة وأن يضيفها إلى قائمة الصفحات المعروفة لديه. تكون بعض الصفحات معروفة، لأنّ محرك البحث Google قد سبق أن زحف إليها. ويكتشف محرك البحث Google صفحات أخرى عندما يتّبع رابطًا مضمّنًا في صفحات معروفة ومؤدّيًا إلى صفحات جديدة. وثمة صفحات أخرى يكتشفها محرك البحث Google عندما يرسل مالك الموقع الإلكتروني قائمة بالصفحات (ملف Sitemap) التي يريد أن يزحف إليها محرك البحث. وإذا كنت تستخدم مضيف ويب مُدارًا، مثل Wix أو Blogger، قد يطلب هذا المضيف من Google الزحف إلى أي صفحات تعدّلها أو أي صفحات جديدة تنشئها.

بعد أن يكتشف محرك البحث Google عنوان URL للصفحة، يزور الصفحة أو يزحف إليها للتعرّف على مضمونها. يعرض محرك البحث Google الصفحة ويحلّل المحتوى النصي وغير النصي ويحلّل التصميم المرئي العام لتحديد المكان المناسب لظهور الصفحة في نتائج البحث. وكلما تمكّن محرك البحث Google من فهم موقعك الإلكتروني بشكل أفضل، زادت قدرتنا على المطابقة بين موقعك الإلكتروني والمستخدمين الذين يبحثون عن المحتوى الذي تنشره على هذا الموقع.

لتحسين زحف محرك البحث Google إلى موقعك الإلكتروني:

  • تأكّد من إمكانية وصول محرك البحث Google إلى صفحات موقعك الإلكتروني ومن أنها تظهر بشكل صحيح. يدخل محرك البحث Google إلى الويب كمستخدم مجهول الهوية (مستخدم بدون كلمات مرور أو معلومات). ويجب أيضًا أن يتمكن محرك البحث Google من الاطّلاع على جميع الصور والعناصر الأخرى للصفحة كي يتمكن من فهمها بشكل صحيح. يمكنك إجراء اختبار سريع من خلال كتابة عنوان URL الخاص بصفحتك في أداة فحص التوافق مع الأجهزة الجوّالة.
  • إذا أنشأت أو عدّلت صفحة واحدة، يمكنك إرسال عنوان URL فردي إلى Google. ولإبلاغ Google بالعديد من الصفحات الجديدة أو المعدّلة في آنٍ واحد، استخدِم ملف Sitemap.
  • إذا طلبت من محرك البحث Google أن يزحف إلى صفحة واحدة فقط، ننصحك بجعلها صفحتك الرئيسية. وتُعدّ صفحتك الرئيسية أهم صفحة على موقعك الإلكتروني بالنسبة إلى محرك البحث Google. ولحث محرك البحث Google على الزحف إلى موقعك الإلكتروني بالكامل، احرص على أن تتضمّن صفحتك الرئيسية (وجميع الصفحات) نظامًا جيدًا للتنقّل في الموقع من خلال توفير روابط مؤدية إلى جميع الأقسام والصفحات المهمّة على موقعك الإلكتروني، وذلك يساعد المستخدمين (ومحرك البحث Google) على التنقّل بسهولة في موقعك الإلكتروني. بالنسبة إلى المواقع الإلكترونية الأصغر حجمًا (أقل من 1,000 صفحة)، يكفي إبلاغ محرك البحث Google عن صفحتك الرئيسية، بشرط أن يتمكن من الوصول إلى جميع صفحاتك الأخرى باتّباع مسار من الروابط يبدأ من صفحتك الرئيسية. 
  • يمكنك إضافة روابط مؤدية إلى صفحتك من صفحات أخرى يعرفها محرك البحث Google. تجدر الإشارة إلى أنّ محرك البحث Google لن يتّبع الروابط المدرَجة في الإعلانات أو الروابط التي تدفع لها مقابلاً ماديًا في مواقع إلكترونية أخرى أو الروابط المدرَجة في التعليقات أو غيرها من الروابط التي لا تتّبع إرشادات مشرفي المواقع من Google.

 

لا تقبل Google تلقّي دفعات مالية مقابل زيادة عدد مرات زحف محرّك بحثها إلى موقع إلكتروني أو وضع الموقع الإلكتروني في ترتيب أفضل في نتائج البحث. إذا أخبرك أي شخص بأي معلومات تناقض ذلك، اعلم أنه مخطئ.

الفهرسة

بعد أن يتمّ العثور على صفحة، يحاول محرّك البحث Google التعرُّف على مضمون الصفحة. وهذه العملية تُسمّى الفهرسة. يحلّل محرك البحث Google محتوى الصفحة ويفهرس الصور وملفات الفيديو المضمّنة في الصفحة ويحاول فهم مضمون الصفحة بأي أسلوب آخر. ويتم حفظ هذه المعلومات في فهرس Google، وهو قاعدة بيانات ضخمة يتم حفظها على عدد هائل من أجهزة الكمبيوتر.

لتحسين فهرسة صفحات موقعك الإلكتروني:

  • أنشئ عناوين مختصرة ومفهومة للصفحات.
  • استخدِم عناوين للصفحات تعبّر بوضوح عن موضوعها.
  • استخدِم النص بدلاً من الصور للتعبير عن المحتوى. (يستطيع محرك البحث Google التعرُّف على بعض الصور والفيديوهات، ولكنّه يفهم النصوص بشكل أفضل. وننصحك بإضافة تعليقات توضيحية على الأقل إلى الفيديوهات والصور، وذلك باستخدام نصوص بديلة وسمات أخرى حسبما تقتضي الحاجة).

عرض صفحات ويب (وتحديد ترتيبها) في نتائج البحث

عندما يكتب مُستخدِم عبارة بحث، يحاول محرك البحث Google العثور على الإجابة الأكثر صلة ضمن فهرسه استنادًا إلى عوامل متعدّدة. ويحاول محرك البحث Google تحديد أفضل الإجابات ومراعاة عوامل أخرى من شأنها تحسين تجربة المستخدم لأقصى حد وتزويد المستخدم بالإجابات المناسبة، ومن هذه العوامل الموقع الجغرافي للمُستخدِم ولغته وجهازه (سواء كان كمبيوتر أو هاتفًا). على سبيل المثال، عند البحث عن "محلات إصلاح الدرّاجات"، ستختلف النتائج التي تظهر لمُستخدِم في دبي عن النتائج التي تظهر لمُستخدِم في بيروت. لا تقبل Google تلقّي دفعات مالية مقابل وضع الموقع الإلكتروني في ترتيب أفضل في نتائج البحث، ويتم تحديد ترتيبه آليًا.

لتحسين عرض موقعك الإلكتروني في نتائج البحث وتحسين ترتيبه فيها:

النسخة المفصّلة عن آلية عمل "بحث Google"

ستجد أدناه المزيد من المعلومات المفصّلة.

النسخة المفصّلة عن آلية عمل "بحث Google"

الزحف

الزحف هو العملية التي من خلالها يزور Googlebot الصفحات الجديدة والمعدّلة لإضافتها إلى فهرس Google.

نحن نستخدم مجموعة ضخمة من أجهزة الكمبيوتر لجلب (أو "الزحف إلى") مليارات الصفحات على الويب. ويُعرف البرنامج الذي يجلب الصفحات باسم Googlebot (وهو معروف أيضًا باسم برنامج روبوت أو برنامج تتبّع أو برنامج عنكبوت). يستخدم Googlebot عملية تعتمد على الخوارزميات لتحديد المواقع الإلكترونية التي يزحف إليها وعدد مرات الزحف وعدد الصفحات التي يجلبها من كل موقع إلكتروني.

وتبدأ عملية زحف Google بقائمة عناوين URL لصفحات ويب تم إنشاؤها من عمليات زحف سابقة ومعزّزة ببيانات ملف Sitemap التي قدّمها مشرفو المواقع. وعندما يزور Googlebot إحدى الصفحات ، يكتشف روابط مضمّنة في الصفحة ويضيفها إلى قائمة الصفحات التي سيتم الزحف إليها. ويرصد Googlebot المواقع الإلكترونية الجديدة والتغييرات التي أُجريَت على المواقع الإلكترونية الحالية والروابط المعطّلة، ثم يستخدمها لتعديل "فهرس Google".

أثناء الزحف، يعرض محرك البحث Google الصفحة باستخدام إصدار حديث من Chrome. وكجزء من عملية العرض، يتم تشغيل أي نصوص برمجية يكتشفها في الصفحة. إذا كان موقعك الإلكتروني يستخدم محتوًى تم إنشاؤه ديناميكيًا، تأكّد من اتّباع القواعد الأساسية لتحسين محركات البحث المستندة إلى JavaScript.

الزحف الأساسي / الزحف الثانوي

يستخدم محرك البحث Google زاحفَين مختلفَين للزحف إلى المواقع الإلكترونية: زاحف خاص بالأجهزة الجوّالة وآخر خاص بأجهزة الكمبيوتر. يحاكي كل نوع زاحف مستخدمًا يزور صفحتك على جهاز من ذلك النوع.

يستخدم محرك البحث Google نوع زاحف واحدًا (إما للأجهزة الجوّالة أو لأجهزة الكمبيوتر) باعتباره الزاحف الأساسي لموقعك الإلكتروني. ويتم الزحف إلى جميع صفحات موقعك الإلكتروني التي يزحف إليها محرك البحث Google باستخدام الزاحف الأساسي. ويتم استخدام الزاحف الخاص بالأجهزة الجوّالة كزاحف أساسي إلى جميع المواقع الإلكترونية الجديدة.

إضافةً إلى ذلك، يعيد محرك البحث Google الزحف إلى بعض صفحات موقعك الإلكتروني بنوع الزاحف الآخر (الخاص بالأجهزة الجوّالة أو أجهزة الكمبيوتر). ويُعرف هذا الإجراء باسم الزحف الثانوي، ويتم تنفيذه لتقييم أداء موقعك الإلكتروني على النوع الآخر من الأجهزة.

كيف يتعرّف محرك البحث Google على الصفحات المطلوب عدم الزحف إليها؟

  • لن يزحف محرك البحث Google إلى الصفحات التي تمّ حظر الوصول إليها باستخدام ملف robots.txt، ولكنه قد يفهرس هذه الصفحات إذا كانت هناك روابط لها مضمّنة في صفحة أخرى. (ويستطيع محرك البحث Google استنتاج محتوى الصفحة من خلال رابط يوجّه المُستخدِمين إليها وفهرسة الصفحة بدون تحليل محتواها.)
  • لا يستطيع محرك البحث Google الزحف إلى أي صفحات تتطلّب من زوّارها تسجيل الدخول. وبالتالي، سيتم منع الزحف إلى صفحة إذا كانت تتطلّب تسجيل الدخول أو إذا كانت محمية بأسلوب آخر من أساليب المصادقة.
  • يتم الزحف بمعدّل أقل إلى الصفحات التي سبق الزحف إليها والتي تُعتبر نُسخًا مكرّرة من صفحة أخرى.

تحسين الزحف إلى صفحات موقعك الإلكتروني

يمكنك استخدام الأساليب التالية لمساعدة محرك البحث Google على رصد الصفحات المناسبة على موقعك الإلكتروني:

الفهرسة

يعالج Googlebot كل صفحة يزحف إليها بهدف فهم محتواها. ويشمل ذلك معالجة المحتوى النصي والعلامات والسمات الرئيسية للمحتوى، مثل علامات <title> وسمات النص البديل والصور والفيديوهات وغير ذلك. ويستطيع Googlebot معالجة عدّة أنوع من المحتوى ولكن ليس كلّها. على سبيل المثال، لا نستطيع معالجة محتوى بعض ملفات الوسائط المتعددة التفاعلية.

في مرحلةٍ معيّنة ما بين الزحف والفهرسة، يحدّد محرك البحث Google ما إذا كانت الصفحة أساسية أو نسخة مكرّرة من صفحة أخرى. وإذا تم اعتبار الصفحة نسخة مكرّرة، سيتم الزحف إليها بمعدّل أقل بكثير. يتم تجميع الصفحات المتشابهة معًا في مستند، وهو عبارة عن مجموعة مكوّنة من صفحة واحدة أو أكثر تتضمّن الصفحة الأساسية (الأكثر تمثيلاً للمجموعة) وأي نُسخ مكرّرة تم العثور عليها (والتي قد تكون عناوين URL بديلة للوصول إلى الصفحة نفسها أو إصدارًا بديلاً من الصفحة نفسها مخصصًا للأجهزة الجوّالة أو لأجهزة الكمبيوتر).

جدير بالذكر أنّ محرك البحث Google لا يفهرس الصفحات التي تحتوي على أمر noindex (العنوان أو العلامة). ولكي يتمكّن محرك البحث Google من الاستجابة لأمر عدم الفهرسة، يجب أن يتمكن من رؤيته، لأنه إذا تم حظر وصوله إلى الصفحة باستخدام ملف robots.txt أو صفحة تسجيل دخول أو جهاز آخر، من الممكن أن يفهرس محرك البحث Google الصفحة حتى لو لم يزحف إليها.

تحسين فهرسة موقعك الإلكتروني

ثمة أساليب متعددة لتحسين قدرة محرك البحث Google على التعرّف على محتوى صفحتك:

ما المقصود بكلمة "مستند"؟

داخليًا، تصف Google الويب على أنه مجموعة (هائلة) من المستندات. ويمثل كل مستند صفحة ويب واحدة أو أكثر. وتكون هذه الصفحات إما متطابقة أو متشابهة جدًا، ولكنها تتضمّن في الأساس المحتوى نفسه الذي يمكن الوصول إليه من خلال عناوين URL مختلفة. ويمكن أن تؤدي عناوين URL المختلفة في المستند إلى الصفحة نفسها بالضبط (على سبيل المثال، قد يعرض العنوانان example.com/dresses/summer/1234 وexample.com?product=1234 الصفحة نفسها) أو إلى الصفحة نفسها مع تغييرات بسيطة كي تناسب المستخدمين على أجهزة مختلفة (على سبيل المثال، example.com/mypage لمستخدمي أجهزة الكمبيوتر وm.example.com/mypage لمستخدمي الأجهزة الجوّالة).

يختار محرك البحث Google أحد عناوين URL في مستند ويعرّفه على أنه عنوان‎ URL الأساسي. وعنوان URL الأساسي للمستند هو أكثر عنوان URL يزحف إليه محرك البحث Google ويفهرسه. أما عناوين URL الأخرى، فتُعتبر نُسخًا مكرّرة أو عناوين بديلة، وقد يتم الزحف إليها من حين إلى آخر أو عرضها بناءً على طلب المستخدم: على سبيل المثال، إذا كان عنوان URL الأساسي هو عنوان URL للأجهزة الجوّالة، سيستمر محرك البحث Google على الأرجح في عرض عنوان URL (البديل) المخصّص لأجهزة الكمبيوتر وذلك للمستخدمين الذين يجرون عمليات بحث على أجهزة الكمبيوتر.

وتنسب معظم التقارير في Search Console البيانات إلى عنوان URL الأساسي للمستند. تتيح بعض الأدوات (مثل أداة فحص عنوان URL) اختبار عناوين URL بديلة، ولكن يجب أن يوفّر فحص عنوان URL الأساسي معلومات حول عناوين URL البديلة أيضًا.

يمكنك إبلاغ Google بعنوان URL الذي تعتقد أنه العنوان الأساسي، ولكن محرك البحث Google قد يختار عنوانًا أساسيًا مختلفًا لأسباب عديدة.

إليك ملخّص عن المصطلحات وكيفية استخدامها في Search Console:

  • المستند: هو مجموعة من الصفحات المتشابهة. ويتضمّن عنوان URL أساسيًا، ويمكن أن يتضمّن عناوين URL بديلة إذا كان موقعك الإلكتروني يحتوي على صفحات مكرّرة. وقد تكون عناوين URL المضمّنة في المستند واردة من المؤسسة نفسها أو من مؤسسة مختلفة (النطاق الجذر "google" على سبيل المثال في www.google.com). يختار محرك البحث Google أفضل عنوان URL لعرضه في نتائج البحث استنادًا إلى منصّة العرض المستخدمة (الجوّال/جهاز الكمبيوتر) أو لغة المستخدم أو الموقع الجغرافي وغيرها من المتغيرات. يكتشف محرك البحث Google الصفحات ذات الصلة على موقعك الإلكتروني من خلال الزحف الأصلي، أو من خلال الميزات التي يطّبقها الموقع، مثل عمليات إعادة التوجيه أو علامات <link rel=alternate/canonical>. للإشارة إلى الصفحات ذات الصلة الواردة من المؤسسات الأخرى كصفحات بديلة، يجب ترميزها صراحةً على موقعك الإلكتروني (من خلال عمليات إعادة التوجيه أو علامات الروابط).
  • عنوان URL: هو عنوان URL المستخدَم للوصول إلى جزء معيّن من المحتوى على أحد المواقع الإلكترونية. قد يحلّل الموقع الإلكتروني عناوين URL مختلفة ويربطها بالصفحة نفسها.
  • الصفحة: هي صفحة ويب معيّنة يتم الوصول إليها عن طريق عنوان URL واحد أو أكثر. وقد تكون هناك إصدارات مختلفة من الصفحة استنادًا إلى منصّة المستخدم (الجوّال أو جهاز الكمبيوتر أو الجهاز اللوحي وما إلى ذلك).
  • النسخة: هي صيغة واحدة من الصفحة، ويتم تصنيفها عادةً على أنها مخصّصة لـ "الأجهزة الجوّالة" و"أجهزة الكمبيوتر" وAMP (على الرغم من أن نسخة AMP يمكن أن تتضمّن نسخًا للأجهزة الجوّالة وأجهزة الكمبيوتر). يمكن أن يكون لكل نسخة عنوان URL مختلفًا (example.com في مقابل m.example.com) أو عنوان URL نفسه (إذا كان موقعك الإلكتروني يستخدم العرض الديناميكي أو تصميم الويب السريع الاستجابة، يمكن أن يعرض عنوان URL نسخًا مختلفة من الصفحة نفسها) وفقًا لتصميم موقعك الإلكتروني. لا تُعتبر صيغ اللغة نسخًا مختلفة، بل مستندات مختلفة.
  • الصفحة الأساسية أو عنوان URL الأساسي: هي عنوان URL الذي يعتبره محرك البحث Google الأكثر تمثيلاً للمستند. يزحف محرك البحث Google دائمًا إلى عنوان URL هذا، ويزحف في بعض الأحيان إلى عناوين URL المكرّرة في المستند.
  • الصفحة البديلة/المكرّرة أو عنوان URL البديل/المكرّر: هو عنوان URL للمستند الذي قد يزحف إليه محرك البحث Google في بعض الأحيان. يعرض محرك البحث Google أيضًا عناوين URL هذه إذا كانت مناسبة للمستخدم ومطابقة للطلب (على سبيل المثال، سيتم عرض عنوان URL بديل للطلبات التي يجريها المستخدمون على أجهزة الكمبيوتر بدلاً من عنوان URL الأساسي المخصّص للأجهزة الجوّالة).
  • الموقع: يُستخدم عادةً كمرادف لموقع إلكتروني (مجموعة من صفحات الويب المرتبطة بمفهوم واحد)، ولكن يُستخدم أحيانًا كمرادف لموقع في Search Console، على الرغم من أنه يمكن في الواقع تعريف الموقع باعتباره جزءًا من أحد المواقع الإلكترونية. يمكن أن يشمل الموقع نطاقات فرعية (وحتى مؤسسات إذا كانت صفحات AMP مرتبطة بشكل صحيح).

يتم تخزين الصفحات التي تتضمّن المحتوى نفسه بلغات مختلفة في مستندات مختلفة تشير إلى بعضها بعضًا باستخدام علامات hreflang، ولهذا من المهم استخدام علامات hreflang للمحتوى المترجَم.

عرض نتائج البحث

عندما يجري المستخدم عملية بحث، تبحث محركاتنا في الفهرس عن الصفحات المطابقة وتعرض له النتائج التي نعتبرها الأكثر صلةً بالمحتوى الذي يبحث عنه. ويتم تحديد مدى الصلة بموضوع البحث من خلال مئات العوامل، ونعمل دائمًا على تحسين الخوارزميات التي نستخدمها. ويأخذ محرك البحث Google تجربة المستخدم بالاعتبار عند اختيار نتائج البحث وترتيبها، لذا احرص على أن تكون صفحتك سريعة التحميل ومتوافقة مع الأجهزة الجوّالة.

تحسين عرض موقعك الإلكتروني في نتائج البحث

  • إذا كانت نتائج البحث عن موقعك الإلكتروني تستهدف مستخدمين في مناطق جغرافية محدّدة أو يتحدثون بلغات محدّدة، يمكنك إعلام Google بخياراتك المفضّلة.
  • احرص على أن تكون صفحات موقعك الإلكتروني سريعة التحميل ومتوافقة مع الأجهزة الجوّالة.
  • اتّبِع إرشادات مشرفي المواقع لتجنّب الأخطاء الشائعة وتحسين ترتيب موقعك الإلكتروني في نتائج البحث.
  • جرِّب الاستفادة من ميزات نتائج البحث لموقعك الإلكتروني، مثل بطاقات وصفات الطعام أو بطاقات المقالات.
  • استخدِم صفحات بتنسيق AMP لزيادة سرعة تحميلها على الأجهزة الجوّالة. وبعض صفحات AMP مؤهَّلة أيضًا للاستفادة من ميزات إضافية في نتائج البحث، مثل منصة العرض بعناصر متغيرة الخاصة بأهم الأخبار.
  • تتحسّن بشكل متواصل الخوارزميات التي تستخدمها Google، لذا ننصحك بالتركيز على اتّباع إرشاداتنا وإنشاء محتوى جيد وتجديده باستمرار ليلقى إعجاب المستخدمين، بدلاً من محاولة تخمين طريقة عمل الخوارزميات وتصميم صفحات موقعك الإلكتروني للتوافق مع طريقة عملها.

المزيد من التفاصيل الدقيقة عن آلية عمل "بحث Google"

يمكنك الاطّلاع على المزيد من التفاصيل الدقيقة عن آلية عمل "بحث Google" (مع صور وفيديوهات).

هل كان ذلك مفيدًا؟
كيف يمكننا تحسينها؟