تقرير ملفات robots.txt

التحقّق من قدرة Google على معالجة ملفات robots.txt الخاصة بموقعك الإلكتروني

يعرض تقرير ملفات robots.txt الملفات التي عثر عليها محرّك بحث Google لأهم 20 مضيفًا على موقعك الإلكتروني، وآخر مرة تم الزحف فيها إلى تلك الملفات، وأي تحذيرات أو أخطاء حدثت أثناء عملية الزحف. يتيح لك التقرير أيضًا طلب إعادة الزحف إلى ملف robots.txt محدّد في الحالات الطارئة.

يُستخدَم ملف robots.txt لمنع محرّكات البحث من الزحف إلى موقعك الإلكتروني. أما لمنع ظهور المحتوى في نتائج البحث، فيمكنك استخدام علامة noindex.

يتوفّر هذا التقرير للمواقع الإلكترونية على مستوى النطاق فقط. وهي تشمل أيًا مما يلي:

موقع إلكتروني في نطاق (مثل example.com أو m.example.com)
موقع إلكتروني يحمل بادئة عنوان URL بدون مسار، مثل https://example.com/‎، ولكن ليس https://example.com/path/‎

فتح تقرير ملف robots.txt

الاطّلاع على ملفات robots.txt وحالة الزحف

إذا كان لديك موقع إلكتروني في نطاق، يعرض التقرير ملفات robots.txt من أهم 20 مضيفًا في ذلك الموقع.

عند التحقّق من ملف robots.txt باستخدام Search Console، يمكنك الاطّلاع على المعلومات التالية:

مسار الملف: وهو عنوان URL الكامل الذي تحقّق محرّك بحث Google من توفُّر ملف robots.txt فيه. ويظهر عنوان URL في التقرير فقط إذا تم تصنيفه بالحالتين "تم استرجاعه" أو "لم يتم استرجاعه" في أيّ وقت خلال آخر 30 يومًا. راجِع القسم موقع ملفات robots.txt.
حالة الاسترجاع: وهي حالة آخر طلب استرجاع لهذا الملف. في ما يلي القيم المحتمَلة لهذه الحالة:
- لم يتم استرجاعه - لم يتم العثور عليه (404): حدث خطأ 404 (الملف غير موجود) عند طلب هذا الملف. إذا كنت قد نشرت ملف robots.txt على عنوان URL المدرَج وظهر لك هذا الخطأ، جرِّب فحص عنوان URL للتحقّق من أيّ مشاكل متعلّقة بتوفّر الملف. إذا بقي الملف مصنّفًا بالحالة لم يتم العثور عليه (404) لمدة 30 يومًا، لن يظهر الملف بعد ذلك في التقرير (إلا أنّ محرّك بحث Google سيواصل فحصه في الخلفية). إذا لم يظهر ملف robots.txt، هذه إشارة جيدة، وهي تعني أنّ محرّك بحث Google يستطيع الزحف إلى جميع عناوين URL على موقعك الإلكتروني. ننصحك بالاطّلاع على سلوك محرّك بحث Google بشأن ملفات robots.txt التي تتضمّن أخطاءً لمعرفة التفاصيل الكاملة.
- لم يتم استرجاعه - أي سبب آخر: حدثت مشكلة أخرى عند طلب هذا الملف. راجِع قائمة مشاكل الفهرسة.
- تم استرجاعه: أدّت محاولة الزحف الأخيرة إلى عرض ملف robots.txt بنجاح. وإذا تم العثور على أيّ مشاكل أثناء تحليل الملف، سيتم إدراجها في عمود المشاكل. يتجاهل محرّك بحث Google الأسطر التي تتضمن مشاكل ويستخدم الأسطر التي يمكنه تحليلها.
تاريخ التحقّق: يشير إلى آخر مرة حاول فيها محرّك بحث Google الزحف إلى عنوان URL هذا بالتوقيت المحلي.
الحجم: يشير إلى حجم الملف الذي تم جلبه، بالبايت. وسيكون هذا الحقل فارغًا إذا لم تنجح آخر محاولة استرجاع.
المشاكل: يعرض الجدول عدد أيّ مشاكل مرتبطة بتحليل محتوى الملف حدثت عند استرجاعه لآخر مرة. تؤدي الأخطاء إلى منع استخدام أيّ قاعدة، إلا أنّ التحذيرات لا تؤدي إلى منع استخدام القاعدة. يمكنك الاطّلاع على سلوك محرّك بحث Google بشأن ملفات robots.txt التي تتضمّن أخطاءً. لحلّ المشاكل المتعلقة بالتحليل، استخدِم أداة التحقّق من ملف robots.txt.

الاطّلاع على آخر إصدار تم استرجاعه

يمكنك الاطّلاع على آخر إصدار تم استرجاعه من ملف robots.txt عن طريق النقر عليه في قائمة الملفات ضمن التقرير. إذا تضمّن ملف robots.txt أيّ أخطاء أو تحذيرات، سيتم تمييزها ضمن محتوى الملف المعروض. ويمكنك التنقل بين الأخطاء والتحذيرات باستخدام مفاتيح الأسهم.

الاطّلاع على الإصدارات التي تم استرجاعها سابقًا

للاطّلاع على طلبات استرجاع ملف robots.txt معيّن الصادرة خلال آخر 30 يومًا، انقر على الملف في قائمة الملفات ضمن التقرير، ثم انقر على الإصدارات. للاطّلاع على محتوى الملف الخاص بإصدار معيّن، انقر على الإصدار المطلوب. لا يتم تضمين الطلب في السجلّ إلا إذا كان هناك اختلاف بين طلب الاسترجاع السابق للملف والملف الذي تم استرجاعه أو نتيجة الاسترجاع.

إذا واجه محرّك بحث Google خطأً في الاسترجاع أثناء آخر محاولة أجراها، سيستخدم آخر إصدار خالٍ من الأخطاء تم استرجاعه بنجاح، وذلك لمدة تصل إلى 30 يومًا.

طلب إعادة الزحف

يمكنك طلب إعادة الزحف إلى ملف robots.txt بعد إصلاح خطأ أو إجراء تغيير مهم.

الحالات التي يمكن فيها طلب إعادة الزحف

بشكل عام، لا تحتاج إلى طلب إعادة الزحف إلى ملف robots.txt لأنّ محرّك بحث Google يعيد الزحف إلى هذه الملفات بشكل متكرّر. مع ذلك، يمكنك طلب إعادة الزحف إلى ملف robots.txt في الحالتين التاليتين:

إذا غيّرت قواعد ملف robots.txt بهدف إزالة حظر الزحف إلى بعض عناوين URL المهمة وأردت إبلاغ محرّك بحث Google بذلك سريعًا (عِلمًا أنّ ذلك لا يضمن إعادة الزحف فورًا إلى عناوين URL المعنيّة).
إذا أصلحت خطأً في الاسترجاع أو خطأً ملحًّا آخر.

كيفية طلب إعادة الزحف

لطلب إعادة الزحف، انقر على رمز المزيد من الإعدادات بجانب ملف في قائمة ملفات robots.txt، ثم انقر على طلب إعادة الزحف.

المواقع الإلكترونية على خدمات الاستضافة

إذا كان موقعك الإلكتروني مستضافًا على خدمة استضافة، قد لا يكون من السهل تعديل ملف robots.txt. في هذه الحالة، راجِع مستندات المضيف لمعرفة كيفية حظر محرّك بحث Google من الزحف إلى صفحات محدّدة أو فهرستها.

يُرجى العِلم أنّ معظم المستخدمين يهمّهم منع ظهور الملفات في "بحث Google"، وليس منع Google من الزحف إليها. إذا كنت مهتمًا بمنع ظهور صفحاتك، ابحث في خدمة الاستضافة عن معلومات حول كيفية حظر الصفحات من الظهور في محرّكات البحث.

موقع ملفات robots.txt

المصطلحات:

البروتوكول، (ويسمى أيضًا المخطط) هو إما HTTP أو HTTPS.
المضيف هو كل المحتوى في عنوان URL بعد البروتوكول (http://‎ أو https://‎) لغاية المسار. بالتالي، يشير المضيف m.de.example.com إلى 3 مضيفات محتملة هي m.de.example.com وde.example.com وexample.com، ويمكن أن يكون لكل مضيف ملف robots.txt خاص به.
المصدر هو البروتوكول مع المضيف. ويمكن أن يكون بالشكل التالي: https://example.com/‎ أو https://m.example.co.es/‎.

وفقًا لمعيار RFC 9309، يجب أن يكون ملف robots.txt في جذر كل تركيبة مكوّنة من بروتوكول ومضيف في موقعك الإلكتروني.

إذا كان لديك موقع إلكتروني في نطاق:

تختار خدمة Search Console أهم 20 مضيفًا، بالترتيب حسب معدل الزحف. يمكن أن يعرض التقرير ما يصل إلى مصدرَين لكل نطاق، ما يعني أنّ الجدول يمكن أن يعرض ما يصل إلى 40 صفًا. وإذا لم تتمكن من العثور على عنوان URL الخاص بملف robots.txt لأحد المضيفات، يمكنك إنشاء موقع إلكتروني في نطاق للنطاق الفرعي غير المتوفر.
تتحقق خدمة Search Console من عنوانَي URL لكل مضيف:
- http://<host>/robots.txt
- https://<host>/robots.txt
إذا بقي ملف robots.txt على عنوان URL المطلوب مصنّفًا بالحالة لم يتم العثور عليه لمدة 30 يومًا، لن تعرض خدمة Search Console عنوان URL في هذا التقرير، إلا أنّ محرّك بحث Google سيواصل التحقّق منه في الخلفية. وفي جميع الحالات الأخرى، سيعرض التقرير عنوان URL الذي تم التحقّق منه.

إذا كان الموقع الإلكتروني يحمل بادئة عنوان URL على مستوى المضيف (مثل https://example.com/‎)، تتحقّق خدمة Search Console من مصدر واحد فقط لذلك الموقع الإلكتروني. أي بالنسبة إلى الموقع الإلكتروني https://example.com، تتحقّق خدمة Search Console من https://example.com/robots.txt فقط، وليس من http://example.com/robots.txt أو https://m.example.com/robots.txt.

المهام الشائعة

عرض ملف robots.txt

لفتح ملف robots.txt مدرَج في هذا التقرير، انقر على الملف في قائمة ملفات robots.txt. لفتح الملف في المتصفّح، انقر على فتح ملف robots.txt المنشور.

يمكنك فتح أيّ ملف robots.txt على الويب في المتصفّح. راجِع المعلومات أدناه لمعرفة عنوان URL الذي يجب استخدامه.

الأماكن التي تتضمّن ملفات robots.txt

يتم وضع ملف robots.txt في جذر البروتوكول والنطاق. لتحديد عنوان URL، احذف كل المحتوى بعد المضيف (والمنفذ الاختياري) في عنوان URL الخاص بالملف، ثم أضِف "‎/robots.txt". وفي حال توفُّر ملف robots.txt، يمكنك الانتقال إليه في المتصفّح. لا تكتسب النطاقات الفرعية أو النطاقات الرئيسية ملفات robots.txt، ويمكن أن تتأثر صفحة معينة بملف robots.txt واحد فقط. في ما يلي بعض الأمثلة:

عنوان URL الخاص بالملف	عنوان URL الخاص بملف robots.txt الذي يمكن أن يؤثر في هذا الملف
http://example.com/home	http://example.com/robots.txt
https://m.de.example.com/some/page/here/mypage	https://m.de.example.com/robots.txt
https://example.com?pageid=234#myanchor	https://example.com/robots.txt
https://images.example.com/flowers/daffodil.png	https://images.example.com/robots.txt

تحديد ملف robots.txt الذي يؤثر في إحدى الصفحات أو الصور

للعثور على عنوان URL الخاص بملف robots.txt الذي يؤثر في الصفحة أو الصورة:

ابحث عن عنوان URL المحدّد الخاص بالصفحة أو الصورة. بالنسبة إلى الصور، انقر بزر الماوس الأيمن في متصفّح Google Chrome واختَر نسخ عنوان URL للصورة.
أزِل الجزء النهائي الذي يلي نطاق المستوى الأعلى في عنوان URL (على سبيل المثال، ‎.com و ‎.org و .‎co.il) وأضِف ‎/robots.txt بدلاً من الجزء الذي أزلته. وبالتالي، إذا كانت الصورة متاحة على العنوان https://images.example.com/flowers/daffodil.png، يكون عنوان URL الخاص بملف robots.txt هو https://images.example.com/robots.txt.
افتح عنوان URL في المتصفّح للتأكّد من أنّه متوفّر. إذا لم يتمكن المتصفّح من فتح الملف، هذا يعني أنّه غير موجود.

اختبار ما إذا كان محرّك بحث Google محظورًا من خلال ملف robots.txt

إذا كنت تريد معرفة ما إذا تم حظر عنوان URL معيّن باستخدام ملف robots.txt، يمكنك اختبار توفُّر عنوان URL من خلال أداة فحص عنوان URL.
إذا كنت مطوِّرًا، اطّلِع على مكتبة robots.txt المفتوحة المصدر من Google، والتي تُستخدم أيضًا في "بحث Google". يمكنك استخدام هذه الأداة لاختبار ملفات robots.txt محليًا على جهاز الكمبيوتر.

مزيد من المعلومات

ما هو ملف robots.txt وكيف يتم استخدامه؟
كيفية تنفيذ ملف robots.txt

اختَر قسمًا لتقديم تعليقات عنه.

هل كان ذلك مفيدًا؟

كيف يمكننا تحسينها؟

تقرير ملفات robots.txt

الاطّلاع على ملفات robots.txt وحالة الزحف

الاطّلاع على آخر إصدار تم استرجاعه

الاطّلاع على الإصدارات التي تم استرجاعها سابقًا

طلب إعادة الزحف

الحالات التي يمكن فيها طلب إعادة الزحف

كيفية طلب إعادة الزحف

المواقع الإلكترونية على خدمات الاستضافة

موقع ملفات robots.txt

المهام الشائعة

عرض ملف robots.txt

تحديد ملف robots.txt الذي يؤثر في إحدى الصفحات أو الصور

اختبار ما إذا كان محرّك بحث Google محظورًا من خلال ملف robots.txt

مزيد من المعلومات

هل كان ذلك مفيدًا؟

هل تحتاج إلى مزيد من المساعدة؟

جرِّب الخطوات التالية:

ما المشكلة في هذا الاختيار؟

شارِك المعلومات أو الاقتراحات الإضافية.

​تقرير ملفات robots.txt

الاطّلاع على ملفات robots.txt وحالة الزحف

الاطّلاع على آخر إصدار تم استرجاعه

الاطّلاع على الإصدارات التي تم استرجاعها سابقًا

طلب إعادة الزحف

الحالات التي يمكن فيها طلب إعادة الزحف

كيفية طلب إعادة الزحف

المواقع الإلكترونية على خدمات الاستضافة

موقع ملفات robots.txt

المهام الشائعة

عرض ملف robots.txt

تحديد ملف robots.txt الذي يؤثر في إحدى الصفحات أو الصور

اختبار ما إذا كان محرّك بحث Google محظورًا من خلال ملف robots.txt

مزيد من المعلومات

هل كان ذلك مفيدًا؟

هل تحتاج إلى مزيد من المساعدة؟

جرِّب الخطوات التالية:

تقرير ملفات robots.txt