इंडेक्स कवरेज की स्थिति की रिपोर्ट

जानें कि आपके कौनसे पेज इंडेक्स किए गए हैं और आपकी साइट को इंडेक्स करते समय किस तरह की समस्याएं आईं.

 

इंडेक्स कवरेज रिपोर्ट

 

रिपोर्ट को समझना

अगर आपने 'Google सर्च' कैसे काम करता है लेख पहले पढ़ा है, तो यह रिपोर्ट समझने में ज़्यादा आसानी होगी.

यह रिपोर्ट बताती है कि आपकी प्रॉपर्टी में Google जिन यूआरएल पर जा चुका है या जिन पर जाने की कोशिश की है, उन्हें इंडेक्स किए जाने की स्थिति क्या है. खास जानकारी देने वाला पेज आपकी प्रॉपर्टी के सभी यूआरएल के नतीजे दिखाता है जिन्हें स्थिति (गड़बड़ी, चेतावनी या मान्य) के मुताबिक समूहों में बाँटा गया है. साथ ही, उस स्थिति की खास वजह (जैसे कि सबमिट किया गया यूआरएल नहीं मिला (404)) भी दिखाता है. एक ही स्थिति/वजह वाले यूआरएल और समस्या के बारे में ज़्यादा जानकारी के लिए, खास जानकारी देने वाले पेज के टेबल की किसी पंक्ति पर क्लिक करें.

 

क्या मुझे इस रिपोर्ट की ज़रूरत है?

अगर आपकी साइट में 500 से कम पेज हैं, तो शायद आपको यह रिपोर्ट इस्तेमाल करने की ज़रूरत नहीं है. इसके बजाय, site:your_site डालकर Google पर अपनी साइट खोजना ज़्यादा आसान है. इसमें "your_site" आपकी साइट के होमपेज का बिना "http://" या "https://" वाला यूआरएल है. उदाहरण के लिए, site:example.com या site:example.com/petstore. खोज नतीजों में आपकी साइट के वे पेज दिखाए जाते हैं जिनके बारे में Google के पास जानकारी है. आप खोज के लिए शब्द जोड़कर अपनी साइट पर खास पेज ढूंढ सकते हैं, उदाहरण के लिए site:example.com/petstore iguanas zebras.

 

खास जानकारी वाला पेज

टॉप लेवल वाली रिपोर्ट उन सभी पेजों के इंडेक्स होने की स्थिति के बारे में बताती है जिन्हें आपकी साइट पर Google ने क्रॉल करने की कोशिश की है. इन पेजों को स्थिति और वजह के हिसाब से समूहों में रखा जाता है.

इस रिपोर्ट में क्या देखें

आम तौर पर, जैसे-जैसे आपकी साइट बेहतर होती जाती है, आपको इंडेक्स किए गए पेजों की संख्या धीरे-धीरे बढ़ती हुई दिखनी चाहिए. अगर आपको यह संख्या कम या ज़्यादा होती दिखती है, तो समस्या के हल वाला सेक्शन देखें. खास जानकारी वाले पेज में स्थिति टेबल को "स्थिति + वजह" के हिसाब से समूह और क्रम में दिखाया जाता है; आपको साइट पर सबसे ज़्यादा असर करने वाली गड़बड़ियों को पहले ठीक करना चाहिए.

इस रिपोर्ट में क्या नहीं देखें

  • आपको अपनी साइट के सभी यूआरएल इंडेक्स किए जाने की उम्मीद नहीं करनी चाहिए. आपका लक्ष्य होना चाहिए कि हर पेज का कैननिकल वर्शन इंडेक्स किया जाए. इस रिपोर्ट में, हर डुप्लीकेट या वैकल्पिक पेज को "शामिल नहीं किया गया" के तौर पर लेबल किया जाएगा. डुप्लीकेट या विकल्प के तौर पर काम करने वाले पेज की सामग्री काफ़ी हद तक कैननिकल पेज की तरह होती है. किसी पेज का 'डुप्लीकेट' या 'वैकल्पिक' चिह्नित होना अच्छा है. इसका मतलब यह है कि हमें कैननिकल पेज मिल गया है और हमने उसे इंडेक्स कर दिया है. आप यूआरएल की जाँच करने वाला टूल इस्तेमाल करके किसी भी यूआरएल का कैननिकल वर्शन ढूंढ सकते हैं. देखें कि पेज न मिलने की दूसरी वजहें क्या हो सकती हैं.
  • जब आप नई सामग्री जोड़ते हैं, तो Google को उसे इंडेक्स करने में कुछ दिन लग सकते हैं. आप इंडेक्स करने का अनुरोध करके इसमें लगने वाले समय को कम कर सकते हैं.

स्थिति

हर पेज में इनमें से कोई एक स्थिति मान हो सकता है:

  • गड़बड़ी: पेज को इंडेक्स नहीं किया गया है. गड़बड़ी और उसे ठीक करने के तरीकों के बारे में ज़्यादा जानने के लिए खास तरह की गड़बड़ी से जुड़ी जानकारी देखें. आपको सबसे पहले इन समस्याओं पर ध्यान देना चाहिए.
  • चेतावनी: पेज को इंडेक्स किया गया है, लेकिन इसमें एक समस्या है जिसके बारे में आपको पता होना चाहिए.
  • शामिल नहीं किया गया: पेज को इंडेक्स नहीं किया गया है, लेकिन हमें लगता है कि आप यही चाहते थे. (उदाहरण के लिए, शायद आपने कोई noindex निर्देश इस्तेमाल करके पेज को जानबूझकर शामिल न किया हो या शायद वह पेज, आपकी साइट पर पहले से इंडेक्स किए गए कैननिकल पेज का डुप्लीकेट हो.)
  • मान्य: पेज को इंडेक्स किया गया.

वजह

हर स्थिति (गड़बड़ी, चेतावनी, मान्य, शामिल नहीं किए गए) के होने की एक खास वजह होती है. हर तरह की स्थिति की जानकारी देखने और उसे प्रबंधित करने के तरीके जानने के लिए, नीचे दी गई स्थिति के प्रकारों की जानकारी देखें.

पुष्टि

इस समस्या की पुष्टि की स्थिति. आपको उन समस्याओं पर पहले ध्यान देना चाहिए जो पुष्टि में सही नहीं पाई गई हैं या जिनकी पुष्टि शुरू नहीं हुई है.

पुष्टि की जानकारी

अपनी साइट पर एक खास तरह की समस्या के सभी इंस्टेंस ठीक कर लेने के बाद, आप Google से अनुरोध करके अपने किए हुए बदलावों की पुष्टि करा सकते हैं. अगर किसी समस्या के सभी इंस्टेंस ठीक कर लिए जाते हैं, तो समस्या की स्थिति दिखाने वाले टेबल में इसे 'ठीक कर लिया गया' के तौर पर दिखाया जाता है और यह टेबल के सबसे निचले हिस्से में चली जाती है. Search Console, समस्या की पुष्टि की स्थिति के साथ-साथ समस्या के हर इंस्टेंस की पुष्टि की स्थिति पर भी नज़र रखता है. जब समस्या के सभी इंस्टेंस ठीक हो जाते हैं, तो उसे 'ठीक कर लिया गया' माना जाता है. (पुष्टि किए जाने की सही स्थिति जानने के लिए, समस्या की पुष्टि की स्थिति और इंस्टेंस की पुष्टि की स्थिति देखें.)

समस्या के 'जीवनकाल' से जुड़ी ज़्यादा जानकारी...

किसी वेबसाइट पर मौजूद समस्या के 'जीवनकाल' में, उसकी पहचान किए जाने के समय से लेकर उसके आखिरी इंस्टेंस के पूरी तरह ठीक किए जाने के 90 दिन बाद तक का समय शामिल होता है. अगर 90 दिनों के बाद समस्या फिर से दिखाई नहीं देती है, तो इसे रिपोर्ट इतिहास से हटा दिया जाता है.

जिस तारीख पर समस्या की पहली बार पहचान की गई हो, उसे समस्या के 'जीवनकाल' का वह समय माना जाता है जब पहली बार उसका पता लगाया गया. समस्या पता चलने की तारीख में कोई बदलाव नहीं होता. इसलिए:

  • अगर किसी समस्या के सभी इंस्टेंस ठीक कर लेने के 15 दिनों बाद, इसका नया इंस्टेंस फिर से दिखाई देता है तो समस्या "ठीक नहीं की गई है" के रूप में दिखाई देती है. इसके पता चलने की मूल तारीख भी "पहली बार पता चलने की तारीख" ही होती है.
  • समस्या के आखिरी इंस्टेंस को ठीक कर लिए जाने के 91 दिन बाद, अगर समस्या फिर से दिखाई देती है तो पिछली समस्या को 'ठीक कर ली गई है' माना जाता है. यही वजह है कि इसे नई समस्या के रूप में दर्ज किया जाता है और इसके पता चलने की तारीख "आज" की होती है.

पुष्टि की प्रोसेस सामान्य रूप से कैसे काम करती है

यहां वह खास जानकारी दी गई है, जिससे यह पता चलता है कि जब आप किसी समस्या के लिए समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो क्या होता है. इस प्रोसेस में कई दिनों का समय लग सकता है और आपको ईमेल के ज़रिए इससे जुड़ी सूचनाएं मिलती रहेंगी.

  1. जब आप समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो Search Console तुरंत कुछ पेजों की जाँच करता है.
    • जाँचे जा रहे किसी भी पेज में मौजूदा समस्या मिलने पर, पुष्टि की प्रोसेस खत्म हो जाती है और पुष्टि किए जाने की स्थिति में कोई बदलाव नहीं होता.
    • अगर इन पेजों (जो नमूनों के तौर पर जाँचे जा रहे हैं) में मौजूदा गड़बड़ी नहीं मिलती है, तो पुष्टि की प्रोसेस शुरू हो गई की स्थिति के साथ जारी रहती है. अगर पुष्टि करने पर दूसरी तरह की समस्याएं मिलती हैं, तो इन्हें इसी तरह की दूसरी समस्याओं में गिना जाता है और पुष्टि की प्रोसेस जारी रहती है.
  2. Search Console, सूची के हिसाब से उन यूआरएल पर काम करता है, जो इस समस्या से प्रभावित हुए हैं. दोबारा क्रॉल करने के लिए तैयार की गई इस सूची में पूरी साइट के बजाय, सिर्फ़ वही यूआरएल शामिल किए जाते हैं जिन पर इस समस्या के इंस्टेंस मौजूद हैं. Search Console जिन यूआरएल को जाँचता है उन सभी का रिकॉर्ड पुष्टि के इतिहास में रखता है, जिसे 'समस्या की जानकारी पेज' पर देखा जा सकता है.
  3. यूआरएल जाँचे जाने पर:
    1. अगर समस्या न मिले, तो इंस्टेंस की पुष्टि की स्थिति बदलकर पास हो रही है हो जाती है. पुष्टि शुरू होने के बाद अगर यह पहला इंस्टेंस है जिसकी जाँच की जा रही है, तो समस्या की पुष्टि की स्थिति बदलकर सब ठीक लग रहा है हो जाती है.
    2. अगर अब यूआरएल देखा नहीं जा सकता, तो इंस्टेंस की पुष्टि की स्थिति बदलकर अन्य (दूसरा) हो जाती है (जो किसी गड़बड़ी की स्थिति नहीं होती है).
    3. इंस्टेंस अगर अब भी मौजूद है, तो समस्या की स्थिति बदलकर फ़ेल हो जाती है. अगर सामान्य तरीके से क्रॉल करने पर यह नया पेज मिला है, तो इसे मौजूदा समस्या का एक और इंस्टेंस माना जाता है.
  4. सभी गड़बड़ियां और चेतावनी वाले यूआरएल जाँचे जाने के बाद समस्या की गिनती 0 रह जाती है, तो समस्या की स्थिति बदलकर पास हो जाती है. ज़रूरी जानकारी : भले ही समस्या के असर वाले पेज की संख्या घटकर 0 और समस्या की स्थिति बदलकर पास हो जाती है, तब भी पेज पर मूल गंभीरता का लेबल (गड़बड़ी या चेतावनी) दिखाया जाएगा.

भले ही आपने कभी भी "पुष्टि शुरू करें" पर क्लिक न किया हो, पर Google किसी समस्या के ठीक कर लिए गए इंस्टेंस पहचान सकता है. नियमित रूप से किए जाने वाले क्रॉल के दौरान अगर Google को पता चलता है कि किसी समस्या के सभी इंस्टेंस ठीक कर लिए गए हैं, तो यह रिपोर्ट पर समस्या की स्थिति बदलकर "लागू नहीं" कर देगा.

किसी यूआरएल या साइट के किसी हिस्से में आई समस्या को "ठीक कर लिया गया" कब माना जाता है?

नीचे दी गईं शर्तों में से किसी एक के पूरे होने पर, यूआरएल या साइट के किसी हिस्से की समस्या को 'ठीक कर लिया गया' माना जाता है :

  • जब यूआरएल क्रॉल किया जाता है और पेज पर समस्या नहीं मिलती. एएमपी टैग की गड़बड़ी के लिए इसका मतलब है कि आपने टैग को ठीक कर लिया है या इसे हटा दिया है (अगर टैग की ज़रूरत नहीं है). पुष्टि किए जाने पर इसे "पास" माना जाएगा.
  • अगर किसी वजह से पेज Google को नहीं मिलता (पेज हटा दिया गया है, पेज पर noindex नियम लागू है, पेज देखने के लिए मंज़ूरी लेना ज़रूरी है और भी दूसरी वजहें), तो उस यूआरएल के लिए समस्या को 'ठीक कर लिया गया' माना जाएगा. पुष्टि के दौरान इसे पुष्टि की "अन्य" स्थिति के रूप में गिना जाता है.

दोबारा पुष्टि करने का तरीका

जब आप किसी फ़ेल हो गई पुष्टि के लिए दोबारा पुष्टि करें पर क्लिक करते हैं, तो सभी फ़ेल इंस्टेंस के लिए पुष्टि दोबारा शुरू हो जाती है. साथ ही, सामान्य रूप से क्रॉल किए जाने पर मिले इस समस्या के नए इंस्टेंस की भी पुष्टि होती है.

दोबारा पुष्टि किए जाने का अनुरोध करने से पहले आपको मौजूदा समय में चल रही पुष्टि की प्रोसेस पूरी होने तक इंतज़ार करना चाहिए, भले ही आपने अनुरोध किए जाने के बाद कुछ समस्याएं ठीक की हों.

जो इंस्टेंस पुष्टि में पास हो चुके हैं (पास के निशान वाले) या अब जिन्हें देखा नहीं जा सकता (अन्य के निशान वाले) उन्हें दोबारा नहीं जाँचा जाता. साथ ही जब आप 'दोबारा पुष्टि करें' पर क्लिक करते हैं, तो इन्हें इतिहास से हटा दिया जाता है.

पुष्टि किए जाने का इतिहास

आप यह देख सकते हैं कि जिस पुष्टि का अनुरोध आपने किया है, उसकी प्रक्रिया कितनी पूरी हुई है. इसके लिए समस्या की जानकारी वाले पेज पर पुष्टि की जानकारी के लिंक पर क्लिक करें.

एएमपी रिपोर्ट और इंडेक्स की स्थिति की रिपोर्ट देखने के लिए, पुष्टि के इतिहास वाले पेज की सामग्री को यूआरएल के हिसाब से समूह में रखा जाता है. मोबाइल पर इस्तेमाल में आसानी की रिपोर्ट और रिच नतीजों की रिपोर्ट में, सामग्रियों को यूआरएल और व्यवस्थित डेटा की सामग्री के हिसाब से समूह में रखा जाता है. इसके लिए सामग्रियों की पहचान उनके नाम के मान से की जाती है. पुष्टि की स्थिति उस खास समस्या पर लागू होती है जिसकी आप जाॅंच कर रहे हैं. किसी पेज पर एक समस्या का लेबल "पास" हो सकता है, लेकिन दूसरी समस्याओं का लेबल "फ़ेल", "पुष्टि होनी बाकी है" या "कुछ और" हो सकता है.

समस्या की पुष्टि की स्थिति

किसी भी समस्या पर नीचे दी गई समस्या की स्थितियां लागू होती हैं:

  • शुरू नहीं हुई है: इस समस्या के इंस्टेंस वाले एक या उससे ज़्यादा पेज हैं जिनकी आपने कभी भी पुष्टि करने की कोशिश नहीं की है. अगले चरण:
    1. गड़बड़ी के बारे में ज़्यादा जानकारी के लिए समस्या पर क्लिक करें. एएमपी जाँच इस्तेमाल करके लाइव पेज पर गड़बड़ियों के उदाहरण देखने के लिए एक-एक पेज को ध्यान से देखें. (हो सकता है कि एएमपी जाँच के ज़रिए पेज पर गड़बड़ी दिखाई न दे. ऐसा इसलिए होता है क्योंकि Google को यह गड़बड़ी मिलने और समस्या की रिपोर्ट तैयार करने के बाद, आपने लाइव पेज पर गड़बड़ी ठीक कर ली है.
    2. जिस नियम का उल्लंघन किया गया है उसके बारे में जानने के लिए जानकारी पेज पर "ज़्यादा जानें" पर क्लिक करें.
    3. किसी खास समस्या के बारे में जानकारी पाने के लिए, टेबल में एक उदाहरण यूआरएल पंक्ति पर क्लिक करें.
    4. अपने पेजों को ठीक करें और फिर ठीक किए जाने की पुष्टि करें पर क्लिक करें ताकि Google आपके पेज फिर से क्रॉल करे. Google आपको इस बात की सूचना देगा कि पुष्टि की प्रोसेस कहां तक पहुंची है. पुष्टि होने में एक-दो दिन से लेकर दो हफ़्ते तक का समय लग सकता है, इसलिए अगर थोड़ा इंतज़ार करना पड़े तो परेशान न हों. 
  • शुरू की गई: आपने पुष्टि की प्रोसेस का अनुरोध किया और अभी तक समस्या का कोई इंस्टेंस नहीं मिला है. अगला चरण: जैस-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी Google आपको सूचनाएं भेजेगा. साथ ही ज़रूरी होने पर आपको बताएगा कि आपको क्या करना होगा.
  • सब ठीक लग रहा है: आपने पुष्टि करने का अनुरोध किया और अब तक समस्या के जितने भी इंस्टेंस मिले हैं उन्हें ठीक कर लिया गया है. अगला चरण: कुछ भी नहीं, लेकिन जैसे-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी, Google आपको सूचनाएं भेजेगा और बताएगा कि आपको क्या करना है.
  • पास: समस्या के सभी पहचाने गए इंस्टेंस अब मौजूद नहीं हैं (या अब वह यूआरएल उपलब्ध नहीं है जिस पर असर हुआ था). इस स्थिति में आने के लिए आपने ज़रूर "ठीक किए जाने की पुष्टि करें" पर क्लिक किया होगा (अगर इंस्टेंस आपके अनुरोध के बिना ही दिखाई नहीं दे रहे हैं, तो पुष्टि की स्थिति बदलकर 'लागू नहीं' हो जाएगी). अगला चरण: अब और कुछ नहीं करना.
  • लागू नहीं: Google को पता चला कि सभी यूआरएल पर समस्या को ठीक कर लिया गया है, हालांकि आपने कभी भी पुष्टि करने का अनुरोध नहीं किया था. अगला चरण: अब और कुछ नहीं करना.
  • फ़ेल: जब आपने "पुष्टि करें" पर क्लिक किया था उसके बाद भी एक तय सीमा तक के पेजों पर अभी भी यह समस्या मौजूद है. अगले चरण: समस्या ठीक करें और दोबारा पुष्टि का अनुरोध करें.

इंस्टेंस की पुष्टि की स्थिति

पुष्टि का अनुरोध करने के बाद, किसी खास समस्या के लिए हर इंस्टेंस को खास स्थिति के तौर पर दिखाया जाता है. यह स्थिति पुष्टि की नीचे दी गईं स्थितियों में से एक होती है (इंडेक्स की स्थिति की रिपोर्ट में पास और कुछ और वाली स्थितियों का इस्तेमाल नहीं किया जाता) :

  • अभी पुष्टि बाकी है: पुष्टि किए जाने के लिए सूची में जोड़ लिया गया है. पिछली बार जब Google ने क्रॉल किया था तब इंस्टेंस मौजूद था.
  • पास: Google ने समस्या का इंस्टेंस ढूंढने की कोशिश की और पाया कि अब इसका कोई इंस्टेंस मौजूद नहीं है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • फ़ेल: Google ने जाँचा और पाया कि समस्या का इंस्टेंस अभी भी मौजूद है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • अन्य: Google उस यूआरएल पर नहीं पहुंच पाया, जो इंस्टेंस होस्ट कर रहा था या (व्यवस्थित डेटा के लिए) अब पेज पर वह चीज़ नहीं ढूंढ पा रहा है. इसे पास के बराबर ही माना जाता है.

इस बात पर ध्यान दें कि अलग-अलग समस्याओं के लिए एक ही यूआरएल की अलग-अलग स्थितियों हो सकती हैं. उदाहरण के लिए, अगर किसी एक ही पेज पर X और Y दोनों तरह की समस्याएं हैं, तो हो सकता है कि X समस्या की पुष्टि की स्थिति पास हो और उसी पेज पर Y समस्या की पुष्टि की स्थिति पुष्टि नहीं हुई है के रूप में दिखाई दे.

यूआरएल खोज का ड्रॉपडाउन फ़िल्टर

चार्ट के ऊपर दिए गए फ़िल्टर का इस्तेमाल करके, इंडेक्स के नतीजों को उस तरीके से फ़िल्टर करें जिस तरह से Google ने यूआरएल खोजा है. नीचे दिए गए मान उपलब्ध हैं:

  • वे सभी पेज जिनके बारे में पहले से जानकारी है [डिफ़ॉल्ट रूप से] - वे सभी यूआरएल दिखाएं जिन्हें Google ने किसी भी तरीके से खोजा है.
  • बमिट किए गए सभी पेज - सिर्फ़ वे पेज दिखाएं जो इस रिपोर्ट के लिए साइटमैप में या साइटमैप पिंग इस्तेमाल करके सबमिट किए गए हैं.
  • खास साइटमैप यूआरएल - सिर्फ़ वे यूआरएल दिखाएं जो इस रिपोर्ट की मदद से सबमिट किए गए किसी खास साइटमैप में मौजूद हैं. इसमें नेस्ट किए गए साइटमैप में मौजूद सभी यूआरएल शामिल हैं.

किसी यूआरएल को 'साइटमैप इस्तेमाल करके सबमिट किया गया' के तौर पर माना जाता है, भले ही उसे किसी दूसरे तरीके से खोजा गया हो (उदाहरण के लिए, किसी दूसरे पेज को ऑर्गैनिक तरीके से क्रॉल करके).

पूरी जानकारी वाला पेज

स्थिति और वजह वाली किसी जोड़ी का जानकारी पेज खोलने के लिए, खास जानकारी वाले पेज में मौजूद उसकी पंक्ति पर क्लिक करें. आप ज़्यादा जानकारी वाले पेज पर ज़्यादा जानें क्लिक करके, चुनी हुई समस्या के बारे में ज़्यादा जानकारी देख सकते हैं.

ग्राफ़ में वे पेज दिखाए जाते हैं जिन पर समय के साथ असर पड़ा है.

टेबल में उन पेज के उदाहरणों की सूची दिखाई जाती है जिन पर समस्या का असर हुआ है:

  • टेबल पंक्ति पर दिए गए जंप लिंक पर क्लिक करके टेबल में दिया गया यूआरएल खोलें.
  • टेबल में किसी यूआरएल की जाँच करने के लिए, टेबल की पंक्ति पर मौजूद जाँच करें आइकॉन पर क्लिक करें.
  • किसी गड़बड़ी या चेतावनी के सभी इंस्टेंस ठीक कर लेने पर, आप Google से अपने सुधारों की पुष्टि करने के लिए कह सकते हैं.

ऐसा यूआरएल दिख रहा है जिसे आपकी ठीक की हुई समस्या के ज़रिए चिह्नित किया गया है? शायद आपने पिछली बार Google क्रॉल हो जाने के बाद समस्या ठीक की है. इसलिए, अगर किसी ऐसी समस्या वाला यूआरएल दिखाई देता है जिसे आप ठीक कर चुके हैं, तो उस यूआरएल को क्रॉल किए जाने की तारीख ज़रूर देखें. अपने सुधार की जाँच करें और पुष्टि करें, फिर दोबारा इंडेक्स करने का अनुरोध करें

 

रिपोर्ट शेयर करने का तरीका

आप पेज पर मौजूद शेयर बटन पर क्लिक करके समस्या से जुड़ी जानकारी शेयर कर सकते हैं. जिस व्यक्ति के पास यह लिंक है, वह इसके ज़रिए सिर्फ़ मौजूदा पेज और इस समस्या से जुड़े पुष्टि के इतिहास वाले किसी भी पेज का इस्तेमाल कर सकते हैं. यह लिंक आपके संसाधन को दूसरे पेजों का इस्तेमाल करने की मंज़ूरी नहीं देता है. इस लिंक के ज़रिए, इस्तेमाल करने वाले किसी दूसरे व्यक्ति को आपकी प्रॉपर्टी या खाते पर किसी भी तरह की कार्रवाई करने की मंज़ूरी नहीं दी जा सकती है. इस पेज को शेयर किए जाने की सुविधा बंद करके आप इस लिंक के ज़रिए मिलने वाली मंज़ूरी पर रोक लगा सकते हैं.

समस्या का हल करना

यहां इंडेक्स करने की सबसे आम समस्याओं के बारे में बताया गया है जो आपको इस रिपोर्ट में दिख सकती हैं:

इंडेक्स किए गए कुल पेजों की संबंधित गड़बड़ियों में गिरावट आना

अगर आपको संबंधित गड़बड़ियों के बिना इंडेक्स किए गए कुल पेज की संख्या में गिरावट दिखती है, तो शायद आप अपने मौजूदा पेजों का एक्सेस ब्लॉक कर रहे हैं (robots.txt, 'noindex' या मंज़ूरी के ज़रिए) जिन्हें आपने इंडेक्स करने के लिए सबमिट नहीं किया है. अगर आपने इन पेजों को इंडेक्स के लिए सबमिट किया था, तो आपको कुछ संबंधित गड़बड़ियां दिखाई देंगी. गिरावट के लिए उन शामिल नहीं किए गए यूआरएल पर नज़र डालें जो आपके पेजों में आई गिरावट से संबंधित हैं.

'मान्य' पेजों की तुलना में ज़्यादा 'शामिल नहीं किए गए' पेज होना

अगर आपको 'मान्य' से ज़्यादा 'शामिल नहीं किए गए' पेज दिखते हैं, तो उन्हें शामिल किए जाने की वजहों पर नज़र डालें. शामिल न किए जाने की आम वजहें ये हैं:

  • आपने एक ऐसा robots.txt नियम लागू किया है जो हमें आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है. अगर आप गलत पेजों को ब्लॉक कर रहे हैं, तो उन पर लगी रोक हटाएं.
  • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी सामान्य संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress{/0 या color=green या sort=price). अगर ये पेज अलग-अलग तरीकों से क्रम से लगाई या फ़िल्टर की गई सामग्री ही दिखा रहे हैं, तो शायद इन्हें शामिल नहीं किया जाना चाहिए. अगर आप एक अनुभवी उपयोगकर्ता हैं और आपको लगता है कि Google आपकी साइट पर मौजूद पैरामीटर को गलत समझ रहा है, तो आप अपनी साइट के पैरामीटर को पसंद के हिसाब से तय करने के लिए यूआरएल पैरामीटर टूल का इस्तेमाल कर सकते हैं.
कुछ गड़बड़ियों की ज़्यादा बढ़ी हुई संख्या

अगर आपको इंडेक्स करने में आने वाली गड़बड़ियों की संख्या में ज़्यादा बढ़ोतरी दिखती है, तो ऐसा आपके टेम्प्लेट में हुए बदलाव की वजह से हो सकता है, क्योंकि टेम्प्लेट में बदलाव करने से उसमें नई गड़बड़ी आ सकती है. इसके अलावा, ऐसा तब भी हो सकता है जब आपने ऐसा साइटमैप सबमिट किया हो, जिसमें शामिल यूआरएल को क्रॉल करने पर रोक लगाई गई हो. यह रोक robots.txt या noindex के इस्तेमाल या लॉगिन को ज़रूरी बनाने से लगी हो सकती है. किसी समस्या पर क्लिक करें और पेज की जाँच करके देखें कि क्या गड़बड़ी है.

अगर आपको किसी गड़बड़ी में बढ़ोतरी दिखाई देती है, तो:

  1. देखें कि क्या आपको इंडेक्स करने में गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या और किसी खास गड़बड़ी का रुझान दिखाने वाले ग्राफ़ (स्पार्कलाइन) के बीच कोई संबंध दिखाई दे रहा है. अगर ऐसा है, तो इससे आपकी गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या पर असर डालने वाली समस्या के बारे में कुछ संकेत मिल सकता है.
  2. ज़्यादा जानकारी देखने के लिए गड़बड़ियों की जानकारी वाले पेज पर जाएं. ऐसा करने के लिए किसी गड़बड़ी वाली पंक्ति पर क्लिक करें. किसी खास तरह की गड़बड़ी को सबसे सही तरीके से ठीक करने का तरीका जानने के लिए, उसके बारे में दी गई जानकारी पढ़ें.
  3. गड़बड़ी के सभी इंस्टेंस ठीक करें और उस वजह के 'ज़्यादा जानकारी' वाले पेज में दिए गए सुधार की पुष्टि करें पर क्लिक करके पुष्टि करने का अनुरोध करें. पुष्टि करने के बारे में ज़्यादा जानें.
  4. जैसे-जैसे आपके पेजों की पुष्टि होगी, आपको इसकी सूचनाएं मिलती रहेंगी. हालांकि, आप कुछ दिन बाद वापस आकर देख सकते हैं कि गड़बड़ियों की संख्या कम हुई या नहीं.
  5. शामिल न किए गए यूआरएल का फ़िल्टर हटाएं. फिर असर होने वाले पेजों की संख्या के हिसाब से उन्हें क्रम से लगाकर समस्याएं देखें. ऐसा समय-समय पर करते रहें.
सर्वर की गड़बड़ियां
सर्वर की गड़बड़ी का मतलब है कि Googlebot आपके यूआरएल को एक्सेस नहीं कर पाया, तय समय में अनुरोध प्रोसेस नहीं हुआ या आपकी साइट पर ज़्यादा ट्रैफ़िक था. इस वजह से Googlebot को अनुरोध रद्द करना पड़ा.

सर्वर के कनेक्शन की जाँच करना

यूआरएल की जाँच करने वाले टूल का इस्तेमाल करके आप यह देख सकते हैं कि आपको इंडेक्स कवरेज की स्थिति की रिपोर्ट में बताई गई सर्वर की गड़बड़ी फिर से मिलती है या नहीं.

सर्वर से कनेक्टविटी की गड़बड़ियां ठीक करना

  • डायनैमिक पेज अनुरोधों के लिए ज़्यादा से ज़्यादा पेज लोडिंग कम करें.
    ऐसी साइट जो एक से ज़्यादा यूआरएल की एक ही सामग्री डिलीवर करती है, उसे डायनैमिक तरीके से सामग्री डिलीवर करने वाला माना जाता है (उदाहरण के लिए, www.example.com/shoes.php?color=red&size=7 से वही सामग्री मिलती है जो www.example.com/shoes.php?size=7&color=red में दिखाई देती है).  डायनैमिक पेज से जवाब मिलने में लंबा समय लग सकता है, जिसकी वजह से समय खत्म होने (टाइम आउट) की समस्याएं हो सकती हैं. डायनैमिक सर्वर पर ज़रूरत से ज़्यादा ट्रैफ़िक होने की स्थिति का मैसेज दिख सकता है, जिसके ज़रिए Googlebot से साइट को पहले के मुकाबले धीरे क्रॉल करने के लिए कहा जा सकता है. आम तौर पर, हम पैरामीटर सूचियों को छोटा रखने और उनका सीमित इस्तेमाल करने का सुझाव देते हैं. अगर आपको अपनी साइट के पैरामीटर के काम करने के तरीके के बारे में पूरी तरह पता है, तो आप Google को बता सकते हैं कि हमें इन पैरामीटर का इस्तेमाल कैसे करना चाहिए.
  • यह पक्का करें कि आपकी साइट का होस्टिंग सर्वर डाउन, ओवरलोड या गलत कॉन्फ़िगर नहीं किया गया है.
    अगर कनेक्शन समय खत्म होने या प्रतिक्रिया की समस्याएं बनी रहती हैं, तो अपने वेब होस्टर से संपर्क करें और ट्रैफ़िक प्रबंधित करने के लिए अपनी साइट की क्षमता बढ़ाने पर विचार करें.
  • यह जॉंच करें कि आप अनजाने में Google को ब्लॉक तो नहीं कर रहे हैं.
    शायद आप सिस्टम की किसी समस्या की वजह से Google को ब्लॉक कर रहे हों. इनमें डीएनएस को कॉन्फ़िगर करने की समस्या, गलत तरीके से कॉन्फ़िगर किए गए फ़ायरवॉल, DoS सुरक्षा सिस्टम या सामग्री प्रबंधन सिस्टम को कॉन्फ़िगर करने की समस्याएं शामिल हो सकती हैं. बेहतर तरीके से होस्ट करने के लिए सुरक्षा के सिस्टम बहुत ज़रूरी हैं. इन्हें सर्वर पर सामान्य से ज़्यादा संख्या में आने वाले अनुरोधों पर अपने आप रोक लगाने के लिए कॉन्फ़िगर किया जाता है. चूंकि,अक्सर मानव उपयोगकर्ता की अपेक्षा Googlebot ज़्यादा अनुरोध करता है, इसलिए यह Googlebot को ब्लॉक करके और इसे आपकी वेबसाइट क्रॉल करने से रोककर इन सुरक्षा सिस्टम को ट्रिगर कर सकता है. ऐसी समस्याएं हल करने के लिए, वेबसाइट के उस हिस्से की पहचान करें जो Googlebot को ब्लॉक कर रहा हो और उसे अनब्लॉक करें. हो सकता है फ़ायरवॉल आपके नियंत्रण में नहीं हो, इसलिए आपको होस्टिंग देने वाले से इस बारे में चर्चा करने की ज़रूरत हो सकती है.
  • सर्च इंजन की साइट को क्रॉल और इंडेक्स करने की प्रक्रिया को सूझ-बूझ से नियंत्रित करें.
    कुछ वेबमास्टर Googlebot को अपनी वेबसाइट क्रॉल करने से जान-बूझकर रोकते हैं. ऐसा करने के लिए शायद वे ऊपर बताए गए तरीके से फ़ायरवॉल का इस्तेमाल करते हैं. ऐसी स्थितियों में, आम तौर पर इसका उद्देश्य Googlebot को पूरी तरह ब्लॉक करना नहीं, बल्कि साइट को क्रॉल करने और इंडेक्स करने के तरीके को नियंत्रित करना होता है. अगर आप भी ऐसा कर रहे हैं, तो इन बातों की जाँच करें:
404 कोड वाली गड़बड़ियां

आम तौर पर, हम सिर्फ़ 404 की गड़बड़ी वाले पेज ठीक करने का सुझाव देते हैं, 404 के शामिल नहीं किए गए पेज का नहीं. 404 की गड़बड़ी वाले यूआरएल ऐसे यूआरएल हैं जिनके लिए आपने Google से खास तौर पर इंडेक्स करने के लिए कहा है, लेकिन वे मिले नहीं थे. 404 के शामिल नहीं किए गए यूआरएल ऐसे यूआरएल हैं जिन्हें Google ने किसी दूसरे तरीके से खोजा था.

यहां बताया गया है कि आपको 404 की गड़बड़ियों से कैसे निपटना चाहिए:

  1. तय करें कि क्या इसे ठीक करना फ़ायदेमंद होगा. 404 कोड वाली कई (ज़्यादातर?) गड़बड़ियां ठीक करने का कोई फ़ायदा नहीं होता क्योंकि 404 की गड़बड़ी से आपकी साइट की इंडेक्सिंग या रैंक को कोई नुकसान नहीं पहुंचता.
    • अगर यह कोई सबमिट किया गया यूआरएल (एक गड़बड़ी) है, तो इसे ठीक करना फ़ायदेमंद होगा.
    • अगर यह कोई ऐसा हटाया गया पेज है जिसके लिए विकल्प या समान पेज उपलब्ध नहीं है, तो 404 लौटाना सही है. एक महीने बाद, रिपोर्ट में 404 की गड़बड़ी दिखाई नहीं देनी चाहिए.
    • अगर यह किसी स्क्रिप्ट से जनरेट किया गया खराब यूआरएल है या फिर यह कभी आपकी साइट पर मौजूद नहीं रहा है, तो हो सकता है कि आपको इसके बारे में चिंता करने की ज़रूरत नहीं है. आपको अपनी रिपोर्ट में यह गड़बड़ी देखकर परेशानी हो सकती है. हालांकि, आपको तब तक इसे ठीक करने की ज़रूरत नहीं है जब तक गड़बड़ी वाला यूआरएल कोई ऐसा लिंक न हो, जिसे लिखते समय आम तौर पर गलतियां हो जाती हैं. (नीचे देखें). 404 की गड़बड़ियों को एक महीने बाद रिपोर्ट से हट जाना चाहिए.
  2. अगर यूआरएल इंडेक्स करने के लिए सबमिट किया गया था, (इसकी स्थिति है गड़बड़ी) तो
    1. यूआरएल की जाँच करके जानें कि उसे कहां से सबमिट किया गया. इसके लिए यूआरएल के बगल में सबमिट आइकॉन पर क्लिक करें खोजें और ढूंढने की जानकारी देखें. साइटमैप को ज़रूरत के मुताबिक अपडेट करें.
    2. अगर सामग्री को दूसरी जगह ले जाया गया है, तो उसके लिए रीडायरेक्ट जोड़ें.
    3. अगर आपने सामग्री को हमेशा के लिए मिटा दिया है और आप उसकी जगह कोई नई या मिलती-जुलती सामग्री नहीं डालने वाले हैं, तो पुराने यूआरएल को 404 या 410 कोड वाली गड़बड़ी दिखाने के लिए सेट करें. फ़िलहाल, Google 410 कोड (हटा दिया गया) वाली गड़बड़ी को 404 कोड (नहीं मिला) वाली गड़बड़ी की तरह ही मानता है. गैरमौजूद पेज के लिए 404 या 410 को छोड़कर कोई कोड लौटाने से (या उपयोगकर्ताओं को 404 लौटाने के बजाय, उन्हें अन्य पेज जैसे होमपेज पर रीडायरेक्ट करना) समस्या हो सकती है. ऐसे पेजों को सॉफ़्ट 404 कहा जाता है और वे इस्तेमाल करने वालों के साथ ही सर्च इंजन के लिए भी उलझन भरे हो सकते हैं.
    4. अगर यूआरएल के बारे में जानकारी नहीं है: कभी-कभी आपको ऐसे यूआरएल के लिए 404 कोड वाली गड़बड़ियां दिखाई दे सकती हैं, जो आपकी साइट के नहीं हैं. ये गड़बड़ियां तब हो सकती हैं जब कोई व्यक्ति ऐसे यूआरएल को ब्राउज़ करता है, जो आपकी साइट पर मौजूद नहीं है. ऐसा, ब्राउज़र में गलत यूआरएल टाइप करने या साइट पर ले जाने वाले यूआरएल को गलत टाइप करने की वजह से हो सकता है. अगर यह गड़बड़ी बहुत ही आम है, तो आपको इसके लिए एक रीडायरेक्ट बनाना पड़ सकता है.
      अनचाहे यूआरएल की एक और वजह JavaScript, Flash फ़ाइलों या एम्बेड की गई दूसरी सामग्री या ऐसी सामग्री हो सकती है, जो शायद सिर्फ़ किसी साइटमैप में मौजूद हो, उसमें मिले लिंक पर जाने की कोशिश करते समय Googlebot के ज़रिए जनरेट हो सकते हैं. उदाहरण के लिए, आपकी साइट पर Google Analytics में डाउनलोड की गईं फ़ाइलों पर नज़र रखने के लिए, इस तरह के कोड का इस्तेमाल हो सकता है:
      <a href="helloworld.pdf"
        onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
        Hello World PDF</a>

      जब Googlebot को  यह कोड दिखाई देता है, तो हो सकता है कि यह यूआरएल http://www.example.com/download-helloworld को क्रॉल करने की कोशिश करे, भले ही यह असली पेज न हो. ऐसे में, क्रॉल करने में होने वाली गड़बड़ियों की रिपोर्ट में यह लिंक 404 कोड (नहीं मिला) वाली गड़बड़ी के तौर पर दिखाई दे सकता है. Google क्रॉल करने में होने वाली इस तरह की गड़बड़ी को रोकने के लिए काम कर रहा है. आपकी साइट को क्रॉल किए जाने या उसकी रैंकिंग पर इस गड़बड़ी का कोई असर नहीं पड़ता है.

  3. न नकली सामग्री बनाएं, न अपने होमपेज पर रीडायरेक्ट करें और न ही 404 की गड़बड़ियों को ब्लॉक करने के लिए robots.txt का इस्तेमाल करें—ये सभी चीज़ें हमारे लिए आपकी साइट की बनावट की पहचान करना और इसे सही तरीके से प्रोसेस करना मुश्किल बना देती हैं. हम इन्हें सॉफ़्ट 404 गड़बड़ियां कहते हैं.(जब Google किसी यूआरएल को एक बार सही तरीके से क्रॉल कर लेता है तब वह उस यूआरएल को हमेशा क्रॉल करने की कोशिश कर सकता है. 300-लेवल वाला रीडायरेक्ट जारी किए जाने पर दोबारा क्रॉल करने की कोशिश में देरी होगी. यह देरी बहुत लंबे समय के लिए हो सकती है.) यूआरएल हटाने वाले टूल का इस्तेमाल करके यूआरएल को हटाने का अनुरोध सबमिट करने पर, इस रिपोर्ट से गड़बड़ी को नहीं हटाया जाएगा.
शामिल न किए गए पेज या साइट

अगर रिपोर्ट में आपके पेज की कोई जानकारी शामिल नहीं की गई है, तो इसकी वजह नीचे दी गई बातों में से एक हो सकती है:

  • Google इस पेज के बारे में नहीं जानता. पेज खोजे जाने के बारे में कुछ ज़रूरी बातें:
    • अगर यह साइट या पेज नया है, तो Google को उसे ढूंढने और क्रॉल करने में कुछ समय लग सकता है.
    • Google नए पेज के बारे में जानें इसके लिए, आपको या तो साइटमैप सबमिट करना चाहिए या फिर पेज क्रॉल करने का अनुरोध करना चाहिए. अगर नहीं, तो Google को आपके पेज में किसी जगह एक लिंक ढूंढना होगा.
    • किसी पेज का यूआरएल पता चल जाने पर, Google को आपकी कुछ या पूरी साइट क्रॉल करने में कुछ समय (कुछ हफ़्ते तक) लग सकता है.
    • इंडेक्स करने का काम कभी भी फटाफट नहीं होता. तब भी नहीं, जब आप क्रॉल का अनुरोध सीधे सबमिट करते हैं.
  • Google आपके पेज तक नहीं पहुंच सकता (इसके लिए लॉगिन करना ज़रूरी है या वह इंटरनेट के दूसरे उपयोगकर्ताओं के लिए उपलब्ध नहीं है)
  • पेज में noindex टैग है जो Google को उसे इंडेक्स करने से रोकता है या
  • पेज को किसी वजह से इंडेक्स से हटा दिया गया था.

गड़बड़ी ठीक करने के लिए:

अपने पेज पर आई समस्या की जाँच करने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें. अगर पेज इंडेक्स कवरेज रिपोर्ट में नहीं है, लेकिन उसे यूआरएल की जाँच की रिपोर्ट में 'इंडेक्स किया गया' के रूप में दिखाया गया है, तो शायद उसे हाल ही में इंडेक्स किया गया था. साथ ही, वह इंडेक्स कवरेज रिपोर्ट में जल्द ही दिखाई देगा. अगर पेज को यूआरएल जाँचने वाले टूल में 'इंडेक्स नहीं किया गया' के रूप में दिखाया गया है (जिसकी आपको उम्मीद है), तो लाइव पेज की जाँच करें. लाइव पेज की जाँच के नतीजों से पता चलना चाहिए कि समस्या क्या है: समस्या को ठीक करने के तरीके के बारे में जानने के लिए, जाँच के नतीजे और जाँच के दस्तावेज़ की जानकारी इस्तेमाल करें.

अक्सर पूछे जाने वाले सवाल

मेरा पेज इंडेक्स में क्यों है? मैं अपने पेज को इंडेक्स किए जाने के पक्ष में नहीं हूं.

Google इसे मिलने वाले किसी भी यूआरएल को इंडेक्स कर सकता है, जब तक कि आप पेज पर कोई गैर-इंडेक्स निर्देश शामिल नहीं करते हैं (या इसे हमेशा के लिए ब्लॉक न किया गया हो). साथ ही, Google किसी पेज को कई तरीकों से ढूंढ सकता है, जिनमें किसी व्यक्ति का आपके पेज को किसी दूसरी साइट से लिंक करना शामिल है.

  • अगर आप चाहते हैं कि आपके पेज को 'Google सर्च' से ब्लॉक कर दिया जाए, तो आपको पेज के लिए किसी तरह के लॉगिन की ज़रूरत होगी या फिर आप पेज पर किसी गैर इंडेक्स निर्देश का इस्तेमाल कर सकते हैं.
  • अगर आप चाहते हैं कि आपका पेज पहले से ही मिल जाने के बाद उसे 'Google सर्च' से हटा दिया जाए, तो आपको ये कदम उठाने होंगे.

मेरी साइट को अभी तक फिर से इंडेक्स क्यों नहीं किया गया?

Google, कई तरह के मापदंडों से पेज को फिर से इंडेक्स करता है, जिनमें यह भी शामिल है कि उसके मुताबिक पेज कितनी बार बदलता है. अगर आपकी साइट में अक्सर बदलाव नहीं होता है, तो इसकी रीफ़्रेश दर धीमी हो सकती है. लेकिन अगर आपके पेज में कोई बदलाव नहीं हुआ है, तो इसमें कोई दिक्कत नहीं है. अगर आपको लगता है कि आपकी साइट को रीफ़्रेश करने की ज़रूरत है, तो Google से इसे फिर से क्रॉल करने के लिए कहें.

क्या आप मेरे पेज/साइट को फिर से क्रॉल कर सकते हैं?

Google से इसे फिर से क्रॉल करने के लिए कहें.

मेरे कई सारे पेज शामिल क्यों नहीं किए गए हैं?

इंडेक्स कवरेज रिपोर्ट देखकर, आप जान सकते हैं कि पेज किन वजहों से शामिल नहीं किए गए हैं. शामिल नहीं किए जाने की ज़्यादातर वजहें इनमें से एक हैं:

  • आपके पास एक robots.txt नियम है जो हमें आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है. समस्या की पुष्टि करने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें.
  • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी सामान्य संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress या color=green या sort=price). ये पेज इंडेक्स कवरेज रिपोर्ट में "डुप्लीकेट" या "विकल्प" के रूप में लेबल किए जाएंगे.
  • यूआरएल, किसी दूसरे यूआरएल पर रीडायरेक्ट हो जाता है. रीडायरेक्ट यूआरएल इंडेक्स नहीं किए जाते हैं, रीडायरेक्ट टारगेट को इंडेक्स किया जाता है.

Google मेरे साइटमैप को एक्सेस नहीं कर पा रहा है

यह देख लें कि आपका साइटमैप robots.txt से ब्लॉक नहीं हो रहा है, वह मान्य है, और यह कि आप अपनी robots.txt एंट्री या अपनी साइटमैप रिपोर्ट के सबमिशन में सही यूआरएल का इस्तेमाल कर रहे हैं. सभी के लिए उपलब्ध साइटमैप की जाँच करने वाले टूल का इस्तेमाल करके अपने साइटमैप यूआरएल की जाँच करेें. 

Google ऐसे पेज को क्यों क्रॉल कर रहा है जिसे हटा दिया गया है?

Google कुछ समय तक ऐसे सभी यूआरएल क्रॉल करना जारी रखता है जिनके बारे में जानकारी है, भले ही उनसे 4XX की गड़बड़ियां मिल रही हों. ऐसा कुछ समय की गड़बड़ी होने पर ही किया जाता है. किसी यूआरएल को क्रॉल न किया जाए, ऐसा तभी होता है जब इससे कोई गैर इंडेक्स निर्देश मिलता है.

आपको 404 वाली गड़बड़ियों की बढ़ती जा रही सूची दिखाने से बचने के लिए, इंडेक्स कवरेज रिपोर्ट सिर्फ़ वही यूआरएल दिखाती है जिनमें पिछले महीने 404 की गड़बड़ियां दिखाई दी थीं.

मुझे अपना पेज दिख रहा है, लेकिन Google को नहीं दिख रहा. ऐसा क्यों?

Google लाइव पेज को देख सकता है या नहीं इसका पता लगाने के लिए, यूआरएल की जाँच करने वाला टूल इस्तेमाल करें. अगर Google ऐसा नहीं कर पा रहा है, तो उसे इसकी वजह बतानी होगी. अगर वह ऐसा कर पा रहा है, तो शायद समस्या यह है कि पिछली बार क्रॉल करने के बाद एक्सेस की गड़बड़ी ठीक कर दी गई है. 'यूआरएल की जाँच करने वाला टूल' इस्तेमाल करके और इंडेक्स करने का अनुरोध करके एक लाइव क्रॉल चलाएं.

'यूआरएल की जाँच करने वाला टूल' कोई समस्या नहीं दिखा रहा है, लेकिन इंडेक्स कवरेज रिपोर्ट में एक गड़बड़ी दिख रही है; ऐसा क्यों?

हो सकता है कि यूआरएल को Google के आखिरी बार क्रॉल करने के बाद आपने गड़बड़ी ठीक कर दी हो. अपना यूआरएल क्रॉल किए जाने की तारीख देखें (यह इंडेक्स कवरेज रिपोर्ट में यूआरएल की जानकारी देने वाले पेज में या फिर यूआरएल की जाँच करने वाले टूल में इंडेक्स किए गए वर्शन व्यू में दिख जाएगी). यह तय करें कि आपने पेज क्रॉल किए जाने के बाद कोई सुधार किया है या नहीं.

मैं किसी खास यूआरएल की इंडेक्स स्थिति कैसे ढूंढू?

किसी खास यूआरएल की इंडेक्स स्थिति जानने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें. आप इंडेक्स कवरेज रिपोर्ट में यूआरएल के हिसाब से न तो खोज सकते हैं और न ही फ़िल्टर कर सकते हैं.

स्थिति की वजहें

यहां हर समस्या की स्थिति के लिए संभावित वजहें दी गई हैं:

"सबमिट किए गए" बनाम "सबमिट नहीं किए गए"

जब भी आपको इंडेक्स करने की ऐसी वजह दिखाई दे जिसमें "सबमिट किए गए" शब्द हो, तो इसका मतलब है कि आपने Google से साफ़ तौर पर कहा है कि वह यूआरएल को किसी साइटमैप में शामिल करके उसे इंडेक्स करे. जब भी इसे "सबमिट नहीं किया गया" के रूप में लेबल किया गया हो, तो इसका मतलब है कि Google ने यूआरएल को खुद ही ढूंढा है (उदाहरण के लिए, किसी लिंक या दूसरे पेज से) और यह कि यूआरएल किसी भी इंडेक्स किए गए साइटमैप में नहीं है.

गड़बड़ी वाले पेज


गड़बड़ियों वाले पेजों को इंडेक्स नहीं किया गया है.


सर्वर में गड़बड़ी (5xx): पेज देखने के लिए अनुरोध करने पर आपके सर्वर से 500-लेवल वाले कोड की गड़बड़ी का मैसेज मिला. सर्वर की गड़बड़ियां ठीक करना देखें.

रीडायरेक्ट से जुड़ी गड़बड़ी: यूआरएल में रीडायरेक्ट से जुड़ी गड़बड़ी मिली. यह गड़बड़ी नीचे दिए गए प्रकारों में से एक हो सकती है: यह एक बहुत ही लंबी रीडायरेक्ट चेन थी; यह एक रीडायरेक्ट लूप था; आखिर में दूसरा वेबलिंक, यूआरएल की लंबाई की तय सीमा से ज़्यादा बड़ा हो गया; रीडायरेक्ट चेन में गलत या खाली यूआरएल मौजूद था.

सबमिट किए गए ऐसे यूआरएल, जिन पर robots.txt के ज़रिए रोक लगाई गई है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन पेज पर robots.txt के ज़रिए रोक लगी है. robots.txt की जाँच करने वाले टूल का इस्तेमाल करके अपने पेज की जाँच करें.

सबमिट किए गए यूआरएल की पहचान 'noindex' के तौर पर की गई: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया, लेकिन इसके मेटा टैग या एचटीटीपी हेडर में 'noindex' डायरेक्टिव दिया गया है. अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको मेटा टैग या एचटीटीपी हेडर हटाना होगा.

सबमिट किए गए यूआरएल से मिली गड़बड़ी 'सॉफ़्ट 404' जैसी लग रही है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन सर्वर से मिला मैसेज सॉफ़्ट 404 की गड़बड़ी वाला लग रहा है.

सबमिट किए गए यूआरएल से 'बिना मंज़ूरी वाले अनुरोध' का मैसेज मिला (401): आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन Google को रिस्पॉन्स के तौर पर 401 (मंज़ूरी नहीं) वाली गड़बड़ी का मैसेज मिला है. ऐसे में, इस पेज के लिए ज़रूरी मंज़ूरी लेने की शर्त हटाएं या Googlebot की पहचान की पुष्टि करके उसे अपने पेज देखने की मंज़ूरी दें.

सबमिट किया गया यूआरएल नहीं मिला (404): आपने इंडेक्स करने के लिए ऐसा यूआरएल सबमिट किया है, जो मौजूद नहीं है. 404 कोड वाली गड़बड़ियों को ठीक करना देखें.

सबमिट किए गए यूआरएल में क्रॉल करने से जुड़ी समस्या है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया और Google को क्रॉल करने में ऐसी गड़बड़ी मिली, जिसके बारे में जानकारी नहीं है. यह गड़बड़ी ऊपर दी गई दूसरी सभी गड़बड़ियों से अलग है. यूआरएल की जाँच करने वाले टूल का इस्तेमाल करके अपने पेज को डीबग करने की कोशिश करें.

चेतावनी वाले पेज


हो सकता है कि आपको चेतावनी वाले पेज़ों पर ध्यान देना पड़े. इसके साथ ही यह भी हो सकता है कि उन्हें खास नतीजे के हिसाब से इंडेक्स किया गया हो या न किया गया हो.


robots.txt के ज़रिए रोक लगाए जाने के बाद भी इंडेक्स किया गया: हालांकि, पेज पर robots.txt के ज़रिए रोक लगाई गई है, फिर भी इसे इंडेक्स किया गया. (Google हमेशा robots.txt के हिसाब से काम करता है, लेकिन अगर कोई व्यक्ति robot.txt में शामिल पेज का लिंक अपनी साइट पर देता है, तो पेज को इंडेक्स किया जा सकता है). इसे चेतावनी के तौर पर इसलिए दिखाया जाता है, क्योंकि हमें इस बारे में ठीक से नहीं पता है कि आप इस पेज को खोज के नतीजों में दिखाने से रोकना चाहते हैं या नहीं. अगर आप इस पेज पर रोक लगाना चाहते हैं, तो इंडेक्स किए जाने से रोकने के लिए robots.txt का इस्तेमाल करना सही तरीका नहीं है. इंडेक्स किए जाने से रोकने के लिए आपको 'noindex' का इस्तेमाल करना चाहिए या इसके लिए अनुमति लेना ज़रूरी बनाना चाहिए, ताकि पहचान ज़ाहिर किए बिना आपका पेज एक्सेस न किया जा सके. robots.txt टेस्टर का इस्तेमाल करके आप यह जान सकते हैं कि इस पेज पर किस नियम के मुताबिक रोक लगाई जा रही है. robots.txt की वजह से हो सकता है कि दिखाया गया कोई भी स्निपेट इस पेज के लिए एकदम सही न हो. अगर आप इस पेज पर रोक नहीं लगाना चाहते हैं, तो अपने पेज पर लगी रोक को हटाने के लिए robots.txt फ़ाइल में बदलाव करें.

मान्य पेज


जिन पेजों की स्थिति ठीक है, वे इंडेक्स किए जा चुके हैं.

सबमिट और इंडेक्स किया गया: आपने यूआरएल को इंडेक्स करने के लिए सबमिट किया और उसे इंडेक्स किया गया.

इंडेक्स किया गया, लेकिन साइटमैप में सबमिट नहीं किया गया: Google ने यूआरएल खोजकर उसे अपने आप इंडेक्स किया. हम सभी ज़रूरी यूआरएल को साइटमैप इस्तेमाल करके सबमिट करने का सुझाव देते हैं.

इंडेक्स में शामिल नहीं किए गए पेज


आम तौर पर ये पेज इंडेक्स नहीं किए जाते हैं और हमें लगता है कि यह सही है. ये पेज या तो इंडेक्स किए गए पेजों के डुप्लीकेट हैं या आपकी साइट पर कुछ तरीकों से इन्हें इंडेक्स करने पर रोक लगी है. अगर इनमें से कोई वजह नहीं है, तो ये किसी ऐसी वजह से इंडेक्स नहीं किए गए, जिसे हम गड़बड़ी नहीं मानते हैं.


‘noindex’ टैग इस्तेमाल करके पेज को इंडेक्स करने पर रोक लगाई गई: जब Google ने इस पेज को इंडेक्स करने की कोशिश की तब 'noindex' निर्देश/2} मिला, इसलिए इसे इंडेक्स नहीं किया गया. अगर आप इस पेज को इंडेक्स नहीं कराना चाहते हैं, तो यह अच्छी बात है कि इसे इंडेक्स नहीं किया गया! अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको 'noindex' डायरेक्टिव हटाना होगा.

पेज हटाने वाला टूल इस्तेमाल करके, पेज को इंडेक्स करने पर रोक लगाई गई: फ़िलहाल, यूआरएल हटाने के अनुरोध की वजह से पेज पर रोक लगी है. अगर साइट के मालिक के तौर पर आपकी पुष्टि की जा चुकी है, तो आप यूआरएल हटाने वाला टूल इस्तेमाल कर सकते हैं. इससे आप देख सकते हैं कि इसे हटाने का अनुरोध किसने किया है. यह अनुरोध, हटाए जाने की तारीख के 90 दिनों तक ही काम करते हैं. इस समय सीमा के बाद, भले ही आप दोबारा इंडेक्स करने का अनुरोध सबमिट न करें, फिर भी हो सकता है कि Googlebot उस पेज पर दोबारा जाए और उसे इंडेक्स करे. अगर आप नहींं चाहते कि पेज को इंडेक्स किया जाए, तो 'noindex' इस्तेमाल करें, पेज देखने के लिए अनुमति लेना ज़रूरी बनाएं या पेज हटा दें.

robots.txt इस्तेमाल करके पेज को इंडेक्स करने पर रोक लगाई गई: robots.txt फ़ाइल इस्तेमाल करके, इस पेज पर आने से Googlebot को रोका गया है. robots.txt टेस्टर इस्तेमाल करके आप जान सकते हैं कि क्या वाकई ऐसा किया गया है. ध्यान दें, इसका यह मतलब नहीं है कि किसी दूसरे तरीके से पेज इंडेक्स नहीं किया जा सकता. अगर इस पेज को लोड किए बगैर Google को इसके बारे में दूसरी जानकारी मिल जाती है तो, हो सकता है कि पेज इंडेक्स कर दिया जाए (हालांकि आम तौर पर ऐसा नहीं होता). यह पक्का करने के लिए कि Google इस पेज को इंडेक्स न करे, आप robots.txt के ज़रिए लगाई गई रोक हटाएं और 'noindex' डायरेक्टिव इस्तेमाल करें.

बिना मंज़ूरी वाले अनुरोध (401) की वजह से पेज को इंडेक्स करने पर रोक लगाई गई: पेज देखने के लिए मंज़ूरी लेने के अनुरोध (401 रिस्पॉन्स) की वजह से Googlebot को पेज देखने से रोका गया. अगर आप चाहते हैं कि Googlebot इस पेज को क्रॉल करे, तो पेज को देखने के लिए मंज़ूरी लेने की शर्त हटाएं या Googlebot को अपने पेज का एक्सेस दें.

क्रॉल करने में समस्या: इस यूआरएल को फ़ेच करने में एक ऐसी गड़बड़ी हुई, जिसकी पहचान नहीं की जा सकी. इसका मतलब है कि 4xx - या 5xx -लेवल वाला रिस्पॉन्स कोड भेजा जा सकता है. पेज को फ़ेच करने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें और देखें कि क्या इससे भी यूआरएल फ़ेच करने में कोई समस्या आ रही है. पेज इंडेक्स नहीं किया गया.

क्रॉल किया गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज को क्रॉल किया है, लेकिन इंडेक्स नहीं किया. हो सकता है कि आने वाले समय में इसे इंडेक्स किया जाए या ना किया जाए; क्रॉल करने के लिए इस यूआरएल को दोबारा सबमिट करने की ज़रूरत नहीं है.

खोजा गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज ढूंढ लिया है, लेकिन इसे अभी तक क्रॉल नहीं किया है. Google ने यूआरएल को क्रॉल करने की कोशिश की, लेकिन तब साइट ओवरलोड थी; इसलिए Google उसे बाद में क्रॉल करने की कोशिश करेगा. इस वजह से रिपोर्ट में पिछली बार क्रॉल करने की तारीख नहीं दी गई है.

सही कैननिकल टैग वाला वैकल्पिक पेज: यह पेज उस पेज का डुप्लीकेट है, जिसकी पहचान Google ने कैननिकल के तौर पर की है. यह पेज कैननिकल पेज पर सही तरीके से ले जाता है, यानी इसके लिए आपको कुछ करने की ज़रूरत नहीं है.

डुप्लीकेट यूआरएल, जो उपयोगकर्ता के कैननिकल यूआरएल चुने बिना मौजूद है: इस पेज के कई डुप्लीकेट पेज हैं, लेकिन किसी को भी कैननिकल के तौर पर नहीं चुना गया है. हमें लगता है कि यह पेज कैननिकल नहीं है. आपको साफ़ तौर पर इस पेज के लिए कैननिकल का टैग जोड़ना होगा. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए, जो Google ने चुना है.

डुप्लीकेट पेज, Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना: यह पेज कई पेजों के लिए कैननिकल के तौर पर चुना गया, लेकिन Google को लगता है कि कोई दूसरा यूआरएल इससे बेहतर कैननिकल हो सकता है. Google ने इस पेज की जगह उस पेज को इंडेक्स किया, जिसे हम कैननिकल मानते हैं. हमारा सुझाव है कि आप साफ़ तौर पर इस पेज को कैननिकल यूआरएल के डुप्लीकेट पेज के तौर पर तय करें. इस पेज को Google ने ढूंढा है और इसे क्रॉल करने के लिए साफ़ तौर पर कोई अनुरोध नहीं किया गया है. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए जिसे Google ने चुना है.

नहीं मिला (404): इस पेज को देखने का अनुरोध करने पर 404 कोड वाली गड़बड़ी मिली. यह यूआरएल Google ने अपने आप ढूंढा था और इसे क्रॉल करने के लिए साफ़ तौर पर कोई अनुरोध नहीं किया गया था, न ही इसे किसी साइटमैप के ज़रिए सबमिट किया गया था. शायद Google ने इस यूआरएल को किसी दूसरी साइट के लिंक के तौर पर ढूंढा है या हो सकता है कि यह पेज पहले मौजूद था और बाद में इसे हटा दिया गया था. Googlebot कुछ समय के लिए इस यूआरएल को क्रॉल करना जारी रख सकता है, क्योंकि ऐसा कोई तरीका नहीं है जिससे Googlebot को कोई यूआरएल हमेशा के लिए भूलने के लिए कहा जा सके. हालांकि, समय के साथ Googlebot इस यूआरएल को कम क्रॉल करेगा. अगर जानबूझकर 404 वाला कोड दिखाने के लिए सेट किया गया है, तो इसमें कोई समस्या नहीं है. अगर आपके पेज की जगह बदल गई है, तो नई जगह पर ले जाने के लिए 301 कोड वाले रीडायरेक्ट का इस्तेमाल करें. 404 कोड वाली गड़बड़ियां ठीक करना लेख पढ़ें

कानूनी शिकायत की वजह से पेज हटा दिया गया है: कानूनी शिकायत की वजह से पेज को इंडेक्स से हटा दिया गया है.

किसी दूसरे वेबलिंक पर रीडायरेक्ट करने वाला पेज: यह किसी दूसरे वेबलिंक पर रीडायरेक्ट करने वाला यूआरएल है, इसलिए इसे इंडेक्स नहीं किया गया.

सॉफ़्ट 404: पेज देखने की कोशिश करने पर हमें लगता है कि नतीजे के तौर पर सॉफ़्ट 404 रिस्पॉन्स मिलता है. इसका मतलब है कि इस पेज को देखने की कोशिश करने पर इससे जुड़ा 404 कोड वाला मैसेज नहीं दिखता. हालांकि, इसमें "नहीं मिला" का ऐसा मैसेज दिखता है, जो उपयोगकर्ता को आसानी से समझ आ सके. हमारा सुझाव है कि आप "नहीं मिला" गड़बड़ी वाले पेजों के लिए 404 रिस्पॉन्स कोड दिखाएं. ऐसा करने के बजाय आप पेज पर ज़्यादा जानकारी जोड़कर हमें बता सकते हैं कि इस पेज में 'सॉफ़्ट 404' वाली गड़बड़ी नहीं है. और जानें

डुप्लीकेट, सबमिट किए गए यूआरएल को कैननिकल के तौर पर नहीं चुना गया है: दिया गया यूआरएल, डुप्लीकेट यूआरएल के सेट में से एक है और साफ़ तौर पर इसकी पहचान कैननिकल पेज के रूप में नहीं की गई है. आपने साफ़ तौर पर इस यूआरएल को इंडेक्स करने का अनुरोध किया, लेकिन Google ने इसे इंडेक्स नहीं किया. ऐसा इसलिए हुआ क्योंकि यह एक डुप्लीकेट पेज है. साथ ही, Google को लगता है कि दूसरा यूआरएल, कैननिकल होने के लिए बेहतर है. इसलिए, Google ने अपने चुने गए कैननिकल को इंडेक्स किया. (Google डुप्लीकेट यूआरएल के सेट में से सिर्फ़ कैननिकल पेज को इंडेक्स करता है.) इस स्थिति और "Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना" में यह अंतर है कि इस मामले में आपने इंडेक्स करने का अनुरोध साफ़ तौर पर किया था. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए, जिसे Google ने चुना है.

क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?