इंडेक्स कवरेज रिपोर्ट

जानें कि आपके किन पेजाें काे इंडेक्स किया गया है और आपकी साइट को इंडेक्स करते समय किस तरह की समस्याएं आईं.

 

इंडेक्स कवरेज रिपोर्ट

 

Search Console में इंडेक्स कवरेज की स्थिति - Google Search Console की ट्रेनिंग

रिपोर्ट को समझना

अगर आपने 'Google सर्च' कैसे काम करता है लेख पढ़ा है, तो यह रिपोर्ट समझने में ज़्यादा आसानी होगी.

यह रिपोर्ट बताती है कि आपकी प्रॉपर्टी में Google जिन यूआरएल पर जा चुका है या जिन पर जाने की कोशिश की है उन्हें इंडेक्स किए जाने की स्थिति क्या है. खास जानकारी देने वाला पेज आपकी प्रॉपर्टी के सभी यूआरएल के नतीजे दिखाता है. इन नतीजों को स्थिति (गड़बड़ी, चेतावनी या मान्य) के मुताबिक ग्रुप में अलग किया जाता है. साथ ही, उस स्थिति की खास वजह (जैसे कि सबमिट किया गया यूआरएल नहीं मिला (404)) भी दिखाई जाती है. एक ही स्थिति/वजह वाले सभी यूआरएल देखने और समस्या के बारे में ज़्यादा जानकारी के लिए, खास जानकारी देने वाले पेज पर टेबल की किसी लाइन पर क्लिक करें.

 

क्या मुझे इस रिपोर्ट की ज़रूरत है?

अगर आपकी साइट में 500 से कम पेज हैं, तो शायद आपको यह रिपोर्ट इस्तेमाल करने की ज़रूरत नहीं है. इसके बजाय, Google पर site:your_site डालकर अपनी साइट खोजना ज़्यादा आसान है. इसमें "your_site" आपकी साइट के होम पेज का बिना "http://" या "https://" वाला यूआरएल है. उदाहरण के लिए, site:example.com या site:example.com/petstore. खोज नतीजों में, आपकी साइट के वे पेज दिखाए जाते हैं जिनके बारे में Google के पास जानकारी है. अपनी साइट पर खास पेजों को ढूंढने के लिए, आप खोज के लिए शब्द जोड़ सकते हैं. उदाहरण के लिए: site:example.com/petstore iguanas zebras.

 

खास जानकारी वाला पेज

सबसे ऊपरी लेवल वाली रिपोर्ट उन सभी पेजों के इंडेक्स होने की स्थिति के बारे में बताती है जिन्हें आपकी साइट पर Google ने क्रॉल करने की कोशिश की है. इन पेजों को स्थिति और वजह के हिसाब से ग्रुप में रखा जाता है.

मुख्य क्रॉलर

खास जानकारी वाले पेज पर मौजूद मुख्य क्रॉलर का मान, उस डिफ़ॉल्ट उपयोगकर्ता एजेंट का प्रकार दिखाता है जिसका इस्तेमाल Google आपकी साइट को क्रॉल करने के लिए करता है. जैसे कि: स्मार्टफ़ोन या डेस्कटॉप. ये मोबाइल डिवाइस या डेस्कटॉप पर एक उपयोगकर्ता की तरह काम करते हैं.

Google इस मुख्य क्रॉलर का इस्तेमाल करके, आपकी साइट के सभी पेजाें को क्रॉल करता है. इसके अलावा, Google किसी दूसरे क्रॉलर (जिसे कभी-कभी वैकल्पिक क्रॉलर भी कहा जाता है) का इस्तेमाल करके भी, आपके पेजाें के किसी सबसेट काे क्रॉल कर सकता है. यह क्रॉलर दूसरी तरह का उपयोगकर्ता एजेंट हाेता है. उदाहरण के लिए, अगर आपकी साइट के लिए मुख्य क्रॉलर स्मार्टफ़ोन है, तो दूसरा क्रॉलर डेस्कटॉप हाेगा. अगर मुख्य क्रॉलर डेस्कटॉप है, तो आपका दूसरा क्रॉलर स्मार्टफ़ोन हाेगा. दूसरे क्रॉलर का काम इस बारे में ज़्यादा जानकारी पाना हाेता है कि जब किसी और डिवाइस से उपयोगकर्ता आपकी साइट पर जाते हैं, ताे साइट कैसा व्यवहार करती है.

इस रिपोर्ट में क्या देखें

आम तौर पर, जैसे-जैसे आपकी साइट बेहतर होती जाती है, आपको इंडेक्स किए गए पेजों की संख्या धीरे-धीरे बढ़ती हुई दिखनी चाहिए. अगर आपको यह संख्या कम या ज़्यादा होती दिखती है, तो समस्या हल करने वाला सेक्शन देखें. खास जानकारी वाले पेज में स्थिति टेबल को "स्थिति + वजह" के हिसाब से ग्रुप और क्रम में दिखाया जाता है; आपको साइट पर सबसे ज़्यादा असर करने वाली गड़बड़ियों को पहले ठीक करना चाहिए.

इस रिपोर्ट में क्या नहीं देखें

  • आपको अपनी साइट के सभी यूआरएल इंडेक्स किए जाने की उम्मीद नहीं करनी चाहिए. आपका लक्ष्य होना चाहिए कि हर पेज का कैननिकल वर्शन इंडेक्स किया जाए. इस रिपोर्ट में, हर डुप्लीकेट या विकल्प के तौर पर काम करने वाले पेज को "शामिल नहीं किया गया" के तौर पर लेबल किया जाएगा. डुप्लीकेट या विकल्प के तौर पर काम करने वाले पेज की सामग्री काफ़ी हद तक कैननिकल पेज की तरह होती है. किसी पेज का डुप्लीकेट या विकल्प के तौर पर काम करने वाले पेज के तौर पर पहचाना जाना अच्छी बात है. इसका मतलब यह है कि हमें कैननिकल पेज मिल गया है और हमने उसे इंडेक्स कर दिया है. आप यूआरएल की जांच करने वाला टूल चलाकर, किसी भी यूआरएल के कैननिकल का पता लगा सकते हैं. देखें कि पेज न मिलने की दूसरी वजहें क्या हो सकती हैं.
  • जब आप नई सामग्री जोड़ते हैं, तो Google को उसे इंडेक्स करने में कुछ दिन लग सकते हैं. आप इंडेक्स करने का अनुरोध करके इसमें लगने वाले समय को कम कर सकते हैं.

स्थिति

हर पेज की स्थिति इनमें से कोई एक हो सकती है:

  • गड़बड़ी: पेज को इंडेक्स नहीं किया गया है. गड़बड़ी को ठीक करने और उसके बारे में ज़्यादा जानने के लिए, खास तरह की गड़बड़ी की जानकारी देखें. सबसे पहले आपको इन समस्याओं पर ध्यान देना चाहिए.
  • चेतावनी: पेज को इंडेक्स किया गया है, लेकिन इसमें एक समस्या है, जिसके बारे में आपको पता होना चाहिए.
  • शामिल नहीं किया गया: पेज को इंडेक्स नहीं किया गया है, लेकिन हमें लगता है कि आप यही चाहते थे. (उदाहरण के लिए, शायद आपने कोई noindex निर्देश इस्तेमाल करके, पेज को जान-बूझकर शामिल न किया हो या शायद वह पेज, आपकी साइट पर पहले से इंडेक्स किए गए कैननिकल पेज का डुप्लीकेट हो.)
  • मान्य: पेज को इंडेक्स किया गया है.

वजह

हर स्थिति (गड़बड़ी, चेतावनी, मान्य, शामिल नहीं किए गए) के होने की एक खास वजह होती है. हर तरह की स्थिति की जानकारी देखने और उसे प्रबंधित करने के तरीके जानने के लिए, नीचे दी गई स्थिति के प्रकारों की जानकारी देखें.

पुष्टि

इस समस्या की पुष्टि की स्थिति. आपको उन समस्याओं को ठीक करने पर पहले ध्यान देना चाहिए जिनकी पुष्टि की स्थिति "सही नहीं पाई गई" या "शुरू नहीं हुई" है.

पुष्टि की जानकारी

अपनी साइट पर एक खास तरह की समस्या के सभी इंस्टेंस ठीक कर लेने के बाद, आप Google से अनुरोध करके अपने किए हुए बदलावों की पुष्टि करा सकते हैं. अगर किसी समस्या के सभी इंस्टेंस ठीक कर लिए जाते हैं, तो समस्या की स्थिति दिखाने वाले टेबल में इसे 'ठीक कर लिया गया' के तौर पर दिखाया जाता है और यह टेबल के सबसे निचले हिस्से में चली जाती है. Search Console, समस्या की पुष्टि की स्थिति के साथ-साथ समस्या के हर इंस्टेंस की पुष्टि की स्थिति पर भी नज़र रखता है. जब समस्या के सभी इंस्टेंस ठीक हो जाते हैं, तो उसे 'ठीक कर लिया गया' माना जाता है. (पुष्टि किए जाने की सही स्थिति जानने के लिए, समस्या की पुष्टि की स्थिति और इंस्टेंस की पुष्टि की स्थिति देखें.)

समस्या के 'जीवनकाल' से जुड़ी ज़्यादा जानकारी...

किसी वेबसाइट पर मौजूद समस्या के 'जीवनकाल' में, उसकी पहचान किए जाने के समय से लेकर उसके आखिरी इंस्टेंस के पूरी तरह ठीक किए जाने के 90 दिन बाद तक का समय शामिल होता है. अगर 90 दिनों के बाद समस्या फिर से दिखाई नहीं देती है, तो इसे रिपोर्ट इतिहास से हटा दिया जाता है.

जिस तारीख पर समस्या की पहली बार पहचान की गई हो, उसे समस्या के 'जीवनकाल' का वह समय माना जाता है जब पहली बार उसका पता लगाया गया. समस्या पता चलने की तारीख में कोई बदलाव नहीं होता. इसलिए:

  • अगर किसी समस्या के सभी इंस्टेंस ठीक कर लेने के 15 दिनों बाद, इसका नया इंस्टेंस फिर से दिखाई देता है तो समस्या "ठीक नहीं की गई है" के रूप में दिखाई देती है. इसके पता चलने की मूल तारीख भी "पहली बार पता चलने की तारीख" ही होती है.
  • समस्या के आखिरी इंस्टेंस को ठीक कर लिए जाने के 91 दिन बाद, अगर समस्या फिर से दिखाई देती है तो पिछली समस्या को 'ठीक कर ली गई है' माना जाता है. यही वजह है कि इसे नई समस्या के रूप में दर्ज किया जाता है और इसके पता चलने की तारीख "आज" की होती है.

पुष्टि की प्रोसेस सामान्य रूप से कैसे काम करती है

यहां वह खास जानकारी दी गई है, जिससे यह पता चलता है कि जब आप किसी समस्या के लिए समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो क्या होता है. इस प्रोसेस में कई दिन का समय लग सकता है. आपको ईमेल के ज़रिए इससे जुड़ी सूचनाएं मिलती रहेंगी.

  1. जब आप समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो Search Console तुरंत कुछ पेजों की जांच करता है.
    • जांचे जा रहे किसी भी पेज में मौजूदा समस्या मिलने पर, पुष्टि की प्रोसेस खत्म हो जाती है और पुष्टि किए जाने की स्थिति में कोई बदलाव नहीं होता.
    • अगर इन पेजों (जो नमूनों के तौर पर जांचे जा रहे हैं) में मौजूदा गड़बड़ी नहीं मिलती है, तो पुष्टि की प्रोसेस शुरू हो गई की स्थिति के साथ जारी रहती है. अगर पुष्टि करने पर दूसरी तरह की समस्याएं मिलती हैं, तो इन्हें इसी तरह की दूसरी समस्याओं में गिना जाता है और पुष्टि की प्रोसेस जारी रहती है.
  2. Search Console, सूची के हिसाब से उन यूआरएल पर काम करता है जिन पर इस समस्या का असर हुआ है. दोबारा क्रॉल करने के लिए तैयार की गई इस सूची में पूरी साइट के बजाय, सिर्फ़ वही यूआरएल शामिल किए जाते हैं जिन पर इस समस्या के इंस्टेंस मौजूद हैं. Search Console जिन यूआरएल को जांचता है उन सभी का रिकॉर्ड पुष्टि के इतिहास में रखता है. इसे 'समस्या की जानकारी पेज' पर देखा जा सकता है.
  3. यूआरएल जांचे जाने पर:
    1. अगर समस्या न मिले, तो इंस्टेंस की पुष्टि की स्थिति बदलकर पास हो रही है हो जाती है. पुष्टि शुरू होने के बाद, अगर यह पहला इंस्टेंस है जिसकी जांच की जा रही है, तो समस्या की पुष्टि की स्थिति बदलकर सब ठीक लग रहा है हो जाती है.
    2. अगर अब यूआरएल देखा नहीं जा सकता, तो इंस्टेंस की पुष्टि की स्थिति बदलकर अन्य (दूसरा) हो जाती है (जो किसी गड़बड़ी की स्थिति नहीं होती है).
    3. इंस्टेंस अगर अब भी मौजूद है, तो समस्या की स्थिति बदलकर फ़ेल हो जाती है. अगर सामान्य तरीके से क्रॉल करने पर यह नया पेज मिला है, तो इसे मौजूदा समस्या का एक और इंस्टेंस माना जाता है.
  4. सभी गड़बड़ियां और चेतावनी वाले यूआरएल जांचे जाने के बाद समस्या की गिनती शून्य रह जाती है, तो समस्या की स्थिति बदलकर पास हो जाती है. ज़रूरी जानकारी: भले ही, समस्या के असर वाले पेज की संख्या घटकर शून्य और समस्या की स्थिति बदलकर पास हो जाए, तब भी पेज पर मूल गंभीरता का लेबल (गड़बड़ी या चेतावनी) दिखाया जाएगा.

भले ही आपने कभी भी "पुष्टि शुरू करें" पर क्लिक न किया हो, पर Google किसी समस्या के ठीक कर लिए गए इंस्टेंस पहचान सकता है. नियमित रूप से किए जाने वाले क्रॉल के दौरान अगर Google को पता चलता है कि किसी समस्या के सभी इंस्टेंस ठीक कर लिए गए हैं, तो यह रिपोर्ट पर समस्या की स्थिति बदलकर "लागू नहीं" कर देगा.

किसी यूआरएल या साइट के किसी हिस्से में आई समस्या को "ठीक कर लिया गया" कब माना जाता है?

नीचे दी गईं शर्तों में से किसी एक के पूरे होने पर, यूआरएल या साइट के किसी हिस्से की समस्या को 'ठीक कर लिया गया' माना जाता है :

  • जब यूआरएल क्रॉल किया जाता है और पेज पर समस्या नहीं मिलती. एएमपी टैग की गड़बड़ी के लिए इसका मतलब है कि आपने टैग को ठीक कर लिया है या इसे हटा दिया है (अगर टैग की ज़रूरत नहीं है). पुष्टि करते समय, इसे "पास" माना जाएगा.
  • अगर किसी वजह (पेज हटा दिया गया है, पेज पर noindex नियम लागू है, पेज देखने के लिए मंज़ूरी लेना ज़रूरी है वगैरह) से Google को पेज नहीं मिलता, तो उस यूआरएल के लिए, समस्या को 'ठीक कर लिया गया' माना जाएगा. पुष्टि के दौरान, इसे पुष्टि की "अन्य" स्थिति के रूप में गिना जाता है.

दोबारा पुष्टि करने का तरीका

जब आप किसी फ़ेल हो गई पुष्टि के लिए दोबारा पुष्टि करें पर क्लिक करते हैं, तो सभी फ़ेल इंस्टेंस के लिए पुष्टि दोबारा शुरू हो जाती है. साथ ही, सामान्य रूप से क्रॉल किए जाने पर मिले इस समस्या के नए इंस्टेंस की भी पुष्टि होती है.

दोबारा पुष्टि किए जाने का अनुरोध करने से पहले आपको मौजूदा समय में चल रही पुष्टि की प्रोसेस पूरी होने तक इंतज़ार करना चाहिए, भले ही आपने अनुरोध किए जाने के बाद कुछ समस्याएं ठीक की हों.

जो इंस्टेंस पुष्टि में 'पास' हो चुके हैं (पास के निशान वाले) या अब जिन्हें देखा नहीं जा सकता (अन्य के निशान वाले) उन्हें दोबारा नहीं जांचा जाता. साथ ही जब आप 'दोबारा पुष्टि करें' पर क्लिक करते हैं, तो इन्हें इतिहास से हटा दिया जाता है.

पुष्टि किए जाने का इतिहास

आप यह देख सकते हैं कि जिस पुष्टि का अनुरोध आपने किया है, उसकी प्रक्रिया कितनी पूरी हुई है. इसके लिए समस्या की जानकारी वाले पेज पर पुष्टि की जानकारी के लिंक पर क्लिक करें.

एएमपी रिपोर्ट और इंडेक्स की स्थिति की रिपोर्ट देखने के लिए, पुष्टि के इतिहास वाले पेज की सामग्री को यूआरएल के हिसाब से समूह में रखा जाता है. मोबाइल पर इस्तेमाल में आसानी की रिपोर्ट और रिच नतीजों की रिपोर्ट में, सामग्रियों को यूआरएल और व्यवस्थित डेटा की सामग्री के हिसाब से समूह में रखा जाता है. इसके लिए सामग्रियों की पहचान उनके नाम के मान से की जाती है. पुष्टि की स्थिति उस खास समस्या पर लागू होती है जिसकी आप जाॅंच कर रहे हैं. किसी पेज पर एक समस्या का लेबल "पास" हो सकता है, लेकिन दूसरी समस्याओं का लेबल "फ़ेल", "पुष्टि होनी बाकी है" या "कुछ और" हो सकता है.

समस्या की पुष्टि की स्थिति

किसी भी समस्या पर नीचे दी गई समस्या की स्थितियां लागू होती हैं:

  • शुरू नहीं हुई है: इस समस्या के इंस्टेंस वाले एक या उससे ज़्यादा पेज हैं. आपने इनकी कभी भी पुष्टि करने की कोशिश नहीं की है. अगले चरण:
    1. गड़बड़ी के बारे में ज़्यादा जानकारी के लिए समस्या पर क्लिक करें. एएमपी जांच का इस्तेमाल करके, लाइव पेज पर गड़बड़ियों के उदाहरण देखने के लिए एक-एक पेज को ध्यान से देखें. (शायद एएमपी जांच से पेज पर गड़बड़ी दिखाई न दे. ऐसा इसलिए होता है, क्योंकि Google को यह गड़बड़ी मिलने और समस्या की रिपोर्ट तैयार करने के बाद, आपने लाइव पेज पर गड़बड़ी ठीक कर ली है.)
    2. जिस नियम का उल्लंघन किया गया है, उसके बारे में जानने के लिए जानकारी पेज पर "ज़्यादा जानें" पर क्लिक करें.
    3. किसी खास समस्या के बारे में जानकारी पाने के लिए, टेबल में एक उदाहरण यूआरएल पंक्ति पर क्लिक करें.
    4. अपने पेजों को ठीक करें और फिर ठीक किए जाने की पुष्टि करें पर क्लिक करें ताकि Google आपके पेज फिर से क्रॉल करे. Google आपको इस बात की सूचना देगा कि पुष्टि की प्रोसेस कहां तक पहुंची है. पुष्टि होने में एक-दो दिन से लेकर दो हफ़्ते तक का समय लग सकता है. इसलिए, अगर थोड़ा इंतज़ार करना पड़े, तो परेशान न हों. 
  • शुरू की गई:  आप पुष्टि करने की कोशिश कर रहे हैं और अभी तक समस्या का कोई इंस्टेंस नहीं मिला है. अगला चरण: जैस-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी, Google आपको सूचनाएं भेजेगा. साथ ही, ज़रूरी होने पर आपको बताएगा कि आपको क्या करना होगा.
  • सब ठीक लग रहा है: आप पुष्टि करने की कोशिश कर रहे हैं और अब तक समस्या के जितने भी इंस्टेंस मिले हैं उन्हें ठीक कर लिया गया है. अगला चरण: कुछ भी नहीं, लेकिन जैसे-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी, Google आपको सूचनाएं भेजेगा और बताएगा कि आपको क्या करना है.
  • पास: समस्या के सभी पहचाने गए इंस्टेंस अब मौजूद नहीं हैं (या अब वह यूआरएल उपलब्ध नहीं है जिस पर असर हुआ था). इस स्थिति में आने के लिए आपने ज़रूर "ठीक किए जाने की पुष्टि करें" पर क्लिक किया होगा (अगर इंस्टेंस आपके अनुरोध के बिना ही दिखाई नहीं दे रहे हैं, तो पुष्टि की स्थिति बदलकर 'लागू नहीं' हो जाएगी). अगला चरण: अब और कुछ नहीं करना.
  • लागू नहीं: Google को पता चला कि सभी यूआरएल पर समस्या को ठीक कर लिया गया है. हालांकि, आपने कभी भी पुष्टि करने की कोशिश नहीं की थी. अगला चरण: अब और कुछ नहीं करना.
  • फ़ेल: जब आपने "पुष्टि करें" पर क्लिक किया था उसके बाद भी एक तय सीमा तक के पेजों पर अब भी यह समस्या मौजूद है. अगले चरण: समस्या ठीक करें और दोबारा पुष्टि का अनुरोध करें.

इंस्टेंस की पुष्टि की स्थिति

पुष्टि का अनुरोध करने के बाद, किसी भी समस्या के लिए हर इंस्टेंस को खास स्थिति के तौर पर दिखाया जाता है. यह स्थिति पुष्टि की नीचे दी गई स्थितियों में से एक होती है:

  • अभी पुष्टि बाकी है: पुष्टि किए जाने के लिए सूची में जोड़ लिया गया है. पिछली बार जब Google ने क्रॉल किया था तब इंस्टेंस मौजूद था.
  • पास: [सभी रिपोर्ट में उपलब्ध नहीं] Google ने समस्या वाले इंस्टेंस की जांच करने पर पाया कि यह अब मौजूद नहीं है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • फ़ेल: Google ने जांचा और पाया कि समस्या का इंस्टेंस अभी भी मौजूद है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • अन्य: [सभी रिपोर्ट में उपलब्ध नहीं] Google उस यूआरएल पर नहीं पहुंच पाया जो इंस्टेंस को होस्ट कर रहा था या (स्ट्रक्चर्ड डेटा के मामले में) अब उस पेज पर वह आइटम नहीं ढूंढ पा रहा है. यह स्थिति पास जैसी ही है.

इस बात पर ध्यान दें कि अलग-अलग समस्याओं के लिए एक ही यूआरएल की अलग-अलग स्थितियां हो सकती हैं. उदाहरण के लिए, अगर किसी एक ही पेज पर X और Y दोनों तरह की समस्याएं हैं, तो हो सकता है कि X समस्या की पुष्टि की स्थिति पास हो और उसी पेज पर Y समस्या की पुष्टि की स्थिति पुष्टि नहीं हुई है के रूप में दिखाई दे.

यूआरएल खोज का ड्रॉपडाउन फ़िल्टर

चार्ट के ऊपर दिए गए ड्रॉपडाउन फ़िल्टर का इस्तेमाल करके, इंडेक्स के नतीजों को उस तरीके से फ़िल्टर करें जिस तरह से Google ने यूआरएल खोजा है. ये मान उपलब्ध हैं:

  • वे सभी पेज जिनके बारे में पहले से जानकारी है [डिफ़ॉल्ट रूप से] - वे सभी यूआरएल दिखाएं जिन्हें Google ने किसी भी तरीके से खोजा है.
  • सबमिट किए गए सभी पेज - सिर्फ़ वे पेज दिखाएं जो इस रिपोर्ट के लिए साइटमैप में या साइटमैप पिंग इस्तेमाल करके, सबमिट किए गए हैं.
  • खास साइटमैप यूआरएल - सिर्फ़ वे यूआरएल दिखाएं जो इस रिपोर्ट की मदद से सबमिट किए गए किसी खास साइटमैप में मौजूद हैं. इसमें नेस्ट किए गए साइटमैप में मौजूद सभी यूआरएल शामिल हैं.

किसी यूआरएल को साइटमैप के ज़रिए सबमिट माना जाता है, भले ही उसे किसी दूसरे तरीके से खोजा गया हो (जैसे, किसी दूसरे पेज को ऑर्गेनिक तरीके से क्रॉल करके).

ज़्यादा जानकारी वाला पेज

स्थिति और वजह वाली किसी जोड़ी का ज़्यादा जानकारी वाला पेज खोलने के लिए, खास जानकारी वाले पेज में मौजूद उसकी पंक्ति पर क्लिक करें. आप ज़्यादा जानकारी वाले पेज पर ज़्यादा जानें पर क्लिक करके, चुनी हुई समस्या के बारे में ज़्यादा जानकारी देख सकते हैं.

इस पेज पर ग्राफ़ दिखाता है कि समय के साथ पेजों पर कितना असर पड़ा है.

टेबल में उन पेज की एक उदाहरण सूची दिखाई जाती है जिन पर समस्या का असर हुआ है:

  • टेबल की लाइन पर दिए गए जंप लिंक पर क्लिक करके टेबल में दिया गया यूआरएल खोलें.
  • टेबल में किसी यूआरएल की जांच करने के लिए, टेबल की लाइन पर मौजूद जांच करें आइकॉन पर क्लिक करें.
  • किसी गड़बड़ी या चेतावनी के सभी इंस्टेंस ठीक कर लेने पर, आप Google से अपने सुधारों की पुष्टि करने के लिए कह सकते हैं.

क्या आपको समस्या वाला ऐसा यूआरएल मिला जिसे आप पहले ही ठीक कर चुके हैं? शायद आपने पिछली बार Google क्रॉल हो जाने के बाद समस्या ठीक की है. इसलिए, अगर आप कोई यूआरएल किसी ऐसी समस्या के साथ देखते हैं जिसे आप ठीक कर चुके हैं, तो उस यूआरएल के क्रॉल होने की तारीख ज़रूर देखें. समस्या ठीक करने की जांच और पुष्टि करें. उसके बाद दोबारा इंडेक्स करने का अनुराेध करें

स्रोत

जानकारियों वाले पेज पर स्रोत का मान दिखाता है कि सूची में दर्ज यूआरएल को क्रॉल करने के लिए किस तरह के उपयोगकर्ता एजेंट, जैसे स्मार्टफ़ोन या डेस्कटॉप का इस्तेमाल किया गया. हर तरह का उपयोगकर्ता एजेंट, उस उपयोगकर्ता की तरह व्यवहार करता है जाे दिए गए डिवाइस (क्रम के हिसाब से मोबाइल या डेस्कटॉप) से पेज पर जाता है.

 

रिपोर्ट शेयर करने का तरीका

आप पेज पर मौजूद शेयर करें बटन पर क्लिक करके, कवरेज या बेहतर बनाने की रिपोर्ट में समस्या से जुड़ी जानकारी शेयर कर सकते हैं. जिस व्यक्ति के पास यह लिंक है, वह इससे सिर्फ़ मौजूदा समस्या से जुड़ी ज़्यादा जानकारी वाले पेज और पुष्टि के इतिहास वाले किसी भी पेज को ऐक्सेस कर सकता है. यह लिंक आपके संसाधन के दूसरे पेजों का ऐक्सेस नहीं देता है. इस लिंक के ज़रिए, किसी दूसरे उपयोगकर्ता को आपकी प्रॉपर्टी या खाते पर किसी भी तरह की कार्रवाई करने की अनुमति नहीं दी जा सकती. इस पेज को शेयर किए जाने की सुविधा बंद करके आप इस लिंक के ज़रिए मिलने वाली मंज़ूरी पर रोक लगा सकते हैं.

रिपोर्ट का डेटा एक्सपोर्ट करने का तरीका

कई रिपोर्ट में डेटा को एक्सपोर्ट करने के लिए, एक्सपोर्ट करें बटन होता है. चार्ट और टेबल, दोनों का डेटा एक्सपोर्ट किया जाता है.

समस्या हल करना

आप इस रिपोर्ट में दिखाए गए यूआरएल की जांच करके, यूआरएल की इंडेक्स करने की स्थिति की पुष्टि कर सकते हैं:

  1. ज़्यादा जानकारी वाले पेज पर, जांच करने के विकल्पों को लिस्ट में शामिल करने वाले साइड पैनल को खोलने के लिए, उदाहरण टेबल में मौजूद किसी यूआरएल पर क्लिक करें.
  2. साइड पैनल में, पेज के 'Google इंडेक्स' वर्शन के बारे में ज़्यादा जानकारी के लिए यूआरएल की जांच करें पर क्लिक करें.
  3. इंडेक्स की गई रिपोर्ट में, पेज के क्रॉल और इंडेक्स स्थिति के बारे में जानकारी के लिए, कवरेज > क्रॉल और कवरेज > इंडेक्सिंग सेक्शन देखें. पेज के लाइव वर्शन की जांच करने के लिए, लाइव यूआरएल की जांच करें पर क्लिक करें.

सामान्य समस्याएं

यहां इंडेक्स करने की सबसे आम समस्याओं के बारे में बताया गया है जो आपको इस रिपोर्ट में दिख सकती हैं:

इंडेक्स किए गए कुल पेजों में बिना संबंधित गड़बड़ी के गिरावट आना

अगर आपको संबंधित गड़बड़ियों के बिना, इंडेक्स किए गए कुल पेजों की संख्या में गिरावट दिखती है, तो शायद आप अपने मौजूदा पेजों का ऐक्सेस ब्लॉक कर रहे हैं (robots.txt या 'noindex' के इस्तेमाल से या लॉगिन को ज़रूरी बनाने से ऐसा हो सकता है) जिन्हें आपने इंडेक्स करने के लिए सबमिट नहीं किया है. अगर आपने इन पेजों को Google में इंडेक्स करने के लिए सबमिट किया था, तो आपको कुछ संबंधित गड़बड़ियां दिखाई देंगी. गिरावट के लिए उन शामिल नहीं किए गए यूआरएल पर नज़र डालें जो आपके मान्य पेजों में आई गिरावट से संबंधित हैं.

'मान्य' पेजों की तुलना में ज़्यादा 'शामिल नहीं किए गए' पेज होना

अगर आपको 'मान्य' से ज़्यादा 'शामिल नहीं किए गए' पेज दिखते हैं, तो उन्हें शामिल न किए जाने की वजहों पर नज़र डालें. शामिल नहीं किए जाने की आम वजहें ये हैं:

  • आपने एक ऐसा robots.txt नियम लागू किया है जो Google को आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है. अगर आप गलत पेजों को ब्लॉक कर रहे हैं, तो उन पर लगी रोक हटाएं.
  • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी सामान्य संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress{/0 या color=green या sort=price). अगर ये पेज अलग-अलग तरीकों से क्रम से लगाई या फ़िल्टर की गई सामग्री ही दिखा रहे हैं, तो शायद इन्हें शामिल नहीं किया जाना चाहिए. अगर आप एक अनुभवी उपयोगकर्ता हैं और आपको लगता है कि Google आपकी साइट पर मौजूद पैरामीटर को गलत समझ रहा है, तो आप अपनी साइट के पैरामीटर को पसंद के हिसाब से तय करने के लिए यूआरएल के पैरामीटर के बारे में जानकारी देने वाले टूल का इस्तेमाल कर सकते हैं.
गड़बड़ियां बढ़ना

अगर इंडेक्स करने में आने वाली गड़बड़ियों की संख्या बढ़ती है, तो ऐसा आपके टेम्प्लेट में हुए बदलाव की वजह से हो सकता है, क्योंकि टेम्प्लेट में बदलाव करने से उसमें नई गड़बड़ी आ सकती है. इसके अलावा, ऐसा तब भी हो सकता है, जब आपने ऐसा साइटमैप सबमिट किया हो जिसमें शामिल यूआरएल को क्रॉल करने पर रोक लगाई गई हो. उदाहरण के लिए, यह रोक robots.txt या noindex के इस्तेमाल या लॉगिन को ज़रूरी बनाने से लगी हो सकती है. किसी समस्या पर क्लिक करें और पेज की जांच करके देखें कि क्या गड़बड़ी है.

अगर आपको किसी गड़बड़ी में बढ़ोतरी दिखाई देती है, तो:

  1. देखें कि क्या इंडेक्स करने में गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या और किसी खास गड़बड़ी का रुझान दिखाने वाले ग्राफ़ (स्पार्कलाइन) के बीच कोई संबंध है. अगर ऐसा है, तो इससे आपकी गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या पर असर डालने वाली समस्या के बारे में कुछ संकेत मिल सकता है.
  2. ज़्यादा जानकारी देखने के लिए, गड़बड़ियों के ज़्यादा जानकारी वाले पेज पर जाएं. ऐसा करने के लिए, किसी गड़बड़ी वाली लाइन पर क्लिक करें. किसी खास तरह की गड़बड़ी को सबसे सही तरीके से ठीक करने का तरीका जानने के लिए, उसके बारे में दी गई जानकारी पढ़ें.
  3. गड़बड़ी के सभी इंस्टेंस ठीक करें और उस वजह के लिए, ज़्यादा जानकारी वाले पेज में दिए गए सुधार की पुष्टि करें पर क्लिक करके पुष्टि करने का अनुरोध करें. पुष्टि करने के बारे में ज़्यादा जानें.
  4. जैसे-जैसे आपके पेजों की पुष्टि होगी, आपको इसकी सूचनाएं मिलती रहेंगी. हालांकि, आप कुछ दिन बाद वापस आकर देख सकते हैं कि गड़बड़ियों की संख्या कम हुई या नहीं.
  5. शामिल नहीं किए गए यूआरएल का फ़िल्टर हटाएं. इसके बाद, जिन पेजों पर असर पड़ा है उनकी संख्या के हिसाब से क्रम में लगाएं और देखें कि अब इनमें किसी तरह की समस्या तो नहीं है. ऐसा समय-समय पर करते रहें.
सर्वर की गड़बड़ियां
सर्वर की गड़बड़ी का मतलब है कि Googlebot आपके यूआरएल को ऐक्सेस नहीं कर सका, तय समय में अनुरोध प्रोसेस नहीं हुआ या आपकी साइट पर ज़्यादा ट्रैफ़िक था. इस वजह से Googlebot को अनुरोध रद्द करना पड़ा.

सर्वर के कनेक्शन की जांच करना

यूआरएल जांचने वाले टूल का इस्तेमाल करके, आप यह देख सकते हैं कि इंडेक्स कवरेज रिपोर्ट में बताई गई सर्वर की गड़बड़ी फिर से हुई या नहीं.

सर्वर से कनेक्टिविटी में आ रही गडबड़ियां दूर करना

  • डाइनैमिक पेज अनुरोधों के लिए बार-बार होने वाली पेज लोडिंग कम करें.
    ऐसी साइट जो एक से ज़्यादा यूआरएल की एक ही सामग्री डिलीवर करती है उसे डाइनैमिक तरीके से सामग्री डिलीवर करने वाला माना जाता है (उदाहरण के लिए, www.example.com/shoes.php?color=red&size=7, www.example.com/shoes.php?size=7&color=red के जैसी ही सामग्री दिखाता है). डाइनैमिक पेजों से जवाब मिलने में लंबा समय लग सकता है, जिसकी वजह से समय खत्म होने (टाइम आउट) की समस्याएं हो सकती हैं. या डाइनैमिक सर्वर पर ज़रूरत से ज़्यादा ट्रैफ़िक होने की स्थिति का मैसेज दिख सकता है. इस वजह से, Googlebot से साइट को पहले के मुकाबले धीरे क्रॉल करने के लिए कहा जा सकता है. आम तौर पर, हम पैरामीटर सूचियों को छोटा रखने और उनका सीमित इस्तेमाल करने का सुझाव देते हैं. अगर आपको अपनी साइट के पैरामीटर के काम करने के तरीके के बारे में पूरी तरह पता है, तो आप Google को बता सकते हैं कि हमें इन पैरामीटर का इस्तेमाल कैसे करना चाहिए.
  • यह पक्का करें कि आपकी साइट का होस्टिंग सर्वर डाउन, ओवरलोड या गलत कॉन्फ़िगर नहीं किया गया है.
    अगर कनेक्शन समय खत्म होने या प्रतिक्रिया की समस्याएं बनी रहती हैं, तो अपने वेब होस्टर से संपर्क करें और ट्रैफ़िक प्रबंधित करने के लिए अपनी साइट की क्षमता बढ़ाने पर विचार करें.
  • जांचे कि आप अनजाने में Google को ब्लॉक तो नहीं कर रहे हैं.
    शायद आप सिस्टम की किसी समस्या की वजह से Google को ब्लॉक कर रहे हों. इनमें डीएनएस को कॉन्फ़िगर करने की समस्या, गलत तरीके से कॉन्फ़िगर किया गया फ़ायरवॉल, DoS सुरक्षा सिस्टम या सामग्री प्रबंधन सिस्टम को कॉन्फ़िगर करने की समस्याएं शामिल हो सकती हैं. बेहतर तरीके से होस्ट करने के लिए सुरक्षा के सिस्टम बहुत ज़रूरी हैं. इन्हें सर्वर पर सामान्य से ज़्यादा संख्या में आने वाले अनुरोधों पर अपने-आप रोक लगने के लिए कॉन्फ़िगर किया जाता है. हालांकि, उपयोगकर्ता के मुकाबले Googlebot ज़्यादा अनुरोध करता है, इसलिए यह Googlebot को ब्लॉक करके और इसे आपकी वेबसाइट क्रॉल करने से रोककर इन सुरक्षा सिस्टम को ट्रिगर कर सकता है. ऐसी समस्याएं हल करने के लिए, वेबसाइट के उस हिस्से की पहचान करें जो Googlebot को ब्लॉक कर रहा हो और उसे अनब्लॉक करें. हो सकता है फ़ायरवॉल आपके कंट्रोल में न हो, इसलिए आप इस बारे में सर्वर देने वाली संस्था से बात कर सकते हैं.
  • सर्च इंजन की साइट को क्रॉल और इंडेक्स करने की प्रक्रिया को समझदारी से कंट्रोल करें.
    कुछ वेबमास्टर Googlebot को अपनी वेबसाइट क्रॉल करने से जान-बूझकर रोकते हैं. ऐसा करने के लिए वे फ़ायरवॉल का इस्तेमाल करते हैं, जैसा कि ऊपर बताया गया है. ऐसी स्थितियों में, आम तौर पर इसका मकसद Googlebot को पूरी तरह ब्लॉक करना नहीं, बल्कि साइट को क्रॉल करने और इंडेक्स करने के तरीके को कंट्रोल करना होता है. अगर यह आप पर लागू होता है, तो इनकी जांच करें:
404 कोड वाली गड़बड़ियां

आम तौर पर, हम सिर्फ़ 404 की गड़बड़ी वाले पेज ठीक करने का सुझाव देते हैं, 404 के शामिल नहीं किए गए पेज का नहीं. 404 की गड़बड़ी वाले यूआरएल ऐसे यूआरएल हैं जिनके लिए आपने Google से खास तौर पर इंडेक्स करने के लिए कहा है, लेकिन वे मिले नहीं थे. 404 के शामिल नहीं किए गए यूआरएल ऐसे यूआरएल हैं जिन्हें Google ने किसी दूसरे तरीके से खोजा था.

404 की गड़बड़ियाें का आकलन करना और उन्हें ठीक करना.

शामिल नहीं किए गए पेज या साइट

अगर रिपोर्ट में आपके पेज की कोई जानकारी शामिल नहीं की गई है, तो इसकी वजह नीचे दी गई बातों में से एक हो सकती है:

  • Google इस पेज के बारे में नहीं जानता. पेज खोजे जाने के बारे में कुछ ज़रूरी बातें:
    • अगर यह साइट या पेज नया है, तो Google को उसे ढूंढने और क्रॉल करने में कुछ समय लग सकता है.
    • Google, नए पेज के बारे में जाने, इसके लिए आपको या तो साइटमैप सबमिट करना होगा या फिर पेज क्रॉल करने का अनुरोध करना होगा. अगर नहीं, तो Google आपके पेज में किसी जगह एक लिंक ढूंढ सकता है.
    • किसी पेज का यूआरएल पता चल जाने पर, Google को आपकी कुछ या पूरी साइट क्रॉल करने में कुछ समय (कुछ हफ़्ते तक) लग सकता है.
    • इंडेक्स करने का काम कभी भी फटाफट नहीं होता. तब भी नहीं, जब आप क्रॉल का अनुरोध सीधे सबमिट करते हैं.
  • Google आपके पेज तक नहीं पहुंच सकता (इसके लिए लॉगिन करना ज़रूरी है या वह इंटरनेट के दूसरे उपयोगकर्ताओं के लिए उपलब्ध नहीं है)
  • पेज में noindex टैग है जो Google को उसे इंडेक्स करने से रोकता है या
  • पेज को किसी वजह से इंडेक्स से हटा दिया गया था.

गड़बड़ी ठीक करने के लिए:

अपने पेज पर आई समस्या की जांच करने के लिए यूआरएल की जांच करने वाला टूल इस्तेमाल करें. अगर पेज इंडेक्स कवरेज रिपोर्ट में नहीं है, लेकिन उसे यूआरएल की जांच की रिपोर्ट में 'इंडेक्स किया गया' के रूप में दिखाया गया है, तो शायद उसे हाल ही में इंडेक्स किया गया था. साथ ही, वह इंडेक्स कवरेज रिपोर्ट में जल्द ही दिखाई देगा. अगर पेज को यूआरएल जांचने वाले टूल में 'इंडेक्स नहीं किया गया' के रूप में दिखाया गया है (जिसकी आपको उम्मीद है), तो लाइव पेज की जांच करें. लाइव पेज की जांच के नतीजों से पता चलना चाहिए कि समस्या क्या है: समस्या को ठीक करने के तरीके के बारे में जानने के लिए, जांच के नतीजे और जांच के दस्तावेज़ की जानकारी इस्तेमाल करें.

"सबमिट किए गए, लेकिन /सबमिट किए गए और" वाली गड़बड़ियां और उन्हें हटाना
शीर्षक में "सबमिट किया गया" शब्द का इस्तेमाल करने वाली इंडेक्सिंग की कोई भी वजह (उदाहरण के लिए, "सबमिट किया गया, लेकिन यूआरएल में क्रॉल करने से जुड़ी समस्या है" का मतलब है कि यूआरएल किसी ऐसे साइटमैप में दिया गया है जो आपकी robots.txt फ़ाइल से जुड़ा है या यूआरएल साइटमैप रिपोर्ट का इस्तेमाल करके सबमिट किया गया है.
"सबमिट की गई" समस्या को ठीक करने के लिए:
  • उस समस्या को ठीक करें जो पेज को क्रॉल होने से रोकती है, या
  • अपने साइटमैप से यूआरएल हटाएं और साइटमैप रिपोर्ट (सबसे जल्दी काम करने के लिए) में साइटमैप को फिर से सबमिट करें या
  • साइटमैप रिपोर्ट का इस्तेमाल करके, यूआरएल वाले सभी साइटमैप हटाएं (और पक्का करें कि आपकी robots.txt फ़ाइल में दिए गए किसी साइटमैप में यह यूआरएल शामिल नहीं है).

अक्सर पूछे जाने वाले सवाल

मेरा पेज इंडेक्स में क्यों है? मैं अपने पेज को इंडेक्स नहीं कराना चाहता.

Google इसे मिलने वाले किसी भी यूआरएल को तब तक इंडेक्स कर सकता है, जब तक कि आप पेज पर किसी noindex निर्देश को शामिल नहीं करते (या इसे हमेशा के लिए ब्लॉक न किया गया हो). साथ ही, Google किसी पेज को कई तरीकों से ढूंढ सकता है जिनमें किसी व्यक्ति का आपके पेज को किसी दूसरी साइट से लिंक करना शामिल है.

  • अगर आप चाहते हैं कि आपके पेज को 'Google सर्च' से ब्लॉक कर दिया जाए, तो आपको पेज के लिए किसी तरह के लॉगिन की ज़रूरत होगी या फिर आप पेज पर किसी noindex निर्देश का इस्तेमाल कर सकते हैं.
  • अगर आप चाहते हैं कि आपका पेज पहले से ही मिल जाने के बाद उसे 'Google सर्च' से हटा दिया जाए, तो आपको यह तरीका अपनाना होगा.

मेरी साइट को अब तक फिर से इंडेक्स क्यों नहीं किया गया?

Google, कई तरह के मापदंडों से पेज को फिर से इंडेक्स करता है जिनमें यह भी शामिल है कि उसके मुताबिक पेज कितनी बार बदलता है. अगर आपकी साइट में अक्सर बदलाव नहीं होता है, तो इसकी रीफ़्रेश दर धीमी हो सकती है. हांलाकि, अगर आपके पेज में कोई बदलाव नहीं हुआ है, तो इसमें कोई दिक्कत नहीं है. अगर आपको लगता है कि आपकी साइट को रीफ़्रेश करने की ज़रूरत है, तो Google से इसे फिर से क्रॉल करने के लिए कहें.

क्या आप मेरे पेज/साइट को फिर से क्रॉल कर सकते हैं?

Google से इसे फिर से क्रॉल करने के लिए कहें.

मेरे कई सारे पेज शामिल क्यों नहीं किए गए हैं?

इंडेक्स कवरेज रिपोर्ट देखकर, आप जान सकते हैं कि पेजों को किन वजहों से शामिल नहीं किया गया है. शामिल नहीं किए जाने की ज़्यादातर वजहें इनमें से एक हैं:

  • आपके पास एक robots.txt नियम है जो हमें आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है. समस्या की पुष्टि करने के लिए यूआरएल की जांच करने वाला टूल इस्तेमाल करें.
  • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी आम संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress या color=green या sort=price). ये पेज, इंडेक्स कवरेज रिपोर्ट में "डुप्लीकेट" या "विकल्प" के रूप में लेबल किए जाएंगे.
  • यूआरएल, किसी दूसरे यूआरएल पर रीडायरेक्ट हो जाता है. रीडायरेक्ट यूआरएल इंडेक्स नहीं किए जाते हैं, रीडायरेक्ट टारगेट को इंडेक्स किया जाता है.

Google मेरे साइटमैप को ऐक्सेस नहीं कर पा रहा है

यह देख लें कि आपका साइटमैप robots.txt से ब्लॉक नहीं हो रहा है, वह मान्य है और यह कि आप अपनी robots.txt एंट्री या अपनी साइटमैप रिपोर्ट के सबमिशन में सही यूआरएल का इस्तेमाल कर रहे हैं. सभी के लिए उपलब्ध साइटमैप की जांच करने वाले टूल का इस्तेमाल करके अपने साइटमैप यूआरएल की जांच करें.

Google ऐसे पेज को क्यों क्रॉल कर रहा है जिसे हटा दिया गया है?

Google कुछ समय तक ऐसे सभी यूआरएल क्रॉल करना जारी रखता है जिनके बारे में जानकारी है, भले ही उनसे 4XX की गड़बड़ियां मिल रही हों. ऐसा कुछ समय की गड़बड़ी होने पर ही किया जाता है. किसी यूआरएल को क्रॉल न किया जाए. ऐसा तभी होता है, जब इससे कोई noindex निर्देश मिलता है.

आपको 404 वाली गड़बड़ियों की बढ़ती जा रही सूची दिखाने से बचने के लिए, इंडेक्स कवरेज रिपोर्ट सिर्फ़ वही यूआरएल दिखाती है जिनमें पिछले महीने 404 की गड़बड़ियां दिखाई दी थीं.

मुझे अपना पेज दिख रहा है, लेकिन Google को नहीं दिख रहा. ऐसा क्यों?

Google लाइव पेज को देख सकता है या नहीं, इसका पता लगाने के लिए यूआरएल की जांच करने वाला टूल इस्तेमाल करें. अगर Google ऐसा नहीं कर पा रहा है, तो उसे इसकी वजह बतानी होगी. अगर वह ऐसा कर पा रहा है, तो शायद समस्या यह है कि पिछली बार क्रॉल करने के बाद ऐक्सेस की गड़बड़ी ठीक कर दी गई है. यूआरएल की जांच करने वाला टूल इस्तेमाल करके और इंडेक्स करने का अनुरोध करके एक लाइव क्रॉल चलाएं.

यूआरएल की जांच करने वाला टूल कोई समस्या नहीं दिखा रहा है, लेकिन इंडेक्स कवरेज रिपोर्ट में एक गड़बड़ी दिख रही है. ऐसा क्यों?

हो सकता है कि यूआरएल को Google के आखिरी बार क्रॉल करने के बाद आपने गड़बड़ी ठीक कर दी हो. अपना यूआरएल क्रॉल किए जाने की तारीख देखें (यह इंडेक्स कवरेज रिपोर्ट में यूआरएल की ज़्यादा जानकारी देने वाले पेज में या फिर यूआरएल की जांच करने वाले टूल में इंडेक्स किए गए वर्शन व्यू में दिख जाएगी). तय करें कि आपने पेज क्रॉल किए जाने के बाद कोई सुधार किया है या नहीं.

मैं किसी खास यूआरएल की इंडेक्स स्थिति कैसे खाेजूं?

किसी खास यूआरएल की इंडेक्स स्थिति जानने के लिए, यूआरएल की जांच करने वाला टूल इस्तेमाल करें. आप इंडेक्स कवरेज रिपोर्ट में यूआरएल के हिसाब से न तो खोज सकते हैं और न ही फ़िल्टर कर सकते हैं.

स्थिति की वजहें

यहां हर समस्या की वजहें दी गई हैं:

गड़बड़ी


गड़बड़ियों वाले पेजों को इंडेक्स नहीं किया गया है.


सर्वर में गड़बड़ी (5xx): पेज देखने का अनुरोध करने पर, आपके सर्वर से 500-लेवल वाले कोड की गड़बड़ी का मैसेज मिला. सर्वर की गड़बड़ियां ठीक करना देखें.

रीडायरेक्ट से जुड़ी गड़बड़ी: यह गड़बड़ी इन गड़बड़ियों में से है: यह एक बहुत ही लंबी रीडायरेक्ट चेन थी; इसमें रीडायरेक्ट लूप था; आखिर में दूसरा वेबलिंक, यूआरएल की लंबाई की तय सीमा से ज़्यादा बड़ा हो गया; रीडायरेक्ट चेन में गलत या खाली यूआरएल मौजूद था. रीडायरेक्ट के बारे में ज़्यादा जानकारी के लिए, लाइटहाउस जैसे वेब डीबग करने का टूल का इस्तेमाल करें

सबमिट किए गए ऐसे यूआरएल जिन पर robots.txt से रोक लगाई गई है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है. हालांकि, पेज पर आपकी साइट की robots.txt फ़ाइल से रोक लगी है.

  1. टूल साइड पैनल बढ़ाने के लिए, उदाहरण टेबल में पेज पर क्लिक करें.
  2. यूआरएल के लिए robots.txt फ़ाइल की जांच करने वाले टूल को चलाने के लिए, robots.txt को रोके जाने की जांच करें पर क्लिक करें.
  3. नियमों को हटाने या बदलने के लिए, कृपया अपनी robots.txt फ़ाइल को अपडेट करें. robots.txt फ़ाइल की जांच करने वाले टूल पर लाइव robots.txt देखें पर क्लिक करें. ऐसा करके, आप फ़ाइल की जगह का पता लगा सकते हैं. अगर आप किसी वेब होस्टिंग सर्विस का इस्तेमाल कर रहे हैं और आपके पास फ़ाइल में बदलाव करने की अनुमति नहीं है, तो होस्टिंग सर्विस के दस्तावेज़ों को खोजें या समस्या के बारे में बताने के लिए सहायता केंद्र से संपर्क करें.

सबमिट किए गए यूआरएल की पहचान 'noindex' के तौर पर की गई: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया, लेकिन इसके मेटा टैग या एचटीटीपी हेडर में 'noindex' डायरेक्टिव दिया गया है. अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको मेटा टैग या एचटीटीपी हेडर हटाना होगा. गड़बड़ी की पुष्टि करने के लिए यूआरएल की जांच करने वाले टूल का इस्तेमाल करें:

  1. टेबल में यूआरएल के बगल में मौजूद, जांच करने वाले आइकॉन पर क्लिक करें.
  2. कवरेज > इंडेक्सिंग > इंडेक्सिंग की अनुमति है? रिपोर्ट में दिखाया गया है कि noindex इंडेक्सिंग को रोक रहा है.
  3. पुष्टि करें कि noindex टैग अब भी लाइव वर्शन में मौजूद है:
    1. लाइव यूआरएल की जांच करें पर क्लिक करें
    2. उपलब्धता > इंडेक्सिंग > इंडेक्सिंग की अनुमति है? देखें कि क्या noindex डायरेक्टिव अब भी मौजूद हैं अगर noindex अब मौजूद नहीं है, तो आप Google से पेज को फिर से इंडेक्स करने के लिए इंडेक्स करने का अनुरोध करें पर क्लिक कर सकते हैं. अगर noindex अब भी मौजूद है, तो आपको पेज को इंडेक्स करने के लिए, इसे हटा दें.

सबमिट किए गए यूआरएल से मिली गड़बड़ी 'सॉफ़्ट 404' जैसी लग रही है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन सर्वर से मिला मैसेज सॉफ़्ट 404 की गड़बड़ी वाला लग रहा है. इसे ठीक करने का तरीका जानें.

सबमिट किए गए यूआरएल से बिना अनुमति वाले अनुरोध का मैसेज मिला (401): आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन Google को रिस्पॉन्स के तौर पर 401 (अनुमति नहीं) वाली गड़बड़ी का मैसेज मिला है. ऐसे में, इस पेज के लिए अनुमति लेने की ज़रूरी शर्तें हटाएं या Googlebot की पहचान की पुष्टि करके उसे अपने पेज देखने की अनुमति दें. गुप्त मोड में मौजूद पेज पर जाकर इस गड़बड़ी की पुष्टि कर सकते हैं.

सबमिट किया गया यूआरएल नहीं मिला (404): आपने इंडेक्स करने के लिए ऐसा यूआरएल सबमिट किया है जो मौजूद नहीं है. 404 कोड वाली गड़बड़ियों को ठीक करना देखें.

सबमिट किए गए यूआरएल में क्रॉल करने से जुड़ी समस्या है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया और Google को क्रॉल करने में ऐसी गड़बड़ी मिली जिसके बारे में जानकारी नहीं है. यह गड़बड़ी ऊपर दी गई दूसरी सभी गड़बड़ियों से अलग है. यूआरएल की जांच करने वाला टूल का इस्तेमाल करके अपने पेज को डीबग करने की कोशिश करें.

चेतावनी वाले पेज


हो सकता है कि आपको चेतावनी वाले पेज़ों पर ध्यान देना पड़े. इसके साथ ही यह भी हो सकता है कि उन्हें खास नतीजे के हिसाब से इंडेक्स किया गया हो या न किया गया हो.


robots.txt के ज़रिए रोक लगाए जाने के बाद भी इंडेक्स किया गया: हालांकि, पेज पर robots.txt के ज़रिए रोक लगाई गई है, फिर भी इसे इंडेक्स किया गया. (Google हमेशा robots.txt के हिसाब से काम करता है, लेकिन अगर कोई व्यक्ति robot.txt में शामिल पेज का लिंक अपनी साइट पर देता है, तो पेज को इंडेक्स किया जा सकता है). इसे चेतावनी के तौर पर इसलिए दिखाया जाता है, क्योंकि हमें इस बारे में ठीक से नहीं पता है कि आप इस पेज को खोज के नतीजों में दिखाने से रोकना चाहते हैं या नहीं. अगर आप इस पेज पर रोक लगाना चाहते हैं, तो इंडेक्स किए जाने से रोकने के लिए robots.txt का इस्तेमाल करना सही तरीका नहीं है. इंडेक्स किए जाने से रोकने के लिए आपको 'noindex' का इस्तेमाल करना चाहिए या इसके लिए अनुमति लेना ज़रूरी बनाना चाहिए, ताकि पहचान ज़ाहिर किए बिना आपका पेज एक्सेस न किया जा सके. robots.txt टेस्टर का इस्तेमाल करके आप यह जान सकते हैं कि इस पेज पर किस नियम के मुताबिक रोक लगाई जा रही है. robots.txt की वजह से हो सकता है कि दिखाया गया कोई भी स्निपेट इस पेज के लिए एकदम सही न हो. अगर आप इस पेज पर रोक नहीं लगाना चाहते हैं, तो अपने पेज पर लगी रोक को हटाने के लिए robots.txt फ़ाइल में बदलाव करें.

मान्य पेज

जिन पेजों की स्थिति ठीक है वे इंडेक्स किए जा चुके हैं.

सबमिट और इंडेक्स किया गया: आपने यूआरएल को इंडेक्स करने के लिए, सबमिट किया और उसे इंडेक्स कर दिया गया.

इंडेक्स किया गया, साइटमैप में सबमिट नहीं किया गया: Google ने यूआरएल खोजकर उसे इंडेक्स किया. हम सभी ज़रूरी यूआरएल को साइटमैप का इस्तेमाल करके सबमिट करने का सुझाव देते हैं.

इंडेक्स में शामिल नहीं किए गए पेज


आम तौर पर ये पेज इंडेक्स नहीं किए जाते हैं और हमें लगता है कि यह सही है. ये पेज या तो इंडेक्स किए गए पेजों के डुप्लीकेट हैं या आपकी साइट पर कुछ तरीकों से इन्हें इंडेक्स करने पर रोक लगी है. अगर इनमें से कोई वजह नहीं है, तो ये किसी ऐसी वजह से इंडेक्स नहीं किए गए, जिसे हम गड़बड़ी नहीं मानते हैं.


‘noindex’ टैग इस्तेमाल करके पेज को इंडेक्स करने पर रोक लगाई गई: जब Google ने इस पेज को इंडेक्स करने की कोशिश की तब 'noindex' निर्देश/2} मिला, इसलिए इसे इंडेक्स नहीं किया गया. अगर आप इस पेज को इंडेक्स नहीं कराना चाहते हैं, तो यह अच्छी बात है कि इसे इंडेक्स नहीं किया गया! अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको 'noindex' डायरेक्टिव हटाना होगा.

पेज हटाने वाला टूल इस्तेमाल करके, पेज को इंडेक्स करने पर रोक लगाई गई: फ़िलहाल, यूआरएल हटाने के अनुरोध की वजह से पेज पर रोक लगी है. अगर साइट के मालिक के तौर पर आपकी पुष्टि की जा चुकी है, तो आप यूआरएल हटाने वाला टूल इस्तेमाल कर सकते हैं. इससे आप देख सकते हैं कि इसे हटाने का अनुरोध किसने किया है. यह अनुरोध, हटाए जाने की तारीख के 90 दिनों तक ही काम करते हैं. इस समय सीमा के बाद, भले ही आप दोबारा इंडेक्स करने का अनुरोध सबमिट न करें, फिर भी हो सकता है कि Googlebot उस पेज पर दोबारा जाए और उसे इंडेक्स करे. अगर आप नहींं चाहते कि पेज को इंडेक्स किया जाए, तो 'noindex' इस्तेमाल करें, पेज देखने के लिए अनुमति लेना ज़रूरी बनाएं या पेज हटा दें.

robots.txt इस्तेमाल करके पेज को इंडेक्स करने पर रोक लगाई गई: robots.txt फ़ाइल इस्तेमाल करके, इस पेज पर आने से Googlebot को रोका गया है. robots.txt टेस्टर इस्तेमाल करके आप जान सकते हैं कि क्या वाकई ऐसा किया गया है. ध्यान दें, इसका यह मतलब नहीं है कि किसी दूसरे तरीके से पेज इंडेक्स नहीं किया जा सकता. अगर इस पेज को लोड किए बगैर Google को इसके बारे में दूसरी जानकारी मिल जाती है तो, हो सकता है कि पेज इंडेक्स कर दिया जाए (हालांकि आम तौर पर ऐसा नहीं होता). यह पक्का करने के लिए कि Google इस पेज को इंडेक्स न करे, आप robots.txt के ज़रिए लगाई गई रोक हटाएं और 'noindex' डायरेक्टिव इस्तेमाल करें.

बिना मंज़ूरी वाले अनुरोध (401) की वजह से पेज को इंडेक्स करने पर रोक लगाई गई: पेज देखने के लिए मंज़ूरी लेने के अनुरोध (401 रिस्पॉन्स) की वजह से Googlebot को पेज देखने से रोका गया. अगर आप चाहते हैं कि Googlebot इस पेज को क्रॉल करे, तो पेज को देखने के लिए मंज़ूरी लेने की शर्त हटाएं या Googlebot को अपने पेज का एक्सेस दें.

क्रॉल करने में समस्या: इस यूआरएल को फ़ेच करने में एक ऐसी गड़बड़ी हुई, जिसकी पहचान नहीं की जा सकी. इसका मतलब है कि 4xx - या 5xx -लेवल वाला रिस्पॉन्स कोड भेजा जा सकता है. पेज को फ़ेच करने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें और देखें कि क्या इससे भी यूआरएल फ़ेच करने में कोई समस्या आ रही है. पेज इंडेक्स नहीं किया गया.

क्रॉल किया गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज को क्रॉल किया है, लेकिन इंडेक्स नहीं किया. हो सकता है कि आने वाले समय में इसे इंडेक्स किया जाए या ना किया जाए; क्रॉल करने के लिए इस यूआरएल को दोबारा सबमिट करने की ज़रूरत नहीं है.

खोजा गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज ढूंढ लिया है, लेकिन इसे अभी तक क्रॉल नहीं किया है. Google ने यूआरएल को क्रॉल करने की कोशिश की, लेकिन तब साइट ओवरलोड थी; इसलिए Google उसे बाद में क्रॉल करने की कोशिश करेगा. इस वजह से रिपोर्ट में पिछली बार क्रॉल करने की तारीख नहीं दी गई है.

सही कैननिकल टैग वाला वैकल्पिक पेज: यह पेज उस पेज का डुप्लीकेट है, जिसकी पहचान Google ने कैननिकल के तौर पर की है. यह पेज कैननिकल पेज पर सही तरीके से ले जाता है, यानी इसके लिए आपको कुछ करने की ज़रूरत नहीं है.

डुप्लीकेट यूआरएल, जो उपयोगकर्ता के कैननिकल यूआरएल चुने बिना मौजूद है: इस पेज के कई डुप्लीकेट पेज हैं, लेकिन किसी को भी कैननिकल के तौर पर नहीं चुना गया है. हमें लगता है कि यह पेज कैननिकल नहीं है. आपको साफ़ तौर पर इस पेज के लिए कैननिकल का टैग जोड़ना होगा. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए, जो Google ने चुना है.

डुप्लीकेट पेज, Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना: यह पेज कई पेजों के लिए कैननिकल के तौर पर चुना गया, लेकिन Google को लगता है कि कोई दूसरा यूआरएल इससे बेहतर कैननिकल हो सकता है. Google ने इस पेज की जगह उस पेज को इंडेक्स किया, जिसे हम कैननिकल मानते हैं. हमारा सुझाव है कि आप साफ़ तौर पर इस पेज को कैननिकल यूआरएल के डुप्लीकेट पेज के तौर पर तय करें. इस पेज को Google ने ढूंढा है और इसे क्रॉल करने के लिए साफ़ तौर पर कोई अनुरोध नहीं किया गया है. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए जिसे Google ने चुना है.

नहीं मिला (404): इस पेज को देखने का अनुरोध करने पर 404 कोड वाली गड़बड़ी मिली. यह यूआरएल Google ने अपने आप ढूंढा था और इसे क्रॉल करने के लिए साफ़ तौर पर कोई अनुरोध नहीं किया गया था, न ही इसे किसी साइटमैप के ज़रिए सबमिट किया गया था. शायद Google ने इस यूआरएल को किसी दूसरी साइट के लिंक के तौर पर ढूंढा है या हो सकता है कि यह पेज पहले मौजूद था और बाद में इसे हटा दिया गया था. Googlebot कुछ समय के लिए इस यूआरएल को क्रॉल करना जारी रख सकता है, क्योंकि ऐसा कोई तरीका नहीं है जिससे Googlebot को कोई यूआरएल हमेशा के लिए भूलने के लिए कहा जा सके. हालांकि, समय के साथ Googlebot इस यूआरएल को कम क्रॉल करेगा. अगर जानबूझकर 404 वाला कोड दिखाने के लिए सेट किया गया है, तो इसमें कोई समस्या नहीं है. अगर आपके पेज की जगह बदल गई है, तो नई जगह पर ले जाने के लिए 301 कोड वाले रीडायरेक्ट का इस्तेमाल करें. 404 कोड वाली गड़बड़ियां ठीक करना लेख पढ़ें

कानूनी शिकायत की वजह से पेज हटा दिया गया है: कानूनी शिकायत की वजह से पेज को इंडेक्स से हटा दिया गया है.

किसी दूसरे वेबलिंक पर रीडायरेक्ट करने वाला पेज: यह किसी दूसरे वेबलिंक पर रीडायरेक्ट करने वाला यूआरएल है, इसलिए इसे इंडेक्स नहीं किया गया.

सॉफ़्ट 404: पेज देखने की कोशिश करने पर हमें लगता है कि नतीजे के तौर पर सॉफ़्ट 404 रिस्पॉन्स मिलता है. इसका मतलब है कि इस पेज को देखने की कोशिश करने पर इससे जुड़ा 404 कोड वाला मैसेज नहीं दिखता. हालांकि, इसमें "नहीं मिला" का ऐसा मैसेज दिखता है, जो उपयोगकर्ता को आसानी से समझ आ सके. हमारा सुझाव है कि आप "नहीं मिला" गड़बड़ी वाले पेजों के लिए 404 रिस्पॉन्स कोड दिखाएं. ऐसा करने के बजाय आप पेज पर ज़्यादा जानकारी जोड़कर हमें बता सकते हैं कि इस पेज में 'सॉफ़्ट 404' वाली गड़बड़ी नहीं है. और जानें

डुप्लीकेट, सबमिट किए गए यूआरएल को कैननिकल के तौर पर नहीं चुना गया है: दिया गया यूआरएल, डुप्लीकेट यूआरएल के सेट में से एक है और साफ़ तौर पर इसकी पहचान कैननिकल पेज के रूप में नहीं की गई है. आपने साफ़ तौर पर इस यूआरएल को इंडेक्स करने का अनुरोध किया, लेकिन Google ने इसे इंडेक्स नहीं किया. ऐसा इसलिए हुआ क्योंकि यह एक डुप्लीकेट पेज है. साथ ही, Google को लगता है कि दूसरा यूआरएल, कैननिकल होने के लिए बेहतर है. इसलिए, Google ने अपने चुने गए कैननिकल को इंडेक्स किया. (Google डुप्लीकेट यूआरएल के सेट में से सिर्फ़ कैननिकल पेज को इंडेक्स करता है.) इस स्थिति और "Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना" में यह अंतर है कि इस मामले में आपने इंडेक्स करने का अनुरोध साफ़ तौर पर किया था. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए, जिसे Google ने चुना है.

क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?