इंडेक्स कवरेज रिपोर्ट

जानें कि आपके कौनसे पेज इंडेक्स किए गए हैं और आपकी साइट को इंडेक्स करते समय किस तरह की समस्याएं आईं.

क्या मुझे इस रिपोर्ट की ज़रूरत है?

अगर आपकी साइट में 500 से कम पेज हैं, तो शायद आपको यह रिपोर्ट इस्तेमाल करने की ज़रूरत नहीं है. इसके बजाय, Google पर site:your_site डालकर अपनी साइट खोजना ज़्यादा आसान है. इसमें "your_site" आपकी साइट के होम पेज का बिना "http://" या "https://" वाला यूआरएल है. उदाहरण के लिए, site:example.com या site:example.com/petstore. खोज नतीजों में, आपकी साइट के वे पेज दिखाए जाते हैं जिनके बारे में Google के पास जानकारी है. अपनी साइट पर चुनिंदा पेजों को ढूंढने के लिए, आप खोज के लिए शब्द जोड़ सकते हैं. उदाहरण के लिए: site:example.com/petstore iguanas zebras.

इंडेक्स कवरेज रिपोर्ट

 

Search Console में इंडेक्स कवरेज की स्थिति - Google Search Console की ट्रेनिंग

रिपोर्ट को समझना

अगर आपने Google Search के काम करने के तरीके के बारे में पढ़ा है, तो आपके लिए इस रिपोर्ट को समझना बहुत आसान होगा और आप इसका इस्तेमाल बेहतर तरीके से कर पाएंगे.

आप इंडेक्स कवरेज रिपोर्ट का इस्तेमाल करके यह देख सकते हैं कि आपकी प्रॉपर्टी के किन यूआरएल को Google इंडेक्स में शामिल किया गया है.

  • टॉप लेवल की खास जानकारी देने वाला पेज आपकी प्रॉपर्टी के सभी यूआरएल से जुड़े नतीजे दिखाता है. इन नतीजों को स्थिति (गड़बड़ी, चेतावनी या मान्य) के मुताबिक, ग्रुप में बांटा जाता है. साथ ही, उस स्थिति की खास वजह (जैसे कि सबमिट किया गया यूआरएल नहीं मिला (404)) भी दिखाई जाती है.
  • ज़्यादा जानकारी वाला पेज देखने के लिए, खास जानकारी वाले पेज में टेबल की किसी पंक्ति पर क्लिक करें. यहां आप समान स्थिति/वजह वाले सभी यूआरएल एक साथ देख सकते हैं.

खास जानकारी वाला पेज

टॉप लेवल रिपोर्ट उन सभी पेजों के इंडेक्स होने की स्थिति के बारे में बताती है जिन्हें आपकी साइट पर Google ने क्रॉल करने की कोशिश की है. इन पेजों को स्थिति और वजह के हिसाब से ग्रुप में रखा जाता है.

मुख्य क्रॉलर

खास जानकारी वाले पेज पर मौजूद मुख्य क्रॉलर की वैल्यू यह दिखाती है कि डिफ़ॉल्ट तौर पर, Google आपकी साइट को क्रॉल करने के लिए किस तरह के उपयोगकर्ता एजेंट का इस्तेमाल करता है. जैसे कि: स्मार्टफ़ोन या डेस्कटॉप. ये क्रॉलर उस उपयोगकर्ता की तरह काम करते हैं जो साइट पर जाने के लिए मोबाइल डिवाइस या डेस्कटॉप कंप्यूटर का इस्तेमाल करता है.

Google इस टाइप के मुख्य क्रॉलर का इस्तेमाल करके, आपकी साइट के सभी पेजाें को क्रॉल करता है. इसके अलावा, Google आपकी साइट के कुछ पेजों को किसी दूसरे क्रॉलर (जिसे कभी-कभी वैकल्पिक क्रॉलर भी कहा जाता है) से भी क्रॉल कर सकता है. यह क्रॉलर दूसरी तरह का उपयोगकर्ता एजेंट हाेता है. उदाहरण के लिए, अगर आपकी साइट के लिए मुख्य क्रॉलर 'स्मार्टफ़ोन' है, तो दूसरा क्रॉलर 'डेस्कटॉप' हाेगा. अगर मुख्य क्रॉलर 'डेस्कटॉप' है, तो आपका दूसरा क्रॉलर 'स्मार्टफ़ोन' हाेगा. दूसरे क्रॉलर का काम इस बारे में ज़्यादा जानकारी पाना हाेता है कि जब किसी और डिवाइस से उपयोगकर्ता आपकी साइट पर जाते हैं, ताे साइट कैसा व्यवहार करती है.

इस रिपोर्ट में क्या देखें

आम तौर पर, जैसे-जैसे आपकी साइट बेहतर होती जाती है, आपको इंडेक्स किए गए पेजों की संख्या धीरे-धीरे बढ़ती हुई दिखनी चाहिए. अगर आपको यह संख्या अचानक कम या ज़्यादा होती दिखती है, तो समस्या का हल करने वाला सेक्शन देखें. खास जानकारी वाले पेज में, यूआरएल की स्थिति दिखाने वाली टेबल में डेटा को "स्थिति + वजह" के हिसाब से ग्रुप और क्रम में दिखाया जाता है.

आपकी कोशिश होनी चाहिए कि हर अहम पेज के कैननिकल वर्शन को इंडेक्स किया जाए. इस रिपोर्ट में, हर डुप्लीकेट या विकल्प के तौर पर दिखने वाले पेज को "शामिल नहीं किया गया" के तौर पर लेबल किया जाना चाहिए. डुप्लीकेट या विकल्प के तौर पर दिखने वाले पेज का कॉन्टेंट काफ़ी हद तक कैननिकल पेज की तरह होता है. किसी पेज को डुप्लीकेट या विकल्प के तौर पर दिखने वाले पेज के तौर पर लेबल करना अच्छी बात है. इसका मतलब यह है कि हमें कैननिकल पेज मिल गया है और हमने उसे इंडेक्स कर दिया है. आप यूआरएल जांचने वाला टूल इस्तेमाल करके, किसी भी यूआरएल के कैननिकल वर्शन का पता लगा सकते हैं. देखें कि पेज न मिलने की दूसरी वजहें क्या हो सकती हैं.

इस रिपोर्ट में क्या नहीं मिलेगा

  • 100% कवरेज: जैसा कि ऊपर बताया गया है, साइट के सभी यूआरएल इंडेक्स नहीं किए जाएंगे, सिर्फ़ कैननिकल पेजों को इंडेक्स किया जाएगा.
  • फटाफट इंडेक्स करना: नए कॉन्टेंट को इंडेक्स करने में Google को कुछ दिन लग सकते हैं. आप इंडेक्स करने का अनुरोध करके, इसमें लगने वाला समय कम कर सकते हैं.

स्थिति

हर पेज की स्थिति इनमें से कोई एक हो सकती है:

  • गड़बड़ी: पेज को इंडेक्स नहीं किया गया है. गड़बड़ी के बारे में ज़्यादा जानने और उसे ठीक करने के लिए, गड़बड़ी जिस तरह की है उसके हिसाब से जानकारी देखें. सबसे पहले आपको इन समस्याओं पर ध्यान देना चाहिए.
  • चेतावनी: पेज को इंडेक्स किया गया है, लेकिन इसमें एक समस्या है, जिसके बारे में आपको पता होना चाहिए.
  • शामिल नहीं किया गया: पेज को इंडेक्स नहीं किया गया है, लेकिन हमें लगता है कि आप ऐसा ही चाहते थे. (उदाहरण के लिए, हो सकता है कि आपने noindex निर्देश का इस्तेमाल करके, पेज को जान-बूझकर शामिल न किया हो या वह पेज, आपकी साइट पर पहले से इंडेक्स किए गए कैननिकल पेज का डुप्लीकेट हो.)
  • मान्य: पेज को इंडेक्स किया गया है.

वजह

हर स्थिति (गड़बड़ी, चेतावनी, मान्य, शामिल नहीं किए गए) के होने की एक खास वजह होती है. हर तरह की स्थिति की जानकारी देखने और उसे मैनेज करने का तरीका जानने के लिए, यहां दी गई, स्थिति जिस तरह की है उसके हिसाब से जानकारी देखें.

पुष्टि

इस समस्या की पुष्टि की स्थिति. आपको उन समस्याओं को ठीक करने पर पहले ध्यान देना चाहिए जिनकी पुष्टि की स्थिति "सही नहीं पाई गई" या "शुरू नहीं हुई" है.

पुष्टि की जानकारी

अपनी साइट पर एक खास तरह की समस्या के सभी इंस्टेंस ठीक कर लेने के बाद, आप Google से अनुरोध करके अपने किए हुए बदलावों की पुष्टि करा सकते हैं. अगर किसी समस्या के सभी इंस्टेंस ठीक कर लिए जाते हैं, तो समस्या की स्थिति दिखाने वाले टेबल में इसे 'ठीक कर लिया गया' के तौर पर दिखाया जाता है और यह टेबल के सबसे निचले हिस्से में चली जाती है. Search Console, समस्या की पुष्टि की स्थिति के साथ-साथ समस्या के हर इंस्टेंस की पुष्टि की स्थिति पर भी नज़र रखता है. जब समस्या के सभी इंस्टेंस ठीक हो जाते हैं, तो उसे 'ठीक कर लिया गया' माना जाता है. (पुष्टि किए जाने की सही स्थिति जानने के लिए, समस्या की पुष्टि की स्थिति और इंस्टेंस की पुष्टि की स्थिति देखें.)

समस्या के 'जीवनकाल' से जुड़ी ज़्यादा जानकारी...

किसी वेबसाइट पर मौजूद समस्या के 'जीवनकाल' में, उसकी पहचान किए जाने के समय से लेकर उसके आखिरी इंस्टेंस के पूरी तरह ठीक किए जाने के 90 दिन बाद तक का समय शामिल होता है. अगर 90 दिनों के बाद समस्या फिर से दिखाई नहीं देती है, तो इसे रिपोर्ट इतिहास से हटा दिया जाता है.

जिस तारीख पर समस्या की पहली बार पहचान की गई हो, उसे समस्या के 'जीवनकाल' का वह समय माना जाता है जब पहली बार उसका पता लगाया गया. समस्या पता चलने की तारीख में कोई बदलाव नहीं होता. इसलिए:

  • अगर किसी समस्या के सभी इंस्टेंस ठीक कर लेने के 15 दिनों बाद, इसका नया इंस्टेंस फिर से दिखाई देता है तो समस्या "ठीक नहीं की गई है" के रूप में दिखाई देती है. इसके पता चलने की मूल तारीख भी "पहली बार पता चलने की तारीख" ही होती है.
  • समस्या के आखिरी इंस्टेंस को ठीक कर लिए जाने के 91 दिन बाद, अगर समस्या फिर से दिखाई देती है तो पिछली समस्या को 'ठीक कर ली गई है' माना जाता है. यही वजह है कि इसे नई समस्या के रूप में दर्ज किया जाता है और इसके पता चलने की तारीख "आज" की होती है.

पुष्टि की प्रोसेस सामान्य रूप से कैसे काम करती है

यहां वह खास जानकारी दी गई है, जिससे यह पता चलता है कि जब आप किसी समस्या के लिए समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो क्या होता है. इस प्रोसेस में कई दिन का समय लग सकता है. आपको ईमेल के ज़रिए इससे जुड़ी सूचनाएं मिलती रहेंगी.

  1. जब आप समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो Search Console तुरंत कुछ पेजों की जांच करता है.
    • जांचे जा रहे किसी भी पेज में मौजूदा समस्या मिलने पर, पुष्टि की प्रोसेस खत्म हो जाती है और पुष्टि किए जाने की स्थिति में कोई बदलाव नहीं होता.
    • अगर इन पेजों (जो नमूनों के तौर पर जांचे जा रहे हैं) में मौजूदा गड़बड़ी नहीं मिलती है, तो पुष्टि की प्रोसेस शुरू हो गई की स्थिति के साथ जारी रहती है. अगर पुष्टि करने पर दूसरी तरह की समस्याएं मिलती हैं, तो इन्हें इसी तरह की दूसरी समस्याओं में गिना जाता है और पुष्टि की प्रोसेस जारी रहती है.
  2. Search Console, सूची के हिसाब से उन यूआरएल पर काम करता है जिन पर इस समस्या का असर हुआ है. दोबारा क्रॉल करने के लिए तैयार की गई इस सूची में पूरी साइट के बजाय, सिर्फ़ वही यूआरएल शामिल किए जाते हैं जिन पर इस समस्या के इंस्टेंस मौजूद हैं. Search Console जिन यूआरएल को जांचता है उन सभी का रिकॉर्ड पुष्टि के इतिहास में रखता है. इसे 'समस्या की जानकारी पेज' पर देखा जा सकता है.
  3. यूआरएल जांचे जाने पर:
    1. अगर समस्या न मिले, तो इंस्टेंस की पुष्टि की स्थिति बदलकर पास हो रही है हो जाती है. पुष्टि शुरू होने के बाद, अगर यह पहला इंस्टेंस है जिसकी जांच की जा रही है, तो समस्या की पुष्टि की स्थिति बदलकर सब ठीक लग रहा है हो जाती है.
    2. अगर अब यूआरएल देखा नहीं जा सकता, तो इंस्टेंस की पुष्टि की स्थिति बदलकर अन्य (दूसरा) हो जाती है (जो किसी गड़बड़ी की स्थिति नहीं होती है).
    3. इंस्टेंस अगर अब भी मौजूद है, तो समस्या की स्थिति बदलकर फ़ेल हो जाती है. अगर सामान्य तरीके से क्रॉल करने पर यह नया पेज मिला है, तो इसे मौजूदा समस्या का एक और इंस्टेंस माना जाता है.
  4. सभी गड़बड़ियां और चेतावनी वाले यूआरएल जांचे जाने के बाद समस्या की गिनती शून्य रह जाती है, तो समस्या की स्थिति बदलकर पास हो जाती है. ज़रूरी जानकारी: भले ही, समस्या के असर वाले पेज की संख्या घटकर शून्य और समस्या की स्थिति बदलकर पास हो जाए, तब भी पेज पर मूल गंभीरता का लेबल (गड़बड़ी या चेतावनी) दिखाया जाएगा.

भले ही आपने कभी भी "पुष्टि शुरू करें" पर क्लिक न किया हो, पर Google किसी समस्या के ठीक कर लिए गए इंस्टेंस पहचान सकता है. नियमित रूप से किए जाने वाले क्रॉल के दौरान अगर Google को पता चलता है कि किसी समस्या के सभी इंस्टेंस ठीक कर लिए गए हैं, तो यह रिपोर्ट पर समस्या की स्थिति बदलकर "लागू नहीं" कर देगा.

किसी यूआरएल या साइट के किसी हिस्से में आई समस्या को "ठीक कर लिया गया" कब माना जाता है?

नीचे दी गईं शर्तों में से किसी एक के पूरे होने पर, यूआरएल या साइट के किसी हिस्से की समस्या को 'ठीक कर लिया गया' माना जाता है :

  • जब यूआरएल क्रॉल किया जाता है और पेज पर समस्या नहीं मिलती. एएमपी टैग की गड़बड़ी के लिए इसका मतलब है कि आपने टैग को ठीक कर लिया है या इसे हटा दिया है (अगर टैग की ज़रूरत नहीं है). पुष्टि करते समय, इसे "पास" माना जाएगा.
  • अगर किसी वजह (पेज हटा दिया गया है, पेज पर noindex नियम लागू है, पेज देखने के लिए मंज़ूरी लेना ज़रूरी है वगैरह) से Google को पेज नहीं मिलता, तो उस यूआरएल के लिए, समस्या को 'ठीक कर लिया गया' माना जाएगा. पुष्टि के दौरान, इसे पुष्टि की "अन्य" स्थिति के रूप में गिना जाता है.

दोबारा पुष्टि करने का तरीका

जब आप किसी फ़ेल हो गई पुष्टि के लिए दोबारा पुष्टि करें पर क्लिक करते हैं, तो सभी फ़ेल इंस्टेंस के लिए पुष्टि दोबारा शुरू हो जाती है. साथ ही, सामान्य रूप से क्रॉल किए जाने पर मिले इस समस्या के नए इंस्टेंस की भी पुष्टि होती है.

दोबारा पुष्टि किए जाने का अनुरोध करने से पहले आपको मौजूदा समय में चल रही पुष्टि की प्रोसेस पूरी होने तक इंतज़ार करना चाहिए, भले ही आपने अनुरोध किए जाने के बाद कुछ समस्याएं ठीक की हों.

जो इंस्टेंस पुष्टि में 'पास' हो चुके हैं (पास के निशान वाले) या अब जिन्हें देखा नहीं जा सकता (अन्य के निशान वाले) उन्हें दोबारा नहीं जांचा जाता. साथ ही जब आप 'दोबारा पुष्टि करें' पर क्लिक करते हैं, तो इन्हें इतिहास से हटा दिया जाता है.

पुष्टि किए जाने का इतिहास

आप यह देख सकते हैं कि जिस पुष्टि का अनुरोध आपने किया है, उसकी प्रक्रिया कितनी पूरी हुई है. इसके लिए समस्या की जानकारी वाले पेज पर पुष्टि की जानकारी के लिंक पर क्लिक करें.

एएमपी रिपोर्ट और इंडेक्स की स्थिति की रिपोर्ट देखने के लिए, पुष्टि के इतिहास वाले पेज की सामग्री को यूआरएल के हिसाब से समूह में रखा जाता है. मोबाइल पर इस्तेमाल में आसानी की रिपोर्ट और रिच नतीजों की रिपोर्ट में, सामग्रियों को यूआरएल और व्यवस्थित डेटा की सामग्री के हिसाब से समूह में रखा जाता है. इसके लिए सामग्रियों की पहचान उनके नाम के मान से की जाती है. पुष्टि की स्थिति उस खास समस्या पर लागू होती है जिसकी आप जाॅंच कर रहे हैं. किसी पेज पर एक समस्या का लेबल "पास" हो सकता है, लेकिन दूसरी समस्याओं का लेबल "फ़ेल", "पुष्टि होनी बाकी है" या "कुछ और" हो सकता है.

समस्या की पुष्टि की स्थिति

किसी भी समस्या पर नीचे दी गई समस्या की स्थितियां लागू होती हैं:

  • शुरू नहीं हुई है: इस समस्या के इंस्टेंस वाले एक या उससे ज़्यादा पेज हैं. आपने इनकी कभी भी पुष्टि करने की कोशिश नहीं की है. अगले चरण:
    1. गड़बड़ी के बारे में ज़्यादा जानकारी के लिए समस्या पर क्लिक करें. एएमपी जांच का इस्तेमाल करके, लाइव पेज पर गड़बड़ियों के उदाहरण देखने के लिए एक-एक पेज को ध्यान से देखें. (शायद एएमपी जांच से पेज पर गड़बड़ी दिखाई न दे. ऐसा इसलिए होता है, क्योंकि Google को यह गड़बड़ी मिलने और समस्या की रिपोर्ट तैयार करने के बाद, आपने लाइव पेज पर गड़बड़ी ठीक कर ली है.)
    2. जिस नियम का उल्लंघन किया गया है, उसके बारे में जानने के लिए जानकारी पेज पर "ज़्यादा जानें" पर क्लिक करें.
    3. किसी खास समस्या के बारे में जानकारी पाने के लिए, टेबल में एक उदाहरण यूआरएल पंक्ति पर क्लिक करें.
    4. अपने पेजों को ठीक करें और फिर ठीक किए जाने की पुष्टि करें पर क्लिक करें ताकि Google आपके पेज फिर से क्रॉल करे. Google आपको इस बात की सूचना देगा कि पुष्टि की प्रोसेस कहां तक पहुंची है. पुष्टि होने में एक-दो दिन से लेकर दो हफ़्ते तक का समय लग सकता है. इसलिए, अगर थोड़ा इंतज़ार करना पड़े, तो परेशान न हों. 
  • शुरू की गई:  आप पुष्टि करने की कोशिश कर रहे हैं और अभी तक समस्या का कोई इंस्टेंस नहीं मिला है. अगला चरण: जैस-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी, Google आपको सूचनाएं भेजेगा. साथ ही, ज़रूरी होने पर आपको बताएगा कि आपको क्या करना होगा.
  • सब ठीक लग रहा है: आप पुष्टि करने की कोशिश कर रहे हैं और अब तक समस्या के जितने भी इंस्टेंस मिले हैं उन्हें ठीक कर लिया गया है. अगला चरण: कुछ भी नहीं, लेकिन जैसे-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी, Google आपको सूचनाएं भेजेगा और बताएगा कि आपको क्या करना है.
  • पास: समस्या के सभी पहचाने गए इंस्टेंस अब मौजूद नहीं हैं (या अब वह यूआरएल उपलब्ध नहीं है जिस पर असर हुआ था). इस स्थिति में आने के लिए आपने ज़रूर "ठीक किए जाने की पुष्टि करें" पर क्लिक किया होगा (अगर इंस्टेंस आपके अनुरोध के बिना ही दिखाई नहीं दे रहे हैं, तो पुष्टि की स्थिति बदलकर 'लागू नहीं' हो जाएगी). अगला चरण: अब और कुछ नहीं करना.
  • लागू नहीं: Google को पता चला कि सभी यूआरएल पर समस्या को ठीक कर लिया गया है. हालांकि, आपने कभी भी पुष्टि करने की कोशिश नहीं की थी. अगला चरण: अब और कुछ नहीं करना.
  • फ़ेल: जब आपने "पुष्टि करें" पर क्लिक किया था उसके बाद भी एक तय सीमा तक के पेजों पर अब भी यह समस्या मौजूद है. अगले चरण: समस्या ठीक करें और दोबारा पुष्टि का अनुरोध करें.

इंस्टेंस की पुष्टि की स्थिति

पुष्टि का अनुरोध करने के बाद, किसी भी समस्या के लिए हर इंस्टेंस को खास स्थिति के तौर पर दिखाया जाता है. यह स्थिति पुष्टि की नीचे दी गई स्थितियों में से एक होती है:

  • अभी पुष्टि बाकी है: पुष्टि किए जाने के लिए सूची में जोड़ लिया गया है. पिछली बार जब Google ने क्रॉल किया था तब इंस्टेंस मौजूद था.
  • पास: [सभी रिपोर्ट में उपलब्ध नहीं] Google ने समस्या वाले इंस्टेंस की जांच करने पर पाया कि यह अब मौजूद नहीं है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • फ़ेल: Google ने जांचा और पाया कि समस्या का इंस्टेंस अभी भी मौजूद है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • अन्य: [सभी रिपोर्ट में उपलब्ध नहीं] Google उस यूआरएल पर नहीं पहुंच पाया जो इंस्टेंस को होस्ट कर रहा था या (स्ट्रक्चर्ड डेटा के मामले में) अब उस पेज पर वह आइटम नहीं ढूंढ पा रहा है. यह स्थिति पास जैसी ही है.

इस बात पर ध्यान दें कि अलग-अलग समस्याओं के लिए एक ही यूआरएल की अलग-अलग स्थितियां हो सकती हैं. उदाहरण के लिए, अगर किसी एक ही पेज पर X और Y दोनों तरह की समस्याएं हैं, तो हो सकता है कि X समस्या की पुष्टि की स्थिति पास हो और उसी पेज पर Y समस्या की पुष्टि की स्थिति पुष्टि नहीं हुई है के रूप में दिखाई दे.

यूआरएल को खोजने के लिए ड्रॉपडाउन फ़िल्टर

चार्ट के ऊपर दिए गए ड्रॉपडाउन फ़िल्टर का इस्तेमाल करके, आप इंडेक्स के नतीजों को उस तरीके से फ़िल्टर कर सकते हैं जिस तरह से Google ने यूआरएल को खोजा है. इसके लिए, ये वैल्यू उपलब्ध हैं:

  • वे सभी पेज जिनके बारे में पहले से जानकारी है [डिफ़ॉल्ट रूप से] - वे सभी यूआरएल दिखाएं जिन्हें Google ने किसी भी तरीके से खोजा है.
  • सबमिट किए गए सभी पेज - सिर्फ़ वे पेज दिखाएं जो इस रिपोर्ट के लिए साइटमैप में या साइटमैप पिंग इस्तेमाल करके, सबमिट किए गए हैं.
  • खास साइटमैप यूआरएल - सिर्फ़ वे यूआरएल दिखाएं जो इस रिपोर्ट की मदद से सबमिट किए गए किसी खास साइटमैप में मौजूद हैं. इसमें नेस्ट किए गए साइटमैप में मौजूद सभी यूआरएल शामिल हैं.

किसी भी यूआरएल को साइटमैप के ज़रिए सबमिट किया गया ही माना जाता है, भले ही उसे किसी दूसरे तरीके से खोजा गया हो (जैसे कि किसी दूसरे पेज को ऑर्गैनिक तरीके से क्रॉल करके).

ज़्यादा जानकारी वाला पेज

स्थिति + वजह वाली किसी जोड़ी का ज़्यादा जानकारी वाला पेज खोलने के लिए, खास जानकारी वाले पेज में मौजूद उसकी पंक्ति पर क्लिक करें. आप पेज के सबसे ऊपर मौजूद ज़्यादा जानें वाले सेक्शन पर क्लिक करके, चुनी गई समस्या से जुड़ी जानकारी देख सकते हैं.

इस पेज पर दिया गया ग्राफ़ दिखाता है कि समय के साथ, कितने पेजों पर इसका असर पड़ा है.

टेबल में उदाहरण के तौर पर ऐसे पेजों की सूची दी गई होती है जिन पर इस स्थिति + वजह कॉम्बिनेशन का असर पड़ा है. आप पंक्ति के इन एलिमेंट पर क्लिक कर सकते हैं:

  • किसी पंक्ति में मौजूद यूआरएल की जानकारी देखने के लिए, उस पंक्ति पर क्लिक करें.
  • URL को नए टैब में खोलता है.
  • उस यूआरएल के लिए, यूआरएल जांचने वाला टूल दिखाता है.
  • यूआरएल को कॉपी करता है

ज़्यादा जानकारी वाले पेज में स्रोत की वैल्यू से पता चलता है कि दिए गए यूआरएल को क्रॉल करने के लिए, किस तरह के उपयोगकर्ता एजेंट (स्मार्टफ़ोन या डेस्कटॉप) का इस्तेमाल किया गया था.

जब आप किसी खास तरह की सारी चेतावनियों या गड़बड़ियों को ठीक कर लेते हैं, तब समस्या हल होने की पुष्टि करें पर क्लिक करके Google को इसकी सूचना दें.

क्या आपको समस्या वाला ऐसा यूआरएल मिला जिसे आप पहले ही ठीक कर चुके हैं? शायद आपने पिछली बार Google क्रॉल हो जाने के बाद समस्या ठीक की है. इसलिए, अगर आप कोई यूआरएल किसी ऐसी समस्या के साथ देखते हैं जिसे आप ठीक कर चुके हैं, तो उस यूआरएल को क्रॉल किए जाने की तारीख ज़रूर देखें. पुष्टि करें कि समस्या ठीक हो गई है. इसके बाद, दोबारा इंडेक्स करने का अनुराेध करें

रिपोर्ट शेयर करने का तरीका

आप पेज पर मौजूद शेयर करें बटन पर क्लिक करके, कवरेज या बेहतर बनाने की रिपोर्ट में समस्या से जुड़ी जानकारी शेयर कर सकते हैं. जिस व्यक्ति के पास यह लिंक है, वह इससे सिर्फ़ मौजूदा समस्या से जुड़ी ज़्यादा जानकारी वाले पेज और पुष्टि के इतिहास वाले किसी भी पेज को ऐक्सेस कर सकता है. यह लिंक आपके संसाधन के दूसरे पेजों का ऐक्सेस नहीं देता है. इस लिंक के ज़रिए, किसी दूसरे उपयोगकर्ता को आपकी प्रॉपर्टी या खाते पर किसी भी तरह की कार्रवाई करने की अनुमति नहीं दी जा सकती. इस पेज को शेयर किए जाने की सुविधा बंद करके आप इस लिंक के ज़रिए मिलने वाली मंज़ूरी पर रोक लगा सकते हैं.

रिपोर्ट का डेटा एक्सपोर्ट करने का तरीका

कई रिपोर्ट में डेटा को एक्सपोर्ट करने के लिए, एक्सपोर्ट करें बटन होता है. चार्ट और टेबल, दोनों का डेटा एक्सपोर्ट किया जाता है. रिपोर्ट में ~ या - (उपलब्ध नहीं है/संख्या नहीं है) के तौर पर दिखाया गया कोई भी मान, डाउनलोड किए गए डेटा में शून्य होगा.

समस्या हल करना

आप पुष्टि कर सकते हैं कि इस रिपोर्ट में दिए गए यूआरएल को इंडेक्स किया गया है या नहीं. इसके लिए, ये चीज़ें करें:

  1. यह तय करें कि किसी यूआरएल को इंडेक्स करने या न करने की क्या वजह है. इसकी वजह, स्थिति के टाइप, इंडेक्स करने के मकसद, और चुनिंदा गड़बड़ी में से कोई एक हो सकती है.
  2. समस्या से जुड़ी खास जानकारी पढ़ें.
  3. यूआरएल जांचने वाले टूल की मदद से, यूआरएल की जांच करें:
    1. उदाहरणों वाली टेबल में, यूआरएल के बगल में दिए गए 'जांच करें' आइकॉन पर क्लिक करें और यूआरएल जांचने वाला टूल खोलें.
    2. यूआरएल की जांच के नतीजों वाली रिपोर्ट में, कवरेज > क्रॉल करना और कवरेज > इंडेक्स करना सेक्शन में जाकर, क्रॉल और इंडेक्स करने से जुड़ी जानकारी देखें.
    3. पेज के लाइव वर्शन की जांच करने के लिए, लाइव यूआरएल की जांच करें पर क्लिक करें.

सामान्य समस्याएं

यहां, इंडेक्स करने के दौरान आने वाली सबसे आम समस्याओं के बारे में बताया गया है. ये आपको इस रिपोर्ट में दिख सकती हैं:

इंडेक्स किए गए कुल पेजों में बिना संबंधित गड़बड़ी के गिरावट आना

अगर आपको इंडेक्स किए गए कुल पेजों की संख्या में गिरावट दिखती है, लेकिन गड़बड़ियों की संख्या में उस हिसाब से बढ़त नहीं दिखती, तो हो सकता है कि आपने robots.txt के 'noindex' टैग का इस्तेमाल करके, अपने मौजूदा पेजों का ऐक्सेस ब्लॉक कर दिया हो या पेज ऐक्सेस करने के लिए लॉगिन करना ज़रूरी बना दिया हो. इसके लिए, देखें कि क्या शामिल नहीं किए गए यूआरएल की संख्या में आई बढ़त, मान्य पेजों की संख्या में हुई गिरावट के बराबर है. ध्यान दें कि अगर ये यूआरएल किसी साइटमैप में सबमिट किए गए थे, तो उन्हें गड़बड़ी के तौर पर दिखाया जाएगा, न कि शामिल नहीं किए गए यूआरएल के तौर पर.

'मान्य' पेजों की तुलना में ज़्यादा 'शामिल नहीं किए गए' पेज होना

अगर आपको 'मान्य' से ज़्यादा 'शामिल नहीं किए गए' पेज दिखते हैं, तो उन्हें शामिल न किए जाने की वजहों पर नज़र डालें. शामिल नहीं किए जाने की आम वजहें ये हैं:

  • आपने एक ऐसा robots.txt नियम लागू किया है जो Google को आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है. अगर आप गलत पेजों को ब्लॉक कर रहे हैं, तो उन पर लगी रोक हटाएं.
  • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी सामान्य संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress या color=green या sort=price). अगर किसी कॉन्टेंट को, अलग-अलग तरीकों से क्रम से लगाने या फ़िल्टर करने या देखे जाने के बाद भी कोई पेज वही कॉन्टेंट दिखाता है, तो ऐसे पेजों को शायद शामिल नहीं किया जाना चाहिए. अगर आप एक अनुभवी उपयोगकर्ता हैं और आपको लगता है कि Google आपकी साइट पर मौजूद पैरामीटर को गलत समझ रहा है, तो आप अपनी साइट के पैरामीटर को पसंद के हिसाब से तय करने के लिए यूआरएल के पैरामीटर के बारे में जानकारी देने वाले टूल का इस्तेमाल कर सकते हैं.
गड़बड़ियां बढ़ना

अगर इंडेक्स करने में आने वाली गड़बड़ियों की संख्या बढ़ती है, तो ऐसा आपके टेंप्लेट में हुए बदलाव की वजह से हो सकता है, क्योंकि टेंप्लेट में बदलाव करने से उसमें नई गड़बड़ी आ सकती है. इसके अलावा, ऐसा तब भी हो सकता है, जब आपने ऐसा साइटमैप सबमिट किया हो जिसमें शामिल यूआरएल को क्रॉल किए जाने पर रोक लगाई गई हो. उदाहरण के लिए, यह रोक robots.txt या noindex के इस्तेमाल या लॉगिन को ज़रूरी बनाने की वजह से लगी रह सकती है.

अगर आपको किसी गड़बड़ी में बढ़ोतरी दिखाई देती है, तो:

  1. देखें कि क्या इंडेक्स करने में हुई गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या और खास जानकारी वाले पेज पर, किसी गड़बड़ी वाली पंक्ति के बगल में मौजूद स्पार्कलाइन (गड़बड़ी का रुझान दिखाने वाला ग्राफ़) के बीच कोई संबंध है. अगर ऐसा है, तो इससे गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या पर असर डालने वाली समस्या के बारे में कुछ संकेत मिल सकता है.
  2. उस गड़बड़ी वाली पंक्ति पर क्लिक करके ज़्यादा जानकारी वाले पेज पर जाएं जो गड़बड़ियों की संख्या में हुई बढ़ोतरी की वजह हो सकती है. अगर आपको किसी गड़बड़ी को ठीक करने का सबसे सही तरीका जानना है, तो उसके बारे में दी गई जानकारी पढ़ें.
  3. किसी समस्या पर क्लिक करके, उदाहरण वाले किसी पेज की जांच करें और देखें कि क्या गड़बड़ी है.
  4. गड़बड़ी के सभी इंस्टेंस ठीक करें. साथ ही, उस गड़बड़ी की वजह से हुई सभी समस्याओं के हल की पुष्टि करने के लिए, ज़्यादा जानकारी वाले पेज में दिए गए समस्या के हल की पुष्टि करें पर क्लिक करें. पुष्टि करने के बारे में ज़्यादा जानें.
  5. जैसे-जैसे आपके पेजों की पुष्टि होगी, आपको इसकी सूचनाएं मिलती रहेंगी. हालांकि, आप कुछ दिन बाद वापस आकर देख सकते हैं कि गड़बड़ियों की संख्या कम हुई है या नहीं.
सर्वर की गड़बड़ियां
सर्वर की गड़बड़ी का मतलब है कि Googlebot आपके यूआरएल को ऐक्सेस नहीं कर सका, तय समय में अनुरोध प्रोसेस नहीं हुआ या आपकी साइट पर ज़्यादा ट्रैफ़िक था. इस वजह से, Googlebot को अनुरोध रद्द करना पड़ा.
क्रॉल करने के आंकड़ों से जुड़ी रिपोर्ट में, अपनी साइट के लिए होस्ट की स्थिति के नतीजे देखें. यहां आप देख पाएंगे कि क्या Google, साइट की उपलब्धता से जुड़ी ऐसी समस्याएं दिखा रहा है जिनके बारे में आप जानते हैं और जिन्हें ठीक कर सकते हैं.

सर्वर की कनेक्टिविटी की जांच करना

यूआरएल जांचने वाले टूल का इस्तेमाल करके, आप यह देख सकते हैं कि इंडेक्स कवरेज रिपोर्ट में बताई गई सर्वर की गड़बड़ी फिर से हुई या नहीं.

सर्वर की कनेक्टिविटी में आ रही गडबड़ियां दूर करना

  • डाइनैमिक पेज अनुरोधों के लिए बार-बार होने वाली पेज लोडिंग कम करें.
    ऐसी साइट जो एक से ज़्यादा यूआरएल के लिए एक ही कॉन्टेंट डिलीवर करती है उसे डाइनैमिक तरीके से कॉन्टेंट डिलीवर करने वाला माना जाता है (उदाहरण के लिए, www.example.com/shoes.php?color=red&size=7, www.example.com/shoes.php?size=7&color=red के जैसा कॉन्टेंट ही दिखाता है). डाइनैमिक पेजों से जवाब मिलने में लंबा समय लग सकता है, जिसकी वजह से समय खत्म होने (टाइम आउट) की समस्याएं हो सकती हैं. या डाइनैमिक सर्वर पर ज़रूरत से ज़्यादा ट्रैफ़िक होने की स्थिति का मैसेज दिख सकता है. इस वजह से, Googlebot से साइट को पहले के मुकाबले धीरे क्रॉल करने के लिए कहा जा सकता है. आम तौर पर, हम पैरामीटर सूचियों को छोटा रखने और उनका सीमित इस्तेमाल करने का सुझाव देते हैं. अगर आपको अपनी साइट के पैरामीटर के काम करने के तरीके के बारे में पूरी तरह पता है, तो आप Google को बता सकते हैं कि हमें इन पैरामीटर का इस्तेमाल कैसे करना चाहिए.
  • यह पक्का करें कि आपकी साइट का होस्टिंग सर्वर डाउन या ओवरलोड नहीं है या फिर, गलत कॉन्फ़िगर नहीं किया गया है.
    अगर कनेक्शन, समय खत्म होने या प्रतिक्रिया की समस्याएं बनी रहती हैं, तो अपने वेब होस्टर से संपर्क करें और ट्रैफ़िक मैनेज करने के लिए अपनी साइट की क्षमता बढ़ाने पर विचार करें.
  • जांचे कि आप अनजाने में Google को ब्लॉक तो नहीं कर रहे हैं.
    शायद आप सिस्टम की किसी समस्या की वजह से Google को ब्लॉक कर रहे हों. इनमें डीएनएस को कॉन्फ़िगर करने की समस्या, गलत तरीके से कॉन्फ़िगर किया गया फ़ायरवॉल, DoS सुरक्षा सिस्टम या कॉन्टेंट मैनेजमेंट सिस्टम को कॉन्फ़िगर करने की समस्याएं शामिल हो सकती हैं. बेहतर तरीके से होस्ट करने के लिए सुरक्षा के सिस्टम बहुत ज़रूरी हैं. इन्हें सर्वर पर इस तरह से कॉन्फ़िगर किया जाता है कि सामान्य से ज़्यादा संख्या में आने वाले अनुरोधों पर अपने-आप रोक लगा दें. हालांकि, उपयोगकर्ता के मुकाबले Googlebot ज़्यादा अनुरोध करता है, इसलिए यह Googlebot को ब्लॉक करके और इसे आपकी वेबसाइट क्रॉल करने से रोककर इन सुरक्षा सिस्टम को ट्रिगर कर सकता है. ऐसी समस्याएं हल करने के लिए, वेबसाइट के उस हिस्से की पहचान करें जो Googlebot को ब्लॉक कर रहा हो और उसे अनब्लॉक करें. हो सकता है फ़ायरवॉल आपके कंट्रोल में न हो, इसलिए आप इस बारे में सर्वर देने वाली संस्था से बात कर सकते हैं.
  • सर्च इंजन की, साइट को क्रॉल और इंडेक्स करने की प्रोसेस को समझदारी से कंट्रोल करें.
    कुछ वेबमास्टर Googlebot को अपनी वेबसाइट क्रॉल करने से जान-बूझकर रोकते हैं. ऐसा करने के लिए वे शायद फ़ायरवॉल का इस्तेमाल करते हैं, जैसा कि ऊपर बताया गया है. ऐसी स्थितियों में, आम तौर पर इसका मकसद Googlebot को पूरी तरह ब्लॉक करना नहीं, बल्कि साइट को क्रॉल करने और इंडेक्स करने के तरीके को कंट्रोल करना होता है. अगर यह आप पर लागू होता है, तो इनकी जांच करें:
404 कोड वाली गड़बड़ियां

आम तौर पर, हम सिर्फ़ 404 की गड़बड़ी वाले पेजों को ठीक करने का सुझाव देते हैं, 404 के शामिल नहीं किए गए पेजों का नहीं. 404 की गड़बड़ी वाले पेज ऐसे पेज होते हैं जिन्हें इंडेक्स करने के लिए आपने खास तौर पर Google से अनुरोध किया था, लेकिन वे मिले नहीं थे. .यह वाकई में एक तरह की गड़बड़ी होती है. 404 के शामिल नहीं किए गए पेज, ऐसे पेज होते हैं जिन्हें Google ने किसी दूसरे तरीके (जैसे कि किसी दूसरे पेज पर मौजूद लिंक) से खोजा था. अगर उस पेज की जगह बदल दी गई है, तो नए पेज पर ले जाने के लिए 3XX रीडायरेक्ट का इस्तेमाल करना चाहिए. 404 कोड वाली गड़बड़ियों का विश्लेषण करने और उन्हें ठीक करने के बारे में ज़्यादा जानें.

ऐसे पेज या साइट जिन्हें शामिल नहीं किया गया है

अगर रिपोर्ट में आपके पेज की कोई जानकारी शामिल नहीं की गई है, तो इसकी वजह नीचे दी गई बातों में से एक हो सकती है:

  • Google इस पेज के बारे में नहीं जानता. पेज खोजे जाने के बारे में कुछ ध्यान देने वाली बातें:
    • अगर यह साइट या पेज नया है, तो Google को उसे ढूंढने और क्रॉल करने में कुछ समय लग सकता है.
    • Google, नए पेज के बारे में जाने, इसके लिए आपको या तो साइटमैप सबमिट करना होगा या फिर पेज क्रॉल करने का अनुरोध करना होगा. अगर नहीं, तो Google को आपके पेज का लिंक मिलना ज़रूरी है.
    • किसी पेज का यूआरएल पता चलने पर, Google को आपकी साइट का कुछ हिस्सा या पूरी साइट क्रॉल करने में कुछ समय (कुछ हफ़्ते तक) लग सकता है.
    • इंडेक्स करने का काम कभी भी फटाफट नहीं होता. तब भी नहीं, जब आप क्रॉल करने का अनुरोध सीधे सबमिट करते हैं.
    • Google इस बात की गारंटी नहीं देता है कि सभी पेजों को Google इंडेक्स में शामिल किया जाएगा.
  • Google आपके पेज को ऐक्सेस नहीं कर सकता (इसे ऐक्सेस करने लिए लॉगिन करना ज़रूरी है या यह इंटरनेट के दूसरे उपयोगकर्ताओं के लिए उपलब्ध नहीं है)
  • पेज में noindex टैग है, जो Google को पेज इंडेक्स करने से रोकता है
  • किसी वजह से पेज को इंडेक्स से हटा दिया गया था.

गड़बड़ी ठीक करने के लिए:

अपने पेज पर आई समस्या की जांच करने के लिए यूआरएल की जांच करने वाला टूल इस्तेमाल करें. अगर पेज, इंडेक्स कवरेज रिपोर्ट में नहीं है, लेकिन उसे यूआरएल की जांच की रिपोर्ट में 'इंडेक्स किया गया' के रूप में दिखाया गया है, तो शायद उसे हाल ही में इंडेक्स किया गया था. साथ ही, वह इंडेक्स कवरेज रिपोर्ट में जल्द ही दिखाई देगा. अगर पेज को यूआरएल जांचने वाले टूल में 'इंडेक्स नहीं किया गया' के रूप में दिखाया गया है (जिसकी आपको उम्मीद है), तो लाइव पेज की जांच करें. लाइव पेज की जांच के नतीजों से पता चलना चाहिए कि समस्या क्या है: समस्या को ठीक करने के तरीके के बारे में जानने के लिए, जांच के नतीजे और जांच के दस्तावेज़ से मिली जानकारी इस्तेमाल करें.

"सबमिट की गई" गड़बड़ियां और शामिल नहीं किए गए पेज
शीर्षक में "सबमिट किया गया" शब्द का इस्तेमाल करने वाली, इंडेक्स करने की किसी भी वजह (उदाहरण के लिए, "सबमिट किए गए यूआरएल में 403 गड़बड़ी वाला मैसेज मिला") का मतलब है कि यूआरएल किसी ऐसे साइटमैप में दिया गया है जो आपकी robots.txt फ़ाइल से जुड़ा है या उसे साइटमैप की रिपोर्ट का इस्तेमाल करके सबमिट किया गया है.
"सबमिट की गई" समस्या को ठीक करने के लिए:
  • उस समस्या को ठीक करें जो पेज को क्रॉल होने से रोकती है
    या
  • सबसे जल्दी काम करने के लिए, अपने साइटमैप से यूआरएल हटाएं और साइटमैप की रिपोर्ट में साइटमैप को फिर से सबमिट करें
    या
  • साइटमैप की रिपोर्ट का इस्तेमाल करके, यूआरएल वाले सभी साइटमैप मिटाएं (और पक्का करें कि आपकी robots.txt फ़ाइल में दिए गए किसी भी साइटमैप में यह यूआरएल शामिल न हो).

अक्सर पूछे जाने वाले सवाल

मेरा पेज इंडेक्स में क्यों है? मैं अपने पेज को इंडेक्स नहीं कराना चाहता.

Google, मिलने वाले किसी भी यूआरएल को तब तक इंडेक्स कर सकता है, जब तक कि आप पेज पर किसी noindex निर्देश को शामिल नहीं करते (या इसे हमेशा के लिए ब्लॉक न किया गया हो). साथ ही, Google किसी पेज को कई तरीकों से ढूंढ सकता है, जैसे कि किसी व्यक्ति की किसी अन्य साइट से आपके पेज को लिंक करना.

  • अगर आप चाहते हैं कि आपके पेज को Google के खोज नतीजों से ब्लॉक कर दिया जाए, तो आपको पेज के लिए किसी तरह के लॉगिन की ज़रूरत होगी या फिर आप पेज पर किसी noindex निर्देश का इस्तेमाल कर सकते हैं.
  • अगर आप चाहते हैं कि आपका पेज खोजे जाने के बाद उसे Google के खोज नतीजों से हटा दिया जाए, तो आपको यह तरीका अपनाना होगा.

मेरी साइट को अब तक फिर से इंडेक्स क्यों नहीं किया गया?

Google, कई तरह के मापदंडों से पेज को फिर से इंडेक्स करता है. इनमें यह भी शामिल है कि उसके मुताबिक पेज कितनी बार बदलता है. अगर आपकी साइट में अक्सर बदलाव नहीं होता है, तो इसकी रीफ़्रेश दर धीमी हो सकती है. हांलाकि, अगर आपके पेज में कोई बदलाव नहीं हुआ है, तो इसमें कोई दिक्कत नहीं है. अगर आपको लगता है कि आपकी साइट को रीफ़्रेश करने की ज़रूरत है, तो Google से इसे फिर से क्रॉल करने के लिए कहें.

क्या आप मेरे पेज/साइट को फिर से क्रॉल कर सकते हैं?

Google से इसे फिर से क्रॉल करने के लिए कहें.

मेरे कई सारे पेज शामिल क्यों नहीं किए गए हैं?

इंडेक्स कवरेज रिपोर्ट देखकर, आप जान सकते हैं कि पेजों को किन वजहों से शामिल नहीं किया गया है. शामिल नहीं किए जाने की ज़्यादातर वजहें इनमें से एक हैं:

  • आपके पास एक robots.txt नियम है जो हमें आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है. समस्या की पुष्टि करने के लिए यूआरएल की जांच करने वाला टूल इस्तेमाल करें.
  • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी आम संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress या color=green या sort=price). ये पेज, इंडेक्स कवरेज रिपोर्ट में "डुप्लीकेट" या "विकल्प" के रूप में लेबल किए जाएंगे.
  • यूआरएल, किसी दूसरे यूआरएल पर रीडायरेक्ट हो जाता है. रीडायरेक्ट यूआरएल इंडेक्स नहीं किए जाते हैं, रीडायरेक्ट टारगेट को इंडेक्स किया जाता है.

Google मेरे साइटमैप को ऐक्सेस नहीं कर पा रहा है

यह देख लें कि आपका साइटमैप robots.txt से ब्लॉक नहीं हो रहा है, वह मान्य है और यह कि आप अपनी robots.txt एंट्री या अपनी साइटमैप रिपोर्ट के सबमिशन में सही यूआरएल का इस्तेमाल कर रहे हैं. सभी के लिए उपलब्ध साइटमैप की जांच करने वाले टूल का इस्तेमाल करके अपने साइटमैप यूआरएल की जांच करें.

Google ऐसे पेज को क्यों क्रॉल कर रहा है जिसे हटा दिया गया है?

Google कुछ समय तक ऐसे सभी यूआरएल क्रॉल करना जारी रखता है जिनके बारे में जानकारी है, भले ही उनसे 4XX की गड़बड़ियां मिल रही हों. ऐसा कुछ समय की गड़बड़ी होने पर ही किया जाता है. किसी यूआरएल को क्रॉल न किया जाए. ऐसा तभी होता है, जब इससे कोई noindex निर्देश मिलता है.

आपको 404 वाली गड़बड़ियों की बढ़ती जा रही सूची दिखाने से बचने के लिए, इंडेक्स कवरेज रिपोर्ट सिर्फ़ वही यूआरएल दिखाती है जिनमें पिछले महीने 404 की गड़बड़ियां दिखाई दी थीं.

मुझे अपना पेज दिख रहा है, लेकिन Google को नहीं दिख रहा. ऐसा क्यों?

Google लाइव पेज को देख सकता है या नहीं, इसका पता लगाने के लिए यूआरएल की जांच करने वाला टूल इस्तेमाल करें. अगर Google ऐसा नहीं कर पा रहा है, तो उसे इसकी वजह बतानी होगी. अगर वह ऐसा कर पा रहा है, तो शायद समस्या यह है कि पिछली बार क्रॉल करने के बाद ऐक्सेस की गड़बड़ी ठीक कर दी गई है. यूआरएल की जांच करने वाला टूल इस्तेमाल करके और इंडेक्स करने का अनुरोध करके एक लाइव क्रॉल चलाएं.

यूआरएल की जांच करने वाला टूल कोई समस्या नहीं दिखा रहा है, लेकिन इंडेक्स कवरेज रिपोर्ट में एक गड़बड़ी दिख रही है. ऐसा क्यों?

हो सकता है कि यूआरएल को Google के आखिरी बार क्रॉल करने के बाद आपने गड़बड़ी ठीक कर दी हो. अपना यूआरएल क्रॉल किए जाने की तारीख देखें (यह इंडेक्स कवरेज रिपोर्ट में यूआरएल की ज़्यादा जानकारी देने वाले पेज में या फिर यूआरएल की जांच करने वाले टूल में इंडेक्स किए गए वर्शन व्यू में दिख जाएगी). तय करें कि आपने पेज क्रॉल किए जाने के बाद कोई सुधार किया है या नहीं.

मैं किसी खास यूआरएल की इंडेक्स स्थिति कैसे खाेजूं?

किसी खास यूआरएल की इंडेक्स स्थिति जानने के लिए, यूआरएल की जांच करने वाला टूल इस्तेमाल करें. आप इंडेक्स कवरेज रिपोर्ट में यूआरएल के हिसाब से न तो खोज सकते हैं और न ही फ़िल्टर कर सकते हैं.

स्थिति की वजहें

इंडेक्स कवरेज रिपोर्ट में पेजों की स्थिति के ये टाइप शामिल होते हैं:

गड़बड़ी

गड़बड़ी वाले पेज इंडेक्स नहीं किए गए

सर्वर में गड़बड़ी (5xx): पेज देखने का अनुरोध करने पर, आपके सर्वर से 500-लेवल वाले कोड की गड़बड़ी का मैसेज मिला. सर्वर की गड़बड़ियां ठीक करना देखें.

रीडायरेक्ट करने से जुड़ी गड़बड़ी: Google को रीडायरेक्ट करने से जुड़ी एक गड़बड़ी मिली है. यह इनमें से कोई एक है: यह एक बहुत ही लंबी रीडायरेक्ट चेन थी; इसमें रीडायरेक्ट लूप था; दूसरा वेबलिंक, जिसके यूआरएल की लंबाई तय सीमा से ज़्यादा थी; रीडायरेक्ट चेन में एक गलत या खाली यूआरएल मौजूद था. रीडायरेक्ट करने के बारे में ज़्यादा जानकारी के लिए, Lighthouse जैसे वेब डीबग करने का टूल इस्तेमाल करें.

सबमिट किए गए ऐसे यूआरएल जिन पर robots.txt से रोक लगाई गई है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है. हालांकि, पेज पर आपकी साइट की robots.txt फ़ाइल से रोक लगी है.

  1. टूल पैनल को बड़ा करने के लिए, उदाहरण टेबल में पेज पर क्लिक करें.
  2. यूआरएल के लिए robots.txt फ़ाइल की जांच करने वाले टूल को चलाने के लिए, robots.txt को रोके जाने की जांच करें पर क्लिक करें. यह टूल बताएगा कि उस यूआरएल को किस नियम की वजह से रोका गया था.
  3. नियमों को हटाने या बदलने के लिए, कृपया अपनी robots.txt फ़ाइल को अपडेट करें. robots.txt फ़ाइल की जांच करने वाले टूल पर लाइव robots.txt देखें पर क्लिक करें. ऐसा करके, आप फ़ाइल की जगह का पता लगा सकते हैं. अगर आप किसी वेब होस्टिंग सेवा का इस्तेमाल कर रहे हैं और आपके पास फ़ाइल में बदलाव करने की अनुमति नहीं है, तो होस्टिंग सेवा के दस्तावेज़ खोजें. इसके अलावा, आप समस्या के बारे में बताने के लिए सहायता केंद्र से संपर्क कर सकते हैं.

सबमिट किए गए यूआरएल की पहचान 'noindex' के तौर पर की गई: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया. हालांकि, इसके मेटा टैग या एचटीटीपी हेडर में 'noindex' डायरेक्टिव दिया गया है. अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको मेटा टैग या एचटीटीपी हेडर हटाना होगा. गड़बड़ी की पुष्टि करने के लिए यूआरएल की जांच करने वाले टूल का इस्तेमाल करें:

  1. टेबल में यूआरएल के आगे, जांच करने वाले आइकॉन पर क्लिक करें.
  2. कवरेज > इंडेक्सिंग > इंडेक्सिंग की अनुमति है? में, रिपोर्ट में यह दिखाया जाना चाहिए कि noindex, इंडेक्स करने से रोक रहा है.
  3. पुष्टि करें कि noindex टैग अब भी लाइव वर्शन में मौजूद है:
    1. लाइव यूआरएल की जांच करें पर क्लिक करें
    2. उपलब्धता > इंडेक्सिंग > इंडेक्सिंग की अनुमति है? में देखें कि क्या noindex डायरेक्टिव अभी भी मौजूद है. अगर noindex अब मौजूद नहीं है और आप चाहते हैं कि Google, पेज को फिर से इंडेक्स करे, ताे इंडेक्स करने का अनुरोध करें पर क्लिक करें. अगर noindex अब भी मौजूद है, तो पेज को इंडेक्स कराने के लिए, इसे हटा दें.

सबमिट किए गए यूआरएल से मिली गड़बड़ी सॉफ़्ट 404 जैसी लग रही है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है. हालांकि, सर्वर से मिला मैसेज सॉफ़्ट 404 की गड़बड़ी वाला लग रहा है. इसे ठीक करने का तरीका जानें.

सबमिट किए गए यूआरएल से बिना अनुमति वाले अनुरोध का मैसेज मिला (401): आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है. हालांकि, Google को जवाब के तौर पर 401 (अनुमति नहीं) वाली गड़बड़ी का मैसेज मिला है. ऐसे में, इस पेज के लिए अनुमति लेने की ज़रूरी शर्तें हटाएं या Googlebot की पहचान की पुष्टि करके, उसे अपने पेज देखने की अनुमति दें. आप गुप्त मोड में मौजूद पेज पर जाकर, इस गड़बड़ी की पुष्टि कर सकते हैं.

सबमिट किया गया यूआरएल नहीं मिला (404): आपने इंडेक्स करने के लिए ऐसा यूआरएल सबमिट किया है जो मौजूद नहीं है. 404 कोड वाली गड़बड़ियों को ठीक करने का तरीका जानें.

सबमिट किए गए यूआरएल पर 403 काेड वाली गड़बड़ी का मैसेज मिला: सबमिट किए गए यूआरएल के लिए ज़रूरी ऐक्सेस चाहिए, लेकिन Google के पास कोई भी क्रेडेंशियल नहीं है. अगर आप चाहते हैं कि यह पेज इंडेक्स हो. तो कृपया ऐसे उपयोगकर्ताओं को भी साइट पर आने का ऐक्सेस दें जो पहचान ज़ाहिर ना करना चाहते हों. अगर आप ऐसा नहीं करते हैं तो इस पेज को इंडेक्स करने के लिए सबमिट न करें.

4xx वाली अन्य गड़बड़ी की वजह से, सबमिट किया गया यूआरएल ब्लॉक किया गया: सर्वर ने 4xx गड़बड़ी वाला रिस्पॉन्स कोड दिया है. यह सबमिट किए गए यूआरएल के लिए यहां दी गई किसी भी अन्य समस्या के दायरे में नहीं आता. आपको या तो यह गड़बड़ी ठीक करनी चाहिए या इंडेक्स करने के लिए यह यूआरएल सबमिट नहीं करना चाहिए. यूआरएल की जांच करने वाले टूल का इस्तेमाल करके, अपने पेज को डीबग करने की कोशिश करें.

चेतावनी

चेतावनी वाले पेजों पर आपको ध्यान देना पड़ सकता है. हो सकता है कि खास नतीजों के हिसाब से उन्हें इंडेक्स किया गया हो या शायद नहीं भी.

robots.txt से रोक लगाए जाने के बाद भी इंडेक्स किया गया: हालांकि, पेज पर आपकी वेबसाइट की robots.txt फ़ाइलसे रोक लगाई गई है, फिर भी इसे इंडेक्स किया गया. (Google हमेशा robots.txt के हिसाब से काम करता है, लेकिन अगर कोई व्यक्ति robot.txt में शामिल किसी पेज को आपके पेज से लिंक करता है, तो ज़रूरी नहीं है कि पेज को इंडेक्स होने से रोका ही जाए). हमें इस बारे में ठीक से नहीं पता है कि आप इस पेज को खोज के नतीजों में दिखाना चाहते हैं या नहीं.

बिना सामग्री के इंडेक्स किया गया: यह पेज, Google इंडेक्स में दिखता है, लेकिन किसी वजह से Google यह सामग्री नहीं पढ़ सका. ऐसा होने की वजह यह हो सकती है कि Google इस पेज को इंडेक्स नहीं कर पा रहा है या सर्च इंजन और उपभोक्ताओं को अलग-अलग जानकारी देने की वजह से पेज को Google इंडेक्स से हटाया जा रहा है. ऐसा robots.txt से रोके जाने की वजह से नहीं है.

मान्य पेज

जिन पेजों की स्थिति ठीक है वे इंडेक्स किए जा चुके हैं.

सबमिट और इंडेक्स किया गया: आपने यूआरएल को इंडेक्स करने के लिए, सबमिट किया और उसे इंडेक्स कर दिया गया.

इंडेक्स किया गया, साइटमैप में सबमिट नहीं किया गया: Google ने यूआरएल खोजकर उसे इंडेक्स किया. हम सभी ज़रूरी यूआरएल को साइटमैप का इस्तेमाल करके सबमिट करने का सुझाव देते हैं.

इंडेक्स में शामिल नहीं किए गए पेज

आम तौर पर, ये पेज इंडेक्स नहीं किए जाते और हमें लगता है कि यह सही है. ये पेज या तो इंडेक्स किए गए पेजों के डुप्लीकेट हैं या आपकी साइट पर कुछ तरीकों से इन्हें इंडेक्स करने पर रोक लगी है. अगर इनमें से कोई वजह नहीं है, तो ये किसी ऐसी वजह से इंडेक्स नहीं किए गए जिसे हम गड़बड़ी नहीं मानते हैं.

‘noindex’ टैग का इस्तेमाल करके पेज को इंडेक्स करने पर रोक लगाई गई: जब Google ने इस पेज को इंडेक्स करने की कोशिश की, तब 'noindex' डायरेक्टिव मिला, इसलिए इसे इंडेक्स नहीं किया गया. अगर आप इस पेज को इंडेक्स कराना नहीं चाहते हैं, तो यह अच्छी बात है कि इसे इंडेक्स नहीं किया गया! अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको 'noindex' डायरेक्टिव हटाना होगा. इस टैग या डायरेक्टिव की मौजूदगी की पुष्टि करने के लिए, ब्राउज़र में पेज का अनुरोध करें. इसके बाद, "noindex" को रिस्पॉन्स हेडर और रिस्पॉन्स के मुख्य हिस्से में खोजें

पेज हटाने वाले टूल का इस्तेमाल करके ब्लॉक किया गया: फ़िलहाल, इस पेज को यूआरएल हटाने के अनुरोध की वजह से ब्लॉक किया गया है. अगर साइट के मालिक के तौर पर आपकी पुष्टि की जा चुकी है, तो आप यूआरएल हटाने वाले टूल का इस्तेमाल करके यह देख सकते हैं कि यूआरएल हटाने का अनुरोध किसने किया है. हटाने के अनुरोध, हटाने की तारीख के 90 दिनों तक ही काम करते हैं. इस समयसीमा के बाद, भले ही आप दोबारा इंडेक्स करने का अनुरोध न करें, फिर भी हो सकता है कि Googlebot उस पेज पर दोबारा जाए और उसे इंडेक्स करे. अगर आप पेज को इंडेक्स कराना नहीं चाहते हैं, तो 'noindex' इस्तेमाल करें. इसके लिए, पेज की पुष्टि करनी होती है या पेज हटाना पड़ता है.

robots.txt फ़ाइल का इस्तेमाल करके ब्लॉक किया गया: robots.txt फ़ाइल इस्तेमाल करके, इस पेज पर Googlebot को ब्लॉक किया गया है. robots.txt टेस्टर का इस्तेमाल करके आप जान सकते हैं कि क्या वाकई ऐसा किया गया है. ध्यान दें, इसका यह मतलब नहीं है कि किसी दूसरे तरीके से इस पेज को इंडेक्स नहीं किया जा सकता. अगर इस पेज को लोड किए बगैर Google को इसके बारे में दूसरी जानकारी मिल जाती है तो, हो सकता है कि पेज इंडेक्स कर दिया जाए (हालांकि आम तौर पर ऐसा नहीं होता). यह पक्का करने के लिए कि Google इस पेज को इंडेक्स न करे, आप robots.txt से लगाई गई रोक को हटाएं और 'noindex' डायरेक्टिव का इस्तेमाल करें.

बिना मंज़ूरी वाले अनुरोध (401) की वजह से ब्लॉक किया गया: पेज देखने के लिए मंज़ूरी लेने के अनुरोध (401 रिस्पॉन्स) की वजह से, इस पेज पर Googlebot को ब्लॉक किया गया है. अगर आप चाहते हैं कि Googlebot इस पेज को क्रॉल करे, तो पेज को देखने के लिए मंज़ूरी लेने की शर्तें हटाएं या Googlebot को अपने पेज का ऐक्सेस दें.

क्रॉल किया गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज को क्रॉल किया है, लेकिन इंडेक्स नहीं किया. हो सकता है कि आने वाले समय में इसे इंडेक्स किया जाए या ना किया जाए; क्रॉल करने के लिए इस यूआरएल को दोबारा सबमिट करने की ज़रूरत नहीं है.

खोजा गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज ढूंढ लिया है, लेकिन इसे अभी तक क्रॉल नहीं किया है. आम तौर पर, Google किसी यूआरएल को क्रॉल करना चाहता है, लेकिन इससे साइट ओवरलोड हो सकती है. इसलिए, Google ने उसे बाद में क्रॉल करने के लिए शेड्यूल किया. इस वजह से रिपोर्ट में पिछली बार क्रॉल करने की तारीख नहीं दी गई है.

सही कैननिकल टैग वाला दूसरा पेज: यह पेज उस पेज का डुप्लीकेट है जिसकी पहचान Google ने कैननिकल के तौर पर की है. यह पेज, कैननिकल पेज पर सही तरीके से ले जाता है. इसलिए, आपको कुछ करने की ज़रूरत नहीं है.

ऐसा डुप्लीकेट यूआरएल जो उपयोगकर्ता के कैननिकल यूआरएल चुने बिना मौजूद है: इस पेज के कई डुप्लीकेट हैं, लेकिन किसी को भी कैननिकल के तौर पर नहीं चुना गया है. हमें लगता है कि यह पेज कैननिकल नहीं है. आपको साफ़ तौर पर इस पेज के लिए कैननिकल का टैग जोड़ना होगा. इस यूआरएल की जांच करने पर वह कैननिकल यूआरएल दिखना चाहिए जिसे Google ने चुना है.

डुप्लीकेट पेज, Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना: यह पेज कई पेजों के लिए कैननिकल के तौर पर चुना गया, लेकिन Google को लगता है कि कोई दूसरा यूआरएल इससे बेहतर कैननिकल हो सकता है. Google ने इस पेज की जगह उस पेज को इंडेक्स किया जिसे हम कैननिकल मानते हैं. हम सुझाव देते हैं कि इस पेज को साफ़ तौर पर, कैननिकल पेज के डुप्लीकेट के रूप में चुनें. इस पेज को, क्रॉल करने के लिए साफ़ तौर पर किए गए अनुरोध के बिना खोजा गया. इस यूआरएल की जांच करने पर वह कैननिकल यूआरएल दिखना चाहिए जिसे Google ने चुना है.

नहीं मिला (404): इस पेज को देखने का अनुरोध करने पर 404 कोड वाली गड़बड़ी मिली. यह यूआरएल Google ने अपने आप ढूंढा था और इसे क्रॉल करने के लिए साफ़ तौर पर कोई अनुरोध नहीं किया गया था, न ही इसे किसी साइटमैप के ज़रिए सबमिट किया गया था. हो सकता है कि Google ने इस यूआरएल को किसी दूसरी साइट के लिंक के तौर पर ढूंढा है या यह पेज पहले मौजूद था और बाद में इसे हटा दिया गया था. Googlebot कुछ समय के लिए इस यूआरएल को क्रॉल करना जारी रख सकता है, क्योंकि ऐसा कोई तरीका नहीं है जिससे Googlebot को कोई यूआरएल हमेशा के लिए भूलने के लिए कहा जा सके. हालांकि, समय के साथ Googlebot इस यूआरएल को कम क्रॉल करेगा. अगर जान-बूझकर 404 वाले कोड दिखाने के लिए सेट किए गए हैं, तो इसमें कोई समस्या नहीं है. अगर पेज कहीं और ले जाया जा चुका है, तो नई जगह पर ले जाने के लिए 301 रीडायरेक्ट इस्तेमाल करें. 404 कोड वाली गड़बड़ियां ठीक करने का तरीका जानें

किसी दूसरे वेबलिंक पर भेजने वाला पेज: यह किसी दूसरे वेबलिंक पर भेजने वाला यूआरएल है, इसलिए इसे इंडेक्स नहीं किया गया.

सॉफ़्ट 404: पेज देखने की कोशिश करने पर हमें लगता है कि नतीजे के तौर पर सॉफ़्ट 404 रिस्पॉन्स मिलता है. इसका मतलब है कि इस पेज को देखने की कोशिश करने पर इससे जुड़ा 404 कोड वाला मैसेज नहीं दिखता. हालांकि, इसमें "नहीं मिला" का ऐसा मैसेज दिखता है, जो उपयोगकर्ता को आसानी से समझ आ सके. हमारा सुझाव है कि आप "नहीं मिला" गड़बड़ी वाले पेजों के लिए 404 रिस्पॉन्स कोड दिखाएं. इसके अलावा, आप पेज पर ज़्यादा जानकारी जोड़कर हमें बता सकते हैं कि इस पेज में 'सॉफ़्ट 404' वाली गड़बड़ी नहीं है. ज़्यादा जानें

डुप्लीकेट के रूप में सबमिट किए गए यूआरएल को कैननिकल के तौर पर नहीं चुना गया है: दिया गया यूआरएल, डुप्लीकेट यूआरएल के सेट में से एक है और साफ़ तौर पर इसकी पहचान कैननिकल पेज के तौर पर नहीं की गई है. आपने साफ़ तौर पर इस यूआरएल को इंडेक्स करने का अनुरोध किया, लेकिन Google ने इसे इंडेक्स नहीं किया. ऐसा इसलिए हुआ, क्योंकि यह एक डुप्लीकेट पेज है. साथ ही, Google को लगता है कि दूसरा यूआरएल, कैननिकल होने के लिए बेहतर है. इसलिए, Google ने अपने चुने गए कैननिकल को इंडेक्स किया. (Google, डुप्लीकेट यूआरएल के सेट में से सिर्फ़ कैननिकल यूआरएल को इंडेक्स करता है.) इस स्थिति और "Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना" में यह अंतर है कि इस मामले में आपने इंडेक्स करने का अनुरोध साफ़ तौर पर किया था. इस यूआरएल की जांच करने पर वह कैननिकल यूआरएल दिखना चाहिए जिसे Google ने चुना है.

पेज को ऐक्सेस न मिलने (403) की वजह से ब्लॉक किया गया: उपयोगकर्ता एजेंट ने क्रेडेंशियल दिए, लेकिन उन्हें ऐक्सेस नहीं दिया गया. हालांकि, Googlebot कभी क्रेडेंशियल नहीं देता है, इसलिए आपका सर्वर गलत तरीके से इस गड़बड़ी को लौटा रहा है. इस गड़बड़ी को ठीक किया जाना चाहिए या फिर पेज को robots.txt या noindex से ब्लॉक करना चाहिए.

अन्य 4xx गड़बड़ी की वजह से ब्लॉक किया गया: सर्वर को 4xx गड़बड़ी का सामना करना पड़ा. यह गड़बड़ी यहां बताई गई किसी भी अन्य गड़बड़ी के दायरे में नहीं आती.

क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?