इंडेक्स कवरेज की स्थिति से जुड़ी रिपोर्ट

इस रिपोर्ट के इस्तेमाल से यह जान सकते हैं कि आपके किन पेजों को इंडेक्स किया गया है. साथ ही, जिन पेजों को इंडेक्स नहीं किया जा सका उन्हें ठीक करने के तरीकों की जानकारी भी मिलेगी.

 

इंडेक्स कवरेज रिपोर्ट खोलें

 

इस रिपोर्ट का इस्तेमाल कैसे करें

अगर आप पहले 'Google सर्च' कैसे काम करता है पढ़ चुके हैं, तो इस रिपोर्ट को समझना कहीं ज़्यादा आसान होगा.

यह रिपोर्ट आपकी प्रॉपर्टी में Google के विज़िट किए हुए या विज़िट करने की कोशिश किए हुए सभी यूआरएल की इंडेक्सिंग स्थिति दिखाती है. खास जानकारी देने वाला पेज आपकी प्रॉपर्टी के सभी यूआरएल के नतीजे दिखाता है जिन्हें स्थिति (गड़बड़ी, चेतावनी या मान्य) के मुताबिक समूह में बाँटा गया है. साथ ही, उस स्थिति की खास वजह (जैसे कि सबमिट किया गया यूआरएल नहीं मिला (404)) भी दिखाता है. एक ही स्थिति/वजह वाले यूआरएल देखने के लिए टेबल की किसी पंक्ति पर क्लिक करें और समस्या के बारे में ज़्यादा जानकारी देखें.

खास जानकारी देखना

टॉप लेवल वाली रिपोर्ट उन सभी पेजों के इंडेक्स होने की स्थिति के बारे में बताती है जिन्हें आपकी साइट पर Google ने क्रॉल करने की कोशिश की है. इन पेजों को स्थिति और वजह के हिसाब से समूहों में रखा जाता है.

इस रिपोर्ट में क्या देखें

  • आम तौर पर, जैसे-जैसे आपकी साइट बेहतर होती जाती है, आपको इंडेक्स किए गए पेजों की संख्या धीरे-धीरे बढ़ती हुई दिखनी चाहिए.
  • अगर आपको इंडेक्स करने में आने वाली गड़बड़ियों की संख्या में ज़्यादा बढ़ोतरी दिखती है, तो ऐसा आपके टेम्प्लेट में हुए बदलाव की वजह से हो सकता है, क्योंकि टेम्प्लेट में बदलाव करने से उसमें नई गड़बड़ी आ सकती है. इसके अलावा, ऐसा तब भी हो सकता है जब आपने ऐसा साइटमैप सबमिट किया हो, जिसमें शामिल यूआरएल को क्रॉल करने पर रोक लगाई गई हो. यह रोक robots.txt या noindex के इस्तेमाल या लॉगिन को ज़रूरी बनाने से लगी हो सकती है. किसी समस्या पर क्लिक करें और पेज की जाँच करके देखें कि क्या गड़बड़ी है.
  • अगर आपको संबंधित गड़बड़ियों के बिना इंडेक्स किए गए कुल पेज की संख्या में गिरावट दिखती है, तो हो सकता है कि आप अपने मौजूदा पेजों का एक्सेस ब्लॉक कर रहे हैं (robots.txt, 'noindex', या मंज़ूरी के ज़रिए) जिन्हें आपने इंडेक्स करने के लिए सबमिट नहीं किया है. गिरावट के लिए उन शामिल नहीं किए गए यूआरएल पर नज़र डालें जो आपके पेजों में आई गिरावट से संबंधित हैं.
  • अगर आपके पास 'मान्य' से ज़्यादा 'शामिल नहीं किए गए' पेज हैं, तो बाहर रखे जाने के प्रकारों पर नज़र डालें. बाहर रखे जाने की आम वजहें ये हैं:
    • आपके पास एक robots.txt नियम है जो हमें आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है.
    • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी सामान्य संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress या color=green या sort=price). अगर ये पेज अलग-अलग तरीकों से क्रम से लगाई या फ़िल्टर की गई सामग्री ही दिखा रहे हैं, तो शायद इन्हें शामिल नहीं किया जाना चाहिए.

नीचे समस्या हल करने के ज़्यादा तरीके देखें.

इस रिपोर्ट में क्या नहीं देखें

  • आपको अपनी साइट के सभी यूआरएल इंडेक्स किए जाने की उम्मीद नहीं करनी चाहिए. आपका लक्ष्य होना चाहिए कि हर पेज का एक वर्शन इंडेक्स हो जाए: कैननिकल वर्शन. कोई भी डुप्लीकेट या विकल्प के तौर पर मौजूद पेज इस रिपोर्ट में 'शामिल नहीं किया गया' के रूप में लेबल किया जाएगा. डुप्लीकेट या विकल्प के तौर पर काम करने वाले पेज की सामग्री काफ़ी हद तक कैननिकल पेज की तरह होती है. किसी पेज का 'डुप्लीकेट' या 'वैकल्पिक' चिह्नित होना एक अच्छा तरीका है. इसका मतलब यह है कि हमें कैननिकल पेज मिल गया है और हमने उसे इंडेक्स कर दिया है. आप यूआरएल की जाँच करने वाला टूल चलाकर किसी भी यूआरएल के कैननिकल का पता लगा सकते हैं.
  • अगर आप नई सामग्री जोड़ रहे हैं, तो आपकी तरफ़ से नया पेज जोड़ने और Google की तरफ़ से उसे इंडेक्स करने के बीच के समय में फ़र्क़ होगा. आप इंडेक्स करने का अनुरोध करके इसमें लगने वाले समय का फ़र्क़ घटा सकते हैं.

स्थिति

हर पेज की सामान्य स्थिति नीचे दी गई श्रेणियों में से कोई एक हो सकती है:

  • गड़बड़ी: पेज को इंडेक्स नहीं किया गया है. गड़बड़ी के बारे में और इसे ठीक करने का तरीका जानने के लिए खास गड़बड़ी प्रकार का ब्यौरा देखें. सबसे पहले आपको इन समस्याओं पर ध्यान देना चाहिए.
  • चेतावनी: पेज इंडेक्स किया गया है या अभी हाल ही तक इंडेक्स किया हुआ था, लेकिन इसमें एक ऐसी समस्या है जिसके बारे में आपको पता होना चाहिए.
  • शामिल नहीं किया गया: पेज को इंडेक्स में शामिल नहीं किया गया है, लेकिन हमें नहीं लगता कि यह कोई गड़बड़ी है. पेज, इंडेक्स करने की प्रक्रिया के बीच में कहीं हो सकता है या फिर आपने जान-बूझकर उसे इंडेक्स में शामिल नहीं किया है (उदाहरण के लिए, किसी गैर इंडेक्स के ज़रिए) और इसीलिए वह ऐसा बर्ताव कर रहा है.
  • मान्य: पेज इंडेक्स किया गया था.

वजह

हर स्थिति (मान्य, चेतावनी, गड़बड़ी, शामिल नहीं किया गया) की उस स्थिति में होने की एक खास वजह होती है. टेबल में मौजूद डेटा वजह के हिसाब से समूहों में लगाया जाता है. इसलिए, हर पंक्ति में एक या उससे ज़्यादा यूआरएल से जुड़ी जानकारी हो सकती है. आप हर तरह की स्थिति से जुड़ी जानकारी देख सकते हैं और उस स्थिति को प्रबंधित कर सकते हैं. इसे करने का तरीका जानने के लिए नीचे दी गई स्थिति के प्रकारों से जुड़ी जानकारी देखें.

पुष्टि

इस समस्या की पुष्टि की स्थिति. आपको उन समस्याओं पर पहले ध्यान देना चाहिए जो पुष्टि में सही नहीं पाई गई हैं या जिनकी पुष्टि शुरू नहीं हुई है.

पुष्टि की जानकारी

अपनी साइट पर एक खास तरह की समस्या के सभी इंस्टेंस ठीक कर लेने के बाद, आप Google से अनुरोध करके अपने किए हुए बदलावों की पुष्टि करा सकते हैं. अगर किसी समस्या के सभी इंस्टेंस ठीक कर लिए जाते हैं, तो समस्या की स्थिति दिखाने वाले टेबल में इसे 'ठीक कर लिया गया' के तौर पर दिखाया जाता है और यह टेबल के सबसे निचले हिस्से में चली जाती है. Search Console, समस्या की पुष्टि की स्थिति के साथ-साथ समस्या के हर इंस्टेंस की पुष्टि की स्थिति पर भी नज़र रखता है. जब समस्या के सभी इंस्टेंस ठीक हो जाते हैं, तो उसे 'ठीक कर लिया गया' माना जाता है. (पुष्टि किए जाने की सही स्थिति जानने के लिए, समस्या की पुष्टि की स्थिति और इंस्टेंस की पुष्टि की स्थिति देखें.)

समस्या के 'जीवनकाल' से जुड़ी ज़्यादा जानकारी...

किसी वेबसाइट पर मौजूद समस्या के 'जीवनकाल' में, उसकी पहचान किए जाने के समय से लेकर उसके आखिरी इंस्टेंस के पूरी तरह ठीक किए जाने के 90 दिन बाद तक का समय शामिल होता है. अगर 90 दिनों के बाद समस्या फिर से दिखाई नहीं देती है, तो इसे रिपोर्ट इतिहास से हटा दिया जाता है.

जिस तारीख पर समस्या की पहली बार पहचान की गई हो, उसे समस्या के 'जीवनकाल' का वह समय माना जाता है जब पहली बार उसका पता लगाया गया. समस्या पता चलने की तारीख में कोई बदलाव नहीं होता. इसलिए:

  • अगर किसी समस्या के सभी इंस्टेंस ठीक कर लेने के 15 दिनों बाद, इसका नया इंस्टेंस फिर से दिखाई देता है तो समस्या "ठीक नहीं की गई है" के रूप में दिखाई देती है. इसके पता चलने की मूल तारीख भी "पहली बार पता चलने की तारीख" ही होती है.
  • समस्या के आखिरी इंस्टेंस को ठीक कर लिए जाने के 91 दिन बाद, अगर समस्या फिर से दिखाई देती है तो पिछली समस्या को 'ठीक कर ली गई है' माना जाता है. यही वजह है कि इसे नई समस्या के रूप में दर्ज किया जाता है और इसके पता चलने की तारीख "आज" की होती है.

पुष्टि की प्रोसेस सामान्य रूप से कैसे काम करती है

यहां वह खास जानकारी दी गई है, जिससे यह पता चलता है कि जब आप किसी समस्या के लिए समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो क्या होता है. इस प्रोसेस में कई दिनों का समय लग सकता है और आपको ईमेल के ज़रिए इससे जुड़ी सूचनाएं मिलती रहेंगी.

  1. जब आप समस्या हल होने की पुष्टि करें पर क्लिक करते हैं, तो Search Console तुरंत कुछ पेजों की जाँच करता है.
    • जाँचे जा रहे किसी भी पेज में मौजूदा समस्या मिलने पर, पुष्टि की प्रोसेस खत्म हो जाती है और पुष्टि किए जाने की स्थिति में कोई बदलाव नहीं होता.
    • अगर इन पेजों (जो नमूनों के तौर पर जाँचे जा रहे हैं) में मौजूदा गड़बड़ी नहीं मिलती है, तो पुष्टि की प्रोसेस शुरू हो गई की स्थिति के साथ जारी रहती है. अगर पुष्टि करने पर दूसरी तरह की समस्याएं मिलती हैं, तो इन्हें इसी तरह की दूसरी समस्याओं में गिना जाता है और पुष्टि की प्रोसेस जारी रहती है.
  2. Search Console, सूची के हिसाब से उन यूआरएल पर काम करता है, जो इस समस्या से प्रभावित हुए हैं. दोबारा क्रॉल करने के लिए तैयार की गई इस सूची में पूरी साइट के बजाय, सिर्फ़ वही यूआरएल शामिल किए जाते हैं जिन पर इस समस्या के इंस्टेंस मौजूद हैं. Search Console जिन यूआरएल को जाँचता है उन सभी का रिकॉर्ड पुष्टि के इतिहास में रखता है, जिसे 'समस्या की जानकारी पेज' पर देखा जा सकता है.
  3. यूआरएल जाँचे जाने पर:
    1. अगर समस्या न मिले, तो इंस्टेंस की पुष्टि की स्थिति बदलकर पास हो रही है हो जाती है. पुष्टि शुरू होने के बाद अगर यह पहला इंस्टेंस है जिसकी जाँच की जा रही है, तो समस्या की पुष्टि की स्थिति बदलकर सब ठीक लग रहा है हो जाती है.
    2. अगर अब यूआरएल देखा नहीं जा सकता, तो इंस्टेंस की पुष्टि की स्थिति बदलकर अन्य (दूसरा) हो जाती है (जो किसी गड़बड़ी की स्थिति नहीं होती है).
    3. इंस्टेंस अगर अब भी मौजूद है, तो समस्या की स्थिति बदलकर फ़ेल हो जाती है. अगर सामान्य तरीके से क्रॉल करने पर यह नया पेज मिला है, तो इसे मौजूदा समस्या का एक और इंस्टेंस माना जाता है.
  4. सभी गड़बड़ियां और चेतावनी वाले यूआरएल जाँचे जाने के बाद समस्या की गिनती 0 रह जाती है, तो समस्या की स्थिति बदलकर पास हो जाती है. ज़रूरी जानकारी : भले ही समस्या के असर वाले पेज की संख्या घटकर 0 और समस्या की स्थिति बदलकर पास हो जाती है, तब भी पेज पर मूल गंभीरता का लेबल (गड़बड़ी या चेतावनी) दिखाया जाएगा.

भले ही आपने कभी भी "पुष्टि शुरू करें" पर क्लिक न किया हो, पर Google किसी समस्या के ठीक कर लिए गए इंस्टेंस पहचान सकता है. नियमित रूप से किए जाने वाले क्रॉल के दौरान अगर Google को पता चलता है कि किसी समस्या के सभी इंस्टेंस ठीक कर लिए गए हैं, तो यह रिपोर्ट पर समस्या की स्थिति बदलकर "लागू नहीं" कर देगा.

किसी यूआरएल या साइट के किसी हिस्से में आई समस्या को "ठीक कर लिया गया" कब माना जाता है?

नीचे दी गईं शर्तों में से किसी एक के पूरे होने पर, यूआरएल या साइट के किसी हिस्से की समस्या को 'ठीक कर लिया गया' माना जाता है :

  • जब यूआरएल क्रॉल किया जाता है और पेज पर समस्या नहीं मिलती. एएमपी टैग की गड़बड़ी के लिए इसका मतलब है कि आपने टैग को ठीक कर लिया है या इसे हटा दिया है (अगर टैग की ज़रूरत नहीं है). पुष्टि किए जाने पर इसे "पास" माना जाएगा.
  • अगर किसी वजह से पेज Google को नहीं मिलता (पेज हटा दिया गया है, पेज पर noindex नियम लागू है, पेज देखने के लिए मंज़ूरी लेना ज़रूरी है और भी दूसरी वजहें), तो उस यूआरएल के लिए समस्या को 'ठीक कर लिया गया' माना जाएगा. पुष्टि के दौरान इसे पुष्टि की "अन्य" स्थिति के रूप में गिना जाता है.

दोबारा पुष्टि करने का तरीका

जब आप किसी फ़ेल हो गई पुष्टि के लिए दोबारा पुष्टि करें पर क्लिक करते हैं, तो सभी फ़ेल इंस्टेंस के लिए पुष्टि दोबारा शुरू हो जाती है. साथ ही, सामान्य रूप से क्रॉल किए जाने पर मिले इस समस्या के नए इंस्टेंस की भी पुष्टि होती है.

दोबारा पुष्टि किए जाने का अनुरोध करने से पहले आपको मौजूदा समय में चल रही पुष्टि की प्रोसेस पूरी होने तक इंतज़ार करना चाहिए, भले ही आपने अनुरोध किए जाने के बाद कुछ समस्याएं ठीक की हों.

जो इंस्टेंस पुष्टि में पास हो चुके हैं (पास के निशान वाले) या अब जिन्हें देखा नहीं जा सकता (अन्य के निशान वाले) उन्हें दोबारा नहीं जाँचा जाता. साथ ही जब आप 'दोबारा पुष्टि करें' पर क्लिक करते हैं, तो इन्हें इतिहास से हटा दिया जाता है.

पुष्टि किए जाने का इतिहास

आप यह देख सकते हैं कि जिस पुष्टि का अनुरोध आपने किया है, उसकी प्रक्रिया कितनी पूरी हुई है. इसके लिए समस्या की जानकारी वाले पेज पर पुष्टि की जानकारी के लिंक पर क्लिक करें.

एएमपी रिपोर्ट और इंडेक्स की स्थिति की रिपोर्ट देखने के लिए, पुष्टि के इतिहास वाले पेज की सामग्री को यूआरएल के हिसाब से समूह में रखा जाता है. मोबाइल पर इस्तेमाल में आसानी की रिपोर्ट और रिच नतीजों की रिपोर्ट में, सामग्रियों को यूआरएल और व्यवस्थित डेटा की सामग्री के हिसाब से समूह में रखा जाता है. इसके लिए सामग्रियों की पहचान उनके नाम के मान से की जाती है. पुष्टि की स्थिति उस खास समस्या पर लागू होती है जिसकी आप जाॅंच कर रहे हैं. किसी पेज पर एक समस्या का लेबल "पास" हो सकता है, लेकिन दूसरी समस्याओं का लेबल "फ़ेल", "पुष्टि होनी बाकी है" या "कुछ और" हो सकता है.

समस्या की पुष्टि की स्थिति

किसी भी समस्या पर नीचे दी गई समस्या की स्थितियां लागू होती हैं:

  • शुरू नहीं हुई है: इस समस्या के इंस्टेंस वाले एक या उससे ज़्यादा पेज हैं जिनकी आपने कभी भी पुष्टि करने की कोशिश नहीं की है. अगले चरण:
    1. गड़बड़ी के बारे में ज़्यादा जानकारी के लिए समस्या पर क्लिक करें. एएमपी जाँच इस्तेमाल करके लाइव पेज पर गड़बड़ियों के उदाहरण देखने के लिए एक-एक पेज को ध्यान से देखें. (हो सकता है कि एएमपी जाँच के ज़रिए पेज पर गड़बड़ी दिखाई न दे. ऐसा इसलिए होता है क्योंकि Google को यह गड़बड़ी मिलने और समस्या की रिपोर्ट तैयार करने के बाद, आपने लाइव पेज पर गड़बड़ी ठीक कर ली है.
    2. जिस नियम का उल्लंघन किया गया है उसके बारे में जानने के लिए जानकारी पेज पर "ज़्यादा जानें" पर क्लिक करें.
    3. किसी खास समस्या के बारे में जानकारी पाने के लिए, टेबल में एक उदाहरण यूआरएल पंक्ति पर क्लिक करें.
    4. अपने पेजों को ठीक करें और फिर ठीक किए जाने की पुष्टि करें पर क्लिक करें ताकि Google आपके पेज फिर से क्रॉल करे. Google आपको इस बात की सूचना देगा कि पुष्टि की प्रोसेस कहां तक पहुंची है. पुष्टि होने में एक-दो दिन से लेकर दो हफ़्ते तक का समय लग सकता है, इसलिए अगर थोड़ा इंतज़ार करना पड़े तो परेशान न हों. 
  • शुरू की गई: आपने पुष्टि की प्रोसेस का अनुरोध किया और अभी तक समस्या का कोई इंस्टेंस नहीं मिला है. अगला चरण: जैस-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी Google आपको सूचनाएं भेजेगा. साथ ही ज़रूरी होने पर आपको बताएगा कि आपको क्या करना होगा.
  • सब ठीक लग रहा है: आपने पुष्टि करने का अनुरोध किया और अब तक समस्या के जितने भी इंस्टेंस मिले हैं उन्हें ठीक कर लिया गया है. अगला चरण: कुछ भी नहीं, लेकिन जैसे-जैसे पुष्टि की प्रोसेस आगे बढ़ेगी, Google आपको सूचनाएं भेजेगा और बताएगा कि आपको क्या करना है.
  • पास: समस्या के सभी पहचाने गए इंस्टेंस अब मौजूद नहीं हैं (या अब वह यूआरएल उपलब्ध नहीं है जिस पर असर हुआ था). इस स्थिति में आने के लिए आपने ज़रूर "ठीक किए जाने की पुष्टि करें" पर क्लिक किया होगा (अगर इंस्टेंस आपके अनुरोध के बिना ही दिखाई नहीं दे रहे हैं, तो पुष्टि की स्थिति बदलकर 'लागू नहीं' हो जाएगी). अगला चरण: अब और कुछ नहीं करना.
  • लागू नहीं: Google को पता चला कि सभी यूआरएल पर समस्या को ठीक कर लिया गया है, हालांकि आपने कभी भी पुष्टि करने का अनुरोध नहीं किया था. अगला चरण: अब और कुछ नहीं करना.
  • फ़ेल: जब आपने "पुष्टि करें" पर क्लिक किया था उसके बाद भी एक तय सीमा तक के पेजों पर अभी भी यह समस्या मौजूद है. अगले चरण: समस्या ठीक करें और दोबारा पुष्टि का अनुरोध करें.

इंस्टेंस की पुष्टि की स्थिति

पुष्टि का अनुरोध करने के बाद, किसी खास समस्या के लिए हर इंस्टेंस को खास स्थिति के तौर पर दिखाया जाता है. यह स्थिति पुष्टि की नीचे दी गईं स्थितियों में से एक होती है (इंडेक्स की स्थिति की रिपोर्ट में पास और कुछ और वाली स्थितियों का इस्तेमाल नहीं किया जाता) :

  • अभी पुष्टि बाकी है: पुष्टि किए जाने के लिए सूची में जोड़ लिया गया है. पिछली बार जब Google ने क्रॉल किया था तब इंस्टेंस मौजूद था.
  • पास: Google ने समस्या का इंस्टेंस ढूंढने की कोशिश की और पाया कि अब इसका कोई इंस्टेंस मौजूद नहीं है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • फ़ेल: Google ने जाँचा और पाया कि समस्या का इंस्टेंस अभी भी मौजूद है. समस्या इस स्थिति में सिर्फ़ तभी पहुंच सकती है, जब आपने इस समस्या के इंस्टेंस के लिए पुष्टि करें पर क्लिक किया हो.
  • अन्य: Google उस यूआरएल पर नहीं पहुंच पाया, जो इंस्टेंस होस्ट कर रहा था या (व्यवस्थित डेटा के लिए) अब पेज पर वह चीज़ नहीं ढूंढ पा रहा है. इसे पास के बराबर ही माना जाता है.

इस बात पर ध्यान दें कि अलग-अलग समस्याओं के लिए एक ही यूआरएल की अलग-अलग स्थितियों हो सकती हैं. उदाहरण के लिए, अगर किसी एक ही पेज पर X और Y दोनों तरह की समस्याएं हैं, तो हो सकता है कि X समस्या की पुष्टि की स्थिति पास हो और उसी पेज पर Y समस्या की पुष्टि की स्थिति पुष्टि नहीं हुई है के रूप में दिखाई दे.

यूआरएल खोज ड्रॉपडाउन फ़िल्टर

चार्ट के ऊपर दिए गए फ़िल्टर का इस्तेमाल करके इंडेक्स के नतीजों को उस तरीके से फ़िल्टर करें जिसके ज़रिए Google ने यूआरएल खोजा है. नीचे दिए गए मान उपलब्ध हैं:

  • वे सभी पेज जिनके बारे में पहले से जानकारी है [डिफ़ॉल्ट रूप से] - वे सभी यूआरएल दिखाएं जिन्हें Google ने किसी भी तरीके से खोजा है.
  • सभी सबमिट किए गए पेज - Search Console या किसी साइटमैप पिंग का इस्तेमाल करके सिर्फ़ साइटमैप में सबमिट किए गए पेज दिखाएं.
  • खास साइटमैप यूआरएल - सिर्फ़ वे यूआरएल दिखाएं जो Search Console की मदद से सबमिट किए गए किसी खास साइटमैप में मौजूद हैं. अगर किसी साइटमैप इंडेक्स से जुड़ी जानकारी देखी जा रही है, तो उसमें शामिल किसी भी साइटमैप के सभी यूआरएल दिखाई देंगे.

किसी यूआरएल को साइटमैप के ज़रिए सबमिट माना जाता है, भले ही उसे किसी दूसरे तरीके से खोजा गया हो (जैसे, किसी दूसरे पेज को ऑर्गेनिक तरीके से क्रॉल करके).

ज़्यादा जानकारी वाला व्यू

खास जानकारी वाले पेज में किसी पंक्ति पर क्लिक करने से आप उस स्थिति + वजह के संयोजन वाले ज़्यादा जानकारी वालू व्यू पर पहुंच जाएंगे. आप ज़्यादा जानकारी वाले पेज पर ज़्यादा जानें क्लिक करके, चुनी हुई समस्या के बारे में ज़्यादा जानकारी देख सकते हैं.

ग्राफ़ में वे पेज दिखाए जाते हैं, जिन पर समय के साथ असर पड़ा है.

टेबल में उन पेज की एक उदाहरण सूची दिखाई जाती है जिन पर समस्या का असर हुआ है:

  • टेबल पंक्ति पर दिए गए जंप लिंक पर क्लिक करके टेबल में दिया गया यूआरएल खोलें.
  • टेबल की पंक्ति पर जाँच करें आइकॉन खोजें पर क्लिक करके टेबल में दिए गए यूआरएल की जाँच करें.
  • किसी गड़बड़ी या चेतावनी के सभी इंस्टेंस ठीक कर लेने पर, आप Google से अपने सुधारों की पुष्टि करने के लिए कह सकते हैं.

ऐसा यूआरएल दिख रहा है जिसे आपकी ठीक की हुई समस्या के ज़रिए चिह्नित किया गया है? शायद आपने पिछली बार Google क्रॉल हो जाने के बाद समस्या ठीक की है. इसीलिए, अगर किसी ऐसी समस्या वाला यूआरएल दिखाई देता है जिसे आप ठीक कर चुके हैं, तो उस यूआरएल को क्रॉल किए जाने की तारीख ज़रूर देखें. अपने सुधार की जाँच करें और पुष्टि करें, फिर दोबारा इंडेक्स करने का अनुरोध करें

 

रिपोर्ट शेयर करने का तरीका

आप पेज पर मौजूद शेयर बटन पर क्लिक करके समस्या से जुड़ी जानकारी शेयर कर सकते हैं. जिस व्यक्ति के पास यह लिंक है, वह इसके ज़रिए सिर्फ़ मौजूदा पेज और इस समस्या से जुड़े पुष्टि के इतिहास वाले किसी भी पेज का इस्तेमाल कर सकते हैं. यह लिंक आपके संसाधन को दूसरे पेजों का इस्तेमाल करने की मंज़ूरी नहीं देता है. इस लिंक के ज़रिए, इस्तेमाल करने वाले किसी दूसरे व्यक्ति को आपकी प्रॉपर्टी या खाते पर किसी भी तरह की कार्रवाई करने की मंज़ूरी नहीं दी जा सकती है. इस पेज को शेयर किए जाने की सुविधा बंद करके आप इस लिंक के ज़रिए मिलने वाली मंज़ूरी पर रोक लगा सकते हैं.

समस्या हल करना

कुछ तरह की गड़बड़ियों की ज़्यादा बढ़ी हुई संख्या

अगर आपको अपनी गड़बड़ियों की संख्या तेज़ी से बढ़ती दिखाई दे, तो:

  1. देखें कि क्या आपको इंडेक्स करने में गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या और किसी खास गड़बड़ी का रुझान दिखाने वाले ग्राफ़ (स्पार्कलाइन) के बीच कोई संबंध दिखाई दे रहा है. अगर ऐसा है, तो इससे आपकी गड़बड़ियों की कुल संख्या या इंडेक्स किए गए पेजों की कुल संख्या पर असर डालने वाली समस्या के बारे में कुछ संकेत मिल सकता है.
  2. गड़बड़ियां ठीक करें
    1. गंभीरता और चेतावनी के हिसाब से यूआरएल के समूह दिखाने वाली टेबल में यूआरएल क्रम से लगाए जाते हैं. यह क्रम, गंभीरता, असर होने वाले पेजो की संख्या और मौजूदा समय में पुष्टि किए जाने या न किए जाने के हिसाब से तय होता है. हमारा सुझाव है कि आप उन्हें दिखाए गए डिफ़ॉल्ट क्रम में ठीक करने की कोशिश करें.
    2. किसी समस्या पंक्ति में तेज़ी से हुई बढ़ोतरी को देखें जो उसी समय हुई हो, जिस समय किसी गड़बड़ी की संख्या में तेज़ी से बढ़ोतरी हुई है.
    3. किसी गड़बड़ी पंक्ति पर क्लिक करके ज़्यादा जानकारी वाले पेज पर क्लिक करके ज़्यादा जानकारी हासिल करें. किसी खास तरह की गड़बड़ी को सबसे सही तरीके से ठीक करने का तरीका जानने के लिए उसके बारे में दी गई जानकारी पढ़ें.
    4. गड़बड़ी के सभी इंस्टेंस ठीक करें और उस वजह के 'ज़्यादा जानकारी' वाले पेज में दिए गए सुधार की पुष्टि करें पर क्लिक करके पुष्टि करने का अनुरोध करें. पुष्टि करने के बारे में ज़्यादा जानें.
    5. जैसे-जैसे आपके पेजों की पुष्टि होगी, आपको इसकी सूचनाएं मिलती रहेंगी. हालांकि, आप कुछ दिन बाद वापस आकर देख सकते हैं कि गड़बड़ियों की संख्या कम हुई या नहीं.
  3. शामिल न किए गए यूआरएल का फ़िल्टर हटाएं. फिर असर होने वाले पेजों की संख्या के हिसाब से उन्हें क्रम से लगाकर समस्याएं देखें. ऐसा समय-समय पर करते रहें.

किसी खास यूआरएल की इंडेक्स स्थिति का पता लगाना

किसी खास यूआरएल की इंडेक्स स्थिति जानने के लिए, यूआरएल की जाँच करने वाला टूल इस्तेमाल करें. आप 'इंडेक्स कवरेज' रिपोर्ट में दिया गया यूआरएल खोज सकते हैं या फ़िल्टर कर सकते हैं.
सर्वर की गड़बड़ियों को ठीक करना
सर्वर की गड़बड़ी का मतलब है कि Googlebot आपके यूआरएल को एक्सेस नहीं कर पाया, तय समय में अनुरोध प्रोसेस नहीं हुआ या आपकी साइट पर ज़्यादा ट्रैफ़िक था. इस वजह से Googlebot को अनुरोध रद्द करना पड़ा.

सर्वर के कनेक्शन की जाँच करना

यूआरएल की जाँच करने वाले टूल का इस्तेमाल करके आप यह देख सकते हैं कि आपको इंडेक्स कवरेज की स्थिति की रिपोर्ट में बताई गई सर्वर की गड़बड़ी फिर से मिलती है या नहीं.

सर्वर से कनेक्ट होने की गड़बड़ियां ठीक करना

  • डायनैमिक पेज अनुरोधों के लिए ज़्यादा से ज़्यादा पेज लोडिंग कम करें.
    ऐसी साइट जो एक से ज़्यादा यूआरएल की एक ही सामग्री डिलीवर करती है, उसे डायनैमिक तरीके से सामग्री डिलीवर करने वाला माना जाता है (उदाहरण के लिए, www.example.com/shoes.php?color=red&size=7 से वही सामग्री मिलती है जो www.example.com/shoes.php?size=7&color=red में दिखाई देती है).  डायनैमिक पेज प्रतिक्रिया करने में लंबा समय ले सकते हैं, जिसकी वजह से समय खत्म होने की समस्याएं हो सकती हैं. डायनैमिक सर्वर पर ज़रूरत से ज़्यादा ट्रैफ़िक होने की स्थिति का मैसेज दिख सकता है, जिसके ज़रिए Googlebot से साइट को पहले के मुकाबले धीरे क्रॉल करने के लिए कहा जा सकता है. आम तौर पर, हम पैरामीटर सूचियों को छोटा रखने और उनका सीमित इस्तेमाल करने का सुझाव देते हैं. अगर आपको अपनी साइट के पैरामीटर के काम करने के तरीके के बारे में पूरी तरह पता है, तो आप Google को बता सकते हैं कि हमें इन पैरामीटर का इस्तेमाल कैसे करना चाहिए.
  • यह पक्का करें कि आपकी साइट का होस्टिंग सर्वर डाउन, ओवरलोड या गलत कॉन्फ़िगर नहीं किया गया है.
    अगर कनेक्शन, समय समाप्त होने या प्रतिक्रिया की समस्याएं बनी रहती हैं, तो अपने वेब होस्टर से संपर्क करें और ट्रैफ़िक प्रबंधित करने के लिए अपनी साइट की क्षमता बढ़ाने पर विचार करें.
  • यह जॉंच करें कि आप अनजाने में Google को ब्लॉक तो नहीं कर रहे हैं.
    शायद आप सिस्टम की किसी समस्या की वजह से Google को ब्लॉक कर रहे हों. इन समस्याओं में डीएनएस को कॉन्फ़िगर करने की समस्या, गलत तरीके से कॉन्फ़िगर किए गए फ़ायरवॉल, DoS सुरक्षा सिस्टम या सामग्री प्रबंधन सिस्टम को कॉन्फ़िगर करने की समस्याएं शामिल हो सकती हैं. बेहतर तरीके से होस्ट करने के लिए सुरक्षा के सिस्टम बहुत ज़रूरी हैं. इन्हें सर्वर पर सामान्य से ज़्यादा संख्या में आने वाले अनुरोधों पर अपने आप रोक लगाने के लिए कॉन्फ़िगर किया जाता है. हालांकि, क्योंकि अक्सर मानव उपयोगकर्ता की अपेक्षा Googlebot ज़्यादा अनुरोध करता है, इसलिए यह Googlebot को ब्लॉक करके और इसे आपकी वेबसाइट क्रॉल करने से रोककर इन सुरक्षा सिस्टम को ट्रिगर कर सकता है. इस तरह की समस्याओं को हल करने के लिए, वेबसाइट के उस हिस्से की पहचान करें जिसकी वजह से Googlebot पर रोक लग रही है. इसके बाद Googlebot पर लगी रोक हटाएं. हो सकता है फ़ायरवॉल आपके नियंत्रण में नहीं हो, इसलिए आपको होस्टिंग देने वाले से इस बारे में चर्चा करने की ज़रूरत हो सकती है.
  • सर्च इंजन की साइट को क्रॉल और इंडेक्स करने की प्रक्रिया को सूझ-बूझ से नियंत्रित करें.
    कुछ वेबमास्टर Googlebot को अपनी वेबसाइट क्रॉल करने से जानबूझकर रोकते हैं. ऐसा करने के लिए शायद वे ऊपर बताए गए तरीके से फ़ायरवॉल का इस्तेमाल करते हैं. ऐसी स्थितियों में, आम तौर पर Googlebot को पूरी तरह ब्लॉक करने का उद्देश्य नहीं होता है, लेकिन साइट को क्रॉल करने और इंडेक्स करने के तरीके को नियंत्रित करना होता है. अगर आप भी ऐसा कर रहे हैं, तो इन बातों की जाँच करें:
404 कोड वाली गड़बड़ियां ठीक करना

आम तौर पर, हम सिर्फ़ 404 की गड़बड़ी वाले पेज ठीक करने का सुझाव देते हैं, 404 के शामिल नहीं किए गए पेज का नहीं. 404 की गड़बड़ी वाले यूआरएल ऐसे यूआरएल हैं जिनके लिए आपने Google से खास तौर पर इंडेक्स करने के लिए कहा है, लेकिन वे मिले नहीं थे. 404 के शामिल नहीं किए गए यूआरएल ऐसे यूआरएल हैं जिन्हें Google ने किसी दूसरे तरीके से खोजा था.

यहां बताया गया है कि आपको 404 की गड़बड़ियों से कैसे निपटना चाहिए:

  1. तय करें कि क्या इसे ठीक करना फ़ायदेमंद होगा. 404 कोड वाली कई (ज़्यादातर?) गड़बड़ियां ठीक करने का कोई फ़ायदा नहीं होता क्योंकि 404 की गड़बड़ी से आपकी साइट की इंडेक्सिंग या रैंक को कोई नुकसान नहीं पहुंचता.
    • अगर यह कोई सबमिट किया गया यूआरएल (एक गड़बड़ी) है, तो इसे ठीक करना फ़ायदेमंद होगा.
    • अगर यह कोई ऐसा हटाया गया पेज है जिसके लिए विकल्प या समान पेज उपलब्ध नहीं है, तो 404 लौटाना सही है. एक महीने बाद, रिपोर्ट में 404 की गड़बड़ी दिखाई नहीं देनी चाहिए.
    • अगर यह किसी स्क्रिप्ट से जनरेट किया गया खराब यूआरएल है या फिर यह कभी भी आपकी साइट पर मौजूद नहीं रहा है, तो हो सकता है कि आपको इसके बारे में चिंता करने की ज़रूरत नहीं है. आपको अपनी रिपोर्ट में यह गड़बड़ी देखकर परेशानी हो सकती है. हालांकि, आपको तब तक इसे ठीक करने की ज़रूरत नहीं है जब तक गड़बड़ी वाला यूआरएल कोई ऐसा लिंक न हो, जिसे लिखते समय आम तौर पर गलतियां हो जाती हैं. (नीचे देखें). 404 की गड़बड़ियों को एक महीने बाद रिपोर्ट से हट जाना चाहिए.
  2. अगर यूआरएल इंडेक्स करने के लिए सबमिट किया गया था, (इसकी स्थिति है गड़बड़ी) तो,
    1. यूआरएल की जाँच करके यह देखें कि इसे कहां से सबमिट किया गया था. इसके लिए यूआरएल के आगे सबमिट करें आइकॉन खोजें पर क्लिक करें और खोज की जानकारी पर नज़र डालें. साइटमैप को ज़रूरत के मुताबिक अपडेट करें.
    2. अगर सामग्री को दूसरी जगह ले जाया गया है, तो उसके लिए रीडायरेक्ट जोड़ें.
    3. अगर आपने सामग्री को हमेशा के लिए मिटा दिया है और आप उसकी जगह कोई नई या मिलती-जुलती सामग्री नहीं डालने वाले हैं, तो पुराने यूआरएल को 404 या 410 कोड वाली गड़बड़ी दिखाने के लिए सेट करें. फ़िलहाल, Google 410 कोड (हटा दिया गया) वाली गड़बड़ी को 404 कोड (नहीं मिला) वाली गड़बड़ी की तरह ही मानता है. गैरमौजूद पेज के लिए 404 या 410 को छोड़कर कोई कोड लौटाने से (या उपयोगकर्ताओं को 404 लौटाने के बजाय, उन्हें अन्य पेज जैसे होमपेज पर रीडायरेक्ट करना) समस्या हो सकती है. ऐसे पेजों को सॉफ़्ट 404 कहा जाता है और वे इस्तेमाल करने वालों के साथ ही सर्च इंजन के लिए भी उलझन भरे हो सकते हैं.
    4. अगर यूआरएल के बारे में जानकारी नहीं है: कभी-कभी आपको ऐसे यूआरएल के लिए 404 कोड वाली गड़बड़ियां दिखाई दे सकती हैं, जो आपकी साइट के नहीं हैं. ये गड़बड़ियां तब हो सकती हैं जब कोई व्यक्ति ऐसे यूआरएल को ब्राउज़ करता है, जो आपकी साइट पर मौजूद नहीं है. ऐसा, ब्राउज़र में गलत यूआरएल टाइप करने या साइट पर ले जाने वाले यूआरएल को गलत टाइप करने की वजह से हो सकता है. अगर यह गड़बड़ी बहुत ही आम है, तो आपको इसके लिए एक रीडायरेक्ट बनाना पड़ सकता है.
      अनचाहे यूआरएल की एक और वजह JavaScript, Flash फ़ाइलों या एम्बेड की गई दूसरी सामग्री या ऐसी सामग्री हो सकती है, जो शायद सिर्फ़ किसी साइटमैप में मौजूद हो, उसमें मिले लिंक पर जाने की कोशिश करते समय Googlebot के ज़रिए जनरेट हो सकते हैं. उदाहरण के लिए, आपकी साइट पर Google Analytics में डाउनलोड की गईं फ़ाइलों पर नज़र रखने के लिए, इस तरह के कोड का इस्तेमाल हो सकता है:
      <a href="helloworld.pdf"
        onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
        Hello World PDF</a>

      जब Googlebot को  यह कोड दिखाई देता है, तो हो सकता है कि यह यूआरएल http://www.example.com/download-helloworld को क्रॉल करने की कोशिश करे, भले ही यह असली पेज न हो. ऐसे में, क्रॉल करने में होने वाली गड़बड़ियों की रिपोर्ट में यह लिंक 404 कोड (नहीं मिला) वाली गड़बड़ी के तौर पर दिखाई दे सकता है. Google क्रॉल करने में होने वाली इस तरह की गड़बड़ी को रोकने के लिए काम कर रहा है. आपकी साइट को क्रॉल किए जाने या उसकी रैंकिंग पर इस गड़बड़ी का कोई असर नहीं पड़ता है.

  3. न तो नकली सामग्री बनाएं, न अपने होमपेज पर रीडायरेक्ट करें, न ही 404 की गड़बड़ियों को ब्लॉक करने के लिए robots.txt का इस्तेमाल करें—ये सभी चीज़ें हमारे लिए आपकी साइट की बनावट की पहचान करना और इसे सही तरीके से प्रोसेस करना मुश्किल बना देती हैं. हम इन्हें सॉफ़्ट 404 गड़बड़ियां कहते हैं.(जब Google किसी यूआरएल को सही तरीके से क्रॉल कर लेता है तब वह उस यूआरएल को हमेशा क्रॉल करने की कोशिश कर सकता है. 300-लेवल वाला रीडायरेक्ट जारी किए जाने पर दोबारा क्रॉल करने की कोशिश में देरी होगी. यह देरी बहुत लंबे समय के लिए हो सकती है.) यूआरएल हटाने वाले टूल का इस्तेमाल करके यूआरएल को हटाने का अनुरोध सबमिट करने पर, इस रिपोर्ट से गड़बड़ी को नहीं हटाया जाएगा.

अक्सर पूछे जाने वाले सवाल

मेरा पेज (या साइट) अब तक इंडेक्स क्यों नहीं हुआ है?

अगर आपकी साइट नई है, तो Google को उसे ढूंढने और क्रॉल करने में कुछ समय लग सकता है.

  1. Google नए पेज के बारे में जानें इसके लिए, आपको या तो साइटमैप सबमिट करना चाहिए या फिर पेज क्रॉल का अनुरोध करना चाहिए. अगर नहीं, तो Google को आपके पेज में किसी जगह एक लिंक ढूंढना होगा.
  2. किसी पेज का यूआरएल पता चल जाने पर, Google को आपकी कुछ या पूरी साइट क्रॉल करने में कुछ समय (पाँच हफ़्ते तक) लग सकता है.

इंडेक्स करने का काम कभी भी फटाफट नहीं होता. तब भी नहीं, जब आप क्रॉल का अनुरोध सीधे सबमिट करते हैं.

मेरा पेज इंडेक्स में क्यों है? मेरी इच्छा नहीं है कि इसे इंडेक्स किया जाए.

Google इसे मिलने वाले किसी भी यूआरएल को इंडेक्स कर सकता है, जब तक कि आप पेज पर कोई गैर-इंडेक्स निर्देश शामिल नहीं करते हैं (या इसे हमेशा के लिए ब्लॉक न किया गया हो). साथ ही, Google किसी पेज को कई तरीकों से ढूंढ सकता है, जिनमें किसी व्यक्ति का आपके पेज को किसी दूसरी साइट से लिंक करना शामिल है.

  1. अगर आप चाहते हैं कि आपके पेज को 'Google सर्च' से ब्लॉक कर दिया जाए, तो आपको पेज के लिए किसी तरह के लॉगिन की ज़रूरत होगी या फिर आप पेज पर किसी गैर इंडेक्स निर्देश का इस्तेमाल कर सकते हैं.
  2. अगर आप चाहते हैं कि आपका पेज पहले से ही मिल जाने के बाद उसे 'Google सर्च' से हटा दिया जाए, तो आपको ये कदम उठाने होंगे.

मेरी साइट अभी तक क्रॉल क्यों नहीं हुई है?

Google, कई तरह के मापदंडों से पेज को फिर से इंडेक्स करता है, जिनमें यह भी शामिल है कि उसके मुताबिक पेज कितनी बार बदलता है. अगर आपकी साइट में अक्सर बदलाव नहीं होता है, तो इसकी रीफ़्रेश दर धीमी हो सकती है. लेकिन अगर आपके पेज में कोई बदलाव नहीं हुआ है, तो इसमें कोई दिक्कत नहीं है. अगर आपको लगता है कि आपकी साइट को रीफ़्रेश करने की ज़रूरत है, तो Google से इसे फिर से क्रॉल करने के लिए कहें.

क्या आप मेरे पेज/साइट को फिर से क्रॉल कर सकते हैं?

Google से इसे फिर से क्रॉल करने के लिए कहें.

मेरे कई सारे पेज शामिल क्यों नहीं किए गए हैं?

इंडेक्स कवरेज रिपोर्ट देखकर, आप जान सकते हैं कि पेज किन वजहों से शामिल नहीं किए गए हैं. शामिल नहीं किए जाने की ज़्यादातर वजहें इनमें से एक हैं:

  • आपके पास एक robots.txt नियम है जो हमें आपकी साइट के बड़े-बड़े सेक्शन क्रॉल नहीं करने दे रहा है. समस्या की पुष्टि करने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें.
  • आपकी साइट में बड़ी संख्या में डुप्लीकेट पेज हैं. इसकी वजह यह है कि आपकी साइट किसी सामान्य संग्रह को फ़िल्टर करने या क्रम से लगाने के लिए पैरामीटर का इस्तेमाल करती है (उदाहरण के लिए: type=dress या color=green या sort=price). ये पेज इंडेक्स कवरेज रिपोर्ट में "डुप्लीकेट" या "विकल्प" के रूप में लेबल किए जाएंगे.
  • यूआरएल, किसी दूसरे यूआरएल पर रीडायरेक्ट हो जाता है. रीडायरेक्ट यूआरएल इंडेक्स नहीं किए जाते हैं, रीडायरेक्ट टारगेट को इंडेक्स किया जाता है.

Google मेरे साइटमैप को इंडेक्स नहीं कर पा रहा है

यह देख लें कि आपका साइटमैप robots.txt से ब्लॉक नहीं हो रहा है, वह मान्य है, और यह कि आप अपनी robots.txt एंट्री या अपनी साइटमैप रिपोर्ट के सबमिशन में सही यूआरएल का इस्तेमाल कर रहे हैं. सभी के लिए उपलब्ध साइटमैप की जाँच करने वाले टूल का इस्तेमाल करके अपने साइटमैप यूआरएल की जाँच करेें. 

Google ऐसे पेज को क्यों क्रॉल कर रहा है जिसे हटा दिया गया है?

Google कुछ समय तक ऐसे सभी यूआरएल क्रॉल करना जारी रखता है जिनके बारे में जानकारी है, भले ही उनसे 4XX की गड़बड़ियां मिल रही हों. ऐसा कुछ समय की गड़बड़ी होने पर ही किया जाता है. किसी यूआरएल को क्रॉल न किया जाए, ऐसा तभी होता है जब इससे कोई गैर इंडेक्स निर्देश मिलता है.

आपको 404 वाली गड़बड़ियों की बढ़ती जा रही सूची दिखाने से बचने के लिए, इंडेक्स कवरेज रिपोर्ट सिर्फ़ वही यूआरएल दिखाती है जिनमें पिछले महीने 404 की गड़बड़ियां दिखाई दी थीं.

मुझे अपना पेज दिख रहा है, लेकिन Google को नहीं दिख रहा. ऐसा क्यों?

Google लाइव पेज को देख सकता है या नहीं इसका पता लगाने के लिए, यूआरएल की जाँच करने वाला टूल इस्तेमाल करें. अगर Google ऐसा नहीं कर पा रहा है, तो उसे इसकी वजह बतानी होगी. अगर वह ऐसा कर पा रहा है, तो शायद समस्या यह है कि पिछली बार क्रॉल करने के बाद एक्सेस की गड़बड़ी ठीक कर दी गई है. 'यूआरएल की जाँच करने वाला टूल' इस्तेमाल करके और इंडेक्स करने का अनुरोध करके एक लाइव क्रॉल चलाएं.

'यूआरएल की जाँच करने वाला टूल' कोई समस्या नहीं दिखा रहा है, लेकिन इंडेक्स कवरेज रिपोर्ट में एक गड़बड़ी दिख रही है; ऐसा क्यों?

हो सकता है कि Google के क्रॉल करने पर यूआरएल मिलने के बाद आपने गड़बड़ी ठीक कर दी हो. अपना यूआरएल क्रॉल किए जाने की तारीख देखें (यह इंडेक्स कवरेज रिपोर्ट में यूआरएल की जानकारी देने वाले पेज में या फिर यूआरएल की जाँच करने वाले टूल में इंडेक्स किए गए वर्शन व्यू में दिख जाएगी). यह तय करें कि आपने पेज क्रॉल किए जाने के बाद कोई सुधार किया है या नहीं.

स्थिति की वजहें

हर पेज की स्थिति की जो वजहें हो सकती हैं, वे नीचे दी गई हैं.

"सबमिट किए गए" बनाम "सबमिट नहीं किए गए"

जब भी आपको इंडेक्स करने की ऐसी वजह दिखाई दे जिसमें "सबमिट किए गए" शब्द हो, तो इसका मतलब है कि आपने Google से साफ़ तौर पर कहा है कि वह यूआरएल को किसी साइटमैप में शामिल करके उसे इंडेक्स करे. जब भी इसे "सबमिट नहीं किया गया" के रूप में लेबल किया गया हो, तो इसका मतलब है कि Google ने यूआरएल को खुद ही ढूंढा है (उदाहरण के लिए, किसी लिंक या दूसरे पेज से) और यह कि यूआरएल किसी भी इंडेक्स किए गए साइटमैप में नहीं है.

गड़बड़ी वाले पेज


गड़बड़ियों वाले पेजों को इंडेक्स नहीं किया गया है.


सर्वर में गड़बड़ी (5xx): पेज देखने के लिए अनुरोध करने पर आपके सर्वर से 500-लेवल वाले कोड की गड़बड़ी का मैसेज मिला. सर्वर की गड़बड़ियां ठीक करना देखें.

रीडायरेक्ट से जुड़ी गड़बड़ी: यूआरएल में रीडायरेक्ट से जुड़ी गड़बड़ी मिली. यह गड़बड़ी नीचे दिए गए प्रकारों में से एक हो सकती है: यह एक बहुत ही लंबी रीडायरेक्ट चेन थी; यह एक रीडायरेक्ट लूप था; आखिर में दूसरा वेबलिंक, यूआरएल की लंबाई की तय सीमा से ज़्यादा बड़ा हो गया; रीडायरेक्ट चेन में गलत या खाली यूआरएल मौजूद था.

सबमिट किए गए ऐसे यूआरएल, जिन पर robots.txt के ज़रिए रोक लगाई गई है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन पेज पर robots.txt के ज़रिए रोक लगी है. robots.txt की जाँच करने वाले टूल का इस्तेमाल करके अपने पेज की जाँच करें.

सबमिट किए गए यूआरएल की पहचान 'noindex' के तौर पर की गई: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया, लेकिन इसके मेटा टैग या एचटीटीपी हेडर में 'noindex' डायरेक्टिव दिया गया है. अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको मेटा टैग या एचटीटीपी हेडर हटाना होगा.

सबमिट किए गए यूआरएल से मिली गड़बड़ी 'सॉफ़्ट 404' जैसी लग रही है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन सर्वर से मिला मैसेज सॉफ़्ट 404 की गड़बड़ी वाला लग रहा है.

सबमिट किए गए यूआरएल से 'बिना मंज़ूरी वाले अनुरोध' का मैसेज मिला (401): आपने इस पेज को इंडेक्स करने के लिए सबमिट किया है, लेकिन Google को रिस्पॉन्स के तौर पर 401 (मंज़ूरी नहीं) वाली गड़बड़ी का मैसेज मिला है. ऐसे में, इस पेज के लिए ज़रूरी मंज़ूरी लेने की शर्त हटाएं या Googlebot की पहचान की पुष्टि करके उसे अपने पेज देखने की मंज़ूरी दें.

सबमिट किया गया यूआरएल नहीं मिला (404): आपने इंडेक्स करने के लिए ऐसा यूआरएल सबमिट किया है, जो मौजूद नहीं है. 404 कोड वाली गड़बड़ियों को ठीक करना देखें.

सबमिट किए गए यूआरएल में क्रॉल करने से जुड़ी समस्या है: आपने इस पेज को इंडेक्स करने के लिए सबमिट किया और Google को क्रॉल करने में ऐसी गड़बड़ी मिली, जिसके बारे में जानकारी नहीं है. यह गड़बड़ी ऊपर दी गई दूसरी सभी गड़बड़ियों से अलग है. यूआरएल की जाँच करने वाले टूल का इस्तेमाल करके अपने पेज को डीबग करने की कोशिश करें.

चेतावनी वाले पेज


हो सकता है कि आपको चेतावनी वाले पेज़ों पर ध्यान देना पड़े. इसके साथ ही यह भी हो सकता है कि उन्हें खास नतीजे के हिसाब से इंडेक्स किया गया हो या न किया गया हो.


robots.txt के ज़रिए रोक लगाए जाने के बाद भी इंडेक्स किया गया: हालांकि, पेज पर robots.txt के ज़रिए रोक लगाई गई है, फिर भी इसे इंडेक्स किया गया. (Google हमेशा robots.txt के हिसाब से काम करता है, लेकिन अगर कोई व्यक्ति robot.txt में शामिल पेज का लिंक अपनी साइट पर देता है, तो पेज को इंडेक्स किया जा सकता है). इसे चेतावनी के तौर पर इसलिए दिखाया जाता है, क्योंकि हमें इस बारे में ठीक से नहीं पता है कि आप इस पेज को खोज के नतीजों में दिखाने से रोकना चाहते हैं या नहीं. अगर आप इस पेज पर रोक लगाना चाहते हैं, तो इंडेक्स किए जाने से रोकने के लिए robots.txt का इस्तेमाल करना सही तरीका नहीं है. इंडेक्स किए जाने से रोकने के लिए आपको 'noindex' का इस्तेमाल करना चाहिए या इसके लिए अनुमति लेना ज़रूरी बनाना चाहिए, ताकि पहचान ज़ाहिर किए बिना आपका पेज एक्सेस न किया जा सके. robots.txt टेस्टर का इस्तेमाल करके आप यह जान सकते हैं कि इस पेज पर किस नियम के मुताबिक रोक लगाई जा रही है. robots.txt की वजह से हो सकता है कि दिखाया गया कोई भी स्निपेट इस पेज के लिए एकदम सही न हो. अगर आप इस पेज पर रोक नहीं लगाना चाहते हैं, तो अपने पेज पर लगी रोक को हटाने के लिए robots.txt फ़ाइल में बदलाव करें.

मान्य पेज


जिन पेजों की स्थिति ठीक है, वे इंडेक्स किए जा चुके हैं.

सबमिट और इंडेक्स किया गया: आपने यूआरएल को इंडेक्स करने के लिए सबमिट किया और उसे इंडेक्स किया गया.

इंडेक्स किया गया, लेकिन साइटमैप में सबमिट नहीं किया गया: Google ने यूआरएल खोजकर उसे अपने आप इंडेक्स किया. हम सभी ज़रूरी यूआरएल को साइटमैप इस्तेमाल करके सबमिट करने का सुझाव देते हैं.

इंडेक्स में शामिल नहीं किए गए पेज


आम तौर पर ये पेज इंडेक्स नहीं किए जाते हैं और हमें लगता है कि यह सही है. ये पेज या तो इंडेक्स किए गए पेजों के डुप्लीकेट हैं या आपकी साइट पर कुछ तरीकों से इन्हें इंडेक्स करने पर रोक लगी है. अगर इनमें से कोई वजह नहीं है, तो ये किसी ऐसी वजह से इंडेक्स नहीं किए गए, जिसे हम गड़बड़ी नहीं मानते हैं.


‘noindex’ टैग इस्तेमाल करके पेज को इंडेक्स करने पर रोक लगाई गई: जब Google ने इस पेज को इंडेक्स करने की कोशिश की तब 'noindex' निर्देश/2} मिला, इसलिए इसे इंडेक्स नहीं किया गया. अगर आप इस पेज को इंडेक्स नहीं कराना चाहते हैं, तो यह अच्छी बात है कि इसे इंडेक्स नहीं किया गया! अगर आप चाहते हैं कि इस पेज को इंडेक्स किया जाए, तो आपको 'noindex' डायरेक्टिव हटाना होगा.

पेज हटाने वाला टूल इस्तेमाल करके, पेज को इंडेक्स करने पर रोक लगाई गई: फ़िलहाल, यूआरएल हटाने के अनुरोध की वजह से पेज पर रोक लगी है. अगर साइट के मालिक के तौर पर आपकी पुष्टि की जा चुकी है, तो आप यूआरएल हटाने वाला टूल इस्तेमाल कर सकते हैं. इससे आप देख सकते हैं कि इसे हटाने का अनुरोध किसने किया है. यह अनुरोध, हटाए जाने की तारीख के 90 दिनों तक ही काम करते हैं. इस समय सीमा के बाद, भले ही आप दोबारा इंडेक्स करने का अनुरोध सबमिट न करें, फिर भी हो सकता है कि Googlebot उस पेज पर दोबारा जाए और उसे इंडेक्स करे. अगर आप नहींं चाहते कि पेज को इंडेक्स किया जाए, तो 'noindex' इस्तेमाल करें, पेज देखने के लिए अनुमति लेना ज़रूरी बनाएं या पेज हटा दें.

robots.txt इस्तेमाल करके पेज को इंडेक्स करने पर रोक लगाई गई: robots.txt फ़ाइल इस्तेमाल करके, इस पेज पर आने से Googlebot को रोका गया है. robots.txt टेस्टर इस्तेमाल करके आप जान सकते हैं कि क्या वाकई ऐसा किया गया है. ध्यान दें, इसका यह मतलब नहीं है कि किसी दूसरे तरीके से पेज इंडेक्स नहीं किया जा सकता. अगर इस पेज को लोड किए बगैर Google को इसके बारे में दूसरी जानकारी मिल जाती है तो, हो सकता है कि पेज इंडेक्स कर दिया जाए (हालांकि आम तौर पर ऐसा नहीं होता). यह पक्का करने के लिए कि Google इस पेज को इंडेक्स न करे, आप robots.txt के ज़रिए लगाई गई रोक हटाएं और 'noindex' डायरेक्टिव इस्तेमाल करें.

बिना मंज़ूरी वाले अनुरोध (401) की वजह से पेज को इंडेक्स करने पर रोक लगाई गई: पेज देखने के लिए मंज़ूरी लेने के अनुरोध (401 रिस्पॉन्स) की वजह से Googlebot को पेज देखने से रोका गया. अगर आप चाहते हैं कि Googlebot इस पेज को क्रॉल करे, तो पेज को देखने के लिए मंज़ूरी लेने की शर्त हटाएं या Googlebot को अपने पेज का एक्सेस दें.

क्रॉल करने में समस्या: इस यूआरएल को फ़ेच करने में एक ऐसी गड़बड़ी हुई, जिसकी पहचान नहीं की जा सकी. इसका मतलब है कि 4xx - या 5xx -लेवल वाला रिस्पॉन्स कोड भेजा जा सकता है. पेज को फ़ेच करने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें और देखें कि क्या इससे भी यूआरएल फ़ेच करने में कोई समस्या आ रही है. पेज इंडेक्स नहीं किया गया.

क्रॉल किया गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज को क्रॉल किया है, लेकिन इंडेक्स नहीं किया. हो सकता है कि आने वाले समय में इसे इंडेक्स किया जाए या ना किया जाए; क्रॉल करने के लिए इस यूआरएल को दोबारा सबमिट करने की ज़रूरत नहीं है.

खोजा गया - अभी इंडेक्स नहीं किया गया है: Google ने पेज ढूंढ लिया है, लेकिन इसे अभी तक क्रॉल नहीं किया है. Google ने यूआरएल को क्रॉल करने की कोशिश की, लेकिन तब साइट ओवरलोड थी; इसलिए Google उसे बाद में क्रॉल करने की कोशिश करेगा. इस वजह से रिपोर्ट में पिछली बार क्रॉल करने की तारीख नहीं दी गई है.

सही कैननिकल टैग वाला वैकल्पिक पेज: यह पेज उस पेज का डुप्लीकेट है, जिसकी पहचान Google ने कैननिकल के तौर पर की है. यह पेज कैननिकल पेज पर सही तरीके से ले जाता है, यानी इसके लिए आपको कुछ करने की ज़रूरत नहीं है.

डुप्लीकेट यूआरएल, जो उपयोगकर्ता के कैननिकल यूआरएल चुने बिना मौजूद है: इस पेज के कई डुप्लीकेट पेज हैं, लेकिन किसी को भी कैननिकल के तौर पर नहीं चुना गया है. हमें लगता है कि यह पेज कैननिकल नहीं है. आपको साफ़ तौर पर इस पेज के लिए कैननिकल का टैग जोड़ना होगा. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए, जो Google ने चुना है.

डुप्लीकेट पेज, Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना: यह पेज कई पेजों के लिए कैननिकल के तौर पर चुना गया, लेकिन Google को लगता है कि कोई दूसरा यूआरएल इससे बेहतर कैननिकल हो सकता है. Google ने इस पेज की जगह उस पेज को इंडेक्स किया, जिसे हम कैननिकल मानते हैं. हमारा सुझाव है कि आप साफ़ तौर पर इस पेज को कैननिकल यूआरएल के डुप्लीकेट पेज के तौर पर तय करें. इस पेज को Google ने ढूंढा है और इसे क्रॉल करने के लिए साफ़ तौर पर कोई अनुरोध नहीं किया गया है. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए जिसे Google ने चुना है.

नहीं मिला (404): इस पेज को देखने का अनुरोध करने पर 404 कोड वाली गड़बड़ी मिली. यह यूआरएल Google ने अपने आप ढूंढा था और इसे क्रॉल करने के लिए साफ़ तौर पर कोई अनुरोध नहीं किया गया था, न ही इसे किसी साइटमैप के ज़रिए सबमिट किया गया था. शायद Google ने इस यूआरएल को किसी दूसरी साइट के लिंक के तौर पर ढूंढा है या हो सकता है कि यह पेज पहले मौजूद था और बाद में इसे हटा दिया गया था. Googlebot कुछ समय के लिए इस यूआरएल को क्रॉल करना जारी रख सकता है, क्योंकि ऐसा कोई तरीका नहीं है जिससे Googlebot को कोई यूआरएल हमेशा के लिए भूलने के लिए कहा जा सके. हालांकि, समय के साथ Googlebot इस यूआरएल को कम क्रॉल करेगा. अगर जानबूझकर 404 वाला कोड दिखाने के लिए सेट किया गया है, तो इसमें कोई समस्या नहीं है. अगर आपके पेज की जगह बदल गई है, तो नई जगह पर ले जाने के लिए 301 कोड वाले रीडायरेक्ट का इस्तेमाल करें. 404 कोड वाली गड़बड़ियां ठीक करना लेख पढ़ें

कानूनी शिकायत की वजह से पेज हटा दिया गया है: कानूनी शिकायत की वजह से पेज को इंडेक्स से हटा दिया गया है.

किसी दूसरे वेबलिंक पर रीडायरेक्ट करने वाला पेज: यह किसी दूसरे वेबलिंक पर रीडायरेक्ट करने वाला यूआरएल है, इसलिए इसे इंडेक्स नहीं किया गया.

सॉफ़्ट 404: पेज देखने की कोशिश करने पर हमें लगता है कि नतीजे के तौर पर सॉफ़्ट 404 रिस्पॉन्स मिलता है. इसका मतलब है कि इस पेज को देखने की कोशिश करने पर इससे जुड़ा 404 कोड वाला मैसेज नहीं दिखता. हालांकि, इसमें "नहीं मिला" का ऐसा मैसेज दिखता है, जो उपयोगकर्ता को आसानी से समझ आ सके. हमारा सुझाव है कि आप "नहीं मिला" गड़बड़ी वाले पेजों के लिए 404 रिस्पॉन्स कोड दिखाएं. ऐसा करने के बजाय आप पेज पर ज़्यादा जानकारी जोड़कर हमें बता सकते हैं कि इस पेज में 'सॉफ़्ट 404' वाली गड़बड़ी नहीं है. और जानें

डुप्लीकेट, सबमिट किए गए यूआरएल को कैननिकल के तौर पर नहीं चुना गया है: दिया गया यूआरएल, डुप्लीकेट यूआरएल के सेट में से एक है और साफ़ तौर पर इसकी पहचान कैननिकल पेज के रूप में नहीं की गई है. आपने साफ़ तौर पर इस यूआरएल को इंडेक्स करने का अनुरोध किया, लेकिन Google ने इसे इंडेक्स नहीं किया. ऐसा इसलिए हुआ क्योंकि यह एक डुप्लीकेट पेज है. साथ ही, Google को लगता है कि दूसरा यूआरएल, कैननिकल होने के लिए बेहतर है. इसलिए, Google ने अपने चुने गए कैननिकल को इंडेक्स किया. (Google डुप्लीकेट यूआरएल के सेट में से सिर्फ़ कैननिकल पेज को इंडेक्स करता है.) इस स्थिति और "Google ने उपयोगकर्ता के चुने गए कैननिकल पेज के बजाय दूसरा कैननिकल पेज चुना" में यह अंतर है कि इस मामले में आपने इंडेक्स करने का अनुरोध साफ़ तौर पर किया था. इस यूआरएल की जाँच करने पर वह कैननिकल यूआरएल दिखना चाहिए, जिसे Google ने चुना है.

 

ऐसी समस्याएं जिनके बारे में पहले से जानकारी है

नए Search Console के इस बीटा वर्शन में कुछ ऐसी गड़बड़ियां हैं जिनके बारे में हम पहले से जानते हैं. इन गड़बड़ियों की जानकारी यहां दी गई है. इन समस्याओं के बारे में हमें रिपोर्ट करने की ज़रूरत नहीं है, लेकिन हम चाहते हैं कि आप इसमें मिलने वाली दूसरी सुविधाओं या गड़बड़ियों के बारे में हमें अपने सुझाव ज़रूर दें. नेविगेशन बार में मौजूद सुझाव देने का तरीका इस्तेमाल करें.

  • इंडेक्स करने से जुड़ा डेटा रोज़ अपडेट नहीं किया जाता है. इसलिए डेटा दिखाई देने में कुछ दिनों का समय लग सकता है. इसके अलावा, न मिल पाने वाला डेटा इंटरपोलेट करके दिखाया जाता है.
  • चार्ट में पिछले 90 दिनों का डेटा शामिल होना चाहिए. लेकिन हो सकता है कि फ़िलहाल इससे कम समय का डेटा दिखाई दे. 
  • साइटमैप ड्रॉपडाउन फ़िल्टर में सिर्फ़ Search Console या robots.txt निर्देश इस्तेमाल करके सबमिट किए गए साइटमैप शामिल होते हैं.
  • स्थिति की सूची बेहतर बनाई जा रही है और उसमें बदलाव हो सकते हैं, उदाहरण के लिए, 'गड़बड़ी' के रूप में लेबल किए गए आइटम में अलग-अलग तरह के जवाब (4xx/5xx) होंगे.
क्‍या यह लेख उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?