अपने साइटमैप प्रबंधित करें

साइटमैप बनाना और सबमिट करना

इस पेज पर, साइटमैप बनाने और उसे Google के लिए उपलब्ध कराने का तरीका बताया गया है. साइटमैप के बारे में ज़्यादा जानें.

साइटमैप बनाना और सबमिट करना:

  1. यह तय करें कि Google आपकी साइट के किस-किस पेज को क्रॉल करे. साथ ही, हर पेज का कैननिकल वर्शन भी तय कर लें. 
  2. तय करें कि आप किस साइटमैप फ़ॉर्मैट का इस्तेमाल करना चाहते हैं. आप अपना साइटमैप मैन्युअल तरीके से बना सकते हैं. इसके अलावा, इसे बनाने के लिए, दिए गए तीसरे पक्ष के टूल में से किसी एक का इस्तेमाल भी कर सकते हैं.
  3. अपने साइटमैप को Google के लिए उपलब्ध कराने के लिए, इसे अपनी robot.txt फ़ाइल में जोड़ें या सीधे Search Console को सबमिट करें.

साइटमैप के फ़ॉर्मैट

Google पर साइटमैप के कई फ़ॉर्मैट इस्तेमाल किए जा सकते हैं. इनके बारे में यहां बताया गया है. Google पर सभी फ़ॉर्मैट के लिए स्टैंडर्ड साइटमैप प्रोटोकॉल का इस्तेमाल किया जाना चाहिए. Google, फ़िलहाल साइटमैप में <priority> विशेषता का इस्तेमाल नहीं करता.

सभी फ़ॉर्मैट में, एक साइटमैप का साइज़ 50 एमबी (बिना कंप्रेस किए) से कम होना चाहिए. साथ ही, उसमें यूआरएल की कुल संख्या 50,000 से ज़्यादा नहीं होनी चाहिए. अगर आपकी फ़ाइल का साइज़ इससे बड़ा है या आपके पास इससे ज़्यादा यूआरएल हैं, तो आपको अपनी सूची को कई साइटमैप में बांटना होगा. इसके अलावा, आप एक साइटमैप इंडेक्स फ़ाइल (एक ऐसी फ़ाइल जिसमें साइटमैप की सूची शामिल होती है) भी बना सकते हैं और उस फ़ाइल को Google को सबमिट कर सकते हैं. आप Google को एक से ज़्यादा साइटमैप और/या साइटमैप इंडेक्स फ़ाइलें सबमिट कर सकते हैं.

एक्सएमएल

यहां एक बुनियादी एक्सएमएल साइटमैप दिया गया है, जिसमें एक यूआरएल की जगह की जानकारी शामिल है:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

आप sitemaps.org पर बेहतर उदाहरण और पूरे दस्तावेज़ देख सकते हैं.

आप किसी दूसरी भाषा के पेजों के बारे में बताने वाले साइटमैप और समाचार, इमेज या वीडियो फ़ाइल के लिए साइटमैप जैसे उदाहरण देख सकते हैं.

आरएसएस, एमआरएसएस, और एटम 1.0

अगर आपके ब्लॉग में आरएसएस या एटम फ़ीड शामिल है, तो आप फ़ीड के यूआरएल को साइटमैप के तौर पर सबमिट कर सकते हैं. ज़्यादातर ब्लॉग सॉफ़्टवेयर आपके लिए फ़ीड बना सकते हैं, लेकिन इस बात का ध्यान रखें कि यह फ़ीड सिर्फ़ हाल ही के यूआरएल की जानकारी देता है.

  • Google पर आरएसएस 2.0 और एटम 1.0 फ़ीड का इस्तेमाल किया जा सकता है.
  • आप Google को अपनी साइट पर मौजूद वीडियो सामग्री की जानकारी देने के लिए एमआरएसएस (मीडिया आरएसएस) फ़ीड का इस्तेमाल कर सकते हैं.
टेक्स्ट

अगर आपके साइटमैप में सिर्फ़ वेब पेज से जुड़े यूआरएल शामिल हैं, तो आप Google को एक सामान्य टेक्स्ट फ़ाइल भेज सकते हैं जिसमें सभी यूआरएल एक के बाद एक लिखे हों. उदाहरण के लिए:

http://www.example.com/file1.html
http://www.example.com/file2.html

टेक्स्ट फ़ाइल वाले साइटमैप के लिए दिशा-निर्देश:

  • UTF-8 एन्कोडिंग का इस्तेमाल करके अपनी फ़ाइल को कोड में बदलें.
  • आपकी टेक्स्ट फ़ाइल में यूआरएल की सूची के अलावा कुछ नहीं होना चाहिए.
  • आप टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दे सकते हैं, लेकिन ध्यान रखें कि उसका एक्सटेंशन .txt हो (जैसे कि sitemap.txt).
Google साइटें

अगर आपने Google Sites का इस्तेमाल करके कोई साइट बनाई है और उसकी पुष्टि की है, तो Google Sites से आपके लिए अपने-आप एक साइटमैप बन जाएगा. आप साइटमैप में बदलाव नहीं कर सकते, लेकिन अगर आप साइटमैप की रिपोर्ट का डेटा देखना चाहते हैं, तो आप उसे Google को सबमिट कर सकते हैं. ध्यान रखें कि अगर आपके पास किसी सब-डायरेक्ट्री में 1,000 से ज़्यादा पेज हैं, तो शायद आपका साइटमैप ठीक तरह से दिखाई न दे.

  • अगर आपकी साइट Google Sites पर होस्ट की जाती है, तो आपके साइटमैप का यूआरएल http://sites.google.com/site/yoursitename/system/feeds/sitemap होगा
  • अगर आपने अपनी साइट बनाने के लिए Google के ऐप्लिकेशन इस्तेमाल किए हैं, तो आपके साइटमैप का यूआरएल http://sites.google.com/yourdomain/yoursitename/system/feeds/sitemap होगा

किसी दूसरे तरह के मीडिया के लिए साइटमैप एक्सटेंशन

नीचे बताए गए अलग-अलग तरह के मीडिया के लिए, Google पर एक्सटेंशन से जुड़े साइटमैप सिंटेक्स इस्तेमाल किए जा सकते हैं. अपनी साइट पर मौजूद वीडियो फ़ाइलों, इमेज, और पार्स करने में मुश्किल सामग्री के बारे में बताने के लिए इन एक्सटेंशन का इस्तेमाल करें. इससे इन संसाधनों को बेहतर तरीके से इंडेक्स किया जा सकेगा.

साइटमैप से जुड़े सामान्य दिशा-निर्देश

  • ऐसे यूआरएल इस्तेमाल करें जो साइट के नाम जैसे ही हों और सभी शर्तें पूरी करते हों. Google आपके यूआरएल को ठीक वैसे ही क्रॉल करेगा जैसे वे लिस्ट होंगे. उदाहरण के लिए, अगर आपकी साइट https://www.example.com/ पर है, तो यूआरएल को https://example.com/ (www मौजूद नहीं) या ./mypage.html (मिलते-जुलते यूआरएल) के तौर पर न दिखाएं.
  • साइटमैप को आपकी साइट पर कहीं भी पोस्ट किया जा सकता है, लेकिन कोई साइटमैप सिर्फ़ पैरंट डायरेक्ट्री से निकले रूप पर ही असर डालता है. इसलिए, साइट रूट पर पोस्ट किया गया साइटमैप, साइट की सभी फ़ाइलों पर असर डाल सकता है. यही वजह है कि हम इसमें साइटमैप पोस्ट करने का सुझाव देते हैं.
  • अपने साइटमैप में यूआरएल का सत्र आईडी शामिल न करें. इससे उन यूआरएल की डुप्लीकेट क्रॉलिंग कम हो जाएगी.
  • hreflang व्याख्याओं का इस्तेमाल करके Google को यूआरएल के दूसरी भाषाओं के वर्शन के बारे में बताएं.
  • यह ज़रूरी है कि साइटमैप फ़ाइलें, UTF-8 कोड में बदली गई हों. साथ ही, उन्हें ठीक तरह से यूआरएल एस्केप किया गया हो.
  • बड़े साइटमैप को छोटे साइटमैप में बांटें: बिना कंप्रेस किए साइटमैप का साइज़ ज़्यादा से ज़्यादा 50,000 यूआरएल/50 एमबी है. अलग-अलग साइटमैप सबमिट करने के बजाय, साइटमैप इंडेक्स फ़ाइल का इस्तेमाल करके सभी साइटमैप की सूची बनाएं. इसके बाद, इस फ़ाइल को Google पर सबमिट करें.
  • अपने साइटमैप में सिर्फ़ कैननिकल यूआरएल की सूची बनाएं. अगर आपके पास किसी पेज के दो वर्शन हैं, तो साइटमैप में सिर्फ़ (Google के चुने हुए) कैननिकल की सूची बनाएं. अगर आपकी साइट के दो वर्शन हैं (उदाहरण के लिए, www वाला और बिना www वाला), तो तय करें कि आपकी पसंदीदा साइट कौनसी है. वहां साइटमैप रखें और rel=canonical जोड़ें या किसी दूसरी साइट पर रीडायरेक्ट करें.
  • अगर आपकी साइट के मोबाइल और डेस्कटॉप वर्शन के यूआरएल अलग-अलग हैं, तो हमारा सुझाव है कि आप साइटमैप में सिर्फ़ एक वर्शन के बारे में बताएं. अगर आप दोनों यूआरएल देना चाहते हैं, तो दोनों यूआरएल लिखें और यह भी बताएं कि कौनसा यूआरएल, डेस्कटॉप वर्शन का है और कौनसा मोबाइल वर्शन का है.
  • वीडियो, इमेज, और समाचार जैसे किसी दूसरे तरह के मीडिया के बारे में बताने के लिए, साइटमैप एक्सटेंशन का इस्तेमाल करें.
  • अगर अलग-अलग भाषाओं या इलाकों के लिए आपकी साइट के अलग-अलग पेज हैं, तो आप साइटमैप या एचटीएमएल टैग में hreflang का इस्तेमाल करके इन अलग-अलग पेजों के यूआरएल के बारे में जानकारी दे सकते हैं.
  • ऐसे वर्ण जो अक्षर या अंक नहीं हैं या फिर लैटिन भाषा में नहीं हैं. आपकी साइटमैप फ़ाइल UTF-8 कोड में बदली हुई होनी चाहिए (आप फ़ाइल सेव करते समय ऐसा कर सकते हैं). सभी एक्सएमएल फ़ाइलों की तरह, डेटा से जुड़े किसी भी मान (जिसमें यूआरएल भी शामिल हैं) के लिए यह ज़रूरी है कि वह नीचे दी गई टेबल में मौजूद वर्णों के लिए एंटिटी एस्केप कोड का इस्तेमाल करे.  साइटमैप में सिर्फ़ ASCII वर्ण ही शामिल किए जा सकते हैं; इसमें अंग्रेज़ी (रोमन स्क्रिप्ट) के बड़े अक्षरों वाले ASCII वर्ण, कुछ चुनिंदा नियंत्रण कोड या खास वर्ण, जैसे कि * और {} शामिल नहीं किए जा सकते. अगर आपके साइटमैप में ये वर्ण हैं, तो इसे जोड़ते समय कोई गड़बड़ी दिखेगी.
    वर्ण एस्केप कोड
    एम्परसैंड & &amp;
    सिंगल कोट ' &apos;
    डबल कोट " &quot;
    इससे ज़्यादा > &gt;
    इससे कम < &lt;
    इसके अलावा, सभी यूआरएल (इनमें आपके साइटमैप का यूआरएल भी शामिल है) को उस सर्वर के हिसाब से पढ़े जाने के लिए कोड में बदला जाना चाहिए जिस पर वे मौजूद हैं और उनका यूआरएल एस्केप किया गया है. अगर आप यूआरएल बनाने के लिए किसी तरह की स्क्रिप्ट, टूल या लॉग फ़ाइल (उन्हें हाथ से टाइप करने के अलावा किसी भी तरीके से) का इस्तेमाल कर रहे हैं, तो आम तौर पर यह काम आपके लिए पहले ही किया जा चुका होता है. साइटमैप सबमिट करते समय, अगर आपको इस गड़बड़ी की सूचना मिलती है कि Google को आपके कुछ यूआरएल नहीं मिल रहे हैं, तो इस बात की अच्छी तरह से जांच कर लें कि आपके यूआरएल, यूआरआई के RFC-3986 मानक, आईआरआई के RFC-3987 मानक, और एक्सएमएल मानक का पालन करते हैं.

    यहां एक ऐसे यूआरएल का उदाहरण दिया है जिसमें गैर-ASCII वर्ण (ü) और एक ऐसा वर्ण (&) है जिसे एंटिटी एस्केप की ज़रूरत है:
    http://www.example.com/ümlat.html&q=name
    यह ISO-8859-1 कोड (वह एन्कोडिंग इस्तेमाल करने वाले सर्वर पर होस्ट करने के लिए) में बदला गया और यूआरएल एस्केप किया गया वही यूआरएल है:
    http://www.example.com/%FCmlat.html&q=name
    यह UTF-8 कोड (सर्वर पर होस्ट करने के लिए जो उस एन्कोडिंग का इस्तेमाल करता है) में बदला गया और यूआरएल एस्केप किया गया वही यूआरएल है:
    http://www.example.com/%C3%BCmlat.html&q=name
    यह एंटिटी एस्केप किया गया वही यूआरएल है:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • याद रखें कि साइटमैप, Google को यह बताने के लिए सुझाव हैं कि आप किन पेजों को ज़रूरी मानते हैं; Google किसी साइटमैप में मौजूद हर यूआरएल को क्रॉल करने का वादा नहीं करता है.
  • Google <priority> और <changefreq> मानों को अनदेखा करता है, इसलिए उन्हें जोड़ने के लिए परेशान न हों.
  • Google <lastmod> मान को पढ़ता है, लेकिन अगर आप इस मान को गलत तरीके से पेश करते हैं, तो हम उसे पढ़ना बंद कर देंगे.
  • साइटमैप में यूआरएल की स्थिति मायने नहीं रखती. Google, यूआरएल को उस क्रम में क्रॉल नहीं करता जिस क्रम में वे आपके साइटमैप में दिखते हैं.

अपना साइटमैप Google को उपलब्ध कराना (अपना साइटमैप Google को सबमिट करना)

Google हर बार साइट क्रॉल करने पर साइटमैप की जांच नहीं करता; साइटमैप को सिर्फ़ पहली बार देखे जाने पर ही उसकी जांच की जाती है. इसके बाद, सिर्फ़ तब उसकी जांच होती है, जब आप हमें यह बताते हैं कि उसमें बदलाव हुआ है. आपको Google को साइटमैप के बारे में सिर्फ़ तभी सूचना देनी चाहिए, जब यह नया हो या अपडेट किया गया हो; ऐसे साइटमैप बार-बार सबमिट या पिंग न करें जिनमें कोई भी बदलाव नहीं हुआ.

Google को अपना साइटमैप उपलब्ध कराने के कुछ तरीके ये हैं:

  • Search Console के साइटमैप टूल का इस्तेमाल करके इसे Google को सबमिट करना
  • आपके साइटमैप पर कैसे पहुंचा जा सकता है, इसकी जानकारी देने के लिए robots.txt फ़ाइल में कहीं भी यह लाइन शामिल करें:
    Sitemap: http://example.com/sitemap_location.xml
  • हमसे अपने साइटमैप को क्रॉल करवाने के लिए "पिंग" फ़ंक्शन का इस्तेमाल करें. एचटीटीपी GET अनुरोध इस तरह भेजें:
      http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    उदाहरण के लिए:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

साइटमैप की समस्या हल करना

साइटमैप की समस्या हल करने की गाइड देखें.

क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?