डुप्लीकेट यूआरएल को एक करना

एक जैसे या डुप्लीकेट पेजों के लिए कैननिकल पेज तय करें

अगर आपकी साइट पर एक ऐसा पेज है जिसके कई यूआरएल हैं या एक जैसी सामग्री वाले कई पेज हैं (जैसे, कोई ऐसा पेज जिसके मोबाइल और डेस्कटॉप, दोनों वर्शन हैं), तो Google उन्हें एक ही पेज के डुप्लीकेट वर्शन मानता है. Google उस पेज के किसी एक यूआरएल काे कैननिकल वर्शन के तौर पर चुनकर उसे क्रॉल करेगा. बाकी सभी यूआरएल काे डुप्लीकेट यूआरएल मानकर उन्हें कभी-कभार क्रॉल करेगा. 

अगर आप साफ़ ताैर पर Google को यह नहीं बताएंगे कि किस यूआरएल को कैननिकल माना जाए, तो Google अपने हिसाब से कैननिकल यूआरएल चुन लेगा या दाेनाें ही यूआरएल काे बराबर मान लेगा. इससे आपके पेज, खोज नतीजों में ठीक से काम नहीं करेंगे. इस बारे में ज़्यादा जानकारी, नीचे दिए गए सेक्शन मुझे कैननिकल यूआरएल क्यों चुनना चाहिए? में माैजूद है.

कैननिकल यूआरएल क्या है?
कैननिकल यूआरएल उस पेज का यूआरएल होता है जिसे Google आपकी साइट पर मौजूद डुप्लीकेट पेजों में से सबसे ज़रूरी मानता है. मान लीजिए आपके पास एक ही पेज के कई यूआरएल हैं (जैसे: example.com?dress=1234 और example.com/dresses/1234), तो Google उनमें से एक यूआरएल को कैननिकल के तौर पर चुन लेता है. ध्यान दें, यह ज़रूरी नहीं है कि पेज बिल्कुल एक जैसे हों; डुप्लीकेट पेजों पर सामग्री का क्रम बदलने या फ़िल्टर लगाने जैसे छोटे बदलाव करने से उन्हें अलग पेज के तौर पर नहीं गिना जाता (उदाहरण के लिए, कीमत के हिसाब से क्रम लगाने या आइटम को रंग के हिसाब से फ़िल्टर करने पर).
कैननिकल पेज किसी डुप्लीकेट पेज के बजाय दूसरे डोमेन से भी तय किया जा सकता है.
ज़्यादा जानकारी
Googlebot किसी साइट को इंडेक्स करते समय यह पता करता है कि हर पेज की मुख्य सामग्री क्या है. अगर Googlebot को एक ही साइट पर एक जैसे कई पेज मिलते हैं, तो वह उस पेज को चुनता है जो उसे सबसे ज़्यादा जानकारी देने वाला और काम का लगता है. वह उस पेज को कैननिकल पेज तय कर देता है. आपकी साइट के कैननिकल पेजों को नियमित रूप से क्रॉल किया जाएगा. डुप्लीकेट पेजों को कभी-कभार क्रॉल किया जाएगा. इससे आपकी साइट पर Google क्रॉलिंग के लोड को कम करने में मदद मिलती है.
Google कई चीज़ों (या संकेतों) के हिसाब से कैननिकल पेज चुनता है. उदाहरण के लिए, पेज को एचटीटीपी या एचटीटीपीएस के ज़रिए दिखाया जाता है या नहीं; उपयोगकर्ता ने कोई पसंदीदा डोमेन तो तय नहीं किया है; किस पेज की क्वॉलिटी बेहतर है; क्या पेज का यूआरएल साइटमैप में शामिल किया गया है, और "rel=canonical" का इस्तेमाल किया गया है या नहीं. आप इन तरीकों से Google को अपनी पसंद बता सकते हैं. इसके बाद भी, Google किसी दूसरे पेज को कैननिकल पेज चुन सकता है. इसकी कई वजहें हो सकती हैं.
किसी पेज के अलग-अलग भाषाओं वाले वर्शन को तभी डुप्लीकेट माना जाता है जब पेज की मुख्य सामग्री उसी भाषा में हो (इसका मतलब यह है कि पेजों के सिर्फ़ हेडर, फ़ुटर या दूसरे गैर ज़रूरी टेक्स्ट का अनुवाद तो किया जाए, लेकिन मुख्य लेख एक ही भाषा में मौजूद हो).
सामग्री और क्वॉलिटी का आकलन करने के लिए, Google मुख्य रूप से कैननिकल पेजों का इस्तेमाल करता है. 'Google सर्च' के नतीजों में आम तौर पर कैननिकल पेज को ही दिखाया जाता है. हालांकि, अगर किसी उपयोगकर्ता के लिए कोई डुप्लीकेट पेज बेहतर हो तब ऐसा नहीं होता. उदाहरण के लिए, अगर उपयोगकर्ता किसी मोबाइल डिवाइस पर कुछ खोज रहा हो, तो खोज नतीजों में शायद मोबाइल पेज ही दिखाया जाएगा. भले ही डेस्कटॉप पेज को कैननिकल पेज तय किया गया हो.

मेरी साइट पर एक जैसे/डुप्लीकेट पेज क्यों होंगे?

आपकी साइट पर एक ही पेज के अलग-अलग यूआरएल हो सकते हैं. साथ ही, अलग-अलग यूआरएल पर डुप्लीकेट या एक जैसे दिखने वाले पेज भी हो सकते हैं. इसकी सबसे आम वजहें यहां दी गई हैं:

  • कई तरह के डिवाइस पर काम करने के लिए:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • खोज पैरामीटर या सत्र आईडी जैसी चीज़ों के लिए डाइनैमिक यूआरएल चालू करना:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • जब आप एक ही पोस्ट कई सेक्शन में डालते हैं, तो आपका ब्लॉग सिस्टम अपने आप कई यूआरएल सेव करता है:
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • अगर आपका सर्वर अलग-अलग www/non-www http/https पर एक ही सामग्री देने के लिए कॉन्फ़िगर किया गया है:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • अगर आप जो सामग्री दूसरी साइटों को ऑफ़लाइन बाँटने के लिए किसी ब्लॉग पर देते हैं, उसे उन डोमेन पर पूरा या थोड़ा-बहुत दिखाया जाता है:
    https://news.example.com/green-dresses-for-every-day-155672.html (syndicated post) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (original post)

मुझे कैननिकल यूआरएल क्यों चुनना चाहिए?

आपकाे इन वजहों से एक जैसे/डुप्लीकेट पेजों के सेट में से किसी पेज को कैननिकल के तौर पर चुनना चाहिए:

  • यह बताने के लिए कि आप कौनसा यूआरएल लोगों को खोज नतीजों में दिखाना चाहते हैं. हो सकता है कि आप https://example.com/dresses/cocktail?gclid=ABCD के बजाय https://www.example.com/dresses/green/greendress.html से लोगों को अपने हरे रंग के कपड़ों के उत्पाद पेज तक पहुंचाना पसंद करें.
  • एक जैसे या डुप्लीकेट पेजों के लिए लिंक सिग्नलों को एक करने के लिए. यह खोज इंजन पर अलग-अलग यूआरएल के लिए मौजूद जानकारी (जैसे कि उनके लिंक) को एक पसंदीदा यूआरएल में, एक साथ लाने में मदद करता है. इसका मतलब है कि http://example.com/dresses/cocktail?gclid=ABCD के लिए दूसरी साइटों के लिंक https://www.example.com/dresses/green/greendress.html के लिंक के साथ एकजुट हो जाते हैं.
  • सिर्फ़ एक उत्पाद/विषय की ट्रैकिंग मेट्रिक को आसान बनाने के लिए. अलग-अलग तरह के यूआरएल होने की वजह से, किसी खास सामग्री के लिए एकजुट मेट्रिक पाना ज़्यादा मुश्किल होता है.
  • प्रतिलिपित सामग्री प्रबंधित करने के लिए. अगर आप दूसरे डोमेन पर प्रकाशित करने के लिए अपनी सामग्री की प्रतिलिपि बनाते हैं, तो आप पेज की रैंकिंग को अपने पसंदीदा यूआरएल में एकजुट करना चाहते हैं.
  • डुप्लीकेट पेजों पर क्रॉलिंग समय गंवाने से बचने के लिए. आप चाहते हैं कि Googlebot की क्रॉलिंग का आपकी साइट को ज़्यादा से ज़्यादा फ़ायदा मिले. इसलिए, बेहतर होगा कि वह एक ही पेज के डेस्कटॉप और मोबाइल वर्शन को क्रॉल करने के बजाय, आपकी साइट पर नए (या अपडेट किए गए) पेजों को क्रॉल करे.

Google के हिसाब से मेरा कैननिकल यूआरएल क्या है?

Google ने किस पेज काे कैननिकल के तौर पर चुना है यह जानने के लिए यूआरएल की जाँच करने वाला टूल इस्तेमाल करें. ध्यान दें कि भले ही आपने किसी पेज को खास तौर से कैननिकल पेज के रूप में तय किया हो, फिर भी Google किसी और पेज को कैननिकल के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं, जैसे पेज की परफ़ॉर्मेंस या सामग्री.

समस्याओं को हल करना

अगर कोई कैननिकल यूआरएल ऐसी प्रॉपर्टी में है जिसके आप मालिक नहीं हैं, तो आप अपने डुप्लीकेट पेज का ट्रैफ़िक नहीं देख पाएंगे. यहां कैननिकल पेज के किसी अलग प्रॉपर्टी में मौजूद होने की कुछ सामान्य वजहें बताई गई हैं:
  • भाषा के गलत वर्शन चुनना: अगर आपकी ऐसी कई वेबसाइटें हैं जिनमें एक जैसी सामग्री दुनिया भर के अलग-अलग उपयोगकर्ताओं के लिए उनकी स्थानीय भाषा में दी गई है, तो अलग-अलग भाषा और इलाके के हिसाब से बनाई गई साइटों के लिए तय किए गए दिशा-निर्देशों का पालन ज़रूर करें.
  • गलत कैननिकल टैग: यूआरएल के कैननिकल होने की जाँच करने वाली तकनीकों का कुछ सामग्री प्रबंधन सिस्टम (सीएमएस) या सीएमएस प्लग-इन गलत इस्तेमाल कर सकते हैं. इससे वे आपकी साइट पर आने वाले उपयोगकर्ता या क्रॉलर को किसी दूसरी साइट पर मौजूद यूआरएल पर भेज सकते हैं. देख लें कि कहीं आपकी सामग्री में यह समस्या तो नहीं है. अगर आपकी साइट ऐसे यूआरएल को कैननिकल यूआरएल मान रही है जिसे आम तौर पर कैननिकल यूआरएल नहीं चुना जाना चाहिए, तो rel="canonical" के गलत इस्तेमाल या 301 कोड वाले रीडायरेक्ट की वजह से ऐसा हो सकता है. इस समस्या को सीएमएस में जाकर ठीक करें.
  • गलत तरीके से कॉन्फ़िगर किए गए सर्वर: होस्ट करने की कुछ सेटिंग गलत तरीके से तय करने की वजह से ऐसे क्रॉस-डोमेन यूआरएल को चुन लिया जाता है जिसे आम तौर पर नहीं चुना जाना चाहिए. उदाहरण के लिए:
    • सर्वर गलत तरीके से कॉन्फ़िगर हो सकता है. ऐसा हाेने पर, b.com के किसी यूआरएल के लिए अनुरोध करने पर जवाब में a.com की सामग्री मिल सकती है.
    • एक दूसरे से अलग दो वेब सर्वर, एक जैसे सॉफ़्ट 404 गड़बड़ी वाले उन पेजों पर वापस भेज सकते हैं जिन्हें Google गड़बड़ी वाले पेजों के रूप में पहचान नहीं पाया था.
  • नुकसान पहुंचाने के लिए की गई हैकिंग: वेबसाइटों पर किए गए कुछ हमलों में ऐसा कोड डाला जाता हैं जिसकी वजह से अनुरोध करने पर जवाब में एचटीटीपी 301 कोड वाला रीडायरेक्ट मिलता है. इसके अलावा, एचटीएमएल <head> या एचटीटीपी हेडर में ऐसा क्रॉस-डोमेन rel=”canonical” लिंक एलिमेंट भी डाला जा सकता है जो अक्सर नुकसान पहुंचाने या स्पैम वाली सामग्री के यूआरएल पर रीडायरेक्ट करता है. इन मामलों में हमारे एल्‍गोरि‍द्म, छेड़छाड़ की गई वेबसाइट पर मौजूद यूआरएल चुनने के बजाय, नुकसान पहुंचाने या स्पैम वाले यूआरएल को चुन सकते हैं.
  • हैक की गई वेबसाइट: बहुत कम मामलों में, हमारा एल्‍गोरि‍द्म किसी ऐसी बाहरी साइट से यूआरएल चुन सकता है जिस साइट पर आपकी अनुमति के बिना आपकी सामग्री मौजूद है. अगर आपको लगता है कि कोई दूसरी साइट आपकी सामग्री को डुप्लीकेट करके कॉपीराइट कानून का उल्लंघन कर रही है, तो आप उस साइट के होस्ट से सामग्री हटाने के लिए अनुरोध कर सकते हैं. साथ ही, आप कॉपीराइट नियमाें का उल्लंघन करने वाले पेज को खोज नतीजाें से हटाने का Google से अनुरोध कर सकते हैं. इसके लिए, आप डिजिटल मिलेनियम कॉपीराइट एक्ट के तहत अनुरोध दर्ज कर सकते हैं.

कैननिकल पेज तय करना

आपके इस्तेमाल के आधार पर, एक डुप्लीकेट सेट में कैननिकल पेज बताए जाने के कुछ अलग तरीके नीचे दिए गए हैं:

तरीका जानकारी
सामान्य दिशा-निर्देश कैननिकल किए जाने के सभी तरीकों के लिए, इन दिशा-निर्देशों का पालन करें.
पसंदीदा डोमेन बताएं

किसी एक डोमेन के यूआरएल को दूसरे डोमेन पर, उससे मिलते-जुलते यूआरएल से अलग करने यानी कैननिकल बताने के लिए, Search Console इस्तेमाल करें. उदाहरण के लिए, www.example.com के बजाय example.com. इसका इस्तेमाल तभी करें जब आपके पास ऐसी दो एक जैसी साइटें हों जो सिर्फ़ उप डोमेन के हिसाब से अलग हैं. एचटीटीपी/एचटीटीपीएस से मिलती-जुलती साइटों के लिए इसका इस्तेमाल न करें.

फ़ायदे:

  • इसे लागू करना, प्रबंधित करना, और बदलना आसान है
  • तभी इस्तेमाल करें जब आपके पास अलग-अलग डोमेन पर एक जैसी साइटें हों.

नुकसान:

  • सिर्फ़ डोमेन की जानकारी के स्तर पर काम करता है. साथ ही, डुप्लीकेट माने जाने के लिए पेजों के पाथ और नाम एक जैसे होने चाहिए.
  • एक जैसे पाथ, नाम वाले पेजों के लिए सिर्फ़ एक पेज-टू-पेज मैपिंग चालू करता है.
rel=canonical <link> टैग

कैननिकल पेज पर ले जाने वाले सभी डुप्लीकेट पेजों के लिए, कोड में एक <link> टैग जोड़ें.

फ़ायदे:

  • अनगिनत संख्या में डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • पेज का आकार बढ़ा सकता है.
  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है, जहां यूआरएल अक्सर बदलते रहते हैं.
  • सिर्फ़ एचटीएमएल पेजों के लिए काम करता है, पीडीएफ़ जैसी फ़ाइलों के लिए नहीं. ऐसे मामलों में, आप rel=canonical एचटीटीपी हेडर इस्तेमाल कर सकते हैं.
rel=canonical HTTP हेडर

आपका पेज खोजे जाने पर rel=canonical हेडर भेजें.

फ़ायदे:

  • पेज का आकार नहीं बढ़ाता.
  • अनगिनत संख्या में डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है, जहां यूआरएल अक्सर बदलते रहते हैं.
साइटमैप

साइटमैप में अपने कैननिकल पेज बताएं.

फ़ायदे:

  • खास तौर पर बड़ी साइटों पर काम करना आसान होता है

नुकसान:

  • Googlebot को अब भी ऐसे किसी कैननिकल पेज के लिए, उससे जुड़ा डुप्लीकेट तय करना होगा जिसके बारे में आप साइटमैप में बताते हैं.
  • Googlebot के लिए, rel=canonical मैपिंग तकनीक के मुकाबले कम ताकतवर सिग्नल.
301 रीडायरेक्ट 301 रीडायरेक्ट का इस्तेमाल Googlebot को यह बताने के लिए करें कि दूसरा वेबलिंक दिए गए यूआरएल के मुकाबले एक बेहतर वर्शन है. इसका इस्तेमाल सिर्फ़ तभी करें जब किसी डुप्लीकेट पेज को रोकना हो.
AMP के अलग-अलग प्रकार अगर आपका कोई फ़ॉर्मैट एक AMP पेज है, तो कैननिकल पेज और AMP फ़ॉर्मैट के बारे में बताने के लिए, आपको AMP दिशा-निर्देशों का पालन करना होगा.

 

हमारी सलाह है कि आप इनमें से किसी तरीके का इस्तेमाल करें. हालांकि, ऐसा करना ज़रूरी नहीं है. अगर आप कोई कैननिकल यूआरएल नहीं बताते हैं, तो हम अपने हिसाब से सबसे अच्छे वर्शन या यूआरएल की पहचान करेंगे.

सामान्य दिशा-निर्देश

कैननिकल करने के सभी तरीके जानने के लिए, इन सामान्य दिशा-निर्देशों का पालन करें.

सामान्य दिशा-निर्देश
  • कैननिकल पेज तय करने के लिए robots.txt फ़ाइल का इस्तेमाल न करें.
  • कैननिकल पेज तय करने के लिए यूआरएल हटाने वाला टूल इस्तेमाल न करें. ऐसा करने से यूआरएल के सभी वर्शन खोज से हटा दिए जाते हैं.
  • एक ही पेज के लिए एक जैसे या अलग तरीकों का इस्तेमाल करके अलग-अलग यूआरएल को कैननिकल के तौर पर तय न करें (उदाहरण के लिए, ऐसा न हो कि किसी पेज के लिए साइटमैप में एक यूआरएल और rel="canonical" टैग का इस्तेमाल करके किसी दूसरे यूआरएल को कैननिकल के तौर पर तय कर दिया जाए).
  • किसी कैननिकल पेज को चुने जाने से रोकने के लिए noindex इस्तेमाल न करें. यह निर्देश इंडेक्स से पेज को बाहर करने के लिए है, कैननिकल पेज की पसंद को प्रबंधित करने के लिए नहीं. 
  • hreflang टैग इस्तेमाल करते समय एक कैननिकल पेज ज़रूर तय करें. उसी भाषा वाले किसी पेज को कैननिकल के तौर पर तय करें या उस भाषा के लिए कोई कैननिकल पेज मौजूद न होने पर, उसके हिसाब से सबसे ठीक भाषा के पेज को चुनें.

  • अपनी साइट में लिंक करते समय डुप्लीकेट यूआरएल के बजाय कैननिकल यूआरएल से लिंक करें. अगर आप हमेशा कैननिकल यूआरएल से ही लिंक करेंगे, तो Google को आपकी पसंद समझने में आसानी होगी.

कैननिकल यूआरएल के लिए एचटीटीपी के बजाय एचटीटीपीएस को चुनें

Google बराबरी के एचटीटीपी पेजों की जगह, एचटीटीपीएस पेजों को कैननिकल बनाना पसंद करता है. इसमें नीचे दी गई समस्याएं या आपस में टकराने वाले सिग्नल से जुड़े मामले शामिल नहीं हैं:

  • एचटीटीपीएस पेज में गलत एसएसएल प्रमाणपत्र है.
  • एचटीटीपीएस पेज में ऐसी चीज़ें (इमेज के अलावा दूसरी चीज़ें) शामिल हैं जो सुरक्षित नहीं, लेकिन ज़रूरी हैं.
  • एचटीटीपीएस पेज उपयोगकर्ताओं को किसी एचटीटीपी पेज पर या इसके ज़रिए दूसरे वेबलिंक पर भेजता है.
  • एचटीटीपीएस पेज में एचटीटीपी पेज का एक rel="canonical" लिंक शामिल है.

वैसे हमारे सिस्टम डिफ़ॉल्ट रूप से एचटीटीपी पेजों की जगह एचटीटीपीएस पेजों को ज़्यादा ज़रूरी मानते हैं. फिर भी, आप नीचे दी गई कोई भी कार्रवाई करके इस व्यवहार को पक्का कर सकते हैं:

  • एचटीटीपी पेज से एचटीटीपीएस पेज पर रीडायरेक्ट जोड़ें.
  • एचटीटीपी पेज से एचटीटीपीएस पेज पर एक rel="canonical" लिंक जोड़ें.
  • एचएसटीएस लागू करें.

Google को गलती से एचटीटीपी पेज को कैननिकल बनाने से रोकने के लिए, आपको नीचे दी गई चीज़ों से बचना चाहिए:

  • गलत एसएसएल प्रमाणपत्र और एचटीटीपीएस-से-एचटीटीपी रीडायरेक्ट की वजह से हम एचटीटीपी को बहुत ज़्यादा ज़रूरी मान लेते हैं. एचएसटीएस लागू करने से इसे बहुत ज़्यादा ज़रूरी मानना बंद नहीं किया जा सकता है.
  • अपने साइटमैप या hreflang कोडिंग में एचटीटीपीएस वर्शन के बजाय एचटीटीपी पेज शामिल करना.
  • होस्ट के गलत प्रकार के लिए अपने एसएसएल/टीएलएस प्रमाणपत्र का इस्तेमाल करना: उदाहरण के लिए, www.example.com के लिए मिले प्रमाणपत्र का इस्तेमाल example.com के लिए करना.  यह प्रमाणपत्र आपकी साइट के पूरे यूआरएल से मेल खाना चाहिए या यह एक वाइल्डकार्ड प्रमाणपत्र होना चाहिए, जिसे किसी डोमेन पर एक से ज़्यादा उप डोमेन के लिए इस्तेमाल किया जा सके.

नई तकनीकें इस्तेमाल करने वाले उपयोगकर्ता: Google को बताएं कि वह डायनैमिक पैरामीटर को अनदेखा करे

पैरामीटर हैंडलिंग का इस्तेमाल कर Googlebot को बताएं कि क्रॉल करते समय किन पैरामीटर को अनदेखा करना है. कुछ पैरामीटर अनदेखा करने से Google के इंडेक्स में डुप्लीकेट सामग्री कम हो सकती है. इससे आपकी साइट को ज़्यादा क्रॉल किया जा सकता है. उदाहरण के लिए, अगर आप यह बताते हैं कि पैरामीटर sessionid को अनदेखा करना चाहिए, तो Googlebot नीचे दिए गए दो यूआरएल को डुप्लीकेट मानेगा:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

खास तरीके

डुप्लीकेट यूआरएल या डुप्लीकेट/मिलते-जुलते पेजों के लिए, एक कैननिकल यूआरएल बताने के लिए नीचे दिया गया कोई एक तरीका चुनें.

देख लें कि सभी तरीकों के लिए, ऊपर बताए गए सामान्य दिशा-निर्देशों का पालन किया जा रहा है.

पसंदीदा डोमेन सेट करें

Search Console का इस्तेमाल करके Google को बताएं कि आप अपनी साइट के यूआरएल का कौनसा वर्शन अपने डोमेन के लिए कैननिकल बनाना पसंद करेंगे:

  • https://www.example.com
  • https://example.com

अगर आप https://example.com को अपने पसंदीदा डोमेन के रूप में सेट करते हैं, तो Google www.example.com पर एक जैसे यूआरएल या पेजों को example.com के पेजों का डुप्लीकेट मानता है.

जानकारी के लिए अपना पसंदीदा डोमेन सेट करें पढ़ें.

rel="canonical" लिंक टैग इस्तेमाल करें

जब कोई पेज किसी दूसरे पेज का डुप्लीकेट हो, तो यह बताने के लिए आप पेज के हेडर में <link> टैग का इस्तेमाल कर सकते हैं.

मान लीजिए कि आप https://example.com/dresses/green-dresses को कैननिकल यूआरएल बनाना चाहते हैं, भले ही कई तरह के यूआरएल इस सामग्री का इस्तेमाल कर सकते हैं. नीचे दिए गए तरीकों से इस यूआरएल को कैननिकल के तौर पर दिखाएं:

  1. सभी डुप्लीकेट पेजों में rel="canonical" लिंक एलिमेंट शामिल करें. कैननिकल पेज पर ले जाने वाले डुप्लीकेट पेजों के <head> सेक्शन में rel="canonical" एट्रिब्यूट वाला एक <link> एलिमेंट जोड़ें. इसका उदाहरण नीचे दिया गया है:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. अगर कैननिकल पेज का मोबाइल वर्शन है, तो इसमें उस वर्शन पर ले जाने वाला rel="alternate" लिंक जोड़ें:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. कोई hreflang या दूसरे रीडायरेक्ट जोड़ें जो पेज के लिए सही हों.

rel="canonical" लिंक एलिमेंट के साथ रिलेटिव पाथ (बिना रूट डायरेक्टरी वाला पाथ) के बजाय ऐब्सोल्यूट पाथ (रूट डायरेक्टरी से शुरू होने वाला पाथ) इस्तेमाल करें.

यह फ़ॉर्मैट इस्तेमाल करें: https://www.example.com/dresses/green/greendresss.html
यह फ़ॉर्मैट इस्तेमाल न करें: /dresses/green/greendress.html
Use rel="canonical" एचटीटीपी हेडर इस्तेमाल करें

अगर आप अपने सर्वर को कॉन्फ़िगर कर सकते हैं, तो आप पीडीएफ़ फ़ाइल जैसे बिना एचटीएमएल वाले दस्तावेज़ के कैननिकल यूआरएल तय करने के लिए rel="canonical" एचटीटीपी हेडर (एचटीएमएल टैग के बजाय) इस्तेमाल कर सकते हैं.

उदाहरण के लिए, अगर आप किसी पीडीएफ़ फ़ाइल को कई यूआरएल के ज़रिए दिखाते हैं, तो डुप्लीकेट यूआरएल के लिए आप एक rel="canonical" एचटीटीपी हेडर दिखा सकते हैं, जैसा कि नीचे दिया गया है. इसके ज़रिए आप Googlebot को यह बताते हैं कि पीडीएफ़ फ़ाइल के लिए कैननिकल यूआरएल कौनसा है:

लिंक: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

फ़िलहाल, Google पर सिर्फ़ वेब खोज नतीजों के लिए यह तरीका काम करता है.

rel="canonical" लिंक एलिमेंट के साथ रिलेटिव पाथ (बिना रूट डायरेक्टरी वाला पाथ) के बजाय ऐब्सोल्यूट पाथ (रूट डायरेक्टरी से शुरू होने वाला पाथ) इस्तेमाल करें. यानी:
यह फ़ॉर्मैट इस्तेमाल करें: http://www.example.com/downloads/white-paper.pdf
यह फ़ॉर्मैट इस्तेमाल न करें: /downloads/white-paper.pdf
साइटमैप इस्तेमाल करें

अपने हर पेज के लिए एक कैननिकल यूआरएल चुनें और इसे साइटमैप में सबमिट करें. साइटमैप में दिए गए सभी पेजों को कैननिकल बताया गया है; Googlebot सामग्री मिलती-जुलती होने के आधार पर यह तय करेगा कि कौनसा पेज (अगर कोई हो) डुप्लीकेट है.

हम इस बात की गारंटी नहीं देते कि हम साइटमैप यूआरएल को कैननिकल मानेंगे, लेकिन यह एक बड़ी साइट के लिए कैननिकल को समझाने का एक आसान तरीका है. साथ ही, साइटमैप Google को यह बताने का एक अच्छा तरीका है कि आप कौनसे पेजों को अपनी साइट पर सबसे ज़्यादा ज़रूरी मानते हैं.

साइटमैप में ऐसे पेज शामिल न करें जो कैननिकल नहीं हैं. अगर साइटमैप का इस्तेमाल करते हैं, तो साइटमैप में सिर्फ़ कैननिकल यूआरएल बताएं.

अब काम नहीं करने वाले यूआरएल के लिए 301 रीडायरेक्ट इस्तेमाल करें

इस तरीके का इस्तेमाल तब करें, जब आप मौजूदा डुप्लीकेट पेजों से छुटकारा पाना चाहते हैं. हालांकि, पुराने यूआरएल का इस्तेमाल करना बंद करने से पहले यह ज़रूर देख लें कि इसे आसानी से बदला जा सकता है.

मान लेते हैं कि आपके पेज पर कई तरीकों से पहुंचा जा सकता है:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

उनमें से किसी एक यूआरएल को अपना कैननिकल यूआरएल चुनें. दूसरे यूआरएल से अपने पसंदीदा यूआरएल में ट्रैफ़िक भेजने के लिए 301 रीडायरेक्ट इस्तेमाल करें. सर्वर की ओर का 301 रीडायरेक्ट यह पक्का करने का सबसे अच्छा तरीका है कि उपयोगकर्ता और खोज इंजन को सही पेज पर ले जाया जाता है. 301 स्थिति कोड का मतलब है कि किसी पेज को हमेशा के लिए किसी नए यूआरएल या सर्वर पर ले जाया गया है.

अगर आप वेबसाइट होस्ट करने वाली किसी कंपनी की सेवा ले रहे हैं, तो 301 रीडायरेक्ट को सेटअप करने के बारे में उनके दस्तावेज़ देखें.

क्‍या यह लेख उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?