एक से ज़्यादा क्षेत्रों और भाषाओं के लिए बनाई गईं साइटें प्रबंधित करना

अगर आपकी साइट पर अलग-अलग भाषाओं, देशों या जगहों के हिसाब से अलग-अलग सामग्री है, तो आप अपनी साइट के लिए 'Google सर्च' के नतीजों को अॉप्टिमाइज़ कर सकते हैं.

बुनियादी जानकारी

  • बहुभाषी वेबसाइट वह वेबसाइट होती है, जिसकी सामग्री एक से ज़्यादा भाषाओं में होती है. उदाहरण के लिए, किसी कनेडियन कारोबार की ऐसी साइट, जिसके वर्शन अंग्रेज़ी और फ़्रेंच भाषा में हों. 'Google सर्च' खोजने वाले व्यक्ति की भाषा में पेज ढूंढने की कोशिश करता है.
  • बहु-क्षेत्रीय वेबसाइट वह वेबसाइट होती है, जो साफ़ तौर पर अलग-अलग देशों के उपयोगकर्ताओं को टारगेट करती है (उनके हिसाब से बनाई जाती है). उदाहरण के लिए, उत्पाद बनाने वाली ऐसी कंपनी की साइट, जो कनाडा और अमेरिका दाेनाें में सामान भेजती है. 'Google सर्च' खोज करने वाले व्यक्ति के हिसाब से, सही इलाके के लिए बना पेज ढूंढने की कोशिश करता है.

कुछ साइटों की सामग्री अलग-अलग क्षेत्रों के हिसाब से होने के साथ कई भाषाओं में भी होती है: उदाहरण के लिए, किसी साइट के अमेरिका और कनाडा के लिए अलग-अलग वर्शन हो सकते हैं. साथ ही, इस साइट की कनेडियन सामग्री वाली साइट के भी दो अलग-अलग वर्शन हो सकते हैं, जो इसे फ़्रेंच और अंग्रेज़ी भाषा में दिखाते हों.

अपनी साइट के एक से ज़्यादा भाषाओं वाले वर्शन प्रबंधित करना

अगर आपकी साइट पर एक जैसी सामग्री एक से ज़्यादा भाषाओं में है, तो नीचे दी गई सलाह के ज़रिए आप उपयोगकर्ताओं (और 'Google सर्च') की सही पेज ढूंढने में मदद कर सकते हैं:

अलग-अलग भाषाओं वाले वर्शन के लिए अलग-अलग यूआरएल इस्तेमाल करना

Google का सुझाव है कि आप किसी पेज के अलग-अलग भाषाओं वाले वर्शन के लिए अलग-अलग यूआरएल इस्तेमाल करें. Google के हिसाब से आपको पेज पर मौजूद सामग्री की भाषा बदलने के लिए, कुकी या ब्राउज़र की सेटिंग का इस्तेमाल नहीं करना चाहिए.

अगर आप अलग-अलग भाषाओं के लिए अलग-अलग यूआरएल इस्तेमाल करते हैं, तो Google के खोज नतीजों में किसी पेज का सही भाषा वाला वर्शन दिखाने के लिए hreflang ऐनोटेशन का इस्तेमाल करें.

अगर आप चाहते हैं कि आपकी वेबसाइट पर मौजूद सामग्री में ज़रूरत के हिसाब से (डायनैमिक रूप से) बदलाव हों या भाषा की सेटिंग के मुताबिक उपयोगकर्ता को दूसरे वेबलिंक पर ले जाया जाए, तो इस बात का ध्यान रखें कि शायद Google आपके पेज के सारे वर्शन न ढूंढ पाए और उन्हें क्रॉल न कर पाए. ऐसा इसलिए होता है क्योंकि आम तौर पर Googlebot क्रॉलर के आईपी पते अमेरिका के होते हैं. इसके अलावा, क्रॉलर अनुरोध के हेडर को Accept-Language के रूप में सेट किए बिना एचटीटीपी अनुरोध भेजता है.

Google को अपने पेज के अलग-अलग भाषाओं वाले वर्शन के बारे में बताना

Google को किसी पेज के अलग-अलग भाषाओं और जगहों वाले वर्शन के बारे में बताने के कई तरीके हैं. इनमें hreflang ऐनोटेशन और साइटमैप भी शामिल हैं. अपने पेज के हिसाब से सबसे सही तरीका इस्तेमाल करके उसे लेबल करें.

ध्यान दें कि पेज की भाषा ऐसी होनी चाहिए जो आसानी से समझ आ जाए

Google आपके पेज पर दिख रही सामग्री इस्तेमाल करके पेज की भाषा का पता लगाता है. हम lang ऐट्रिब्यूट या यूआरएल जैसी कोड-लेवल भाषा में दी गई किसी भी जानकारी का इस्तेमाल नहीं करते हैं. अपने पेज की सही भाषा पहचानने में Google की मदद करने के लिए, हर पेज पर सामग्री और नेविगेशन के लिए एक ही भाषा का इस्तेमाल करें. साथ ही, साइट की मूल सामग्री के साथ उसका अनुवाद न दिखाएं.

ऐसे ज़्यादातर पेज जो उपयोगकर्ता की बनाई गई सामग्री दिखाते हैं, उनमें पेज की ज़्यादातर सामग्री को एक ही भाषा में रखकर सिर्फ़ बॉयलरप्लेट लेख का अनुवाद किया जाता है. बॉयलरप्लेट लेख ऐसा लेख होता है, जो पहले से तैयार किया जाता है और बिना ज़्यादा बदलाव किए दोबारा इस्तेमाल किया जा सकता है. अगर इस तरह के अनुवाद की वजह से खोज नतीजों में एक ही सामग्री अलग-अलग बॉयलरप्लेट भाषाओं में दिखाई देती है, तो उपयोगकर्ताओं को आपकी साइट इस्तेमाल करने में परेशानी हो सकती है.

सर्च इंजन को अपनी साइट पर ऐसे पेज क्रॉल करने से रोकें, जिनकी सामग्री का अनुवाद मशीन से होता है. ऐसा करने के लिए robots.txt का इस्तेमाल करें. मशीन से किया गया अनुवाद हमेशा सही नहीं होता और इसे स्पैम के तौर पर देखा जा सकता है. इससे ज़रूरी बात यह है कि खराब अनुवाद की वजह से आपकी साइट की छवि पर बुरा असर पड़ सकता है.

उपयोगकर्ता को पेज की भाषा बदलने का विकल्प देना

अगर आपकी साइट के किसी पेज के एक से ज़्यादा वर्शन हैं तो:

  • उस पेज के दूसरी भाषाओं वाले वर्शन के हाइपरलिंक जोड़ें. ऐसा करने से उपयोगकर्ता पेज के अलग-अलग भाषाओं वाले वर्शन पर क्लिक करके उन्हें चुन सकते हैं.
  • सिस्टम के ज़रिए पता लगाई गई भाषा के हिसाब से उपयोगकर्ता को अपने आप दूसरे वेबलिंक पर न भेजें. इस तरह दूसरे वेबलिंक पर भेजने से उपयोगकर्ता (और सर्च इंजन) आपकी साइट के सभी वर्शन नहीं देख पाएंगे.

अलग-अलग भाषा के लिए अलग-अलग यूआरएल इस्तेमाल करना

यूआरएल में स्थानीय शब्दों या अंतरराष्ट्रीय स्तर के डोमेन नाम (आईडीएन) का इस्तेमाल करना ठीक है. हालांकि, यूआरएल में यूटीएफ़-8 एनकोडिंग का ही इस्तेमाल करें (हमारा सुझाव है कि जहां भी मुमकिन हो, यूटीएफ़-8 का ही इस्तेमाल करें). साथ ही, यूआरएल जोड़ते समय उन्हें ठीक तरह से एस्केप करना न भूलें.

किसी खास देश के हिसाब से साइट पर सामग्री दिखाना (इलाके के हिसाब से टारगेट करना)

आप अपनी वेबसाइट या इसके कुछ हिस्सों को किसी खास देश में कोई खास भाषा बोलने वाले लोगों के लिए टारगेट कर सकते हैं. ऐसा करने से उस देश में आपके पेज की रैंक बेहतर हो सकती है, लेकिन दूसरे इलाकों/भाषाओं में यह कम भी हो सकती है.

Google पर अपनी साइट को किसी इलाके के हिसाब से टारगेट करना:

याद रखें कि यह ज़रूरी नहीं है कि इलाके के हिसाब से टारगेट करने से आपको बिल्कुल सही नतीजे मिलें. इसलिए, उन उपयोगकर्ताओं का भी ध्यान रखें, जो आपकी साइट के "गलत" वर्शन पर चले जाते हैं. ऐसा करने का एक तरीका यह है कि सभी पेजों पर उपयोगकर्ताओं को ऐसे लिंक दिखाए जाएं, जिनके ज़रिए वे अपना इलाका और/या अपनी पसंद की भाषा चुन सकें.

सामग्री को किसी खास इलाके के हिसाब से बनाने के लिए, आईपी पते से पता की गई जगह की जानकारी का इस्तेमाल न करें. आईपी पते से जगह की जानकारी का पता लगाना मुश्किल हाेता है और आम तौर पर इस पर भराेसा नहीं किया जा सकता. इस वजह से, शायद Google आपकी साइट के अलग-अलग वर्शन काे ठीक से क्रॉल न कर पाए. हमेशा ताे नहीं लेकिन ज़्यादातर मामलाें में, Google अमेरिका से साइट क्रॉल करता है अाैर हम साइट के अलग-अलग वर्शन काे पहचानने के लिए अपनी जगह नहीं बदलते हैं. अाईपी पते के बजाय, यहां दिखाए गए पूरी जानकारी देने वाले तरीकों में से एक का इस्तेमाल करें (hreflang, वैकल्पिक यूआरएल और अलग से बनाए गए लिंक).

अलग-अलग इलाकों के लिए अलग-अलग यूआरएल इस्तेमाल करना

ऐसे यूआरएल इस्तेमाल करें जिनसे आपकी साइट या इसके कुछ हिस्सों के लिए अलग-अलग जगहों के उपयोगकर्ता टारगेट हो पाएं. नीचे दिए गए टेबल में आपके लिए उपलब्ध विकल्पों के बारे में जानकारी दी गई है:

यूआरएल के प्रकार यूआरएल के उदाहरण फ़ायदे नुकसान
खास देश के लिए डोमेन example.de
  • इलाके के हिसाब से सही तरीके से टारगेट करने की सुविधा
  • सर्वर की जगह की जानकारी डालने की ज़रूरत नहीं होती
  • साइटों के अलग-अलग वर्शन आसानी से बनाए जा सकते हैं
  • महंगे होते हैं (कुछ ही जगहों में उपलब्ध हो सकते हैं)
  • सामान्य से ज़्यादा बुनियादी सुविधाओं की ज़रूरत होती है
  • कभी-कभी सीसीटीएलडी की पूरी जानकारी देना ज़रूरी होता है
जीटीएलडी वाले सब-डोमेन de.example.com
  • आसानी से सेटअप किए जा सकते हैं
  • Search Console की इलाके के हिसाब से टारगेट करने की सुविधा इस्तेमाल की जा सकती है
  • एक से ज़्यादा जगहों वाले सर्वर इस्तेमाल किए जा सकते हैं
  • साइटों के अलग-अलग वर्शन आसानी से बनाए जा सकते हैं
  • शायद उपयोगकर्ता सिर्फ़ यूआरएल की मदद से टारगेट किए गए इलाकों की पहचान न कर पाएं (यह दुविधा हो सकती है कि "de" भाषा है या देश?)
जीटीएलडी के साथ सब-डायरेक्ट्री example.com/de/
  • आसानी से सेटअप किए जा सकते हैं
  • Search Console की इलाके के हिसाब से टारगेट करने की सुविधा इस्तेमाल की जा सकती है
  • एक ही होस्ट होने की वजह से कम रखरखाव की ज़रूरत होती है
  • शायद उपयोगकर्ता सिर्फ़ यूआरएल की मदद से टारगेट किए गए इलाकों की पहचान न कर पाएं
  • एक ही जगह पर मौजूद सर्वर इस्तेमाल किए जा सकते हैं
  • साइट के अलग-अलग वर्शन बनाना मुश्किल होता है
यूआरएल के पैरामीटर site.com?loc=de
  • इसका इस्तेमाल करने का सुझाव नहीं दिया जाता.
  • साइट के अलग-अलग वर्शन के लिए अलग-अलग यूआरएल बनाना मुश्किल होता है
  • शायद उपयोगकर्ता सिर्फ़ यूआरएल की मदद से टारगेट किए गए इलाकों की पहचान न कर पाएं
  • Search Console में इलाके के हिसाब से टारगेट करने की सुविधा इस्तेमाल नहीं की जा सकती

 

Google किसी साइट के लिए टारगेट किया गया इलाका कैसे तय करता है?

किसी पेज के लिए सही दर्शक ढूंढने के लिए Google कई चीज़ों का इस्तेमाल करता है:

  • Search Console की अंतरराष्ट्रीय उपयोगकर्ताओं को टारगेट करने के बारे में रिपोर्ट का इस्तेमाल करके टारगेट किए गए इलाके के बारे में बताना. अगर आप जेनरिक टॉप लेवल डोमेन (जीटीएलडी) का इस्तेमाल करते हैं और अपनी साइट को दूसरे देश की संस्था के सर्वर पर होस्ट कर रहे हैं, तो हमारा सुझाव है कि Search Console के ज़रिए हमें बताएं कि आपकी साइट किस देश के लिए बनाई गई है. ऐसा तब करें जब आप अपनी साइट के लिए, इलाके के हिसाब से उपयोगकर्ताओं को टारगेट करना चाहते हैं.
  • कंट्री-कोड टॉप-लेवल डोमेन नेम (सीसीटीएलडी). ये कोड किसी खास देश के लिए होते हैं (उदाहरण के लिए, जर्मनी के लिए .de, चीन के लिए .cn). सर्च इंजन और उपयोगकर्ताओं के लिए यह मुख्य जानकारी है, जो बताती है कि आपकी साइट किसी खास देश के लिए बनाई गई है. (कुछ देशों में इस बात पर पाबंदी लगी है कि सीसीटीएलडी का इस्तेमाल कौन कर सकता है. इसलिए, पहले इस बारे में जानकारी इकट्ठा कर लें.) हम कुछ खास सीसीटीएलडी (जैसे .tv, .me, वगैरह) को जीटीएलडी जैसा ही मानते हैं. ऐसा इसलिए है क्योंकि उपयोगकर्ता और वेबमास्टर, इन्हें किसी खास देश के लिए टारगेट किए गए डोमेन की तरह मानने के बजाय सामान्य डोमेन मानते हैं (हमारे पास ऐसे खास सीसीटीएलडी की पूरी सूची नहीं है, जिन्हें हम जीटीएलडी जैसा मानते हैं क्योंकि यह सूची समय के साथ बदलती रहती है). Google की जीटीएलडी वाली सूची देखें.
  • hreflang के मान, चाहे वे टैग में मौजूद हों या फिर हेडर या साइटमैप में.
  • सर्वर की जगह की जानकारी (सर्वर के आईपी पते के ज़रिए). आम तौर पर, सर्वर आपकी साइट के उपयोगकर्ताओं के आस-पास की जगह पर मौजूद होता है और इससे पता चल सकता है कि आपकी साइट कहां रहने वाले दर्शकों के लिए है. कुछ वेबसाइटें, कॉन्टेंट डिलीवरी नेटवर्क (सीडीएन) के ज़रिए एक से ज़्यादा सर्वर का इस्तेमाल करती हैं या वे ऐसे देश से होस्ट की जाती हैं, जहां वेब सर्वर बेहतर तरीके से काम करते हैं. इसलिए, सर्वर की जगह की जानकारी से टारगेट इलाके के बारे में साफ़ तौर पर पता नहीं चलता.
  • पेज के लिए सही दर्शक ढूंढने के लिए दूसरी चीज़ें. आपकी साइट के लिए सही दर्शकों का पता लगाने के लिए दूसरी जानकारी भी इस्तेमाल होती है. इनमें पेज पर मौजूद स्थानीय पते या फ़ोन नंबर शामिल हैं. इसके अलावा, पेज पर मौजूद स्थानीय भाषा और मुद्रा, दूसरी स्थानीय साइटों के लिंक और/या Google मेरा व्यवसाय (जहां उपलब्ध हो) से भी इस बारे में पता लगाया जा सकता है.

Google नीचे दी गई चीज़ें नहीं करता:

  • Google दुनिया भर की अलग-अलग जगहों की वेबसाइटों को क्रॉल करता है. हम किसी साइट पर मौजूद पेज के अलग-अलग वर्शन ढूंढने के लिए, उस पर इस्तेमाल किए गए क्रॉलर का स्रोत बदलने की कोशिश नहीं करते हैं. इसलिए, अपनी साइट के लिए अलग-अलग इलाकों और भाषाओं वाले वर्शन के बारे में Google को साफ़ तौर पर बताएं. इसके लिए यहां बताए गए तरीकों (जैसे hreflang के मान, सीसीटीएलडी या अलग से बनाए गए लिंक) का इस्तेमाल करें.
  • जगह की जानकारी से जुड़े मेटा टैग (जैसे geo.position या distribution) या इलाके के हिसाब से टारगेट करने के लिए इस्तेमाल होने वाले एचटीएमएल ऐट्रिब्यूट पर Google ध्यान नहीं देता.

डुप्लीकेट पेजों वाली बहुभाषी/बहु-क्षेत्रीय साइटों को प्रबंधित करना

अगर आपकी किसी बहु-क्षेत्रीय साइट के अलग-अलग यूआरएल में मिलती-जुलती या डुप्लीकेट सामग्री है और दोनों वर्शन में एक भाषा का इस्तेमाल होता है (जैसे example.de/ और example.com/de/ दोनों ही जर्मन भाषा में मिलती-जुलती सामग्री दिखाती हैं), तो आपको इनमें से एक को मुख्य वर्शन के तौर पर चुनना होगा. इसके लिए आपको rel=canonical element और hreflang टैग इस्तेमाल करने होंगे, ताकि खोजने वाले लोगों को अपनी भाषा या जगह के हिसाब से सही यूआरएल मिल सके.

 

जेनरिक टॉप लेवल डोमेन

जेनरिक टॉप लेवल डोमेन (जीटीएलडी) ऐसे डोमेन होते हैं, जो किसी खास जगह से नहीं जुड़े होते. अगर आपकी साइट पर .com, .org जैसे जेनरिक टॉप लेवल डोमेन या नीचे दिए गए डोमेन में से कोई इस्तेमाल होता है और आप किसी खास जगह के उपयोगकर्ताओं को टारगेट करना चाहते हैं, तो टारगेट करने के लिए साफ़ तौर पर एक देश का नाम सेट करें. ऐसा करने के लिए आप पहले बताए जा चुके तरीकों में से किसी एक का इस्तेमाल कर सकते हैं.

नीचे दिए गए डोमेन को Google ऐसे जीटीएलडी मानता है, जिन्हें Search Console में इलाके के हिसाब से टारगेट किया जा सकता है:

  • जेनरिक टॉप लेवल डोमेन (जीटीएलडी): जब तक किसी डोमेन के आखिरी हिस्से को ICANN पर कंट्री कोड टॉप लेवल डोमेन के लिए रजिस्टर नहीं किया जाता, तब तक Google उन सभी टीएलडी को जीटीएलडी मानेगा जो IANA डीएनएस के रूट ज़ोन से होते हैं. उदाहरण:
    • .com
    • .org
    • .edu
    • .gov
    • इनके अलावा और भी कई डोमेन...
  • जेनरिक रीजनल टॉप लेवल डोमेन: हालांकि, ये डोमेन किसी खास जगह के लिए होते हैं लेकिन आम तौर पर इन्हें जेनरिक टॉप लेवल डोमेन ही माना जाता है (.com या .org की तरह):
    • .eu
    • .asia
  • जेनेरिक कंट्री कोड टॉप लेवल डोमेन (सीसीटीएलडी): कुछ सीसीटीएलडी (जैसे .tv, .me, वगैरह) को Google जीटीएलडी मानता है. ऐसा इसलिए होता है क्योंकि उपयोगकर्ता और वेबमास्टर अक्सर इन्हें किसी खास देश के लिए मानने के बजाय सामान्य ही मानते हैं. यहां ऐसे कुछ सीसीटीएलडी की सूची दी गई है (यह सूची बदल सकती है).
    • .ad
    • .as
    • .bz
    • .cc
    • .cd
    • .co
    • .dj
    • .fm
    • .io
    • .la
    • .me
    • .ms
    • .nu
    • .sc
    • .sr
    • .su
    • .tv
    • .tk
    • .ws
क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?