'Google सर्च' के काम करने का तरीका

जानें कि Google वेब पेज कैसे खोजता है, कैसे क्रॉल करता है और उन्हें किस तरह दिखाता है

'Google सर्च' कैसे काम करता है? यहां इस बारे में प्रमुख बातें बताने के साथ-साथ पूरी जानकारी भी दी गई है.

Google को कई अलग-अलग जगहों से जानकारी मिलती है. इनमें नीचे दिए गए स्रोत शामिल हैं : 

  • वेब पेज,
  • उपयोगकर्ता की ओर से सबमिट की गई सामग्री जैसे, 'Google मेरा व्यवसाय' और 'मैप' इस्तेमाल करने वाले लोगों की सबमिट की गई जानकारी
  • किताब स्कैन करना
  • इंटरनेट पर सभी के इस्तेमाल के लिए मौजूद डेटाबेस
  • कई दूसरे स्रोत

हालांकि, इस पेज पर सिर्फ़ वेब पेजों से मिलने वाली जानकारी के बारे में बताया गया है.

मुख्य बातें

वेब पेजों से नतीजे दिखाने के लिए Google तीन बुनियादी चरणों का पालन करता है:

क्रॉल करना

पहले चरण में यह पता लगाया जाता है कि वेब पर किस तरह के पेज मौजूद हैं. सभी वेब पेजों के लिए कोई एक रजिस्ट्री नहीं है, इसलिए Google को लगातार नए पेज ढूंढने पड़ते हैं और उन्हें अपनी क्रॉल किए जा चुके पेजों की सूची में जोड़ना पड़ता है. पेज ढूंढने की इस प्रक्रिया को क्रॉल करना कहते है.

Google के पास कुछ पेजों के बारे में पहले से जानकारी होती है क्योंकि वे पहले ही क्रॉल किए जा चुके होते हैं. जब Google को क्रॉल किए जा चुके किसी पेज से नए पेज का लिंक मिलता है, तब उसे दूसरे पेजों का पता चलता है. फिर भी दूसरे पेज उस समय मिलते हैं जब वेबसाइट का मालिक Google के पास क्रॉल करने के लिए पेज की सूची (साइटमैप) सबमिट करता है. अगर आप ऐसा वेब होस्ट इस्तेमाल कर रहे हैं जिसे Wix या Blogger जैसी कंपनियां प्रबंधित करती हैं, तो ये कंपनियां Google को आपके बदलावों या नए पेजों को क्रॉल करने के बारे में बता सकती हैं.

क्रॉल होने के लिए अपनी साइट को बेहतर बनाने का तरीका

  • किसी एक पेज में किए गए बदलावों के बारे में बताने के लिए, आप Google को एक यूआरएल सबमिट कर सकते हैं.
  • अपने पेज का लिंक ऐसे किसी पेज पर दें जिसे Google पहले ही क्रॉल कर चुका है. हालांकि, इस बात का ध्यान रखें कि विज्ञापन में दिए गए लिंक, पैसे देकर दूसरी साइट पर दिखाए गए लिंक या टिप्पणी में दिए गए लिंक को क्रॉल नहीं किया जाएगा. इनके अलावा, ऐसे लिंक को भी क्रॉल नहीं किया जाएगा जो वेबमास्टर के लिए बने Google के दिशा-निर्देशों के हिसाब से सही नहीं होते.
  • अगर आप चाहते हैं कि Google आपकी साइट के सिर्फ़ एक पेज को क्रॉल करें, तो वह पेज आपका होम पेज होना चाहिए. Google के हिसाब से होम पेज आपकी साइट का सबसे अहम पेज होता है. अगर आप चाहते हैं कि आपकी साइट को अच्छी तरह क्रॉल किया जाए, तो ध्यान रखें कि आपके होम पेज (और सभी पेजों) पर अच्छा साइट नेविगेशन सिस्टम होना चाहिए, जो आपकी साइट के अहम पेजों और सेक्शन को लिंक करता हो. इससे उपयोगकर्ताओं (और Google) को आपकी साइट की एक जगह से दूसरी जगह पर आसानी से जाने में मदद मिलती है.

 

Google किसी साइट को ज़्यादा बार क्रॉल करने या उसे खोज नतीजों में ऊपर दिखाने के लिए पैसे नहीं लेता. अगर कोई व्यक्ति आपको बताता है कि Google ऐसा करने के लिए पैसे लेता है, तो वह झूठ बोल रहा है.

इंडेक्स करना

पेज का पता लगने के बाद, Google यह समझने की कोशिश करता है कि पेज किस बारे में है. इस प्रक्रिया को इंडेक्स करना कहते हैं. Google पेज पर एम्बेड की गई इमेज और वीडियो फ़ाइलों को अपनी लाइब्रेरी में सेव करता है, पेज की सामग्री की जाँच करता है, और दूसरे तरीकों से पेज को समझने की कोशिश करता है. यह जानकारी Google इंडेक्स में सेव हो जाती है. यह एक ऐसा डेटाबेस है, जो कई कंप्यूटर में सेव है.

इंडेक्स होने के लिए अपने पेज को बेहतर बनाने का तरीका :

  • पेज के ऐसे शीर्षक बनाएं, जो छोटे हों और उपयोगकर्ता को आसानी से समझ में आ जाएं.
  • पेज के बारे में बताने के लिए पेज की हेडिंग इस्तेमाल करें.
  • सामग्री के बारे में बताने के लिए इमेज के बजाय लेख इस्तेमाल करें. (Google कुछ इमेज और वीडियो को समझ सकता है, लेकिन यह इन्हें उतनी अच्छी तरह से नहीं समझ पाता जितनी अच्छी तरह से लेख को समझता है. इसलिए, कम से कम अपने वीडियो और इमेज पर वैकल्पिक लेख और दूसरी विशेषताओं पर ऐनोटेशन (लिखावट) जोड़ें. साथ ही, आपको ज़रूरत के मुताबिक दूसरे ऐट्रिब्यूट भी जोड़ने चाहिए.)

पेज दिखाना (और रैंक करना)

जब कोई उपयोगकर्ता किसी क्वेरी की खोज करता है, तब Google प्रासंगिक नतीजे ढूंढने की कोशिश करता है. ऐसा करने के लिए Google कई चीज़ों को ध्यान में रखता है. Google सबसे अच्छी क्वालिटी वाले नतीजे दिखाने की कोशिश करता है. ऐसा करने के लिए वह उपयोगकर्ता अनुभव को बेहतर बनाने वाली चीज़ों को ध्यान में रखता है. Google उपयोगकर्ता की जगह की जानकारी, भाषा, और डिवाइस (डेस्कटॉप या फ़ोन) जैसी दूसरी जानकारी को ध्यान में रखकर सटीक नतीजे दिखाता है. उदाहरण के लिए, अगर भारत में कोई उपयोगकर्ता इंटरनेट पर "साइकिल की मरम्मत करने वाली दुकान" के बारे में खोजता है और बांग्लादेश में भी कोई उपयोगकर्ता इंटरनेट पर यही खोज करता है, तो दोनों को अलग-अलग खोज नतीजे दिखाई देंगे. किसी पेज की रैंक बढ़ाने के लिए Google पैसा नहीं लेता. पेज की रैंकिंग, प्रोग्राम के ज़रिए तय की जाती है.

खोज नतीजों में पेज को बेहतर तरीके से दिखाने और उसकी रैंकिंग बेहतर बनाने का तरीका :

पूरी जानकारी

क्या आप इस बारे में ज़्यादा जानकारी पाना चाहते हैं? यहां इस बारे में ज़्यादा जानकारी दी गई है :

पूरी जानकारी

 

क्रॉल करना

क्रॉल करना ऐसी प्रक्रिया है जिसके ज़रिए Googlebot, Google इंडेक्स में जोड़े जाने के लिए नए और अपडेट किए गए पेज ढूंढता है.

हम वेब पर अरबों पेज फ़ेच करने (या "क्रॉल करने") के लिए बहुत सारे कंप्यूटर का इस्तेमाल करते हैं. पेज ढूंढने वाले इस प्रोग्राम को Googlebot कहते हैं (इसे रोबोट, बॉट या स्पाइडर के तौर पर भी जाना जाता है). Googlebot एक एल्गोरिद्म प्रक्रिया का इस्तेमाल करता है: यह कंप्यूटर प्रोग्राम इस बात का ध्यान रखता है कि किस साइट को क्रॉल करना है, उसे कितनी बार क्रॉल करना है और हर साइट के कितने पेजों को फ़ेच करना है.

Google की क्रॉल करने से जुड़ी प्रक्रिया की शुरुआत, वेब पेजों के यूआरएल की एक सूची बनाने से होती है. यह सूची पिछली बार क्रॉल करने की प्रक्रिया और वेबमास्टर की ओर से मिले साइटमैप के डेटा की मदद से तैयार की जाती है. जैसे ही Googlebot इन वेबसाइट पर जाता है, वैसे ही यह हर पेज पर दिए गए लिंक की पहचान करता है और उन्हें क्रॉल करने वाले पेजों की सूची में जोड़ देता है. नई साइटें, मौजूदा साइटों में किए गए बदलाव और इस्तेमाल न किए जा रहे लिंक को नोट करके Google इंडेक्स को अपडेट करने के लिए इनका इस्तेमाल किया जाता है.

Google किसी पेज को कैसे ढूंढता है?

किसी पेज को ढूंढने के लिए Google कई तकनीकों का इस्तेमाल करता है. इनमें शामिल हैं :

  • दूसरी साइटों और पेजों पर मौजूद लिंक पर जाकर
  • साइटमैप पढ़कर

Google को कैसे पता चलता है कि किस पेज को क्रॉल करना है और किसे नहीं?

  • robots.txt के ज़रिए ब्लॉक किए गए पेजों को क्रॉल नहीं किया जाएगा, लेकिन अगर किसी दूसरे पेज पर उनका लिंक मिलता है, तो उन्हें इंडेक्स किया जा सकता है. (Google लिंक के ज़रिए यह अंदाज़ा लगा सकता है कि पेज पर किस तरह की सामग्री है और सामग्री को पार्स किए बिना उसे इंडेक्स कर सकता है.)
  • Google किसी ऐसे पेज को क्रॉल नहीं कर सकता जिसे कोई अनजान उपयोगकर्ता (बिना ईमेल आईडी जैसी कोई जानकारी डाले या कोई मंज़ूरी लिए) एक्सेस न कर पाए. इसलिए ऐसे किसी पेज को क्रॉल नहीं किया जाएगा जिसे एक्सेस करने के लिए लॉग इन करने या सुरक्षा से जुड़ी किसी मंज़ूरी की ज़रूरत हो.
  • जिन पेजों को पहले ही क्रॉल किया जा चुका है और माना जाता है कि वे दूसरे पेज के डुप्लीकेट हैं उन्हें ज्यादा क्रॉल नहीं किया जाता.

क्रॉल करवाने के लिए अपनी साइट को बेहतर बनाना

Google को अपनी साइट के पेज ढूंढने में मदद करने के लिए इन तकनीकों का इस्तेमाल करें :

इंडेक्स करना

पेज पर देखे गए सभी शब्दों और पेज पर उनकी जगह की जानकारी का बड़ा इंडेक्स बनाने के लिए Googlebot क्रॉल किए गए हर पेज को प्रोसेस करता है. इसके अलावा, हम मुख्य सामग्री देने वाले टैग और विशेषताओं को प्रोसेस करते हैं जैसे, title टैग और वैकल्पिक विशेषताएं. Googlebot कई तरह की सामग्री को प्रोसेस करता है लेकिन यह सभी तरह की सामग्री को प्रोसेस नहीं करता. उदाहरण के लिए, हम रिच मीडिया वाली कुछ फ़ाइलों की सामग्री को प्रोसेस नहीं करते हैं.

क्रॉल और इंडेक्स करते समय Google को यह पता चल जाता है कि कोई पेज, दूसरे पेज का डुप्लीकेट या कैननिकल है या नहीं. अगर पेज को डुप्लीकेट माना जाता है, तो उसे कम बार क्रॉल किया जाएगा.

ध्यान दें कि Google noindex डायरेक्टिव (हेडर या टैग) वाले पेज इंडेक्स नहीं करता. अगर किसी पेज को robot.txt फ़ाइल, लॉगिन पेज या दूसरे डिवाइस से ब्लॉक किया गया है, तो Google को इस बारे में निर्देश दिखाई देने चाहिए. शायद Google उस पेज को भी इंडेक्स कर ले जिस पर वह कभी गया न हो.

इंडेक्स करवाने के लिए अपने पेज को बेहतर बनाना

आप नीचे दी गई तकनीकों का इस्तेमाल करके अपने पेज की सामग्री को बेहतर तरीके से समझने में Google की मदद कर सकते हैं:

नतीजे दिखाना

जब कोई उपयोगकर्ता कोई क्वेरी खोजता है, तो हमारी मशीनें इंडेक्स में क्वेरी से मिलते-जुलते पेज ढूंढती हैं. इसके बाद, उन नतीजों को दिखाया जाता है जिनके बारे में हमें लगता है कि वे उपयोगकर्ता की क्वेरी से सबसे ज़्यादा मेल खाते हैं. क्वेरी से मिलते-जुलते नतीजों को ढूंढते समय 200 से ज़्यादा चीज़ों का ध्यान रखा जाता है. हम हमेशा अपने एल्गोरिद्म को बेहतर बनाने के लिए काम करते रहते हैं. नतीजों को चुनने और उन्हें दिखाने का क्रम तय करने के लिए, Google इस बात को ध्यान में रखता है कि उपयोगकर्ता उन्हें कितनी अच्छी तरह से इस्तेमाल कर सकते हैं. इसलिए, आपके पेज का तेज़ी से लोड और मोबाइल-फ़्रेंडली होना ज़रूरी है.

नतीजों में दिखाई देने के लिए अपने पेज को बेहतर बनाने का तरीका

और ज़्यादा जानकारी

आप यहां 'Google सर्च' के काम करने के तरीके के बारे में और ज़्यादा जानकारी पा सकते हैं (यहां इस बारे में तस्वीरों और वीडियो की मदद से बताया गया है).

क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?