रुझान डेटा को कैसे दुरुस्त किया जाता है

'रुझान' खोज डेटा को दुरुस्त करता है, ताकि शब्दों के बीच आसानी से तुलना की जा सके.

किसी क्वेरी की रैंक इस बात से तय होती है कि वह क्वेरी कब और कहां से की गई है. ऐसा करने के लिए आगे दिए गए तरीके का इस्तेमाल किया जाता है:

  • किसी एक डेटा बिंदु को बाकी डेटा बिंदुओं की तुलना में कितना कम या कितना ज़्यादा खोजा जा रहा है, यह जानने के लिए हर डेटा बिंदु को इस आधार पर बांट दिया जाता है कि अलग-अलग जगहों और समय-अंतरालों के लिए उसे कितनी-कितनी बार खोजा गया. ऐसा न किया जाए तो जिन जगहों के लिए खोज मात्रा सबसे ज़्यादा है, उनकी रैंक हमेशा सबसे ऊपर होगी.
  • इसके बाद अलग-अलग विषयों (डेटा बिंदुओं) के लिए जो संख्याएं मिलती हैं, उनका मान बदल कर उन्हें 0 से 100 तक की किसी संख्या के बराबर कर दिया जाता है. इसके लिए 'एक विषय के लिए की गई खोजों की संख्या' और 'सभी विषयों के लिए की गई कुल खोजों की संख्या' के अनुपात को आधार बनाया जाता है.
  • जिन अलग-अलग जगहों पर किसी शब्द को खोजने के लिए बराबर दिलचस्पी दिखाई पड़ती है, उन जगहों के लिए खोजों की कुल संख्या हमेशा बराबर नहीं होती.

रुझान डेटा कहां से आता है

'Google रुझान' डेटा, 'Google सर्च' डेटा का एक 'निष्पक्ष नमूना' होता है. रुझान डेटा तैयार करने के लिए सिर्फ़ कुछ प्रतिशत खोजों का ही इस्तेमाल किया जाता है.

रुझान डेटा 2 तरह के होते हैं:

  • असल समय का डेटा पिछले 7 दिनों की खोजों का एक नमूना होता है (यह नमूना इस तरह से लिया जाता है कि इसमें किसी भी खोज के शामिल होने की संभावना बराबर होती है)
  • पुराना डेटा 'Google सर्च' डेटा का एक नमूना होता है, जिसे 2004 से लेकर आपकी खोज से 36 घंटे पहले तक के समय-अंतराल में लिया जाता है (यह नमूना इस तरह से लिया जाता है कि इसमें किसी भी खोज के शामिल होने की संभावना बराबर होती है)

खोज डेटा इकट्ठा कर लेने के बाद हम उसे श्रेणियों में बांटते हैं, किसी विषय से जोड़ते हैं और कोई भी निजी जानकारी हटा देते हैं.

शामिल न किया जाने वाला डेटा

  • बहुत कम लोगों की ओर से की गई खोजें: रुझान सिर्फ़ लोकप्रिय शब्दों के लिए डेटा दिखाता है, इसलिए कम बार खोजे गए शब्द "0" के रूप में दिखाई देते हैं
  • डुप्लीकेट खोजें: रुझान एक छोटे समय-अंतराल में एक ही व्यक्ति की ओर से बार-बार की गई एक ही खोज को निकाल देता है
  • विशेष वर्ण: रुझान अपॉसट्रफ़ी और दूसरे विशेष वर्णों वाली क्वेरी को अलग कर देता है