डेटा सैंपलिंग क्या है
डेटा सैंपलिंग, डेटा के किसी सबसेट का विश्लेषण करने की प्रोसेस है, ताकि किसी बड़े डेटा सेट से काम की जानकारी मिल सके. इस प्रोसेस की मदद से, डेटा क्वालिटी पर कम से कम असर डालते हुए, तेज़ी से डेटा वापस पाया जा सकता है.
उदाहरण के लिए, अगर 100 एकड़ में समान दूरी पर लगे पेड़ों की संख्या का अनुमान लगाना हो, तो 1 एकड़ में पेड़ों की संख्या की गिनती करके उसे 100 से गुणा किया जा सकता है. दूसरा तरीका यह है कि आधे एकड़ में पेड़ों की गिनती करके उसे 200 से गुणा कर दें.
आपको डेटा सैंपलिंग क्यों दिखती है
Google Analytics में, डेटा सैंपलिंग तब की जा सकती है, जब कोई रिपोर्ट, अनुरोध या एक्सप्लोरेशन बनाने के लिए इस्तेमाल किए गए इवेंट की संख्या, आपकी प्रॉपर्टी के लिए तय की गई सीमा से ज़्यादा हो. ऐसा होने पर Analytics, डेटा के एक हिस्से का इस्तेमाल करता है और उसके बाद बड़े पैमाने पर सटीक नतीजे देता है. इन नतीजों में आपके पूरे डेटा की जानकारी होती है.
जब आपके नतीजों में सैंपलिंग का इस्तेमाल किया जाता है, तो यह डेटा क्वालिटी के आइकॉन में दिखता है. इस आइकॉन में, नतीजे बनाने के लिए इस्तेमाल किए गए डेटा के प्रतिशत की जानकारी भी दिखती है. सैंपल साइज़ जितना बड़ा होगा नतीजे उतने ही सटीक होंगे.
इवेंट लेवल की क्वेरी के लिए सीमाएं
Google Analytics की स्टैंडर्ड प्रॉपर्टी के लिए, इवेंट लेवल की क्वेरी का कोटा एक करोड़ है. साथ ही, Google Analytics 360 प्रॉपर्टी के लिए यह कोटा एक अरब है.
Google Analytics 360 प्रॉपर्टी में हर क्वेरी के लिए, शुरुआती तौर पर इवेंट की डिफ़ॉल्ट संख्या 10 करोड़ होती है. इससे आपको जल्दी और सटीक नतीजे मिलते हैं. ज़्यादा सटीक जानकारी की ज़रूरत होने पर, सैंपलिंग की ज़्यादा से ज़्यादा सीमाएं ऐक्सेस की जा सकती हैं. इसके लिए, आपको डेटा क्वालिटी के आइकॉन में जाकर, “ज़्यादा जानकारी वाले नतीजे” चुनकर, 'एक्सप्लोर करें' विकल्प पर जाना होगा.
पूरे डेटा के बारे में क्या जानकारी मिलती है
पूरे डेटा पर आधारित रिपोर्ट के लिए Google Analytics, HyperLogLog++ (HLL++) का इस्तेमाल करता है. इससे, सक्रिय उपयोगकर्ताओं और सेशन जैसी ज़्यादा इस्तेमाल की जाने वाली मेट्रिक की सटीक गिनती का अनुमान लगाया जाता है. HLL++ का इस्तेमाल करने से, बेहतर परफ़ॉर्मेंस और अनुमान की ज़्यादा सटीक जानकारी मिलती है. साथ ही, इससे गड़बड़ी में कमी आती है. BigQuery में अपने Google Analytics डेटा के साथ, HLL++ का इस्तेमाल भी किया जा सकता है. Google Analytics में यूनीक संख्या के अनुमान के बारे में ज़्यादा जानें.