[GA4] BigQuery Export

 

BigQuery एक क्लाउड डेटा वेयरहाउस है. इसकी मदद से, बड़े डेटासेट में मौजूद बेहतर परफ़ॉर्म करने वाली क्वेरी चलाई जा सकती हैं.

Google Analytics 4 प्रॉपर्टी से, रॉ इवेंट डेटा को BigQuery में एक्सपोर्ट किया जा सकता है. इसमें सब-प्रॉपर्टी और रोल-अप प्रॉपर्टी का डेटा भी शामिल है. इसके बाद, एसक्यूएल जैसे सिंटैक्स का इस्तेमाल करके उस डेटा के लिए क्वेरी चलाई जा सकती है. BigQuery में, अपने डेटा को बाहरी स्टोरेज में एक्सपोर्ट किया जा सकता है. इसके अलावा, बाहरी डेटा का इस्तेमाल अपने Analytics डेटा के साथ करने के लिए, उसे इंपोर्ट भी किया जा सकता है.

BigQuery में एक्सपोर्ट किए गए डेटा पर आपका मालिकाना हक होता है. साथ ही, BigQuery ACL का इस्तेमाल करके प्रोजेक्ट और डेटासेट की अनुमतियां मैनेज की जा सकती हैं.

ध्यान दें: Analytics से BigQuery में डेटा एक्सपोर्ट करने के बाद, उसे दोबारा एक्सपोर्ट नहीं किया जा सकता.

दिन में एक बार पूरा डेटा एक्सपोर्ट होता है. डेटा पूरे दिन एक्सपोर्ट होता रहता है. इसके बारे में ज़्यादा जानकारी के लिए नीचे दिया गया स्ट्रीमिंग एक्सपोर्ट विषय देखें.

BigQuery सैंडबॉक्स की मदद से, एक तय सीमा तक बिना किसी शुल्क के डेटा एक्सपोर्ट किया जा सकता है, लेकिन सैंडबॉक्स सीमा से ज़्यादा डेटा एक्सपोर्ट करने पर शुल्क लगता है.

स्टैंडर्ड प्रॉपर्टी के लिए, BigQuery Export की रोज़ की सीमा 10 लाख इवेंट है. BigQuery Export की अन्य सीमाओं के बारे में ज़्यादा जानें

Google Analytics इंटरफ़ेस और BigQuery Export के बीच अंतर

BigQuery इवेंट एक्सपोर्ट की मदद से, रॉ इवेंट डेटा और उपयोगकर्ता-लेवल का डेटा ऐक्सेस किया जा सकता है. हालांकि, इसमें आपको वे अतिरिक्त सुविधाएं नहीं मिलती हैं जो स्टैंडर्ड रिपोर्ट और एक्सप्लोरेशन में मौजूद डेटा के लिए, Google Analytics इंटरफ़ेस में मिलती हैं. इस वजह से, BigQuery इवेंट एक्सपोर्ट और Google Analytics इंटरफ़ेस के डेटा के बीच अंतर हो सकता है.

BigQuery इवेंट एक्सपोर्ट और Google Analytics इंटरफ़ेस के बीच के अंतर को समझने और इन्हें कम करने के तरीके जानने के लिए, Google Analytics यूज़र इंटरफ़ेस और BigQuery एक्सपोर्ट के बीच के अंतर को कम करना लेख देखें.

स्ट्रीमिंग एक्सपोर्ट

अपनी Google Analytics 4 प्रॉपर्टी को BigQuery से लिंक करने पर, स्ट्रीमिंग एक्सपोर्ट का विकल्प चुना जा सकता है.

BigQuery स्ट्रीमिंग एक्सपोर्ट, BigQuery Export की मदद से कुछ ही मिनटों में उस दिन का डेटा उपलब्ध कराता है.

इस विकल्प का इस्तेमाल करने पर, BigQuery में हाल ही की जानकारी दिखती है. इससे उपयोगकर्ताओं के बारे में और अपनी प्रॉपर्टी पर उनके ट्रैफ़िक का विश्लेषण किया जा सकता है.

स्ट्रीमिंग एक्सपोर्ट, हर दिन के लिए एक नई टेबल बनाता है:

  • events_intraday_YYYYMMDD: यह एक इंटरनल स्टेजिंग टेबल है और इसमें दिन भर में होने वाले सेशन की गतिविधि के रिकॉर्ड शामिल होते हैं. स्ट्रीमिंग एक्सपोर्ट, तुरंत डेटा उपलब्ध कराता है. इसलिए, हो सकता है कि इवेंट में देरी होने और/या अपलोड न होने जैसी वजहों से, इसमें पूरा डेटा शामिल न हो. डेटा को दिन भर लगातार एक्सपोर्ट किया जाता है. जब किसी सेशन में एक से ज़्यादा एक्सपोर्ट कार्रवाइयां होती हैं, तब इस टेबल में उस सेशन के रिकॉर्ड शामिल हो सकते हैं. events_YYYYMMDD के पूरा होने पर, इस टेबल को मिटा दिया जाता है.

BigQuery Export सेट अप करते समय रोज़ का विकल्प चुनने पर, नीचे दी गई टेबल भी हर दिन बनाई जाती है.

  • events_YYYYMMDD: इवेंट का हर दिन किया जाने वाला एक्सपोर्ट.

आपको events_intraday_YYYYMMDD के बजाय events_YYYYMMDD के लिए क्वेरी करनी चाहिए, ताकि आपकी उस दिन की क्वेरी स्थायी डेटासेट के लिए हो.

events_YYYYMMDD और events_intraday_YYYYMMDD टेबल के बारे में ज़्यादा जानकारी पाने के लिए, BigQuery Export स्कीमा देखें.

BigQuery स्ट्रीमिंग एक्सपोर्ट में, नए उपयोगकर्ताओं के लिए नीचे दिया गया उपयोगकर्ता-एट्रिब्यूशन डेटा शामिल नहीं होता है:

  • traffic_source.name (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का कैंपेन)
  • traffic_source.source (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का सोर्स)
  • traffic_source.medium (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का मीडियम)

मौजूदा उपयोगकर्ताओं का उपयोगकर्ता एट्रिब्यूशन डेटा शामिल किया गया है, लेकिन इस डेटा को पूरी तरह से प्रोसेस होने में करीब 24 घंटे लगते हैं. इसलिए, हमारा सुझाव है कि आप स्ट्रीमिंग एक्सपोर्ट के डेटा पर भरोसा करने के बजाय हर दिन एक्सपोर्ट किए गए पूरे डेटा का उपयोगकर्ता एट्रिब्यूशन डेटा हासिल करें.

स्ट्रीमिंग एक्सपोर्ट का इस्तेमाल करने पर, आपको हर गीगाबाइट (जीबी) डेटा के लिए, BigQuery के शुल्क के तौर पर अतिरिक्त 0.05 डॉलर चुकाने होंगे. एक गीगाबाइट (जीबी) में करीब 6,00,000 Google Analytics इवेंट आ सकते हैं. हालांकि, यह संख्या इवेंट के साइज़ के आधार पर अलग-अलग होगी. BigQuery की कीमतों के बारे में ज़्यादा जानें.

टेबल के अपडेट का शेड्यूल

BigQuery Export के हिस्से के तौर पर बनाई गई टेबल के अपडेट, उस Analytics प्रॉपर्टी के टाइम ज़ोन के हिसाब से होते हैं जिससे डेटा एक्सपोर्ट किया जा रहा है.

स्ट्रीमिंग-एक्सपोर्ट टेबल (events_intraday_YYYYMMDD) पूरे दिन अपडेट होती रहती हैं. उदाहरण के लिए, प्रॉपर्टी के टाइम ज़ोन में, रात 12:00:00 बजे से रात 11:59:59 बजे तक. प्रॉपर्टी के टाइम ज़ोन के हिसाब से नया दिन शुरू होने पर, इवेंट एक नई इंट्रा-डे टेबल में लिखे जाते हैं.

Analytics जब दिन के सभी इवेंट इकट्ठा कर लेता है, तब रोज़ की एक्सपोर्ट टेबल (events_YYYYMMDD) बनाई जाती हैं. Analytics, डेली टेबल की तारीख के बाद 72 घंटों तक उन टेबल को अपडेट करेगा. ऐसा सिर्फ़ उन इवेंट के लिए किया जाता है जिनकी तय तारीख, टेबल की तारीख से मैच होती है. उदाहरण के लिए, इवेंट के ऐसे बंडल जो मेज़रमेंट प्रोटोकॉल या Firebase SDK टूल से देर में मिलते हैं. उदाहरण के लिए, अगर टेबल में तारीख 20220101 है, तो Analytics 20220104 तक टेबल को उन इवेंट के लिए अपडेट करेगा जिनके लिए 20220101 तय तारीख है.

कभी-कभी, Analytics 72 घंटे की विंडो के बाद किसी भी समय डेली टेबल को अपडेट कर सकता है. हालांकि, ऐसा सिर्फ़ उन स्थितियों में होगा जब Analytics को पुराने डेटा को फिर से प्रोसेस करने की ज़रूरत हो. उदाहरण के लिए, ऐसी गड़बड़ी ठीक करने के लिए जिससे प्रोसेसिंग की समस्या ठीक होती है.

बिना कुकी वाले पिंग और ग्राहक से मिला डेटा

सहमति मोड लागू होने पर, Analytics बिना कुकी वाले जिन पिंग को इकट्ठा करेगा उन्हें BigQuery Export में दिखाया जाएगा. इसमें ग्राहकों से मिला डेटा भी दिखेगा. जैसे, user_id और कस्टम डाइमेंशन.

GA4 - Firebase इंटिग्रेशन और BigQuery

अगर किसी GA4 प्रॉपर्टी और Firebase प्रोजेक्ट को इंटिग्रेट किया गया है, तो उन्हें अलग-अलग BigQuery प्रोजेक्ट से लिंक नहीं किया जा सकता.

Google Analytics 4 और Universal Analytics में BigQuery Export की तुलना करें

Google Analytics 4 यूनिवर्सल Analytics

स्टैंडर्ड (मुफ़्त) और 360 (पेड) वर्शन में उपलब्ध है

स्टैंडर्ड वर्शन की सीमा: हर दिन 10 लाख इवेंट

360 वर्शन की सीमा: हर दिन अरबों इवेंट

360 (पेड) वर्शन में उपलब्ध है

लागत

सैंडबॉक्स की सीमाओं के तहत, BigQuery सैंडबॉक्स में डेटा एक्सपोर्ट करने के लिए कोई शुल्क नहीं लिया जाता

सैंडबॉक्स के लिए तय की गई सीमाओं से ज़्यादा डेटा एक्सपोर्ट करने पर, समझौते की शर्तों के मुताबिक शुल्क लिया जाता है

लागत

सैंडबॉक्स की सीमाओं के तहत, BigQuery सैंडबॉक्स में डेटा एक्सपोर्ट करने के लिए कोई शुल्क नहीं लिया जाता

सैंडबॉक्स के लिए तय की गई सीमाओं से ज़्यादा डेटा एक्सपोर्ट करने पर, समझौते की शर्तों के मुताबिक शुल्क लिया जाता है

सेट अप

इसमें, कुछ डेटा स्ट्रीम शामिल की जा सकती हैं. साथ ही, हर प्रॉपर्टी के लिए कुछ इवेंट को बाहर रखा जा सकता है

इसकी मदद से, एक्सपोर्ट वॉल्यूम और लागत को कंट्रोल किया जा सकता है

सेट अप

इसमें, हर प्रॉपर्टी के लिए एक व्यू को लिंक किया जा सकता है

उस व्यू में मौजूद पूरे डेटा को एक्सपोर्ट करता है

स्ट्रीमिंग एक्सपोर्ट

हर जीबी के लिए 0.05 डॉलर. BigQuery में, डेटा के लिए तय की गई कीमतों के बारे में ज़्यादा जानें

टेबल बनाई जाती है:

events_intraday_YYYMMDD

टेबल हर दिन मिटाई जाती है:

  • अगर स्ट्रीमिंग के साथ-साथ, डेली-एक्सपोर्ट का विकल्प भी इस्तेमाल किया जाता है
  • हर दिन बनाई जाने वाली टेबल के पूरा होने पर

इसमें नए उपयोगकर्ताओं के लिए, उपयोगकर्ता के कैंपेन, सोर्स या मीडियम से जुड़े डेटा को शामिल नहीं किया जाता

स्ट्रीमिंग एक्सपोर्ट

हर जीबी के लिए 0.05 डॉलर. BigQuery में, डेटा के लिए तय की गई कीमतों के बारे में ज़्यादा जानें

टेबल बनाई जाती है:

ga_realtime_sessions_YYYYMMDD

BigQuery व्यू बनाया गया:

ga_realtime_sessions_view_YYYYMMDD

डेली एक्सपोर्ट

टेबल बनाई जाती है:

events_YYYYMMDD

डेली एक्सपोर्ट

टेबल बनाई जाती हैं

ga_sessions_intraday_YYYYMMDD

  • हर दिन, कम से कम तीन बार अपडेट की जाती हैं
  • हर बार अपडेट करने पर, पिछला डेटा ओवरराइट हो जाता है
  • अगले दिन का पूरा डेटा इंपोर्ट हो जाने पर, मिटा दी जाती हैं

ga_sessions_YYYYMMDD

  • पूरा डेली इंपोर्ट

एक्सपोर्ट, सामान्य

बैकफ़िल: कोई बैकफ़िल नहीं

डेटासेट: लिंक की गई हर प्रॉपर्टी के लिए, analytics_<property id> नाम का एक डेटासेट

अगर आपने सहमति मोड लागू किया है, तो एक्सपोर्ट में ये चीज़ें शामिल होंगी:

  • बिना कुकी वाले पिंग
  • ग्राहक से मिला डेटा (user_id, कस्टम डाइमेंशन)

एक्सपोर्ट, सामान्य

बैकफ़िल: लिंक करने पर, 13 महीने के डेटा का बैकफ़िल या 10B हिट, इनमें से जो भी कम हो

BigQuery सैंडबॉक्स में बैकफ़िल की प्रोसेस में रुकावट आ सकती है

डेटासेट: लिंक किए गए हर व्यू के लिए, एक डेटासेट का नाम व्यू के नाम जैसा होता है

स्कीमा एक्सपोर्ट

BigQuery टेबल की हर लाइन किसी इवेंट के बारे में बताती है

Google Analytics 4 के लिए यूनीक इवेंट डेटा

Google Analytics 4 के कुछ फ़ील्ड, यूनिवर्सल Analytics फ़ील्ड जैसे ही हैं. उदाहरण के लिए, device.category और device.deviceCategory. हालांकि, GA4 के इवेंट डेटा और UA के हिट डेटा के बीच समानता के बजाय अंतर ज़्यादा है

स्कीमा एक्सपोर्ट

BigQuery टेबल की हर लाइन किसी सेशन के बारे में बताती है

यूनिवर्सल Analytics के लिए यूनीक हिट डेटा

Google Analytics 4 के कुछ फ़ील्ड, यूनिवर्सल Analytics फ़ील्ड जैसे ही हैं. उदाहरण के लिए: device.deviceCategory और device.category. हालांकि, UA के हिट डेटा और GA4 के इवेंट डेटा के बीच समानता के बजाय अंतर ज़्यादा है.

 

इसी विषय से जुड़े लिंक

इनके बारे में ज़्यादा जानने के लिए BigQuery डेवलपर गाइड पर जाएं:

क्या यह उपयोगी था?

हम उसे किस तरह बेहतर बना सकते हैं?
खोजें
खोज हटाएं
खोज बंद करें
मुख्य मेन्यू
4989758055494822702
true
खोज मदद केंद्र
true
true
true
true
true
69256
false
false