[GA4] BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

अपनी भाषा में सबटाइटल देखने के लिए, YouTube कैप्शन चालू करें. इसके लिए, वीडियो प्लेयर में सबसे नीचे मौजूद "सेटिंग" आइकॉन YouTube सेटिंग आइकॉन की इमेज को चुनें. इसके बाद, "सबटाइटल" पर क्लिक करें और अपनी भाषा चुनें.


BigQuery एक क्लाउड डेटा वेयरहाउस है. इसकी मदद से, बड़े डेटासेट की ज़्यादा परफ़ॉर्म करने वाली क्वेरी चलाई जा सकती हैं.

Google Analytics 4 प्रॉपर्टी से, अपने पूरे रॉ इवेंट डेटा को BigQuery में एक्सपोर्ट किया जा सकता है. इसमें सब-प्रॉपर्टी और रोल-अप प्रॉपर्टी का डेटा भी शामिल है. इसके बाद, एसक्यूएल जैसे सिंटैक्स का इस्तेमाल करके उस डेटा के लिए क्वेरी की जा सकती है. BigQuery में, अपने डेटा को बाहरी स्टोरेज में एक्सपोर्ट किया जा सकता है. इसके अलावा, अपने Analytics डेटा के साथ बाहरी डेटा का इस्तेमाल करने के लिए, उसे इंपोर्ट किया जा सकता है.

BigQuery में एक्सपोर्ट किए गए डेटा पर आपका मालिकाना हक होता है. साथ ही, BigQuery ACL का इस्तेमाल करके प्रोजेक्ट और डेटासेट की अनुमतियां मैनेज की जा सकती हैं.

ध्यान दें: Analytics से BigQuery में डेटा एक्सपोर्ट करने के बाद, उसे दोबारा एक्सपोर्ट नहीं किया जा सकता.

दिन में एक बार पूरा डेटा एक्सपोर्ट होता है. डेटा पूरे दिन एक्सपोर्ट होता रहता है. इसके बारे में ज़्यादा जानकारी के लिए, यहां दिया गया स्ट्रीमिंग एक्सपोर्ट देखें.

BigQuery सैंडबॉक्स की मदद से, एक तय सीमा तक बिना किसी शुल्क के डेटा एक्सपोर्ट किया जा सकता है, लेकिन सैंडबॉक्स सीमा से ज़्यादा डेटा एक्सपोर्ट करने पर शुल्क लगता है.

स्टैंडर्ड प्रॉपर्टी के लिए, BigQuery Export की रोज़ की सीमा 10 लाख इवेंट है. BigQuery Export की अन्य सीमाओं के बारे में ज़्यादा जानें

BigQuery Export के टाइप

Google Analytics, BigQuery Export के लिए ये विकल्प उपलब्ध कराता है. इनमें से हर विकल्प में, मौजूदा दिन के लिए डेटा की उपलब्धता अलग-अलग होती है. इन विकल्पों को डेटा से जुड़ी अपनी ज़रूरतों और बजट के हिसाब से चुना जाना चाहिए:

एक्सपोर्ट के टाइप इसका इस्तेमाल तब करें, जब... एक्सपोर्ट की जानकारी सीमाएं चेतावनियां

रोज़ाना का एक्सपोर्ट

(स्टैंडर्ड, 360)

आपको पिछले दिन का पूरा डेटा चाहिए और आपको डेटा की ज़रूरत तुरंत न हो या आप 360 के ग्राहक न हों

पिछले दिन का रॉ और बिना सैंपल वाला पूरा इवेंट डेटा, दिन में एक बार एक्सपोर्ट करता है

किसी तय समय पर एक्सपोर्ट होने की गारंटी नहीं है

आम तौर पर, यह आपकी प्रॉपर्टी के टाइमज़ोन के हिसाब से दोपहर के समय एक्सपोर्ट करता है. हालांकि, इसमें देरी हो सकती है और यह देर शाम या अगले दिन तक भी हो सकता है

लास्ट क्लिक मॉडल का इस्तेमाल किया गया, मॉडलिंग नहीं की गई

स्टैंडर्ड प्रॉपर्टी: हर दिन 10 लाख इवेंट तक, तय सीमा में रहने के लिए फ़िल्टर करने के विकल्प

360 प्रॉपर्टी: हर दिन 20 अरब इवेंट तक

उपयोगकर्ता एट्रिब्यूशन जैसे कुछ डेटा को प्रोसेस होने में ज़्यादा से ज़्यादा 24 घंटे लग सकते हैं. हमारा सुझाव है कि उपयोगकर्ता एट्रिब्यूशन डेटा के लिए, स्ट्रीमिंग के बजाय रोज़ाना एक्सपोर्ट करने की सुविधा का इस्तेमाल करें

रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी

(360)

आपको पूरे दिन का डेटा तुरंत चाहिए हो

आम तौर पर, डेटा सुबह 5 बजे तक मिल जाता है

दिन भर में कई बार बैच अपडेट होता है, आम तौर पर 60 मिनट के अंदर

रोज़ाना एक्सपोर्ट जैसा ही स्कीमा

प्रॉपर्टी के टाइमज़ोन के हिसाब से, एक्सपोर्ट शुरू होता है

लास्ट क्लिक मॉडल का इस्तेमाल किया गया, मॉडलिंग नहीं की गई

रोज़ाना एक्सपोर्ट की तुलना में ज़्यादा तेज़ी से

कुछ XL प्रॉपर्टी के लिए, एसएलए उपलब्ध नहीं है यह सुविधा सिर्फ़ "सामान्य" और "बड़ी" 360 प्रॉपर्टी के लिए उपलब्ध है.

स्ट्रीमिंग

(स्टैंडर्ड, 360)

आपको करीब-करीब रीयल टाइम में डेटा (कुछ ही मिनटों में) चाहिए हो

मौजूदा दिन के डेटा का रीयल टाइम में एक्सपोर्ट

सबसे अच्छी सेवा: यह बिना पूरी जानकारी वाले एसएलओ के काम करती है. इसमें डेटा गैप हो सकते हैं

वॉल्यूम की कोई सीमा नहीं नए उपयोगकर्ता और नए सेशन के ट्रैफ़िक सोर्स का डेटा, एक्सपोर्ट से बाहर रखा जाता है

ध्यान दें: हर एक्सपोर्ट के लिए, BigQuery को स्टोरेज और प्रोसेसिंग के लिए शुल्क देना होगा. स्ट्रीमिंग एक्सपोर्ट का इस्तेमाल करने पर, आपको हर गीगाबाइट (जीबी) डेटा के लिए, BigQuery के शुल्क के तौर पर अतिरिक्त 0.05 डॉलर चुकाने होंगे. एक गीगाबाइट (जीबी) में करीब 6,00,000 Google Analytics इवेंट आ सकते हैं. हालांकि, यह संख्या इवेंट के साइज़ के आधार पर अलग-अलग होगी. BigQuery की कीमतों के बारे में ज़्यादा जानें.

Google Analytics इंटरफ़ेस और BigQuery Export के बीच अंतर

BigQuery इवेंट एक्सपोर्ट की मदद से, रॉ इवेंट डेटा और उपयोगकर्ता-लेवल का डेटा ऐक्सेस किया जा सकता है. हालांकि, इसमें आपको वे अतिरिक्त सुविधाएं नहीं मिलती हैं जो स्टैंडर्ड रिपोर्ट और एक्सप्लोरेशन में मौजूद डेटा के लिए, Google Analytics इंटरफ़ेस में मिलती हैं. इस वजह से, BigQuery इवेंट एक्सपोर्ट और Google Analytics इंटरफ़ेस के डेटा के बीच अंतर हो सकता है.

BigQuery इवेंट एक्सपोर्ट और Google Analytics इंटरफ़ेस के बीच के अंतर को समझने और इन्हें कम करने के तरीके जानने के लिए, Google Analytics यूज़र इंटरफ़ेस और BigQuery एक्सपोर्ट के बीच के अंतर को कम करना लेख देखें.

स्ट्रीमिंग एक्सपोर्ट

अपनी Google Analytics 4 प्रॉपर्टी को BigQuery से लिंक करने पर, स्ट्रीमिंग एक्सपोर्ट का विकल्प चुना जा सकता है.

BigQuery स्ट्रीमिंग एक्सपोर्ट, BigQuery Export की मदद से कुछ ही मिनटों में उस दिन का डेटा उपलब्ध कराता है.

इस विकल्प का इस्तेमाल करने पर, BigQuery में हाल ही की जानकारी दिखती है. इससे उपयोगकर्ताओं के बारे में और अपनी प्रॉपर्टी पर उनके ट्रैफ़िक का विश्लेषण किया जा सकता है.

स्ट्रीमिंग एक्सपोर्ट, हर दिन के लिए एक नई टेबल बनाता है:

  • events_intraday_YYYYMMDD: यह एक इंटरनल स्टेजिंग टेबल है और इसमें दिन भर में होने वाले सेशन की गतिविधि के रिकॉर्ड शामिल होते हैं. स्ट्रीमिंग एक्सपोर्ट, सबसे बढ़िया ऑपरेशन है. ऐसा हो सकता है कि इवेंट में देरी होने और/या अपलोड न किए जा सकने जैसी वजहों से, इसमें पूरा डेटा शामिल न हो. डेटा को दिन भर लगातार एक्सपोर्ट किया जाता है. जब किसी सेशन में एक से ज़्यादा एक्सपोर्ट कार्रवाइयां होती हैं, तब इस टेबल में उस सेशन के रिकॉर्ड शामिल हो सकते हैं. events_YYYYMMDD के पूरा होने पर, इस टेबल को मिटा दिया जाता है.

BigQuery Export सेट अप करते समय रोज़ का विकल्प चुनने पर, नीचे दी गई टेबल भी हर दिन बनाई जाती है.

  • events_YYYYMMDD: इवेंट का हर दिन किया जाने वाला एक्सपोर्ट.

आपको events_YYYYMMDD के बजाय events_YYYYMMDD के लिए क्वेरी करनी चाहिए, ताकि आपकी उस दिन की क्वेरी, स्टेबल डेटासेट के लिए हो.

events_YYYYMMDD और events_intraday_YYYYMMDD टेबल के बारे में ज़्यादा जानकारी पाने के लिए, BigQuery Export स्कीमा देखें.

BigQuery स्ट्रीमिंग एक्सपोर्ट में, नए उपयोगकर्ताओं के लिए नीचे दिया गया उपयोगकर्ता-एट्रिब्यूशन डेटा शामिल नहीं होता है:

  • traffic_source.name (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का कैंपेन)
  • traffic_source.source (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का सोर्स)
  • traffic_source.medium (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का मीडियम)

मौजूदा उपयोगकर्ताओं का उपयोगकर्ता एट्रिब्यूशन डेटा शामिल किया गया है, लेकिन इस डेटा को पूरी तरह से प्रोसेस होने में करीब 24 घंटे लगते हैं. इसलिए, हमारा सुझाव है कि आप स्ट्रीमिंग एक्सपोर्ट के डेटा पर भरोसा करने के बजाय हर दिन एक्सपोर्ट किए गए पूरे डेटा का उपयोगकर्ता एट्रिब्यूशन डेटा हासिल करें.

स्ट्रीमिंग एक्सपोर्ट का इस्तेमाल करने पर, आपको हर गीगाबाइट (जीबी) डेटा के लिए, BigQuery के शुल्क के तौर पर अतिरिक्त 0.05 डॉलर चुकाने होंगे. एक गीगाबाइट (जीबी) में करीब 6,00,000 Google Analytics इवेंट आ सकते हैं. हालांकि, यह संख्या इवेंट के साइज़ के आधार पर अलग-अलग होगी. BigQuery की कीमतों के बारे में ज़्यादा जानें.

रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी

अब आपके पास रोज़ और स्ट्रीमिंग एक्सपोर्ट के विकल्पों के साथ-साथ, रोज़ाना अपडेट होने वाले डेटा को एक्सपोर्ट करने की फ़्रीक्वेंसी चुनने का विकल्प भी है. हर दिन का नया डेटा एक्सपोर्ट करने की सुविधा, Analytics 360 प्रॉपर्टी के लिए अब उपलब्ध है. साथ ही, एक्सपोर्ट करने के तीनों विकल्पों को अलग-अलग चालू किया जा सकता है.

रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी की सुविधा को कॉन्फ़िगर करने के लिए, आपको Google Cloud Platform पर बिलिंग को सेट अप करना होगा. BigQuery के लिए रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी (GA360) के बारे में ज़्यादा जानें.

पूरा होने का सिग्नल

GA360 के जिन ग्राहकों ने रोज़ाना अपडेट होने वाले डेटा को एक्सपोर्ट करने की सुविधा का इस्तेमाल किया है उन्हें 'पूरा होने के सिग्नल' से पता चलता है कि पिछले दिन का सारा डेटा एक्सपोर्ट हो गया है.

'पूरा होने का सिग्नल' ऐक्सेस करने के लिए:

  1. Cloud Logging में साइन इन करें और “लॉग एक्सप्लोरर” सेक्शन पर जाएं.
  2. "एक्सपोर्ट पूरा हो गया" खोजें.

लॉग एक्सप्लोरर में टाइमस्टैंप की रेंज बढ़ानी पड़ सकती है. आम तौर पर, यह मैसेज प्रॉपर्टी के टाइमज़ोन में सुबह 5 बजे के आस-पास दिखता है.

'पूरा होने के सिग्नल' को Cloud Logging के लॉग राऊटर सेक्शन में देखा जा सकता है. इसे Cloud Pub/Sub के विषयों पर भेजा जा सकता है.

टेबल के अपडेट का शेड्यूल

BigQuery Export के हिस्से के तौर पर बनाई गई टेबल के अपडेट, उस Analytics प्रॉपर्टी के टाइम ज़ोन के हिसाब से होते हैं जिससे डेटा एक्सपोर्ट किया जा रहा है. अगर प्रॉपर्टी का टाइम ज़ोन बदला जाता है, तो इसका असर BigQuery Export पर पड़ेगा. इससे डेटा में अंतर हो सकता है या रोज़ाना होने वाला एक्सपोर्ट स्किप हो सकता है.

स्ट्रीमिंग-एक्सपोर्ट टेबल (events_intraday_YYYYMMDD) पूरे दिन अपडेट होती रहती हैं. उदाहरण के लिए, प्रॉपर्टी के टाइम ज़ोन में, रात 12:00:00 बजे से रात 11:59:59 बजे तक. प्रॉपर्टी के टाइम ज़ोन के हिसाब से नया दिन शुरू होने पर, इवेंट एक नई इंट्रा-डे टेबल में लिखे जाते हैं.

Analytics जब दिन के सभी इवेंट इकट्ठा कर लेता है, तब रोज़ की एक्सपोर्ट टेबल (events_YYYYMMDD) बनाई जाती हैं. Analytics, डेली टेबल की तारीख के बाद 72 घंटों तक उन टेबल को अपडेट करेगा. ऐसा सिर्फ़ उन इवेंट के लिए किया जाता है जिनकी तय तारीख, टेबल की तारीख से मैच होती है. उदाहरण के लिए, इवेंट के ऐसे बंडल जो मेज़रमेंट प्रोटोकॉल या Firebase SDK से देर में मिलते हैं. उदाहरण के लिए, अगर टेबल में तारीख 20220101 है, तो Analytics 20220104 तक टेबल को उन इवेंट के लिए अपडेट करेगा जिनके लिए 20220101 तय तारीख है.

कभी-कभी, Analytics 72 घंटे की विंडो के बाद किसी भी समय डेली टेबल को अपडेट कर सकता है. हालांकि, ऐसा सिर्फ़ उन स्थितियों में होगा जब Analytics को पुराने डेटा को फिर से प्रोसेस करने की ज़रूरत हो. उदाहरण के लिए, ऐसी गड़बड़ी ठीक करने के लिए जिससे प्रोसेसिंग की समस्या ठीक होती है.

बिना कुकी वाले पिंग और ग्राहक से मिला डेटा

सहमति मोड लागू होने पर, Analytics बिना कुकी वाले जिन पिंग को इकट्ठा करेगा उन्हें BigQuery Export में दिखाया जाएगा. इसमें ग्राहकों से मिला डेटा भी दिखेगा. जैसे, user_id और कस्टम डाइमेंशन.

“उपलब्ध नहीं है” ट्रैफ़िक सोर्स डाइमेंशन को बैकफ़िल करना

अगर किसी दिए गए GCLID के लिए, एट्रिब्यूट किए गए ट्रैफ़िक सोर्स डाइमेंशन को लुकअप करना है, तो यहां दिए गए संसाधनों का इस्तेमाल करें. ध्यान दें कि wBRAID और gBRAID आइडेंटिफ़ायर, BigQuery Export में शामिल नहीं किए जाते.

  • Google Ads API
  • Google Ads स्क्रिप्ट
  • Google Ads के लिए, BigQuery डेटा ट्रांसफ़र सेवा

अगर "traffic_source" कॉलम में, "उपलब्ध नहीं है" रिकॉर्ड के लिए GCLID ढूंढना है, तो “collected_traffic_source” कॉलम में GCLID फ़ील्ड के लिए क्वेरी करें. किसी दिए गए GCLID से Google Ads में कैंपेन की जानकारी देखने के तरीके के बारे में ज़्यादा जानने के लिए, BigQuery Export का सेवा स्तर समझौता देखें.

GA4 - Firebase इंटिग्रेशन और BigQuery

अगर किसी GA4 प्रॉपर्टी और Firebase प्रोजेक्ट को इंटिग्रेट किया गया है, तो उन्हें अलग-अलग BigQuery प्रोजेक्ट से लिंक नहीं किया जा सकता.

Google Analytics 4 और Universal Analytics में BigQuery Export की तुलना करें

Google Analytics 4 Universal Analytics

स्टैंडर्ड (मुफ़्त) और 360 (पेड) वर्शन में उपलब्ध है

स्टैंडर्ड वर्शन की सीमा: हर दिन 10 लाख इवेंट

360 वर्शन की सीमा: हर दिन अरबों इवेंट

360 (पेड) वर्शन में उपलब्ध है

लागत

सैंडबॉक्स की सीमाओं के तहत, BigQuery सैंडबॉक्स में डेटा एक्सपोर्ट करने के लिए कोई शुल्क नहीं लिया जाता

सैंडबॉक्स के लिए तय की गई सीमाओं से ज़्यादा डेटा एक्सपोर्ट करने पर, समझौते की शर्तों के मुताबिक शुल्क लिया जाता है

लागत

सैंडबॉक्स की सीमाओं के तहत, BigQuery सैंडबॉक्स में डेटा एक्सपोर्ट करने के लिए कोई शुल्क नहीं लिया जाता

सैंडबॉक्स के लिए तय की गई सीमाओं से ज़्यादा डेटा एक्सपोर्ट करने पर, समझौते की शर्तों के मुताबिक शुल्क लिया जाता है

सेटअप

इसमें, कुछ डेटा स्ट्रीम शामिल की जा सकती हैं. साथ ही, हर प्रॉपर्टी के लिए कुछ इवेंट को बाहर रखा जा सकता है

इसकी मदद से, एक्सपोर्ट वॉल्यूम और लागत को कंट्रोल किया जा सकता है

सेटअप

इसमें, हर प्रॉपर्टी के लिए एक व्यू को लिंक किया जा सकता है

उस व्यू में मौजूद पूरे डेटा को एक्सपोर्ट करता है

स्ट्रीमिंग एक्सपोर्ट

हर जीबी के लिए 0.05 डॉलर. BigQuery में, डेटा के लिए तय की गई कीमतों के बारे में ज़्यादा जानें

टेबल बनाई जाती है:

events_intraday_YYYYMMDD

टेबल हर दिन मिटाई जाती है:

  • अगर स्ट्रीमिंग के साथ-साथ, डेली-एक्सपोर्ट का विकल्प भी इस्तेमाल किया जाता है
  • हर दिन बनाई जाने वाली टेबल के पूरा होने पर

इसमें नए उपयोगकर्ताओं के लिए, उपयोगकर्ता के कैंपेन, सोर्स या मीडियम से जुड़े डेटा को शामिल नहीं किया जाता

स्ट्रीमिंग एक्सपोर्ट

हर जीबी के लिए 0.05 डॉलर. BigQuery में, डेटा के लिए तय की गई कीमतों के बारे में ज़्यादा जानें

टेबल बनाई जाती है:

ga_realtime_sessions_YYYYMMDD

BigQuery व्यू बनाया गया:

ga_realtime_sessions_view_YYYYMMDD

डेली एक्सपोर्ट

टेबल बनाई जाती है:

events_YYYYMMDD

डेली एक्सपोर्ट

टेबल बनाई जाती हैं

ga_sessions_intraday_YYYYMMDD

  • हर दिन, कम से कम तीन बार अपडेट की जाती हैं
  • हर बार अपडेट करने पर, पिछला डेटा ओवरराइट हो जाता है
  • अगले दिन का पूरा डेटा इंपोर्ट हो जाने पर, मिटा दी जाती हैं

ga_sessions_YYYYMMDD

  • पूरा डेली इंपोर्ट

रोज़ाना अपडेट होने वाले डेटा का एक्सपोर्ट

“सामान्य” और “बड़ी” 360 प्रॉपर्टी के लिए उपलब्ध है

डेटा को प्रोसेस करने के तरीके की वजह से, रोज़ाना के एक्सपोर्ट और रोज़ाना अपडेट होने वाले डेटा में अंतर के बारे में ज़्यादा जानें.

लागू नहीं

एक्सपोर्ट, सामान्य

बैकफ़िल: कोई बैकफ़िल नहीं

डेटासेट: लिंक की गई हर प्रॉपर्टी के लिए, analytics_<property id> नाम का एक डेटासेट

अगर आपने सहमति मोड लागू किया है, तो एक्सपोर्ट में ये चीज़ें शामिल होंगी:

  • बिना कुकी वाले पिंग
  • ग्राहक से मिला डेटा (user_id, कस्टम डाइमेंशन)

एक्सपोर्ट, सामान्य

बैकफ़िल: लिंक करने पर, 13 महीने के डेटा का बैकफ़िल या 10B हिट, इनमें से जो भी कम हो

BigQuery सैंडबॉक्स में बैकफ़िल की प्रोसेस में रुकावट आ सकती है

डेटासेट: लिंक किए गए हर व्यू के लिए, एक डेटासेट का नाम व्यू के नाम जैसा होता है

स्कीमा एक्सपोर्ट

GA4 सिर्फ़ उस ट्रैफ़िक सोर्स को एक्सपोर्ट करता है जिसकी वजह से उपयोगकर्ता पहली बार आपसे जुड़ा

BigQuery में एक्सपोर्ट किए गए UA डेटा के साथ काम नहीं करता

BigQuery टेबल की हर लाइन किसी इवेंट के बारे में बताती है

Google Analytics 4 के लिए यूनीक इवेंट डेटा

Google Analytics 4 के कुछ फ़ील्ड, Universal Analytics फ़ील्ड जैसे ही हैं. उदाहरण के लिए, device.category और device.deviceCategory. हालांकि, GA4 के इवेंट डेटा और UA के हिट डेटा के बीच समानता के बजाय अंतर ज़्यादा है

स्कीमा एक्सपोर्ट

एक से ज़्यादा टच पॉइंट पर सेशन-लेवल एट्रिब्यूशन

BigQuery टेबल की हर लाइन किसी सेशन के बारे में बताती है

यूनिवर्सल Analytics के लिए यूनीक हिट डेटा

Google Analytics 4 के कुछ फ़ील्ड,Universal Analytics फ़ील्ड जैसे ही हैं. उदाहरण के लिए: device.deviceCategory और device.category. हालांकि, UA के हिट डेटा और GA4 के इवेंट डेटा के बीच समानता के बजाय अंतर ज़्यादा है.

इसी विषय से जुड़े लिंक

इनके बारे में ज़्यादा जानने के लिए BigQuery डेवलपर गाइड पर जाएं:

क्या यह उपयोगी था?

हम उसे किस तरह बेहतर बना सकते हैं?
खोजें
खोज हटाएं
खोज बंद करें
Google ऐप
मुख्य मेन्यू