BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

अपनी भाषा में सबटाइटल देखने के लिए, YouTube कैप्शन चालू करें. इसके लिए, वीडियो प्लेयर में सबसे नीचे मौजूद "सेटिंग" आइकॉन YouTube सेटिंग आइकॉन की इमेज को चुनें. इसके बाद, "सबटाइटल" पर क्लिक करें और अपनी भाषा चुनें.


BigQuery एक क्लाउड डेटा वेयरहाउस है. इसकी मदद से, बड़े डेटासेट की ज़्यादा परफ़ॉर्म करने वाली क्वेरी चलाई जा सकती हैं.

Google Analytics प्रॉपर्टी से, रॉ इवेंट डेटा को BigQuery में एक्सपोर्ट किया जा सकता है. इसमें सब-प्रॉपर्टी और रोल-अप प्रॉपर्टी का डेटा भी शामिल है. इसके बाद, एसक्यूएल जैसे सिंटैक्स का इस्तेमाल करके उस डेटा के लिए क्वेरी चलाई जा सकती है. BigQuery में, अपने डेटा को बाहरी स्टोरेज में एक्सपोर्ट किया जा सकता है या बाहरी डेटा को अपने Analytics डेटा के साथ मिलाने के लिए, उसे इंपोर्ट भी किया जा सकता है.

BigQuery में एक्सपोर्ट किए गए डेटा पर आपका मालिकाना हक होता है. साथ ही, BigQuery ACL का इस्तेमाल करके प्रोजेक्ट और डेटासेट की अनुमतियां मैनेज की जा सकती हैं.

दिन में एक बार पूरा डेटा एक्सपोर्ट होता है. डेटा को दिन भर लगातार एक्सपोर्ट किया जाता है. स्ट्रीमिंग एक्सपोर्ट के बारे में ज़्यादा जानें.

BigQuery सैंडबॉक्स की मदद से, एक तय सीमा तक बिना किसी शुल्क के डेटा एक्सपोर्ट किया जा सकता है, लेकिन सैंडबॉक्स सीमा से ज़्यादा डेटा एक्सपोर्ट करने पर शुल्क लगता है.

स्टैंडर्ड प्रॉपर्टी के लिए, BigQuery Export की रोज़ की सीमा 10 लाख इवेंट है. BigQuery Export की सीमाओं के बारे में ज़्यादा जानें.

ध्यान दें:
  • Google Analytics से लिंक किए गए प्रॉडक्ट डेटा को जोड़ने के अनुरोध, एक्सपोर्ट नहीं किए जा रहे हैं. BigQuery में सिर्फ़ रॉ इवेंट डेटा होता है, जो Google Analytics को क्लाइंट से मिलता है.
  • Analytics से BigQuery में डेटा एक्सपोर्ट करने के बाद, उसे दोबारा एक्सपोर्ट नहीं किया जा सकता.

इस पेज पर इन विषयों के बारे में बताया गया है


BigQuery Export के टाइप

Google Analytics, BigQuery Export के लिए ये विकल्प उपलब्ध कराता है. इनमें से हर विकल्प में, मौजूदा दिन के लिए डेटा की उपलब्धता अलग-अलग होती है. इन विकल्पों को डेटा से जुड़ी अपनी ज़रूरतों और बजट के हिसाब से चुना जाना चाहिए:

एक्सपोर्ट के टाइप इसका इस्तेमाल तब करें, जब... एक्सपोर्ट की जानकारी सीमाएं चेतावनियां

रोज़ाना का एक्सपोर्ट

(स्टैंडर्ड, 360)

आपको पिछले दिन का पूरा डेटा चाहिए और आपको डेटा की ज़रूरत तुरंत न हो या आप 360 के ग्राहक न हों

पिछले दिन का रॉ और बिना सैंपल वाला पूरा इवेंट डेटा, दिन में एक बार एक्सपोर्ट करता है

किसी तय समय पर एक्सपोर्ट होने की गारंटी नहीं है

आम तौर पर, यह आपकी प्रॉपर्टी के टाइमज़ोन के हिसाब से दोपहर के समय एक्सपोर्ट करता है. हालांकि, इसमें देरी हो सकती है और यह देर शाम या अगले दिन तक भी हो सकता है

लास्ट क्लिक मॉडल का इस्तेमाल किया गया, मॉडलिंग नहीं की गई

स्टैंडर्ड प्रॉपर्टी: हर दिन 10 लाख इवेंट तक, तय सीमा में रहने के लिए फ़िल्टर करने के विकल्प

360 प्रॉपर्टी: हर दिन 20 अरब इवेंट तक

उपयोगकर्ता एट्रिब्यूशन जैसे कुछ डेटा को प्रोसेस होने में ज़्यादा से ज़्यादा 24 घंटे लग सकते हैं. हमारा सुझाव है कि उपयोगकर्ता एट्रिब्यूशन डेटा के लिए, स्ट्रीमिंग के बजाय रोज़ाना एक्सपोर्ट करने की सुविधा का इस्तेमाल करें

रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी

(360)

आपको पूरे दिन का डेटा तुरंत चाहिए हो

आम तौर पर, डेटा सुबह 5 बजे तक मिल जाता है

दिन भर में कई बार बैच अपडेट होता है, आम तौर पर 60 मिनट के अंदर

रोज़ाना एक्सपोर्ट जैसा ही स्कीमा

प्रॉपर्टी के टाइमज़ोन के हिसाब से, एक्सपोर्ट शुरू होता है

लास्ट क्लिक मॉडल का इस्तेमाल किया गया, मॉडलिंग नहीं की गई

रोज़ाना एक्सपोर्ट की तुलना में ज़्यादा तेज़ी से

कुछ XL प्रॉपर्टी के लिए, एसएलए उपलब्ध नहीं है यह सुविधा सिर्फ़ "सामान्य" और "बड़ी" 360 प्रॉपर्टी के लिए उपलब्ध है.

स्ट्रीमिंग

(स्टैंडर्ड, 360)

आपको करीब-करीब रीयल टाइम में डेटा (कुछ ही मिनटों में) चाहिए हो

मौजूदा दिन के डेटा का रीयल टाइम में एक्सपोर्ट

सबसे अच्छी सेवा: यह बिना पूरी जानकारी वाले एसएलओ के काम करती है. इसमें डेटा गैप हो सकते हैं

वॉल्यूम की कोई सीमा नहीं नए उपयोगकर्ता और नए सेशन के ट्रैफ़िक सोर्स का डेटा, एक्सपोर्ट से बाहर रखा जाता है
ध्यान दें: हर एक्सपोर्ट के लिए, BigQuery को स्टोरेज और प्रोसेसिंग के लिए शुल्क देना होगा. स्ट्रीमिंग एक्सपोर्ट का इस्तेमाल करने पर, आपको हर गीगाबाइट (जीबी) डेटा के लिए, BigQuery के शुल्क के तौर पर अतिरिक्त 0.05 डॉलर चुकाने होंगे. एक गीगाबाइट (जीबी) में करीब 6,00,000 Google Analytics इवेंट आ सकते हैं. हालांकि, यह संख्या इवेंट के साइज़ के आधार पर अलग-अलग होगी. BigQuery की कीमतों के बारे में ज़्यादा जानें.

Google Analytics इंटरफ़ेस और BigQuery Export के बीच अंतर

BigQuery इवेंट एक्सपोर्ट की मदद से, रॉ इवेंट डेटा और उपयोगकर्ता-लेवल का डेटा ऐक्सेस किया जा सकता है. हालांकि, इसमें आपको वे अतिरिक्त सुविधाएं नहीं मिलती हैं जो स्टैंडर्ड रिपोर्ट और एक्सप्लोरेशन में मौजूद डेटा के लिए, Google Analytics इंटरफ़ेस में मिलती हैं. इस वजह से, BigQuery इवेंट एक्सपोर्ट और Google Analytics इंटरफ़ेस के डेटा के बीच अंतर हो सकता है.

BigQuery इवेंट एक्सपोर्ट और Google Analytics इंटरफ़ेस के बीच के अंतर को समझने और इन्हें कम करने के तरीके जानने के लिए, Google Analytics यूज़र इंटरफ़ेस और BigQuery एक्सपोर्ट के बीच के अंतर को कम करना लेख देखें.

स्ट्रीमिंग एक्सपोर्ट

अपनी Google Analytics प्रॉपर्टी को BigQuery से लिंक करने पर, स्ट्रीमिंग एक्सपोर्ट का विकल्प चुना जा सकता है.

BigQuery स्ट्रीमिंग एक्सपोर्ट, BigQuery Export की मदद से कुछ ही मिनटों में उस दिन का डेटा उपलब्ध कराता है.

इस विकल्प का इस्तेमाल करने पर, BigQuery में हाल ही की जानकारी दिखती है. इससे उपयोगकर्ताओं के बारे में और अपनी प्रॉपर्टी पर उनके ट्रैफ़िक का विश्लेषण किया जा सकता है.

स्ट्रीमिंग एक्सपोर्ट, हर दिन के लिए एक नई टेबल बनाता है:

  • events_intraday_YYYYMMDD: यह एक इंटरनल स्टेजिंग टेबल है और इसमें दिन भर में होने वाले सेशन की गतिविधि के रिकॉर्ड शामिल होते हैं. स्ट्रीमिंग एक्सपोर्ट, सबसे बढ़िया ऑपरेशन है. ऐसा हो सकता है कि इवेंट में देरी होने और/या अपलोड न किए जा सकने जैसी वजहों से, इसमें पूरा डेटा शामिल न हो. डेटा को दिन भर लगातार एक्सपोर्ट किया जाता है. जब किसी सेशन में एक से ज़्यादा एक्सपोर्ट कार्रवाइयां होती हैं, तब इस टेबल में उस सेशन के रिकॉर्ड शामिल हो सकते हैं. events_YYYYMMDD के पूरा होने पर, इस टेबल को मिटा दिया जाता है.

BigQuery Export सेट अप करते समय रोज़ का विकल्प चुनने पर, नीचे दी गई टेबल भी हर दिन बनाई जाती है.

  • events_YYYYMMDD: इवेंट का हर दिन किया जाने वाला एक्सपोर्ट.

आपको events_YYYYMMDD के बजाय events_YYYYMMDD के लिए क्वेरी करनी चाहिए, ताकि आपकी उस दिन की क्वेरी, स्टेबल डेटासेट के लिए हो.

events_YYYYMMDD और events_intraday_YYYYMMDD टेबल के बारे में ज़्यादा जानकारी पाने के लिए, BigQuery Export स्कीमा देखें.

BigQuery स्ट्रीमिंग एक्सपोर्ट में, नए उपयोगकर्ताओं के लिए नीचे दिया गया उपयोगकर्ता-एट्रिब्यूशन डेटा शामिल नहीं होता है:

  • traffic_source.name (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का कैंपेन)
  • traffic_source.source (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का सोर्स)
  • traffic_source.medium (रिपोर्टिंग डाइमेंशन: उपयोगकर्ता का मीडियम)

मौजूदा उपयोगकर्ताओं का उपयोगकर्ता एट्रिब्यूशन डेटा शामिल किया गया है, लेकिन इस डेटा को पूरी तरह से प्रोसेस होने में करीब 24 घंटे लगते हैं. इसलिए, हमारा सुझाव है कि आप स्ट्रीमिंग एक्सपोर्ट के डेटा पर भरोसा करने के बजाय हर दिन एक्सपोर्ट किए गए पूरे डेटा का उपयोगकर्ता एट्रिब्यूशन डेटा हासिल करें.

स्ट्रीमिंग एक्सपोर्ट का इस्तेमाल करने पर, आपको हर गीगाबाइट (जीबी) डेटा के लिए, BigQuery के शुल्क के तौर पर अतिरिक्त 0.05 डॉलर चुकाने होंगे. एक गीगाबाइट (जीबी) में करीब 6,00,000 Google Analytics इवेंट आ सकते हैं. हालांकि, यह संख्या इवेंट के साइज़ के आधार पर अलग-अलग होगी. BigQuery की कीमतों के बारे में ज़्यादा जानें.

रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी

अब आपके पास रोज़ और स्ट्रीमिंग एक्सपोर्ट के विकल्पों के साथ-साथ, रोज़ाना अपडेट होने वाले डेटा को एक्सपोर्ट करने की फ़्रीक्वेंसी चुनने का विकल्प भी है. हर दिन का नया डेटा एक्सपोर्ट करने की सुविधा, Analytics 360 प्रॉपर्टी के लिए अब उपलब्ध है. साथ ही, एक्सपोर्ट करने के तीनों विकल्पों को अलग-अलग चालू किया जा सकता है.

रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी की सुविधा को कॉन्फ़िगर करने के लिए, आपको Google Cloud Platform पर बिलिंग को सेट अप करना होगा. BigQuery के लिए रोज़ाना अपडेट होने वाले डेटा की एक्सपोर्ट फ़्रीक्वेंसी (GA360) के बारे में ज़्यादा जानें.


पूरा होने का सिग्नल

GA360 के जिन ग्राहकों ने रोज़ाना अपडेट होने वाले डेटा को एक्सपोर्ट करने की सुविधा का इस्तेमाल किया है उन्हें Google Analytics, 'पूरा होने का सिग्नल' भेजता है. इससे पता चलता है कि पिछले दिन का सारा डेटा एक्सपोर्ट हो गया है.

'पूरा होने का सिग्नल' ऐक्सेस करने के लिए:

  1. Cloud Logging में साइन इन करें और “लॉग एक्सप्लोरर” सेक्शन पर जाएं.
  2. "एक्सपोर्ट पूरा हो गया" खोजें.

लॉग एक्सप्लोरर में टाइमस्टैंप की रेंज बढ़ानी पड़ सकती है. आम तौर पर, यह मैसेज प्रॉपर्टी के टाइमज़ोन में सुबह 5 बजे के आस-पास दिखता है.

'पूरा होने के सिग्नल' को Cloud Logging के लॉग राऊटर सेक्शन में देखा जा सकता है. इसे Cloud Pub/Sub के विषयों पर भेजा जा सकता है.

ध्यान दें: Google Analytics प्रॉपर्टी में किए गए कुछ बदलावों की वजह से, पहले दिन डेटा इंटिग्रेशन की स्थिति का सिग्नल मौजूद नहीं हो सकता है या गलत हो सकता है. इसमें इस तरह के उदाहरण शामिल हैं:
  • प्रॉपर्टी का टाइमज़ोन बदलने के बाद
  • प्रॉपर्टी के लिए BigQuery लिंक बनाने के बाद

पूरा होने का सिग्नल कैसे काम करता है

पूरा होने से जुड़ा सिग्नल, किसी दिन के लिए प्रोसेस और एक्सपोर्ट किए गए इवेंट की कुल संख्या के बारे में अहम जानकारी देता है. इसमें ऐसे इवेंट भी शामिल हैं जो किसी पिछली तारीख को हुए थे, लेकिन बाद में मिले या बैकफ़िल किए गए. सिग्नल, एक्सपोर्ट किए जाने वाले दिन के डेटा फ़्लो को दिखाता है. यह ज़रूरी नहीं है कि यह इवेंट के ओरिजनल टाइमस्टैंप को दिखाए.

उदाहरण

यहां दिए गए उदाहरण पर विचार करें. इसमें Google Analytics प्रॉपर्टी, 29 जुलाई से ऐप्लिकेशन और वेब स्ट्रीम के लिए इवेंट इकट्ठा करना शुरू करती है:

  • 29 जुलाई: X इवेंट, Google Analytics को भेजे जाते हैं और उन्हें तुरंत प्रोसेस किया जाता है. इसके अलावा, इस दिन L ऐप्लिकेशन इवेंट भी होते हैं. हालांकि, उपयोगकर्ताओं के ऑफ़लाइन होने की वजह से, ये इवेंट 30 जुलाई तक Google Analytics को नहीं मिलते.
  • 30 जुलाई: इस दिन Y इवेंट होते हैं और इन्हें Google Analytics को भेजा जाता है.
  • 31 जुलाई: 29 जुलाई को हुए M इवेंट को मेज़रमेंट प्रोटोकॉल के ज़रिए बैकफ़िल किया गया. इस दिन Z इवेंट होते हैं और इन्हें Google Analytics को भी भेजा जाता है.

इस उदाहरण में, 'पूरा होने का सिग्नल' इन बातों को दिखाएगा:

  • 29 जुलाई: X इवेंट के लिए, डेटा पूरा होने का सिग्नल जनरेट होगा.
  • 30 जुलाई: डेटा की पूरी जानकारी वाले सिग्नल में, Y और L, दोनों तरह के इवेंट शामिल होंगे.
  • 31 जुलाई: डेटा की पूरी जानकारी देने वाले सिग्नल में, M और Z, दोनों तरह के इवेंट शामिल होंगे.

टेबल के अपडेट का शेड्यूल

BigQuery Export के हिस्से के तौर पर बनाई गई टेबल के अपडेट, उस Analytics प्रॉपर्टी के टाइम ज़ोन के हिसाब से होते हैं जिससे डेटा एक्सपोर्ट किया जा रहा है. अगर प्रॉपर्टी का टाइम ज़ोन बदला जाता है, तो इसका असर BigQuery Export पर पड़ेगा. इससे डेटा में अंतर हो सकता है या रोज़ाना होने वाला एक्सपोर्ट स्किप हो सकता है.

स्ट्रीमिंग-एक्सपोर्ट टेबल (events_intraday_YYYYMMDD) पूरे दिन अपडेट होती रहती हैं. उदाहरण के लिए, प्रॉपर्टी के टाइम ज़ोन में, रात 12:00:00 बजे से रात 11:59:59 बजे तक. प्रॉपर्टी के टाइम ज़ोन के हिसाब से नया दिन शुरू होने पर, इवेंट एक नई इंट्रा-डे टेबल में लिखे जाते हैं.

Analytics जब दिन के सभी इवेंट इकट्ठा कर लेता है, तब रोज़ की एक्सपोर्ट टेबल (events_YYYYMMDD) बनाई जाती हैं. Analytics, डेली टेबल की तारीख के बाद दो कैलेंडर दिनों तक उन टेबल को अपडेट करेगा. ऐसा सिर्फ़ उन इवेंट के लिए किया जाता है जिनकी तय तारीख, टेबल की तारीख से मैच होती है. उदाहरण के लिए, इवेंट के ऐसे बंडल जो मेज़रमेंट प्रोटोकॉल या Firebase SDK से देर में मिलते हैं. उदाहरण के लिए, अगर टेबल में तारीख 20220101 है, तो Analytics 20220104 तक टेबल को उन इवेंट के लिए अपडेट करेगा जिनके लिए 20220101 तय तारीख है.

कभी-कभी, Analytics दो कैलेंडर दिनों की विंडो के बाद भी डेली टेबल को अपडेट कर सकता है. हालांकि, ऐसा सिर्फ़ उन स्थितियों में होगा जब Analytics को पुराने डेटा को फिर से प्रोसेस करने की ज़रूरत होती है (उदाहरण के लिए, ऐसी गड़बड़ी ठीक करना जिससे प्रोसेसिंग की समस्या ठीक होती है).


बिना कुकी वाले पिंग और ग्राहक से मिला डेटा

सहमति मोड लागू होने पर, Analytics बिना कुकी वाले जिन पिंग को इकट्ठा करेगा उन्हें BigQuery Export में दिखाया जाएगा. इसमें ग्राहकों से मिला डेटा भी दिखेगा. जैसे, user_id और कस्टम डाइमेंशन.


“उपलब्ध नहीं है” ट्रैफ़िक सोर्स डाइमेंशन को बैकफ़िल करना

अगर किसी दिए गए GCLID के लिए, एट्रिब्यूट किए गए ट्रैफ़िक सोर्स डाइमेंशन को लुकअप करना है, तो यहां दिए गए संसाधनों का इस्तेमाल करें. ध्यान दें कि wBRAID और gBRAID आइडेंटिफ़ायर, BigQuery Export में शामिल नहीं किए जाते.

  • Google Ads API
  • Google Ads स्क्रिप्ट
  • Google Ads के लिए, BigQuery डेटा ट्रांसफ़र सेवा

अगर "traffic_source" कॉलम में, "उपलब्ध नहीं है" रिकॉर्ड के लिए GCLID ढूंढना है, तो “collected_traffic_source” कॉलम में GCLID फ़ील्ड के लिए क्वेरी करें. किसी दिए गए GCLID से Google Ads में कैंपेन की जानकारी देखने के तरीके के बारे में ज़्यादा जानने के लिए, Google Ads ट्रैफ़िक सोर्स डेटा को जल्द से जल्द बैकफ़िल करें (GA 360) लेख पढ़ें.


Google Analytics - Firebase इंटिग्रेशन और BigQuery

अगर किसी Google Analytics प्रॉपर्टी और Firebase प्रोजेक्ट को इंटिग्रेट किया गया है, तो उन्हें अलग-अलग BigQuery प्रोजेक्ट से लिंक नहीं किया जा सकता.


इसी विषय से जुड़े लिंक

इनके बारे में ज़्यादा जानने के लिए BigQuery डेवलपर गाइड पर जाएं:

क्या यह उपयोगी था?

हम उसे किस तरह बेहतर बना सकते हैं?
खोजें
खोज हटाएं
खोज बंद करें
Google ऐप
मुख्य मेन्यू
7133128131055200102
true
खोज मदद केंद्र
false
true
true
true
true
true
69256
false
false
false
false