أداة BigQuery هي مستودع بيانات في السحابة الإلكترونية يتيح لك تنفيذ طلبات بحث عالية الأداء لمجموعات البيانات الكبيرة.
يمكنك تصدير جميع الأحداث الأوّلية من مواقع "إحصاءات Google 4" (بما في ذلك المواقع الفرعية ومواقع البيانات المجمّعة) إلى BigQuery، ثمّ استخدام بنية تشبه لغة الاستعلامات البنيوية (SQL) لإجراء طلبات لهذه البيانات. وفي BigQuery، يمكنك اختيار تصدير بياناتك إلى وحدة تخزين خارجية أو استيراد البيانات الخارجية لأغراض دمجها في بيانات "إحصاءات Google".
عند تصدير البيانات إلى BigQuery، تصبح أنت مالك هذه البيانات، ويمكنك استخدام قوائم ACL في BigQuery لإدارة أذونات المشاريع ومجموعات البيانات.
يحدث التصدير الكامل للبيانات مرّة واحدة في اليوم. ويتمّ تصدير هذه البيانات أيضًا بصفة مستمرّة على مدار اليوم (راجِع تصدير بيانات البث أدناه).
يمكنك التصدير إلى نسخة افتراضية مجّانية من BigQuery (وضع الحماية على BigQuery)، ولكن ستُفرض رسوم على عمليات التصدير التي تتجاوز حدود وضع الحماية.
للمواقع العادية حدّ يومي في BigQuery Export يبلغ مليون حدث. اطّلِع على مزيد من المعلومات عن حدود BigQuery Export الأخرى.
الاختلافات بين واجهة "إحصاءات Google" وBigQuery Export
يوفِّر تصدير الأحداث من BigQuery إمكانية الوصول إلى البيانات على مستوى المستخدِم وبيانات الأحداث الأوّلية، باستثناء أيّ إضافات قيمة تُجريها "إحصاءات Google" للبيانات الواردة في التقارير والاستكشافات العادية. ولهذا السبب، قد تختلف البيانات الواردة من تصدير الأحداث من BigQuery عن البيانات الواردة في واجهة "إحصاءات Google".
للتعرّف على الاختلافات بين تصدير الأحداث من BigQuery وواجهة "إحصاءات Google"، واكتشاف طرق التخفيف من حدّة هذه الاختلافات متى أمكن، اطّلِع على المقالة سدّ الفجوة بين واجهة مستخدِم "إحصاءات Google" وBigQuery Export.
تصدير بيانات البث
يمكنك تحديد خيار تصدير البث عند ربط موقع "إحصاءات Google 4" وBigQuery.
يتيح تصدير بث BigQuery بيانات لليوم الحالي في غضون دقائق قليلة من خلال ميزة BigQuery Export.
عند استخدام خيار التصدير هذا، تحصل أداة BigQuery على معلومات أكثر حداثة يمكنك تحليلها حول المستخدمين وزياراتهم في موقعك.
في كل يوم، تُنشئ عملية تصدير بيانات البث جدولاً جديدًا واحدًا:
events_intraday_YYYYMMDD
: جدول تقسيم مرحلي داخلي يحتوي على سجلات نشاط الجلسة التي حدثت خلال اليوم. وتصدير بيانات البثّ هو عملية تستنِد إلى أفضل جهد وقد لا تتضمّن جميع البيانات لأسباب مثل معالجة النتائج المتأخّرة و/أو عمليات التحميل التي تعذّر إتمامها. ويتم تصدير البيانات بصفة مستمرة على مدار اليوم. ويمكن أن يتضمّن هذا الجدول سجلّات الجلسة عندما تمتد تلك الجلسة على مستوى عمليات تصدير متعددة. ويتم حذف هذا الجدول عند اكتمالevents_YYYYMMDD
.
في حال تحديد الخيار اليومي عند إعداد ميزة BigQuery Export، يتم أيضًا إنشاء الجدول التالي كل يوم.
events_YYYYMMDD
: التصدير اليومي الكامل للأحداث.
عليك إجراء طلب البحث events_YYYYMMDD
بدلاً من events_intraday_YYYYMMDD
بحيث ترسل طلبات بحث عن مجموعة بيانات ثابتة خلال اليوم.
يمكنك الاطّلاع على مخطط BigQuery Export لمزيد من المعلومات عن الجدولَين events_YYYYMMDD
وevents_intraday_YYYYMMDD
.
لا يتضمّن تصدير بث BigQuery بيانات إحالة المستخدم التالية للمستخدمين الجدد:
- traffic_source.name (مكوّن إعداد التقارير: حملة المستخدم)
- traffic_source.source (مكوّن إعداد التقارير: مصدر المستخدم)
- traffic_source.medium (مكوّن إعداد التقارير: وسيط المستخدم)
يتمّ تضمين بيانات مصدر المستخدِم، وذلك في ما يخصّ المستخدِمين الحاليين، إلّا إنّ تلك البيانات تتطلّب 24 ساعة تقريبًا لمعالجتها بالكامل. لذا ننصح بعدم الاعتماد على تلك البيانات من تصدير بيانات البثّ وبدلاً من ذلك الحصول على بيانات تحديد مصدر المستخدِم من التصدير اليومي الكامل.
ستتحمّل تكاليف إضافية في ما يخصّ BigQuery لإجراء عملية تصدير بيانات البثّ بسعر 0.05 دولار أمريكي (أو ما يعادله بالعملة المحلّية) لكلّ غيغابايت من البيانات. ويساوي 1 غيغابايت حوالي 600,000 حدث في "إحصاءات Google"، إلا أنّ هذا العدد سيختلف اعتمادًا على حجم الأحداث. اطّلِع على مزيد من المعلومات عن تسعير BigQuery.
الجدول الزمني لتعديلات الجداول
إنّ توقيت التعديلات على الجداول التي يتم إنشاؤها كجزء من BigQuery Export مرتبط بالمنطقة الزمنية لموقع "إحصاءات Google" الذي يتم تصدير البيانات منه.
يتم تعديل جداول تصدير بيانات البث (events_intraday_YYYYMMDD) بشكل مستمر على مدار اليوم (مثلاً من الساعة 12:00:00 صباحًا إلى 11:59:59 مساءً بتوقيت المنطقة الزمنية للموقع). وبعد أن يبدأ يوم جديد في المنطقة الزمنية للموقع، يتم إدخال الأحداث في جدول جديد خلال اليوم الواحد.
يتم إنشاء جداول التصدير اليومية (events_YYYYMMDD) بعد أن تجمع "إحصاءات Google" جميع الأحداث خلال اليوم. وستعمل "إحصاءات Google" على تعديل الجداول اليومية لمدة تصل إلى 72 ساعة بعد تاريخ إصدار الجدول الذي يتضمّن أحداثًا تحمِل طوابع زمنية بتاريخ الجدول، مثل مجموعات الأحداث التي ترِد متأخرة من Measurement Protocol أو حِزم تطوير البرامج (SDK) لمنصة Firebase. على سبيل المثال، إذا كان تاريخ الجدول هو 2022/01/01، ستعمل "إحصاءات Google" على تعديل الجدول إلى 2022/01/04 مع تضمين الأحداث التي تحمِل طابعًا زمنيًا بتاريخ 2022/01/01.
في بعض الأحيان، يمكن أن تعدِّل "إحصاءات Google" الجداول اليومية في أي وقت بعد فترة الاثنين وسبعين ساعة في ظل ظروف تتطلب منها إعادة معالجة البيانات السابقة (مثل إصلاح خطأ يساعد على تصحيح خطأ في المعالجة).
إشعارات بدون ملفّات تعريف الارتباط وبيانات مقدَّمة من العملاء
عند تنفيذ وضع الموافقة، ستكون إشعارات ملفّات تعريف الارتباط التي تجمعها "إحصاءات Google" متوفّرة في BigQuery Export، بالإضافة إلى البيانات المقدَّمة من العملاء مثل user_id والسمات المخصّصة.
إحصاءات Google 4 - دمج Firebase وBigQuery
في حال دمج موقع على "إحصاءات Google 4" ومشروع على Firebase، لا يمكن ربطهما بمشاريع BigQuery منفصلة.
مقارنة BigQuery Export في كلٍّ من "إحصاءات Google 4" وUniversal Analytics
إحصاءات Google 4 | Universal Analytics |
---|---|
تتوفّر في الإصدار العادي (المجاني) وإصدار 360 (المدفوع) الحد الأقصى للأحداث في الإصدار العادي: مليون حدث في اليوم الحد الأقصى للأحداث في إصدار 360: مليارات الأحداث في اليوم |
تتوفّر في إصدار 360 (المدفوع) |
التكلفة تصدير مجاني إلى وضع الحماية في BigQuery ضمن حدود هذا الوضع وفقًا لبنود العقد، تُفرض رسوم على البيانات التي يتم تصديرها وتتجاوز حدود وضع الحماية |
التكلفة تصدير مجاني إلى وضع الحماية في BigQuery ضمن حدود هذا الوضع وفقًا لبنود العقد، تُفرض رسوم على البيانات التي يتم تصديرها وتتجاوز حدود وضع الحماية |
عملية الإعداد يمكن تضمين مصادر بيانات معيَّنة واستبعاد أحداث معيَّنة لكل موقع (إتاحة إمكانية التحكم في حجم التصدير وتكلفته) |
عملية الإعداد يمكن ربط ملف شخصي واحد لكل موقع (يتم تصدير جميع البيانات في هذا الملف الشخصي) |
التصدير باستخدام البث 0.05 دولار أمريكي (أو ما يعادله بالعملة المحلية) لكل غيغابايت (مزيد من المعلومات عن أسعار BigQuery) اسم الجدول الذي يتم إنشاؤه: events_intraday_YYYYMMDD يتم حذف الجدول كل يوم في الحالات التالية:
لا يتم تضمين بيانات حملة المستخدِم أو مصدر المستخدِم أو وسيط المستخدِم في ما يتعلق بالمستخدِمين الجدد |
التصدير باستخدام البث 0.05 دولار أمريكي (أو ما يعادله بالعملة المحلية) لكل غيغابايت (مزيد من المعلومات عن أسعار BigQuery) اسم الجدول الذي يتم إنشاؤه: ga_realtime_sessions_YYYYMMDD اسم الملف الشخصي الذي يتم إنشاؤه من BigQuery: ga_realtime_sessions_view_YYYYMMDD |
التصدير اليومي اسم الجدول الذي يتم إنشاؤه: events_YYYYMMDD |
التصدير اليومي اسم الجدول الذي يتم إنشاؤه: ga_sessions_intraday_YYYYMMDD
ga_sessions_YYYYMMDD
|
إعدادات التصدير العامة إضافة بيانات سابقة: غير سارية مجموعة البيانات: لكل موقع مرتبط، يتم تخصيص مجموعة بيانات واحدة باسم analytics_<معرِّف الموقع> إذا تم تنفيذ وضع الموافقة، ستتضمن عملية التصدير ما يلي:
|
إعدادات التصدير العامة إضافة بيانات سابقة: عند الربط، تتم إضافة بيانات سابقة منذ 13 شهرًا أو إضافة بيانات 10 مليارات نتيجة سابقة، أيهما أقل (قد تتعذّر إضافة البيانات السابقة إلى وضع الحماية في BigQuery) مجموعة البيانات: لكل ملف شخصي مرتبط، يتم تخصيص مجموعة بيانات واحدة باسم الملف الشخصي نفسه |
مخطط التصدير كل صف في جدول BigQuery يمثِّل حدثًا بيانات الأحداث مخصَّصة لخدمة "إحصاءات Google 4" فقط على الرغم من أنّ هناك بعض حقول "إحصاءات Google 4" التي تشبه حقول Universal Analytics بشكل أساسي (مثل device.category وdevice.deviceCategory)، فإن أوجه الاختلاف أكثر من أوجه التشابه بين بيانات أحداث "إحصاءات Google 4" وبيانات نتائج Universal Analytics |
مخطط التصدير كل صف في جدول BigQuery يمثِّل جلسة بيانات النتائج مخصَّصة لخدمة Universal Analytics فقط على الرغم من أنّ هناك بعض حقول Universal Analytics التي تشبه حقول "إحصاءات Google 4" بشكل أساسي (مثل device.deviceCategory وdevice.category)، فإن أوجه الاختلاف أكثر من أوجه التشابه بين بيانات نتائج Universal Analytics وبيانات أحداث "إحصاءات Google 4" |
مراجع ذات صلة
يمكنك زيارة دليل المطوِّر لدى BigQuery لمعرفة المزيد عن ما يلي: