[GA4] BigQuery Export

 

BigQuery là một kho dữ liệu trên đám mây, giúp bạn chạy những truy vấn có hiệu suất cao trên các tập dữ liệu lớn.

Bạn có thể xuất tất cả sự kiện thô từ tài sản Google Analytics 4 (bao gồm cả tài sản phụtài sản tổng hợp) sang BigQuery, sau đó dùng cú pháp giống như SQL để truy vấn dữ liệu đó. Trong BigQuery, bạn có thể chọn xuất dữ liệu sang bộ nhớ ngoài hoặc nhập dữ liệu bên ngoài để kết hợp dữ liệu đó với dữ liệu của Analytics.

Khi xuất dữ liệu sang BigQuery, bạn sẽ sở hữu dữ liệu đó và có thể sử dụng các tệp Danh sách kiểm soát quyền truy cập (ACL) của BigQuery để quản lý quyền truy cập đối với các dự án và tập dữ liệu.

Lưu ý: Sau khi xuất dữ liệu từ Analytics sang BigQuery, bạn không thể xuất lại dữ liệu đó.

Việc xuất toàn bộ dữ liệu diễn ra 1 lần/ngày. Dữ liệu cũng được xuất liên tục suốt cả ngày (xem phần Xuất trực tuyến bên dưới).

Bạn có thể xuất sang phiên bản BigQuery miễn phí (hộp cát BigQuery), nhưng phải trả phí cho những lượt xuất vượt quá hạn mức của hộp cát.

Đối với tài sản chuẩn, tính năng BigQuery Export có thể xuất 1 triệu sự kiện mỗi ngày. Tìm hiểu thêm về các hạn mức khác của BigQuery Export

Sự khác biệt giữa giao diện Google Analytics và BigQuery Export

Tính năng xuất sự kiện BigQuery cung cấp quyền truy cập vào dữ liệu cấp người dùng và sự kiện thô, không bao gồm mọi giá trị do Google Analytics thêm vào dữ liệu trong báo cáo chuẩn và dữ liệu khám phá. Vì lý do này, dữ liệu có nguồn gốc từ tính năng xuất sự kiện BigQuery có thể khác với dữ liệu trong giao diện Google Analytics.

Để hiểu rõ sự khác biệt về dữ liệu giữa tính năng xuất sự kiện BigQuery và giao diện Google Analytics, đồng thời khám phá các cách để giảm thiểu những khác biệt này khi có thể, hãy xem bài viết Thu hẹp sự khác biệt về dữ liệu giữa giao diện người dùng Google Analytics và tính năng xuất dữ liệu BigQuery.

Xuất trực tuyến

Bạn có thể chọn chế độ xuất trực tuyến khi liên kết tài sản Google Analytics 4 với BigQuery.

Tùy chọn xuất trực tuyến của BigQuery cung cấp dữ liệu của ngày hiện tại trong vòng vài phút thông qua tính năng BigQuery Export.

Khi bạn sử dụng tùy chọn xuất này, BigQuery cung cấp thông tin mới hơn về người dùng và lưu lượng truy cập của người dùng trên tài sản của bạn, và bạn có thể phân tích thông tin này.

Mỗi ngày, tính năng xuất trực tuyến sẽ tạo ra một bảng mới:

  • events_intraday_YYYYMMDD: Một bảng nội bộ, được chia theo giai đoạn và bao gồm các bản ghi hoạt động của phiên diễn ra trong ngày. Xuất trực tuyến là cách hiệu quả nhất và có thể không bao gồm mọi dữ liệu vì một số lý do, chẳng hạn như do phải xử lý các sự kiện gửi muộn và/hoặc do tải lên không thành công. Hệ thống sẽ xuất dữ liệu liên tục suốt cả ngày. Bảng này có thể bao gồm các bản ghi của một phiên khi phiên đó kéo dài qua nhiều lần xuất. Bảng này bị xóa khi events_YYYYMMDD hoàn tất.

Nếu bạn chọn tùy chọn hằng ngày khi thiết lập BigQuery Export, bảng sau đây cũng được tạo mỗi ngày.

  • events_YYYYMMDD: Xuất hằng ngày toàn bộ các sự kiện.

Bạn nên truy vấn events_YYYYMMDD thay vì events_intraday_YYYYMMDD để truy vấn một tập dữ liệu ổn định cho ngày đó.

Hãy xem Giản đồ BigQuery Export để biết thêm thông tin về bảng events_YYYYMMDDevents_intraday_YYYYMMDD.

Chế độ xuất trực tuyến của BigQuery không bao gồm những dữ liệu phân bổ cho người dùng sau đây đối với người dùng mới:

  • traffic_source.name (phương diện báo cáo: Chiến dịch đã thu nạp người dùng)
  • traffic_source.source (phương diện báo cáo: Nguồn đã thu nạp người dùng)
  • traffic_source.medium (thứ nguyên báo cáo: Phương tiện người dùng)

Tuỳ chọn này áp dụng dữ liệu phân bổ người dùng cho người dùng hiện tại, nhưng phải mất khoảng 24 giờ để xử lý hoàn toàn dữ liệu. Vì vậy, bạn không nên dùng dữ liệu đó cho hoạt động xuất trực tuyến, mà hãy lấy dữ liệu phân bổ người dùng từ hoạt động xuất toàn bộ hằng ngày.

Bạn sẽ phải trả thêm phí sử dụng tính năng xuất trực tuyến của BigQuery với mức phí là 0,05 đô la Mỹ cho mỗi gigabyte dữ liệu. 1 gigabyte dữ liệu tương đương với khoảng 600.000 sự kiện Google Analytics, tuy nhiên, con số đó sẽ thay đổi tuỳ thuộc vào kích thước của sự kiện. Tìm hiểu thêm về giá của BigQuery.

Lịch cập nhật bảng

Những bảng được tạo trong BigQuery Export sẽ được cập nhật theo múi giờ của tài sản Analytics mà bạn xuất dữ liệu.

Bảng xuất trực tuyến (events_intraday_YYYYMMDD) được cập nhật liên tục suốt cả ngày (ví dụ: từ 12:00:00 sáng cho đến 11:59:59 tối theo múi giờ của tài sản). Khi ngày mới bắt đầu theo múi giờ của tài sản, các sự kiện được ghi vào một bảng mới trong ngày.

Bảng xuất hằng ngày (events_YYYYMMDD) được tạo sau khi Analytics thu thập tất cả sự kiện cho ngày hôm đó. Analytics sẽ cập nhật bảng hằng ngày trong vòng 72 giờ sau ngày tạo bảng bằng cách thêm những sự kiện có dấu thời gian khớp với ngày trong bảng (ví dụ: nhóm sự kiện mà Measurement Protocol hoặc Firebase SDK gửi muộn). Ví dụ: nếu ngày trong bảng là 20220101, thì Analytics sẽ cập nhật bảng này cho đến hết ngày 20220104 bằng cách thêm những sự kiện có dấu thời gian là 20220101.

Đôi khi, Analytics có thể cập nhật các bảng hằng ngày bất cứ lúc nào sau khoảng thời gian 72 giờ, trong trường hợp Analytics cần xử lý lại dữ liệu trong quá khứ (ví dụ: để sửa một lỗi gây ra lỗi xử lý).

Các ping không có cookie và dữ liệu do khách hàng cung cấp

Khi bạn triển khai chế độ đồng ý, các ping không có cookie mà Analytics thu thập sẽ xuất hiện trong BigQuery Export, cùng với dữ liệu do khách hàng cung cấp như user_idphương diện tuỳ chỉnh.

GA4 – Tích hợp Firebase và BigQuery

Nếu một tài sản GA4 và một dự án Firebase đã được tích hợp, thì bạn sẽ không thể liên kết chúng với các dự án BigQuery riêng biệt.

So sánh tính năng BigQuery Export trong Google Analytics 4 và Universal Analytics

Google Analytics 4 Universal Analytics

Dành cho gói Chuẩn (miễn phí) và 360 (có tính phí)

Hạn mức cho gói Chuẩn: 1 triệu sự kiện mỗi ngày

Hạn mức cho gói 360: Hàng tỷ sự kiện mỗi ngày

Dành cho gói 360 (có tính phí)

Chi phí

Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí

Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng

Chi phí

Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí

Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng

Thiết lập

Có thể bao gồm những luồng dữ liệu cụ thể và loại trừ những sự kiện cụ thể cho từng tài sản

(cho phép bạn kiểm soát lượng dữ liệu được xuất và chi phí)

Thiết lập

Có thể liên kết với 1 chế độ xem trên mỗi tài sản

(xuất tất cả dữ liệu trong chế độ xem đó)

Xuất trực tuyến

0,05 đô la/GB (tìm hiểu thêm về mô hình tính phí của BigQuery)

Bảng được tạo:

events_intraday_YYYMMDD

Bảng bị xoá mỗi ngày:

  • nếu bạn cũng sử dụng tính năng xuất dữ liệu hằng ngày, cùng với tính năng xuất dữ liệu trực tuyến
  • khi bảng hoàn tất hằng ngày

Không bao gồm dữ liệu trong Chiến dịch đã thu nạp người dùng, Nguồn đã thu nạp người dùng hoặc Phương tiện đã thu nạp người dùng cho người dùng mới

Xuất trực tuyến

0,05 đô la/GB (tìm hiểu thêm về mô hình tính phí của BigQuery)

Bảng được tạo:

ga_realtime_sessions_YYYYMMDD

Chế độ xem được tạo trong BigQuery:

ga_realtime_sessions_view_YYYYMMDD

Xuất dữ liệu hằng ngày

Bảng được tạo:

events_YYYYMMDD

Xuất dữ liệu hằng ngày

Các bảng được tạo

ga_sessions_intraday_YYYYMMDD

  • Cập nhật ít nhất 3 lần/ngày
  • Mỗi bản cập nhật sẽ ghi đè dữ liệu trước đó
  • Bị xoá khi nhập xong đầy đủ dữ liệu của ngày tiếp theo

ga_sessions_YYYYMMDD

  • Nhập đầy đủ dữ liệu hằng ngày

Xuất dữ liệu, chung

Không bổ sung dữ liệu cũ

Tập dữ liệu: đối với mỗi tài sản được liên kết, 1 tập dữ liệu được đặt tên là analytics_<property id>

Nếu bạn đã triển khai chế độ đồng ý, thì dữ liệu được xuất sẽ bao gồm:

  • ping không có cookie
  • dữ liệu do khách hàng cung cấp (mã nhận dạng người dùng, phương diện tuỳ chỉnh)

Xuất dữ liệu, chung

Bổ sung dữ liệu cũ: sau khi liên kết, bổ sung dữ liệu trong 13 tháng hoặc 10 tỷ lượt truy cập, tuỳ theo lượng dữ liệu nào ít hơn

(Có thể sẽ không bổ sung được dữ liệu cũ cho Hộp cát BigQuery)

Tập dữ liệu: đối với mỗi chế độ xem được liên kết, 1 tập dữ liệu được đặt tên giống như chế độ xem

Giản đồ xuất dữ liệu

Mỗi hàng trong bảng BigQuery thể hiện một sự kiện

Dữ liệu sự kiện được dùng riêng cho Google Analytics 4

Về cơ bản, mặc dù một số trường Google Analytics 4 giống với các trường Universal Analytics (ví dụ: device.category và device.deviceCategory), nhưng số điểm khác biệt vẫn nhiều hơn so với số điểm tương đồng giữa dữ liệu sự kiện GA4 và dữ liệu lượt truy cập UA.

Giản đồ xuất dữ liệu

Mỗi hàng trong bảng BigQuery thể hiện một phiên hoạt động

Dữ liệu lượt truy cập được dùng riêng cho Universal Analytics

Về cơ bản, mặc dù một số trường Universal Analytics giống với các trường Google Analytics 4 (ví dụ: device.deviceCategory và device.category), nhưng số điểm khác biệt vẫn nhiều hơn so với số điểm tương đồng giữa dữ liệu lượt truy cập UA và dữ liệu sự kiện GA4.

 

Thông tin có liên quan

Xem Hướng dẫn về BigQuery dành cho nhà phát triển để tìm hiểu thêm về:

Thông tin này có hữu ích không?

Chúng tôi có thể cải thiện trang này bằng cách nào?
Tìm kiếm
Xóa nội dung tìm kiếm
Đóng tìm kiếm
Trình đơn chính
17512828639934522582
true
Tìm kiếm trong Trung tâm trợ giúp
true
true
true
true
true
69256
false
false