BigQuery là một kho dữ liệu trên đám mây, giúp bạn chạy những truy vấn có hiệu suất cao trên các tập dữ liệu lớn.
Bạn có thể xuất tất cả sự kiện thô từ tài sản Google Analytics 4 (bao gồm cả tài sản phụ và tài sản tổng hợp) sang BigQuery, sau đó dùng cú pháp giống như SQL để truy vấn dữ liệu đó. Trong BigQuery, bạn có thể chọn xuất dữ liệu sang bộ nhớ ngoài hoặc nhập dữ liệu bên ngoài để kết hợp dữ liệu đó với dữ liệu của Analytics.
Khi xuất dữ liệu sang BigQuery, bạn sẽ sở hữu dữ liệu đó và có thể sử dụng các tệp Danh sách kiểm soát quyền truy cập (ACL) của BigQuery để quản lý quyền truy cập đối với các dự án và tập dữ liệu.
Việc xuất toàn bộ dữ liệu diễn ra 1 lần/ngày. Dữ liệu cũng được xuất liên tục suốt cả ngày (xem phần Xuất trực tuyến bên dưới).
Bạn có thể xuất sang phiên bản BigQuery miễn phí (hộp cát BigQuery), nhưng phải trả phí cho những lượt xuất vượt quá hạn mức của hộp cát.
Đối với tài sản chuẩn, tính năng BigQuery Export có thể xuất 1 triệu sự kiện mỗi ngày. Tìm hiểu thêm về các hạn mức khác của BigQuery Export
Sự khác biệt giữa giao diện Google Analytics và BigQuery Export
Tính năng xuất sự kiện BigQuery cung cấp quyền truy cập vào dữ liệu cấp người dùng và sự kiện thô, không bao gồm mọi giá trị do Google Analytics thêm vào dữ liệu trong báo cáo chuẩn và dữ liệu khám phá. Vì lý do này, dữ liệu có nguồn gốc từ tính năng xuất sự kiện BigQuery có thể khác với dữ liệu trong giao diện Google Analytics.
Để hiểu rõ sự khác biệt về dữ liệu giữa tính năng xuất sự kiện BigQuery và giao diện Google Analytics, đồng thời khám phá các cách để giảm thiểu những khác biệt này khi có thể, hãy xem bài viết Thu hẹp sự khác biệt về dữ liệu giữa giao diện người dùng Google Analytics và tính năng xuất dữ liệu BigQuery.
Xuất trực tuyến
Bạn có thể chọn chế độ xuất trực tuyến khi liên kết tài sản Google Analytics 4 với BigQuery.
Tùy chọn xuất trực tuyến của BigQuery cung cấp dữ liệu của ngày hiện tại trong vòng vài phút thông qua tính năng BigQuery Export.
Khi bạn sử dụng tùy chọn xuất này, BigQuery cung cấp thông tin mới hơn về người dùng và lưu lượng truy cập của người dùng trên tài sản của bạn, và bạn có thể phân tích thông tin này.
Mỗi ngày, tính năng xuất trực tuyến sẽ tạo ra một bảng mới:
events_intraday_YYYYMMDD
: Một bảng nội bộ, được chia theo giai đoạn và bao gồm các bản ghi hoạt động của phiên diễn ra trong ngày. Xuất trực tuyến là cách hiệu quả nhất và có thể không bao gồm mọi dữ liệu vì một số lý do, chẳng hạn như do phải xử lý các sự kiện gửi muộn và/hoặc do tải lên không thành công. Hệ thống sẽ xuất dữ liệu liên tục suốt cả ngày. Bảng này có thể bao gồm các bản ghi của một phiên khi phiên đó kéo dài qua nhiều lần xuất. Bảng này bị xóa khievents_YYYYMMDD
hoàn tất.
Nếu bạn chọn tùy chọn hằng ngày khi thiết lập BigQuery Export, bảng sau đây cũng được tạo mỗi ngày.
events_YYYYMMDD
: Xuất hằng ngày toàn bộ các sự kiện.
Bạn nên truy vấn events_YYYYMMDD
thay vì events_intraday_YYYYMMDD
để truy vấn một tập dữ liệu ổn định cho ngày đó.
Hãy xem Giản đồ BigQuery Export để biết thêm thông tin về bảng events_YYYYMMDD
và events_intraday_YYYYMMDD
.
Chế độ xuất trực tuyến của BigQuery không bao gồm những dữ liệu phân bổ cho người dùng sau đây đối với người dùng mới:
- traffic_source.name (phương diện báo cáo: Chiến dịch đã thu nạp người dùng)
- traffic_source.source (phương diện báo cáo: Nguồn đã thu nạp người dùng)
- traffic_source.medium (thứ nguyên báo cáo: Phương tiện người dùng)
Tuỳ chọn này áp dụng dữ liệu phân bổ người dùng cho người dùng hiện tại, nhưng phải mất khoảng 24 giờ để xử lý hoàn toàn dữ liệu. Vì vậy, bạn không nên dùng dữ liệu đó cho hoạt động xuất trực tuyến, mà hãy lấy dữ liệu phân bổ người dùng từ hoạt động xuất toàn bộ hằng ngày.
Bạn sẽ phải trả thêm phí sử dụng tính năng xuất trực tuyến của BigQuery với mức phí là 0,05 đô la Mỹ cho mỗi gigabyte dữ liệu. 1 gigabyte dữ liệu tương đương với khoảng 600.000 sự kiện Google Analytics, tuy nhiên, con số đó sẽ thay đổi tuỳ thuộc vào kích thước của sự kiện. Tìm hiểu thêm về giá của BigQuery.
Lịch cập nhật bảng
Những bảng được tạo trong BigQuery Export sẽ được cập nhật theo múi giờ của tài sản Analytics mà bạn xuất dữ liệu.
Bảng xuất trực tuyến (events_intraday_YYYYMMDD) được cập nhật liên tục suốt cả ngày (ví dụ: từ 12:00:00 sáng cho đến 11:59:59 tối theo múi giờ của tài sản). Khi ngày mới bắt đầu theo múi giờ của tài sản, các sự kiện được ghi vào một bảng mới trong ngày.
Bảng xuất hằng ngày (events_YYYYMMDD) được tạo sau khi Analytics thu thập tất cả sự kiện cho ngày hôm đó. Analytics sẽ cập nhật bảng hằng ngày trong vòng 72 giờ sau ngày tạo bảng bằng cách thêm những sự kiện có dấu thời gian khớp với ngày trong bảng (ví dụ: nhóm sự kiện mà Measurement Protocol hoặc Firebase SDK gửi muộn). Ví dụ: nếu ngày trong bảng là 20220101, thì Analytics sẽ cập nhật bảng này cho đến hết ngày 20220104 bằng cách thêm những sự kiện có dấu thời gian là 20220101.
Đôi khi, Analytics có thể cập nhật các bảng hằng ngày bất cứ lúc nào sau khoảng thời gian 72 giờ, trong trường hợp Analytics cần xử lý lại dữ liệu trong quá khứ (ví dụ: để sửa một lỗi gây ra lỗi xử lý).
Các ping không có cookie và dữ liệu do khách hàng cung cấp
Khi bạn triển khai chế độ đồng ý, các ping không có cookie mà Analytics thu thập sẽ xuất hiện trong BigQuery Export, cùng với dữ liệu do khách hàng cung cấp như user_id và phương diện tuỳ chỉnh.
GA4 – Tích hợp Firebase và BigQuery
Nếu một tài sản GA4 và một dự án Firebase đã được tích hợp, thì bạn sẽ không thể liên kết chúng với các dự án BigQuery riêng biệt.
So sánh tính năng BigQuery Export trong Google Analytics 4 và Universal Analytics
Google Analytics 4 | Universal Analytics |
---|---|
Dành cho gói Chuẩn (miễn phí) và 360 (có tính phí) Hạn mức cho gói Chuẩn: 1 triệu sự kiện mỗi ngày Hạn mức cho gói 360: Hàng tỷ sự kiện mỗi ngày |
Dành cho gói 360 (có tính phí) |
Chi phí Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng |
Chi phí Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng |
Thiết lập Có thể bao gồm những luồng dữ liệu cụ thể và loại trừ những sự kiện cụ thể cho từng tài sản (cho phép bạn kiểm soát lượng dữ liệu được xuất và chi phí) |
Thiết lập Có thể liên kết với 1 chế độ xem trên mỗi tài sản (xuất tất cả dữ liệu trong chế độ xem đó) |
Xuất trực tuyến 0,05 đô la/GB (tìm hiểu thêm về mô hình tính phí của BigQuery) Bảng được tạo: events_intraday_YYYMMDD Bảng bị xoá mỗi ngày:
Không bao gồm dữ liệu trong Chiến dịch đã thu nạp người dùng, Nguồn đã thu nạp người dùng hoặc Phương tiện đã thu nạp người dùng cho người dùng mới |
Xuất trực tuyến 0,05 đô la/GB (tìm hiểu thêm về mô hình tính phí của BigQuery) Bảng được tạo: ga_realtime_sessions_YYYYMMDD Chế độ xem được tạo trong BigQuery: ga_realtime_sessions_view_YYYYMMDD |
Xuất dữ liệu hằng ngày Bảng được tạo: events_YYYYMMDD |
Xuất dữ liệu hằng ngày Các bảng được tạo ga_sessions_intraday_YYYYMMDD
ga_sessions_YYYYMMDD
|
Xuất dữ liệu, chung Không bổ sung dữ liệu cũ Tập dữ liệu: đối với mỗi tài sản được liên kết, 1 tập dữ liệu được đặt tên là analytics_<property id> Nếu bạn đã triển khai chế độ đồng ý, thì dữ liệu được xuất sẽ bao gồm:
|
Xuất dữ liệu, chung Bổ sung dữ liệu cũ: sau khi liên kết, bổ sung dữ liệu trong 13 tháng hoặc 10 tỷ lượt truy cập, tuỳ theo lượng dữ liệu nào ít hơn (Có thể sẽ không bổ sung được dữ liệu cũ cho Hộp cát BigQuery) Tập dữ liệu: đối với mỗi chế độ xem được liên kết, 1 tập dữ liệu được đặt tên giống như chế độ xem |
Giản đồ xuất dữ liệu Mỗi hàng trong bảng BigQuery thể hiện một sự kiện Dữ liệu sự kiện được dùng riêng cho Google Analytics 4 Về cơ bản, mặc dù một số trường Google Analytics 4 giống với các trường Universal Analytics (ví dụ: device.category và device.deviceCategory), nhưng số điểm khác biệt vẫn nhiều hơn so với số điểm tương đồng giữa dữ liệu sự kiện GA4 và dữ liệu lượt truy cập UA. |
Giản đồ xuất dữ liệu Mỗi hàng trong bảng BigQuery thể hiện một phiên hoạt động Dữ liệu lượt truy cập được dùng riêng cho Universal Analytics Về cơ bản, mặc dù một số trường Universal Analytics giống với các trường Google Analytics 4 (ví dụ: device.deviceCategory và device.category), nhưng số điểm khác biệt vẫn nhiều hơn so với số điểm tương đồng giữa dữ liệu lượt truy cập UA và dữ liệu sự kiện GA4. |
Thông tin có liên quan
Xem Hướng dẫn về BigQuery dành cho nhà phát triển để tìm hiểu thêm về: