BigQuery là một kho dữ liệu trên đám mây, giúp bạn chạy những truy vấn có hiệu suất cao trên các tập dữ liệu lớn.
Bạn có thể xuất tất cả sự kiện thô từ tài sản Google Analytics 4 (bao gồm cả tài sản phụ và tài sản tổng hợp) sang BigQuery, sau đó dùng cú pháp giống như SQL để truy vấn dữ liệu đó. Trong BigQuery, bạn có thể chọn xuất dữ liệu sang bộ nhớ ngoài hoặc nhập dữ liệu bên ngoài để kết hợp dữ liệu đó với dữ liệu của Analytics.
Khi xuất dữ liệu sang BigQuery, bạn sẽ sở hữu dữ liệu đó và có thể sử dụng các tệp Danh sách kiểm soát quyền truy cập (ACL) của BigQuery để quản lý quyền truy cập đối với các dự án và tập dữ liệu.
Việc xuất toàn bộ dữ liệu diễn ra 1 lần/ngày. Dữ liệu cũng được xuất liên tục trong suốt cả ngày (xem phần Kiểu xuất truyền trực tuyến bên dưới).
Bạn có thể xuất sang phiên bản BigQuery miễn phí (hộp cát BigQuery), nhưng phải trả phí cho những lượt xuất vượt quá hạn mức của hộp cát.
Đối với tài sản chuẩn, tính năng BigQuery Export có thể xuất 1 triệu sự kiện mỗi ngày. Tìm hiểu thêm về các hạn mức khác đối với BigQuery Export
Các kiểu xuất của BigQuery Export
Google Analytics cung cấp các kiểu xuất dữ liệu sang BigQuery sau đây, mỗi kiểu xuất có phạm vi cung cấp dữ liệu khác nhau cho ngày hiện tại. Vì vậy, bạn nên chọn kiểu xuất dựa trên nhu cầu về dữ liệu và ngân sách của mình:
Kiểu xuất | Phù hợp nhất khi bạn cần... | Thông tin về hoạt động xuất | Giới hạn | Chú ý |
---|---|---|---|---|
Xuất hằng ngày (Chuẩn, 360) |
một tập dữ liệu đầy đủ cho ngày hôm trước và không cần nhận dữ liệu nhanh chóng hoặc không phải là khách hàng 360 |
Xuất tất cả dữ liệu sự kiện thô, chưa được lấy mẫu một lần mỗi ngày từ ngày hôm trước Không đảm bảo thời gian cụ thể Thường xuất vào giữa buổi chiều theo múi giờ của tài sản, nhưng có thể bị trì hoãn cho đến cuối ngày hoặc ngày hôm sau Ghi nhận lượt nhấp cuối cùng, không lập mô hình |
Tài sản chuẩn: tối đa 1 triệu sự kiện mỗi ngày, với các lựa chọn lọc để không vượt quá hạn mức Tài sản 360: tối đa 20 tỷ sự kiện mỗi ngày |
Một số dữ liệu (chẳng hạn như dữ liệu phân bổ người dùng) có thể bị trì hoãn đến tối đa 24 giờ. Bạn nên sử dụng kiểu xuất hằng ngày thay vì truyền trực tuyến cho dữ liệu phân bổ người dùng |
Xuất dữ liệu mới hằng ngày (360) |
dữ liệu đầy đủ hơn và nhận dữ liệu nhanh hơn trong suốt cả ngày |
Dữ liệu thường đến muộn nhất vào lúc 5 giờ sáng Cập nhật theo lô trong suốt cả ngày, thường là trong vòng 60 phút Cùng một giản đồ với kiểu xuất hằng ngày Quá trình xuất bắt đầu dựa trên múi giờ của tài sản Ghi nhận lượt nhấp cuối cùng, không lập mô hình Nhanh hơn nhiều so với kiểu xuất hằng ngày |
Thoả thuận mức độ cung cấp dịch vụ (SLA) không áp dụng cho một số tài sản rất lớn | Chỉ áp dụng cho các tài sản 360 "Bình thường" và "Lớn". |
Truyền trực tuyến (Chuẩn, 360) |
dữ liệu gần như theo thời gian thực (trong vòng vài phút) |
Xuất dữ liệu của ngày hiện tại theo thời gian thực Xuất dữ liệu với nỗ lực tối đa |
Không giới hạn số lượng | Dữ liệu về nguồn lưu lượng truy cập của phiên mới và người dùng mới sẽ không được xuất |
Lưu ý: Mỗi kiểu xuất dữ liệu sẽ phát sinh chi phí lưu trữ và xử lý ở phía BigQuery. Bạn sẽ phải trả thêm phí sử dụng kiểu xuất truyền trực tuyến của BigQuery với mức phí là 0,05 USD cho mỗi gigabyte dữ liệu. 1 gigabyte dữ liệu tương đương với khoảng 600.000 sự kiện Google Analytics, tuy nhiên, con số đó sẽ thay đổi tuỳ thuộc vào kích thước của sự kiện. Tìm hiểu thêm về giá của BigQuery.
Sự khác biệt giữa giao diện Google Analytics và BigQuery Export
Tính năng xuất sự kiện BigQuery cung cấp quyền truy cập vào dữ liệu cấp người dùng và sự kiện thô, không bao gồm mọi giá trị do Google Analytics thêm vào dữ liệu trong báo cáo chuẩn và dữ liệu khám phá. Vì lý do này, dữ liệu có nguồn gốc từ tính năng xuất sự kiện BigQuery có thể khác với dữ liệu trong giao diện Google Analytics.
Để hiểu rõ sự khác biệt về dữ liệu giữa tính năng xuất sự kiện BigQuery và giao diện Google Analytics, đồng thời khám phá các cách để giảm thiểu những khác biệt này khi có thể, hãy xem bài viết Thu hẹp sự khác biệt về dữ liệu giữa giao diện người dùng Google Analytics và tính năng xuất dữ liệu BigQuery.
Xuất trực tuyến
Bạn có thể chọn chế độ xuất trực tuyến khi liên kết tài sản Google Analytics 4 với BigQuery.
Tùy chọn xuất trực tuyến của BigQuery cung cấp dữ liệu của ngày hiện tại trong vòng vài phút thông qua tính năng BigQuery Export.
Khi bạn sử dụng tùy chọn xuất này, BigQuery cung cấp thông tin mới hơn về người dùng và lưu lượng truy cập của người dùng trên tài sản của bạn, và bạn có thể phân tích thông tin này.
Mỗi ngày, tính năng xuất trực tuyến sẽ tạo ra một bảng mới:
events_intraday_YYYYMMDD
: Một bảng nội bộ, được chia theo giai đoạn và bao gồm các bản ghi hoạt động của phiên diễn ra trong ngày. Xuất trực tuyến là cách hiệu quả nhất và có thể không bao gồm mọi dữ liệu vì một số lý do, chẳng hạn như do phải xử lý các sự kiện gửi muộn và/hoặc do tải lên không thành công. Hệ thống sẽ xuất dữ liệu liên tục suốt cả ngày. Bảng này có thể bao gồm các bản ghi của một phiên khi phiên đó kéo dài qua nhiều lần xuất. Bảng này bị xóa khievents_YYYYMMDD
hoàn tất.
Nếu bạn chọn tùy chọn hằng ngày khi thiết lập BigQuery Export, bảng sau đây cũng được tạo mỗi ngày.
events_YYYYMMDD
: Xuất hằng ngày toàn bộ các sự kiện.
Bạn nên truy vấn events_YYYYMMDD
thay vì events_intraday_YYYYMMDD
để truy vấn một tập dữ liệu ổn định cho ngày đó.
Hãy xem Giản đồ BigQuery Export để biết thêm thông tin về bảng events_YYYYMMDD
và events_intraday_YYYYMMDD
.
Chế độ xuất trực tuyến của BigQuery không bao gồm những dữ liệu phân bổ cho người dùng sau đây đối với người dùng mới:
- traffic_source.name (phương diện báo cáo: Chiến dịch đã thu nạp người dùng)
- traffic_source.source (phương diện báo cáo: Nguồn đã thu nạp người dùng)
- traffic_source.medium (thứ nguyên báo cáo: Phương tiện người dùng)
Tuỳ chọn này áp dụng dữ liệu phân bổ người dùng cho người dùng hiện tại, nhưng phải mất khoảng 24 giờ để xử lý hoàn toàn dữ liệu. Vì vậy, bạn không nên dùng dữ liệu đó cho hoạt động xuất trực tuyến, mà hãy lấy dữ liệu phân bổ người dùng từ hoạt động xuất toàn bộ hằng ngày.
Bạn sẽ phải trả thêm phí sử dụng kiểu xuất truyền trực tuyến của BigQuery với mức phí là 0,05 USD cho mỗi gigabyte dữ liệu. 1 gigabyte dữ liệu tương đương với khoảng 600.000 sự kiện Google Analytics, tuy nhiên, con số đó sẽ thay đổi tuỳ thuộc vào kích thước của sự kiện. Tìm hiểu thêm về giá của BigQuery.
Xuất dữ liệu mới hằng ngày
Giờ đây, bạn có thể chọn Xuất dữ liệu mới hằng ngày cùng với các kiểu xuất Hằng ngày và Truyền trực tuyến. Tính năng Xuất dữ liệu mới hằng ngày hiện áp dụng cho các tài sản Analytics 360. Bạn có thể bật từng kiểu trong số 3 kiểu xuất dữ liệu một cách độc lập với nhau.
Để thiết lập tính năng Xuất dữ liệu mới hằng ngày, bạn phải thiết lập thông tin thanh toán trên Google Cloud Platform.
Các điểm hạn chế
Tính năng Xuất dữ liệu mới hằng ngày áp dụng cho các tài sản đặc biệt "Bình thường" và "Lớn". Kiểu xuất này không áp dụng cho các tài sản đặc biệt "Rất lớn".
Tính năng Xuất dữ liệu mới hằng ngày có chứa tất cả các trường và cột dữ liệu được hiểu là có trong tệp dữ liệu được xuất hằng ngày, bao gồm cả dữ liệu đã ghi nhận được về hoạt động phân bổ người dùng và Lượt hiển thị quảng cáo. Tìm hiểu thêm về Giản đồ BigQuery Export.
Lịch cập nhật bảng
Những bảng được tạo trong BigQuery Export sẽ được cập nhật theo múi giờ của tài sản Analytics mà bạn xuất dữ liệu.
Bảng xuất trực tuyến (events_intraday_YYYYMMDD) được cập nhật liên tục suốt cả ngày (ví dụ: từ 12:00:00 sáng cho đến 11:59:59 tối theo múi giờ của tài sản). Khi ngày mới bắt đầu theo múi giờ của tài sản, các sự kiện được ghi vào một bảng mới trong ngày.
Bảng xuất hằng ngày (events_YYYYMMDD) được tạo sau khi Analytics thu thập tất cả sự kiện cho ngày hôm đó. Analytics sẽ cập nhật bảng hằng ngày trong vòng 72 giờ sau ngày tạo bảng bằng cách thêm những sự kiện có dấu thời gian khớp với ngày trong bảng (ví dụ: nhóm sự kiện mà Measurement Protocol hoặc Firebase SDK gửi muộn). Ví dụ: nếu ngày trong bảng là 20220101, thì Analytics sẽ cập nhật bảng này cho đến hết ngày 20220104 bằng cách thêm những sự kiện có dấu thời gian là 20220101.
Đôi khi, Analytics có thể cập nhật các bảng hằng ngày bất cứ lúc nào sau khoảng thời gian 72 giờ, trong trường hợp Analytics cần xử lý lại dữ liệu trong quá khứ (ví dụ: bản sửa lỗi giúp khắc phục lỗi xử lý).
Tính năng Xuất dữ liệu mới hằng ngày được cập nhật khoảng 60 phút một lần trong suốt cả ngày.
Các ping không có cookie và dữ liệu do khách hàng cung cấp
Khi bạn triển khai chế độ đồng ý, các ping không có cookie mà Analytics thu thập sẽ xuất hiện trong BigQuery Export, cùng với dữ liệu do khách hàng cung cấp như user_id và phương diện tuỳ chỉnh.
GA4 – Tích hợp với Firebase và BigQuery
Nếu một tài sản GA4 và một dự án Firebase đã được tích hợp, thì bạn sẽ không thể liên kết chúng với các dự án BigQuery riêng biệt.
So sánh tính năng BigQuery Export trong Google Analytics 4 và Universal Analytics
Google Analytics 4 | Universal Analytics |
---|---|
Dành cho gói Chuẩn (miễn phí) và 360 (có tính phí) Hạn mức cho gói Chuẩn: 1 triệu sự kiện mỗi ngày Hạn mức cho gói 360: Hàng tỷ sự kiện mỗi ngày |
Dành cho gói 360 (có tính phí) |
Chi phí Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng |
Chi phí Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng |
Thiết lập Có thể bao gồm những luồng dữ liệu cụ thể và loại trừ những sự kiện cụ thể cho từng tài sản (cho phép bạn kiểm soát lượng dữ liệu được xuất và chi phí) |
Thiết lập Có thể liên kết với 1 chế độ xem trên mỗi tài sản (xuất tất cả dữ liệu trong chế độ xem đó) |
Xuất trực tuyến 0,05 USD/GB (tìm hiểu thêm về giá của BigQuery) Bảng được tạo: events_intraday_YYYYMMDD Bảng bị xoá mỗi ngày:
Không bao gồm dữ liệu trong Chiến dịch đã thu nạp người dùng, Nguồn đã thu nạp người dùng hoặc Phương tiện đã thu nạp người dùng cho người dùng mới |
Xuất trực tuyến 0,05 USD/GB (tìm hiểu thêm về giá của BigQuery) Bảng được tạo: ga_realtime_sessions_YYYYMMDD Chế độ xem được tạo trong BigQuery: ga_realtime_sessions_view_YYYYMMDD |
Xuất dữ liệu hằng ngày Bảng được tạo: events_YYYYMMDD |
Xuất dữ liệu hằng ngày Các bảng được tạo ga_sessions_intraday_YYYYMMDD
ga_sessions_YYYYMMDD
|
Xuất dữ liệu mới hằng ngày Dành cho tài sản 360 "Bình thường" và "Lớn" Có chứa tất cả các trường và cột dữ liệu được hiểu là có trong tệp dữ liệu được xuất hằng ngày, bao gồm cả dữ liệu đã ghi nhận được về hoạt động phân bổ người dùng và Lượt hiển thị quảng cáo. |
Không áp dụng |
Xuất dữ liệu, chung Không bổ sung dữ liệu cũ Tập dữ liệu: đối với mỗi tài sản được liên kết, 1 tập dữ liệu được đặt tên là analytics_<property id> Nếu bạn đã triển khai chế độ đồng ý, thì dữ liệu được xuất sẽ bao gồm:
|
Xuất dữ liệu, chung Bổ sung dữ liệu cũ: sau khi liên kết, bổ sung dữ liệu trong 13 tháng hoặc 10 tỷ lượt truy cập, tuỳ theo lượng dữ liệu nào ít hơn (Có thể sẽ không bổ sung được dữ liệu cũ cho Hộp cát BigQuery) Tập dữ liệu: đối với mỗi chế độ xem được liên kết, 1 tập dữ liệu được đặt tên giống như chế độ xem |
Giản đồ xuất dữ liệu GA4 chỉ xuất nguồn lưu lượng truy cập đã thu nạp người dùng lần đầu Không hỗ trợ dữ liệu UA được xuất sang BigQuery Mỗi hàng trong bảng BigQuery thể hiện một sự kiện Dữ liệu sự kiện được dùng riêng cho Google Analytics 4 Về cơ bản, mặc dù một số trường Google Analytics 4 giống với các trường Universal Analytics (ví dụ: |
Giản đồ xuất dữ liệu Mô hình phân bổ ở cấp phiên trên nhiều điểm tiếp xúc Mỗi hàng trong bảng BigQuery thể hiện một phiên Dữ liệu lượt truy cập được dùng riêng cho Universal Analytics Về cơ bản, mặc dù một số trường Universal Analytics giống với các trường Google Analytics 4 (ví dụ: |
Thông tin có liên quan
Xem Hướng dẫn về BigQuery dành cho nhà phát triển để tìm hiểu thêm về: