[GA4] BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

Bật phụ đề trên YouTube để xem phụ đề bằng ngôn ngữ của bạn. Chọn biểu tượng cài đặt Hình ảnh biểu tượng cài đặt trên YouTube ở cuối trình phát video, sau đó chọn "Phụ đề" rồi chọn ngôn ngữ của bạn.


BigQuery là kho dữ liệu đám mây, cho phép bạn chạy các truy vấn có hiệu suất cao trên các tập dữ liệu lớn.

Bạn có thể xuất tất cả sự kiện thô từ tài sản Google Analytics 4 (bao gồm cả tài sản phụtài sản tổng hợp) sang BigQuery, sau đó dùng cú pháp giống như SQL để truy vấn dữ liệu đó. Trong BigQuery, bạn có thể chọn xuất dữ liệu sang bộ nhớ ngoài hoặc nhập dữ liệu bên ngoài để kết hợp dữ liệu đó với dữ liệu của Analytics.

Khi xuất dữ liệu sang BigQuery, bạn sẽ sở hữu dữ liệu đó và có thể sử dụng các tệp Danh sách kiểm soát quyền truy cập (ACL) của BigQuery để quản lý quyền truy cập đối với các dự án và tập dữ liệu.

Lưu ý: Sau khi xuất dữ liệu từ Analytics sang BigQuery, bạn không thể xuất lại dữ liệu đó.

Việc xuất toàn bộ dữ liệu diễn ra 1 lần/ngày. Dữ liệu cũng được xuất liên tục trong suốt cả ngày (xem phần Kiểu xuất truyền trực tuyến bên dưới).

Bạn có thể xuất sang phiên bản BigQuery miễn phí (hộp cát BigQuery), nhưng phải trả phí cho những lượt xuất vượt quá hạn mức của hộp cát.

Tài sản chuẩn có hạn mức hằng ngày cho BigQuery Export là 1 triệu sự kiện. Tìm hiểu thêm về các hạn mức khác đối với BigQuery Export

Các kiểu xuất của BigQuery Export

Google Analytics cung cấp các kiểu xuất dữ liệu sang BigQuery sau đây, mỗi kiểu xuất có phạm vi cung cấp dữ liệu khác nhau cho ngày hiện tại. Vì vậy, bạn nên chọn kiểu xuất dựa trên nhu cầu về dữ liệu và ngân sách của mình:

Kiểu xuất Phù hợp nhất khi bạn cần... Thông tin về hoạt động xuất Giới hạn Chú ý

Xuất dữ liệu hằng ngày

(Chuẩn, 360)

một tập dữ liệu đầy đủ cho ngày hôm trước và không cần nhận dữ liệu nhanh chóng hoặc không phải là khách hàng 360

Xuất tất cả dữ liệu sự kiện thô, chưa được lấy mẫu một lần mỗi ngày từ ngày hôm trước

Không đảm bảo thời gian cụ thể

Thường xuất vào giữa buổi chiều theo múi giờ của tài sản, nhưng có thể bị trì hoãn cho đến cuối ngày hoặc ngày hôm sau

Ghi nhận lượt nhấp cuối cùng, không lập mô hình

Tài sản chuẩn: tối đa 1 triệu sự kiện mỗi ngày, với các lựa chọn lọc để không vượt quá hạn mức

Tài sản 360: tối đa 20 tỷ sự kiện mỗi ngày

Một số dữ liệu (chẳng hạn như dữ liệu phân bổ người dùng) có thể bị trì hoãn đến tối đa 24 giờ. Bạn nên sử dụng kiểu xuất hằng ngày thay vì truyền trực tuyến cho dữ liệu phân bổ người dùng

Xuất dữ liệu mới hằng ngày

(360)

dữ liệu đầy đủ hơn và nhận dữ liệu nhanh hơn trong suốt cả ngày

Dữ liệu thường đến muộn nhất vào lúc 5 giờ sáng

Cập nhật theo lô trong suốt cả ngày, thường là trong vòng 60 phút

Cùng một giản đồ với kiểu xuất hằng ngày

Quá trình xuất bắt đầu dựa trên múi giờ của tài sản

Ghi nhận lượt nhấp cuối cùng, không lập mô hình

Nhanh hơn nhiều so với kiểu xuất hằng ngày

Thoả thuận mức độ cung cấp dịch vụ (SLA) không áp dụng cho một số tài sản rất lớn Chỉ áp dụng cho các tài sản 360 "Bình thường" và "Lớn".

Truyền trực tuyến

(Chuẩn, 360)

dữ liệu gần như theo thời gian thực (trong vòng vài phút)

Xuất dữ liệu của ngày hiện tại theo thời gian thực

Xuất dữ liệu với nỗ lực tối đa

Không giới hạn số lượng Dữ liệu về nguồn lưu lượng truy cập của phiên mới và người dùng mới sẽ không được xuất

Lưu ý: Mỗi kiểu xuất dữ liệu sẽ phát sinh chi phí lưu trữ và xử lý ở phía BigQuery. Bạn sẽ phải trả thêm phí sử dụng kiểu xuất truyền trực tuyến của BigQuery với mức phí là 0,05 USD cho mỗi gigabyte dữ liệu. 1 gigabyte dữ liệu tương đương với khoảng 600.000 sự kiện Google Analytics, tuy nhiên, con số đó sẽ thay đổi tuỳ thuộc vào kích thước của sự kiện. Tìm hiểu thêm về giá của BigQuery.

Sự khác biệt giữa giao diện Google Analytics và BigQuery Export

Tính năng xuất sự kiện BigQuery cung cấp quyền truy cập vào dữ liệu cấp người dùng và sự kiện thô, không bao gồm mọi giá trị do Google Analytics thêm vào dữ liệu trong báo cáo chuẩn và dữ liệu khám phá. Vì lý do này, dữ liệu có nguồn gốc từ tính năng xuất sự kiện BigQuery có thể khác với dữ liệu trong giao diện Google Analytics.

Để hiểu rõ sự khác biệt về dữ liệu giữa tính năng xuất sự kiện BigQuery và giao diện Google Analytics, đồng thời khám phá các cách để giảm thiểu những khác biệt này khi có thể, hãy xem bài viết Thu hẹp sự khác biệt về dữ liệu giữa giao diện người dùng Google Analytics và tính năng xuất dữ liệu BigQuery.

Xuất trực tuyến

Bạn có thể chọn chế độ xuất trực tuyến khi liên kết tài sản Google Analytics 4 với BigQuery.

Tùy chọn xuất trực tuyến của BigQuery cung cấp dữ liệu của ngày hiện tại trong vòng vài phút thông qua tính năng BigQuery Export.

Khi bạn sử dụng tùy chọn xuất này, BigQuery cung cấp thông tin mới hơn về người dùng và lưu lượng truy cập của người dùng trên tài sản của bạn, và bạn có thể phân tích thông tin này.

Mỗi ngày, tính năng xuất trực tuyến sẽ tạo ra một bảng mới:

  • events_intraday_YYYYMMDD: Một bảng nội bộ, được chia theo giai đoạn và bao gồm các bản ghi hoạt động của phiên diễn ra trong ngày. Xuất trực tuyến là cách hiệu quả nhất và có thể không bao gồm mọi dữ liệu vì một số lý do, chẳng hạn như quy trình xử lý các sự kiện sau cùng và/hoặc lượt tải lên không thành công. Hệ thống sẽ xuất dữ liệu liên tục suốt cả ngày. Bảng này có thể bao gồm các bản ghi của một phiên khi phiên đó kéo dài qua nhiều lần xuất. Bảng này bị xóa khi events_YYYYMMDD hoàn tất.

Nếu bạn chọn tùy chọn hằng ngày khi thiết lập BigQuery Export, bảng sau đây cũng được tạo mỗi ngày.

  • events_YYYYMMDD: Xuất hằng ngày toàn bộ các sự kiện.

Bạn nên truy vấn events_YYYYMMDD thay vì events_intraday_YYYYMMDD để truy vấn một tập dữ liệu ổn định cho ngày đó.

Hãy xem Giản đồ BigQuery Export để biết thêm thông tin về bảng events_YYYYMMDDevents_intraday_YYYYMMDD.

Chế độ xuất trực tuyến của BigQuery không bao gồm những dữ liệu phân bổ cho người dùng sau đây đối với người dùng mới:

  • traffic_source.name (phương diện báo cáo: Chiến dịch đã thu nạp người dùng)
  • traffic_source.source (phương diện báo cáo: Nguồn đã thu nạp người dùng)
  • traffic_source.medium (thứ nguyên báo cáo: Phương tiện người dùng)

Tuỳ chọn này áp dụng dữ liệu phân bổ người dùng cho người dùng hiện tại, nhưng phải mất khoảng 24 giờ để xử lý hoàn toàn dữ liệu. Vì vậy, bạn không nên dùng dữ liệu đó cho hoạt động xuất trực tuyến, mà hãy lấy dữ liệu phân bổ người dùng từ hoạt động xuất toàn bộ hằng ngày.

Bạn sẽ phải trả thêm phí sử dụng kiểu xuất truyền trực tuyến của BigQuery với mức phí là 0,05 USD cho mỗi gigabyte dữ liệu. 1 gigabyte dữ liệu tương đương với khoảng 600.000 sự kiện Google Analytics, tuy nhiên, con số đó sẽ thay đổi tuỳ thuộc vào kích thước của sự kiện. Tìm hiểu thêm về giá của BigQuery.

Xuất dữ liệu mới hằng ngày

Giờ đây, bạn có thể chọn Xuất dữ liệu mới hằng ngày cùng với các kiểu xuất Hằng ngày và Truyền trực tuyến. Tính năng Xuất dữ liệu mới hằng ngày hiện áp dụng cho các tài sản Analytics 360. Bạn có thể bật từng kiểu trong số 3 kiểu xuất dữ liệu một cách độc lập với nhau.

Để thiết lập tính năng Xuất dữ liệu mới hằng ngày, bạn phải thiết lập thông tin thanh toán trên Google Cloud Platform. Tìm hiểu thêm về tính năng Xuất dữ liệu mới hằng ngày trên BigQuery (GA360).

Lịch cập nhật bảng

Những bảng được tạo trong BigQuery Export sẽ được cập nhật theo múi giờ của tài sản Analytics mà bạn xuất dữ liệu.

Bảng xuất trực tuyến (events_intraday_YYYYMMDD) được cập nhật liên tục suốt cả ngày (ví dụ: từ 12:00:00 sáng cho đến 11:59:59 tối theo múi giờ của tài sản). Khi ngày mới bắt đầu theo múi giờ của tài sản, các sự kiện được ghi vào một bảng mới trong ngày.

Bảng xuất hằng ngày (events_YYYYMMDD) được tạo sau khi Analytics thu thập tất cả sự kiện cho ngày hôm đó. Analytics sẽ cập nhật bảng hằng ngày trong vòng 72 giờ sau ngày tạo bảng bằng cách thêm những sự kiện có dấu thời gian khớp với ngày trong bảng (ví dụ: nhóm sự kiện mà Measurement Protocol hoặc Firebase SDK gửi muộn). Ví dụ: nếu ngày trong bảng là 20220101, thì Analytics sẽ cập nhật bảng này cho đến hết ngày 20220104 bằng cách thêm những sự kiện có dấu thời gian là 20220101.

Đôi khi, Analytics có thể cập nhật các bảng hằng ngày bất cứ lúc nào sau khoảng thời gian 72 giờ, trong trường hợp Analytics cần xử lý lại dữ liệu trong quá khứ (ví dụ: để sửa một lỗi gây ra lỗi xử lý).

Các ping không có cookie và dữ liệu do khách hàng cung cấp

Khi bạn triển khai chế độ đồng ý, các ping không có cookie mà Analytics thu thập sẽ xuất hiện trong BigQuery Export, cùng với dữ liệu do khách hàng cung cấp như user_idphương diện tuỳ chỉnh.

Bổ sung dữ liệu cũ cho các phương diện nguồn lưu lượng truy cập "Không có sẵn"

Bạn có thể sử dụng các tài nguyên sau để tra cứu phương diện nguồn lưu lượng truy cập được phân bổ cho một mã lượt nhấp của Google (GCLID) cụ thể. Xin lưu ý rằng giá trị nhận dạng wBRAID và gBRAID không được đưa vào tính năng BigQuery Export.

  • API Google Ads
  • Tập lệnh Google Ads
  • Dịch vụ chuyển dữ liệu của BigQuery cho Google Ads

Để tìm GCLID cho bản ghi "Không có sẵn" trong cột "traffic_source", hãy truy vấn trường GCLID trong cột "collected_traffic_source". Để biết thêm thông tin về cách tra cứu thông tin chiến dịch trong Google Ads từ một GCLID cụ thể, hãy xem Thoả thuận mức độ cung cấp dịch vụ BigQuery Export.

GA4 – Tích hợp với Firebase và BigQuery

Nếu một tài sản GA4 và một dự án Firebase đã được tích hợp, thì bạn sẽ không thể liên kết chúng với các dự án BigQuery riêng biệt.

So sánh tính năng BigQuery Export trong Google Analytics 4 và Universal Analytics

Google Analytics 4 Universal Analytics

Dành cho gói Chuẩn (miễn phí) và 360 (có tính phí)

Hạn mức cho gói Chuẩn: 1 triệu sự kiện mỗi ngày

Hạn mức cho gói 360: Hàng tỷ sự kiện mỗi ngày

Dành cho gói 360 (có tính phí)

Chi phí

Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí

Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng

Chi phí

Xuất sang Hộp cát BigQuery trong hạn mức của Hộp cát mà không tốn phí

Bạn phải trả phí cho dữ liệu được xuất vượt quá hạn mức của Hộp cát theo điều khoản hợp đồng

Thiết lập

Có thể bao gồm những luồng dữ liệu cụ thể và loại trừ những sự kiện cụ thể cho từng tài sản

(cho phép bạn kiểm soát lượng dữ liệu được xuất và chi phí)

Thiết lập

Có thể liên kết với 1 chế độ xem trên mỗi tài sản

(xuất tất cả dữ liệu trong chế độ xem đó)

Xuất trực tuyến

0,05 USD/GB (tìm hiểu thêm về giá của BigQuery)

Bảng được tạo:

events_intraday_YYYYMMDD

Bảng bị xoá mỗi ngày:

  • nếu bạn cũng sử dụng tính năng xuất dữ liệu hằng ngày, cùng với tính năng xuất dữ liệu trực tuyến
  • khi bảng hoàn tất hằng ngày

Không bao gồm dữ liệu trong Chiến dịch đã thu nạp người dùng, Nguồn đã thu nạp người dùng hoặc Phương tiện đã thu nạp người dùng cho người dùng mới

Xuất trực tuyến

0,05 USD/GB (tìm hiểu thêm về giá của BigQuery)

Bảng được tạo:

ga_realtime_sessions_YYYYMMDD

Chế độ xem được tạo trong BigQuery:

ga_realtime_sessions_view_YYYYMMDD

Xuất dữ liệu hằng ngày

Bảng được tạo:

events_YYYYMMDD

Xuất dữ liệu hằng ngày

Các bảng được tạo

ga_sessions_intraday_YYYYMMDD

  • Cập nhật ít nhất 3 lần/ngày
  • Mỗi bản cập nhật sẽ ghi đè dữ liệu trước đó
  • Bị xoá khi nhập xong đầy đủ dữ liệu của ngày tiếp theo

ga_sessions_YYYYMMDD

  • Nhập đầy đủ dữ liệu hằng ngày

Xuất dữ liệu mới hằng ngày

Dành cho tài sản 360 có quy mô "Bình thường" và "Lớn"

Tìm hiểu thêm về sự khác biệt về cách xử lý giữa phương thức xuất dữ liệu hằng ngày và phương thức xuất dữ liệu mới hằng ngày.

Không áp dụng

Xuất dữ liệu, chung

Không bổ sung dữ liệu cũ

Tập dữ liệu: đối với mỗi tài sản được liên kết, 1 tập dữ liệu được đặt tên là analytics_<property id>

Nếu bạn đã triển khai chế độ đồng ý, thì dữ liệu được xuất sẽ bao gồm:

  • ping không có cookie
  • dữ liệu do khách hàng cung cấp (mã nhận dạng người dùng, phương diện tuỳ chỉnh)

Xuất dữ liệu, chung

Bổ sung dữ liệu cũ: sau khi liên kết, bổ sung dữ liệu trong 13 tháng hoặc 10 tỷ lượt truy cập, tuỳ theo lượng dữ liệu nào ít hơn

(Có thể sẽ không bổ sung được dữ liệu cũ cho Hộp cát BigQuery)

Tập dữ liệu: đối với mỗi chế độ xem được liên kết, 1 tập dữ liệu được đặt tên giống như chế độ xem

Giản đồ xuất dữ liệu

GA4 chỉ xuất nguồn lưu lượng truy cập đã thu nạp người dùng lần đầu

Không hỗ trợ dữ liệu UA được xuất sang BigQuery

Mỗi hàng trong bảng BigQuery thể hiện một sự kiện

Dữ liệu sự kiện được dùng riêng cho Google Analytics 4

Về cơ bản, mặc dù một số trường Google Analytics 4 giống với các trường Universal Analytics (ví dụ: device.categorydevice.deviceCategory), nhưng số điểm khác biệt vẫn nhiều hơn so với số điểm tương đồng giữa dữ liệu sự kiện GA4 và dữ liệu lượt truy cập UA

Giản đồ xuất dữ liệu

Mô hình phân bổ ở cấp phiên trên nhiều điểm tiếp xúc

Mỗi hàng trong bảng BigQuery thể hiện một phiên

Dữ liệu lượt truy cập được dùng riêng cho Universal Analytics

Về cơ bản, mặc dù một số trường Universal Analytics giống với các trường Google Analytics 4 (ví dụ: device.deviceCategorydevice.category), nhưng số điểm khác biệt vẫn nhiều hơn so với số điểm tương đồng giữa dữ liệu lượt truy cập UA và dữ liệu sự kiện GA4.

Thông tin có liên quan

Xem Hướng dẫn về BigQuery dành cho nhà phát triển để tìm hiểu thêm về:

Thông tin này có hữu ích không?

Chúng tôi có thể cải thiện trang này bằng cách nào?
Tìm kiếm
Xóa nội dung tìm kiếm
Đóng tìm kiếm
Trình đơn chính
6052364329809196229
true
Tìm kiếm trong Trung tâm trợ giúp
true
true
true
true
true
69256
false
false