Giới thiệu về phương thức lấy mẫu dữ liệu

Trong hoạt động phân tích dữ liệu, lấy mẫu là phương pháp phân tích một nhóm dữ liệu nhỏ để tìm ra những thông tin có ý nghĩa trong tập dữ liệu lớn hơn. Ví dụ: nếu muốn ước tính số cây trong khu vực rộng 100 mẫu mà cây được phân bố khá đồng đều, bạn có thể tính số lượng cây trong 1 mẫu và nhân với 100 hoặc tính số cây trong 1/2 mẫu và nhân với 200 để có được số cây chính xác trong toàn bộ 100 mẫu.

Bài viết này giải thích các trường hợp Analytics áp dụng phương thức lấy mẫu phiên cho dữ liệu của bạn để kịp thời cung cấp cho bạn báo cáo chính xác.

 

Nội dung trong bài viết này:

Ngưỡng lấy mẫu

Báo cáo mặc định không cần lấy mẫu.

Các truy vấn đặc biệt với dữ liệu của bạn phải tuân theo các ngưỡng chung sau khi lấy mẫu:

  • Analytics Chuẩn: 500 nghìn phiên hoạt động ở cấp thuộc tính trong phạm vi ngày bạn đang sử dụng
  • Analytics 360: 100 triệu phiên hoạt động ở cấp chế độ xem trong phạm vi ngày bạn đang chọn

Trong một số trường hợp, bạn có thể thấy số phiên hoạt động được lấy mẫu sẽ thấp hơn. Điều này có thể là do quy trình triển khai Analytics phức tạp, việc sử dụng bộ lọc chế độ xem, truy vấn phức tạp về việc phân đoạn hoặc một số kiểu kết hợp của các yếu tố đó. Mặc dù chúng tôi luôn cố gắng hết sức để lấy mẫu theo ngưỡng đã đề cập ở trên, nhưng việc hệ thống lấy mẫu ít phiên hoạt động hơn đối với một truy vấn đặc biệt cũng khá thường gặp.

Trường hợp áp dụng phương thức lấy mẫu

Các mục sau giải thích những trường hợp Analytics có thể áp dụng phương thức lấy mẫu phiên trong báo cáo.

Báo cáo mặc định

Analytics liệt kê một tập hợp các báo cáo mặc định, được định cấu hình trước trong khung bên trái trong các mục Đối tượng, Thu nạp, Hành vi và Lượt chuyển đổi.

Analytics lưu trữ một tập dữ liệu hoàn chỉnh, chưa được lọc cho từng thuộc tính trong từng tài khoản. Đối với mỗi chế độ xem báo cáo trong một thuộc tính, Analytics cũng tạo các bảng chứa các chỉ số và thứ nguyên tổng hợp từ dữ liệu hoàn chỉnh, chưa được lọc. Khi bạn chạy báo cáo mặc định, Analytics sẽ truy vấn các bảng dữ liệu tổng hợp để nhanh chóng đưa ra kết quả chưa được lấy mẫu.

Analytics định kỳ thêm báo cáo mới và đôi khi thực hiện thay đổi đối với cách tính các chỉ số. Nếu phạm vi ngày của báo cáo bao gồm một khoảng thời gian trước khi báo cáo được thêm hoặc trước khi cách tính toán chỉ số thay đổi, thì Analytics có thể tạo một truy vấn đặc biệt và hệ thống có thể lấy mẫu dữ liệu.

Hệ thống lấy mẫu dữ liệu khi các báo cáo bao gồm chỉ số Người dùng và Người dùng đang hoạt động có dữ liệu từ trước tháng 9 năm 2016. Tìm hiểu thêm

Báo cáo mặc định không được lấy mẫu trong cả Analytics Chuẩn và Analytics 360. Tuy nhiên, nếu sử dụng tính năng ghi đè tự động gắn thẻ , bạn có thể thấy hoạt động lấy mẫu xảy ra trong một số báo cáo trong Google Ads.

Báo cáo đặc biệt

Nếu bạn sửa đổi một báo cáo mặc định theo một cách nhất định (ví dụ: bằng cách áp dụng phân đoạn, bộ lọc hoặc thứ nguyên phụ) hoặc nếu bạn tạo báo cáo tùy chỉnh bằng cách kết hợp các thứ nguyên và chỉ số không có trong báo cáo mặc định, thì bạn sẽ tạo ra truy vấn đặc biệt với dữ liệu Analytics.

Trước tiên, Analytics sẽ truy cập vào các bảng dữ liệu tổng hợp để xem liệu thông tin yêu cầu trong truy vấn đặc biệt của bạn đã có trong các bảng đó hay chưa. Nếu ở đó không có thông tin, Analytics sẽ truy vấn tập dữ liệu hoàn chỉnh chưa được lọc để đáp ứng yêu cầu truy vấn.

Các truy vấn đặc biệt này sẽ được lấy mẫu nếu số phiên hoạt động trong phạm vi ngày mà bạn đang sử dụng vượt quá ngưỡng cho loại thuộc tính của bạn.

Thuật toán lấy mẫu sử dụng mẫu của dữ liệu hoàn chỉnh tương ứng với tỷ lệ số phiên hoạt động hằng ngày cho thuộc tính đó trong phạm vi ngày mà bạn đang sử dụng. Ví dụ: nếu trong khoảng thời gian 5 ngày, phiên hoạt động đã được lấy mẫu ở mức 25%, thì mẫu sẽ bao gồm 25% số phiên hoạt động mỗi ngày:

  Thứ Hai Thứ Ba Thứ Tư Thứ Năm Thứ Sáu
Tổng số phiên 200.000 100.000 200.000 300.000 200.000
25% mẫu 50.000 25.000 50.000 75.000 50.000

 

Tốc độ lấy mẫu của mỗi truy vấn là khác nhau tùy thuộc vào số lượng phiên hoạt động trong một phạm vi ngày đối với một chế độ xem nhất định.

Khi phương thức lấy mẫu có hiệu lực, bạn sẽ thấy thông báo ở đầu báo cáo có nội dung như sau Báo cáo này được tổng hợp dựa trên N% phiên hoạt động.

Ở bên phải thông báo đó, bạn có thể chọn một trong hai tùy chọn để thay đổi kích thước lấy mẫu:

  • Chính xác hơn: Sử dụng kích thước lấy mẫu lớn nhất có thể nếu bạn muốn nhận được kết quả chính xác nhất cho cho tập dữ liệu hoàn chỉnh của bạn
  • Phản hồi nhanh hơn: Sử dụng kích thước lấy mẫu nhỏ hơn nếu bạn muốn nhận được kết quả nhanh hơn
Sampling controls: Greater precision or Faster response
Các tùy chọn kiểm soát phương thức lấy mẫu.

Các báo cáo khác

Cách hoạt động của phương thức lấy mẫu cho các báo cáo này khác với cách hoạt động cho báo cáo mặc định hoặc truy vấn đặc biệt.

Báo cáo Phễu đa kênh.

Giống như báo cáo mặc định, các báo cáo này không áp dụng phương thức lấy mẫu trừ khi bạn sửa đổi báo cáo (ví dụ: bằng cách thay đổi giai đoạn xem lại, thay đổi loại chuyển đổi được đưa vào báo cáo hoặc thêm phân đoạn hay thứ nguyên phụ). Nếu bạn sửa đổi báo cáo theo bất kỳ hình thức nào, hệ thống cũng sẽ trả về kết quả lấy mẫu tối đa là 1 triệu lượt chuyển đổi.

Báo cáo hình ảnh hóa luồng

Báo cáo hình ảnh hóa luồng (Luồng người dùng, Luồng hành vi, Luồng sự kiện, Luồng mục tiêu) được tạo từ tối đa 100 nghìn phiên hoạt động trong phạm vi ngày đã chọn.

Kết quả từ các báo cáo hình ảnh hóa luồng (bao gồm tỷ lệ truy cập, tỷ lệ thoát và tỷ lệ chuyển đổi) có thể khác với các kết quả trong báo cáo Hành vi và báo cáo Lượt chuyển đổi mặc định (các báo cáo này được tổng hợp dựa trên một tập hợp mẫu khác).

Bộ lọc và phân đoạn

Analytics Chuẩn và Analytics 360 lấy mẫu dữ liệu phiên ở cấp chế độ xem, sau khi các bộ lọc chế độ xem được áp dụng. Ví dụ: nếu bộ lọc chế độ xem bao gồm hoặc loại trừ một số phiên, thì mẫu chỉ được lấy từ các phiên đó.

Analytics Chuẩn và Analytics 360 đều áp dụng các phân đoạn sau khi áp dụng bộ lọc báo cáo và sau khi lấy mẫu, điều này có nghĩa là một phân đoạn có thể bao gồm ít phiên hơn so với mẫu tổng thể.

Cách sử dụng kích thước mẫu

Sử dụng các tùy chọn kiểm soát để chuyển đổi giữa kích thước lấy mẫu tối đa để có báo cáo chính xác hơn hoặc kích thước lấy mẫu nhỏ hơn để có phản hồi nhanh hơn cho truy vấn của bạn.

Để tránh lấy mẫu, bạn có thể sử dụng tùy chọn rút ngắn phạm vi ngày của báo cáo cho đến khi số phiên nằm dưới ngưỡng lấy mẫu, nếu lượng dữ liệu của bạn cho phép điều đó.

Nếu là người dùng Google Analytics 360, bạn có 2 tùy chọn khác để nhận báo cáo chưa được lấy mẫu:

Thông tin này có hữu ích không?
Chúng tôi có thể cải thiện trang này bằng cách nào?
Tìm kiếm
Xóa tìm kiếm
Đóng tìm kiếm
Các ứng dụng của Google
Menu chính
Tìm kiếm trong Trung tâm trợ giúp
true
69256
false