Jak dane są przechowywane i wyświetlane

[GA4] Próbkowanie danych

Czym jest próbkowanie danych

Próbkowanie danych to metoda analizy podzbioru danych, która służy do odkrywania cennych informacji o większym zbiorze danych. Umożliwia ona szybsze pobieranie danych przy minimalnym wpływie na ich jakość.

Jeśli np. chcesz oszacować liczbę drzew na obszarze 100 akrów, na którym ich zagęszczenie jest dosyć równomierne, możesz policzyć drzewa na powierzchni 1 akra, a potem przemnożyć uzyskaną wartość przez 100, lub policzyć drzewa na powierzchni 0,5 akra, a następnie przemnożyć uzyskaną wartość przez 200, aby otrzymać dobre przybliżenie liczebności drzew na całym 100-akrowym obszarze.

Dlaczego występuje próbkowanie danych

W Google Analytics próbkowanie danych może wystąpić, gdy liczba zdarzeń użytych do utworzenia raportu, eksploracji lub żądania przekracza limit obowiązujący w przypadku Twojej usługi. Analytics używa wtedy części danych, a potem przeskalowuje wyniki, aby uzyskać statystyki o dużej przybliżonej dokładności, które odzwierciedlają wszystkie dane.

Jeśli wyniki zostały uzyskane za pomocą próbkowania, jest to sygnalizowane przez ikonę jakości danych, której towarzyszy wartość procentowa danych użytych do wygenerowania wyników. Im większy rozmiar próbki, tym dokładniejsze wyniki.

Ile wynoszą limity

Limit zapytań na poziomie zdarzenia to 10 mln zdarzeń w przypadku standardowych usług w Google Analytics i maksymalnie 1 mld zdarzeń w przypadku usług w Google Analytics 360.

W usługach w Google Analytics 360 początkowo obowiązuje ustawienie domyślne 100 mln zdarzeń na zapytanie, co pozwala szybciej wyświetlać wyniki o dużej przybliżonej dokładności. Jeśli wymagana jest większa precyzja, za pomocą ikony jakości danych możesz uzyskać dostęp do wyższego limitu próbkowania w sekcji Eksplorowanie. Musisz tylko wybrać opcję „Bardziej szczegółowe wyniki”.

Co z danymi niespróbkowanymi

W przypadku niespróbkowanych raportów Google Analytics używa funkcji HyperLogLog++ (HLL++) do oszacowania dokładnych wartości liczbowych poszczególnych najczęściej używanych danych, np. Aktywnych użytkowników i Sesji. Korzystanie z HLL++ zapewnia lepszą wydajność, większą dokładność prognozowania i niższe granice błędu. W BigQuery możesz też używać funkcji HLL++ z danymi Google Analytics. Więcej informacji o przybliżonej liczbie unikalnych użytkowników w Google Analytics.

Czy to było pomocne?

Jak możemy ją poprawić?
Szukaj
Wyczyść wyszukiwanie
Zamknij wyszukiwanie
Menu główne
15438789608145979363
true
Wyszukaj w Centrum pomocy
true
true
true
true
true
69256
false
false