Próbkowanie danych – informacje

W przypadku analizowania danych próbkowanie polega na analizie podzbioru wszystkich danych, która służy do odkrywania cennych informacji o większym zbiorze danych. Jeśli np. chcesz oszacować liczbę drzew na obszarze 100 akrów, na którym ich zagęszczenie jest dosyć równomierne, możesz policzyć drzewa na powierzchni 1 akra, a następnie przemnożyć uzyskaną wartość przez 100, lub policzyć drzewa na powierzchni 0,5 akra, a następnie przemnożyć uzyskaną wartość przez 200, by otrzymać dobre przybliżenie liczebności drzew na całym 100-akrowym obszarze.

W tym artykule objaśniono okoliczności, w jakich Analytics stosuje do Twoich danych próbkowanie sesji, by w odpowiednio krótkim czasie generować dokładne raporty.

 

Tematy w tym artykule:

Wartości progowe próbkowania

Raporty domyślne nie podlegającą próbkowaniu.

Zapytania doraźne związane z Twoimi danymi podlegają próbkowaniu po przekroczeniu następujących ogólnych wartości progowych:

  • Analytics (wersja standardowa): 500 tys. sesji na poziomie usługi w przypadku wyznaczonego zakresu dat
  • Analytics 360: 100 mln sesji na poziomie widoku danych w przypadku wyznaczonego zakresu dat

W pewnych okolicznościach próbka może obejmować mniej sesji. Może to wynikać ze poziomu złożoności Twojej implementacji Analytics, użycia filtrów w widoku danych, złożoności zapytań służących do podziału danych na segmenty lub z kombinacji tych czynników. Chociaż staramy się, by próbka obejmowała podaną wyżej liczbę sesji, czasami w przypadku zapytań doraźnych zdarza się, że zwracanych jest nieco mniej sesji.

Kiedy zachodzi próbkowanie

W kolejnych sekcjach objaśniono, kiedy możesz się spodziewać próbkowania sesji w raportach Analytics.

Raporty domyślne

W Analytics występuje zestaw skonfigurowanych wstępnie raportów domyślnych, których lista widoczna jest w lewym okienku poniżej pozycji Odbiorcy, Pozyskiwanie, Zachowanie i Konwersje.

Analytics przechowuje na każdym koncie jeden pełny, niefiltrowany zbiór danych dla każdej usługi. W każdym widoku raportów w ramach danej usługi Analytics tworzy również tabele ze zagregowanymi wymiarami i danymi pochodzącymi z pełnego, niefiltrowanego zbioru danych. Gdy korzystasz z jednego z raportów domyślnych, Analytics wysyła zapytanie do tabel ze zagregowanymi danymi, aby szybko dostarczyć niespróbkowane wyniki.

Analytics okresowo dodaje nowe raporty, a czasami wprowadza zmiany w sposobie obliczania danych. Jeśli zakres dat raportu obejmuje okres przed dodaniem raportu lub przed zmianą sposobu obliczania danych, Analytics może wysłać zapytanie doraźne i spróbkować dane.

Dane są próbkowane, gdy raporty zawierające dane o użytkownikach i aktywnych użytkownikach obejmują informacje sprzed września 2016 r. Więcej informacji

Raporty domyślne nie podlegają próbkowaniu ani w standardowej wersji Analytics, ani w Analytics 360. Jeśli jednak korzystasz z funkcji zastępowania automatycznego tagowania tagowaniem ręcznym, możesz spotkać się z próbkowaniem w przypadku niektórych raportów Google Ads.

Raporty doraźne

Jeśli zmodyfikujesz jakoś raport domyślny, np. stosując segment, filtr lub wymiar dodatkowy, albo jeśli utworzysz raport niestandardowy z kombinacją wymiarów i danych, która nie występuje w raporcie domyślnym, wygenerujesz w ten sposób doraźne zapytanie obejmujące dane Analytics.

Analytics sprawdza najpierw w tabelach z danymi zbiorczymi, czy są w nich dostępne wszystkie informacje żądane w zapytaniu doraźnym. Jeśli brakuje w nich odpowiednich informacji, Analytics wysyła zapytanie do pełnego, niefiltrowanego zbioru danych, by wykonać żądanie.

Zapytania doraźne podlegają próbkowaniu, jeśli liczba sesji w ramach wyznaczonego zakresu dat przekracza wartość progową określoną dla typu Twojej usługi.

Algorytm próbkowania korzysta z próbki pełnego zbioru danych, która jest proporcjonalna do dziennego rozkładu sesji w usłudze w wyznaczonym zakresie dat. Jeśli np. w przypadku pięciodniowego okresu próbkowanie ma obejmować 25% sesji, wielkość próbki obejmie 25% sesji z każdego dnia:

  poniedziałek wtorek środa czwartek piątek
Łączna liczba sesji 200 000 100 000 200 000 300 000 200 000
Próbka 25% 50 000 25 000 50 000 75 000 50 000

 

Wielkość próbki zmienia się w zależności od liczby sesji w ramach zakresu dat wyznaczonego w konkretnym widoku danych.

Gdy stosowane jest próbkowanie, na górze raportu pojawia się komunikat Raport został wygenerowany na podstawie N% sesji.

Po prawej stronie tego komunikatu możesz wybrać jedną z dwóch opcji, by zmienić wielkość próbki:

  • Większa precyzja: wykorzystuje maksymalną wielkość próbki, by wyniki najdokładniej odzwierciedlały Twój zbiór danych.
  • Krótszy czas reakcji: korzysta z mniejszej próbki, by szybciej dostarczyć wyniki.
Sampling controls: Greater precision or Faster response
Ustawienia próbkowania

Inne raporty

W przypadku tych raportów próbkowanie działa inaczej niż przy raportach domyślnych i zapytaniach doraźnych.

Raporty z sekcji Ścieżki wielokanałowe

Podobnie jak w przypadku raportów domyślnych, próbkowanie nie jest stosowane, dopóki nie zmodyfikujesz raportu, np. zmieniając okres ważności lub grupę konwersji objętych raportem albo dodając segment lub wymiar dodatkowy. Jeśli wprowadzisz w raporcie jakąkolwiek modyfikację, zostanie zwrócona próbka o maksymalnej wielkości 1 mln konwersji.

Raporty Wizualizacja procesu

Raporty Wizualizacja procesu (Przepływ użytkowników, Zmiany w zachowaniu, Przebieg zdarzeń, Przepływ celów) są generowane na podstawie podzbioru liczącego maksymalnie 100 tys. sesji z wyznaczonego zakresu dat.

Wyniki raportów wizualizacji procesu, obejmujące m.in. współczynniki wejść i wyjść oraz współczynniki konwersji, mogą się różnić od wyników standardowych raportów Zachowanie i Konwersje, które opierają się na innym spróbkowanym zbiorze.

Filtry i segmenty

Analytics (w wersji standardowej) i Analytics 360 próbkują dane sesji na poziomie widoku danych po zastosowaniu do niego filtrów. Jeśli np. filtry widoku uwzględniają lub wykluczają sesje, próbka jest wykonywana tylko na podstawie tych odfiltrowanych sesji.

Analytics (w wersji standardowej) i Analytics 360 stosują segmenty po użyciu filtrów w raportach i po próbkowaniu, przez co segment może obejmować mniej sesji niż znajduje się w ogólnej próbce.

Określanie wielkości próbki

Za pomocą elementów sterujących można przełączać się między maksymalną wielkością próbki, która zwiększa dokładność raportu, a mniejszą próbką przyspieszającą realizację zapytania.

Jedną z możliwości uniknięcia próbkowania jest takie zmniejszenie zakresu dat w raporcie, by liczba sesji nie przekraczała wartości progowej, jeśli pozwala na to ilość Twoich danych.

Jeśli korzystasz z Google Analytics 360, masz dwie dodatkowe możliwości otrzymywania niespróbkowanych raportów:

Czy to było pomocne?
Jak możemy ją poprawić?