Ce este eșantionarea datelor
Eșantionarea datelor este procesul prin care se analizează un subset de date pentru a descoperi informații semnificative dintr-un set mai extins de date. Această practică vă permite să preluați datele mai rapid, cu un impact minim asupra calității datelor.
De exemplu, dacă doriți să estimați numărul arborilor de pe o suprafață de 100 de hectare, unde distribuția copacilor este destul de uniformă, ați putea să numărați copacii de pe un hectar și să înmulțiți cu 100 sau să numărați copacii de pe o jumătate de hectar și să înmulțiți cu 200, pentru a obține o reprezentare exactă a întregii suprafețe.
De ce vedeți eșantionarea datelor
În Google Analytics, eșantionarea datelor poate avea loc atunci când numărul de evenimente folosite pentru a crea un raport, o explorare sau o solicitare depășește limita cotei pentru proprietatea dvs. Când se întâmplă acest lucru, Analytics folosește o parte din date, apoi le scalează pentru a oferi rezultate corecte, reprezentative pentru toate datele.
Când rezultatele dvs. folosesc eșantionarea, acest lucru este indicat în pictograma pentru calitatea datelor, cu procentajul de date folosite pentru determinarea rezultatelor. Cu cât dimensiunea eșantionului este mai mare, cu atât rezultatele sunt mai precise.
Care sunt limitele
Limita cotei pentru interogările la nivel de eveniment este de 10 milioane de evenimente pentru proprietățile Google Analytics standard și de până la un miliard de evenimente pentru proprietățile Google Analytics 360.
Pentru a vă oferi rezultate precise și mai rapide, proprietățile Google Analytics 360 au o valoare prestabilită de 100 de milioane de evenimente pentru fiecare interogare. Când este necesară o precizie sporită, cu ajutorul pictogramei pentru calitatea datelor puteți accesa limita de eșantionare mai ridicată în Explorați, selectând Rezultate mai detaliate.
Ce se întâmplă cu datele neeșantionate
Pentru rapoartele bazate pe date complete, Google Analytics folosește HyperLogLog++ (HLL++) pentru a estima numărul exact de valori distincte pentru cele mai frecvent folosite valori, cum ar fi Utilizatori activi și Sesiuni. Folosirea HLL++ asigură performanțe mai bune, o precizie mai mare a estimărilor și intervale de eroare mai mici. Puteți folosi HLL++ și cu datele Google Analytics din BigQuery. Aflați mai multe despre aproximarea unică a numărului în Google Analytics.