Τι είναι η δειγματοληψία δεδομένων
Η δειγματοληψία δεδομένων είναι η πρακτική της ανάλυσης ενός υποσυνόλου των δεδομένων, προκειμένου να αποκαλυφθούν σημαντικές πληροφορίες από ένα μεγαλύτερο σύνολο δεδομένων. Η πρακτική σάς επιτρέπει να ανακτάτε δεδομένα πιο γρήγορα με ελάχιστο αντίκτυπο στην ποιότητα των δεδομένων.
Για παράδειγμα, αν θέλατε να εκτιμήσετε τον αριθμό των δέντρων σε μια περιοχή έκτασης 100 στρεμμάτων όπου η κατανομή των δέντρων είναι αρκούντως ομοιόμορφη, θα μπορούσατε να μετρήσετε τον αριθμό των δέντρων σε 1 στρέμμα και να πολλαπλασιάσετε επί 100 ή να μετρήσετε τα δέντρα σε μισό στρέμμα και να πολλαπλασιάσετε επί 200, προκειμένου να καταλήξετε σε έναν αριθμό που αντιπροσωπεύει με ακρίβεια το σύνολο των 100 στρεμμάτων.
Γιατί βλέπετε δειγματοληψία δεδομένων
Στο Google Analytics, η δειγματοληψία δεδομένων μπορεί να πραγματοποιηθεί, όταν ο αριθμός των συμβάντων που χρησιμοποιούνται για τη δημιουργία μιας αναφοράς, εξερεύνησης ή αιτήματος υπερβαίνει το όριο για την ιδιοκτησία σας. Όταν συμβαίνει αυτό, το Analytics χρησιμοποιεί ένα τμήμα των δεδομένων και, στη συνέχεια, προσαρμόζεται, για να παρέχει αποτελέσματα που σας κατευθύνουν με ακρίβεια, τα οποία είναι αντιπροσωπευτικά όλων των δεδομένων σας.
Όταν τα αποτελέσματά σας χρησιμοποιούν δειγματοληψία, υποδεικνύεται στο εικονίδιο ποιότητας δεδομένων με το ποσοστό των δεδομένων που χρησιμοποιήθηκαν για τη δημιουργία των αποτελεσμάτων. Όσο υψηλότερο είναι το μέγεθος του δείγματος που χρησιμοποιείται, τόσο πιο ακριβή είναι τα αποτελέσματα.
Ποια είναι τα όρια
Το όριο για ερωτήματα σε επίπεδο συμβάντος είναι 10 εκατομμύρια συμβάντα για βασικές ιδιοκτησίες Google Analytics και έως 1 δισεκατομμύριο συμβάντα για ιδιοκτησίες Google Analytics 360.
Οι ιδιοκτησίες Google Analytics 360 έχουν μια αρχική προεπιλογή 100 εκατομμυρίων συμβάντων ανά ερώτημα, ώστε να σας παρέχουν πιο γρήγορα και ακριβή αποτελέσματα. Όταν απαιτείται αυξημένη ακρίβεια, μέσω του εικονιδίου ποιότητας δεδομένων μπορείτε να αποκτήσετε πρόσβαση στο υψηλότερο όριο δειγματοληψίας, στην Εξερεύνηση, με την επιλογή "πιο λεπτομερή αποτελέσματα".
Τι γίνεται με τα δεδομένα βάσει συνόλου δεδομένων
Για αναφορές βάσει συνόλου δεδομένων, το Google Analytics χρησιμοποιεί το HyperLogLog++ (HLL++), για να εκτιμήσει τις ακριβείς ξεχωριστές μετρήσεις για τις μετρήσεις που χρησιμοποιούνται συχνότερα, όπως οι Ενεργοί χρήστες και οι Περίοδοι σύνδεσης. Η χρήση του HLL++ διασφαλίζει καλύτερη απόδοση, υψηλότερη ακρίβεια εκτίμησης και χαμηλότερα όρια σφαλμάτων. Μπορείτε, επίσης, να χρησιμοποιήσετε το HLL++ με τα δεδομένα σας στο Google Analytics στο BigQuery. Μάθετε περισσότερα σχετικά με την προσέγγιση μοναδικού πλήθους στο Google Analytics.