Πώς αποθηκεύονται και προβάλλονται τα δεδομένα

Σχετικά με τη δειγματοληψία δεδομένων

Τι είναι η δειγματοληψία δεδομένων

Η δειγματοληψία δεδομένων είναι η πρακτική της ανάλυσης ενός υποσυνόλου των δεδομένων, προκειμένου να αποκαλυφθούν σημαντικές πληροφορίες από ένα μεγαλύτερο σύνολο δεδομένων. Η πρακτική σάς επιτρέπει να ανακτάτε δεδομένα πιο γρήγορα με ελάχιστο αντίκτυπο στην ποιότητα των δεδομένων.

Για παράδειγμα, αν θέλατε να εκτιμήσετε τον αριθμό των δέντρων σε μια περιοχή έκτασης 100 στρεμμάτων όπου η κατανομή των δέντρων είναι αρκούντως ομοιόμορφη, θα μπορούσατε να μετρήσετε τον αριθμό των δέντρων σε 1 στρέμμα και να πολλαπλασιάσετε επί 100 ή να μετρήσετε τα δέντρα σε μισό στρέμμα και να πολλαπλασιάσετε επί 200, προκειμένου να καταλήξετε σε έναν αριθμό που αντιπροσωπεύει με ακρίβεια το σύνολο των 100 στρεμμάτων.

Γιατί βλέπετε δειγματοληψία δεδομένων

Στο Google Analytics, η δειγματοληψία δεδομένων μπορεί να πραγματοποιηθεί, όταν ο αριθμός των συμβάντων που χρησιμοποιούνται για τη δημιουργία μιας αναφοράς, εξερεύνησης ή αιτήματος υπερβαίνει το όριο για την ιδιοκτησία σας. Όταν συμβαίνει αυτό, το Analytics χρησιμοποιεί ένα τμήμα των δεδομένων και, στη συνέχεια, προσαρμόζεται, για να παρέχει αποτελέσματα που σας κατευθύνουν με ακρίβεια, τα οποία είναι αντιπροσωπευτικά όλων των δεδομένων σας.

Όταν τα αποτελέσματά σας χρησιμοποιούν δειγματοληψία, υποδεικνύεται στο εικονίδιο ποιότητας δεδομένων με το ποσοστό των δεδομένων που χρησιμοποιήθηκαν για τη δημιουργία των αποτελεσμάτων. Όσο υψηλότερο είναι το μέγεθος του δείγματος που χρησιμοποιείται, τόσο πιο ακριβή είναι τα αποτελέσματα.

Ποια είναι τα όρια

Το όριο για ερωτήματα σε επίπεδο συμβάντος είναι 10 εκατομμύρια συμβάντα για βασικές ιδιοκτησίες Google Analytics και έως 1 δισεκατομμύριο συμβάντα για ιδιοκτησίες Google Analytics 360.

Οι ιδιοκτησίες Google Analytics 360 έχουν μια αρχική προεπιλογή 100 εκατομμυρίων συμβάντων ανά ερώτημα, ώστε να σας παρέχουν πιο γρήγορα και ακριβή αποτελέσματα. Όταν απαιτείται αυξημένη ακρίβεια, μέσω του εικονιδίου ποιότητας δεδομένων μπορείτε να αποκτήσετε πρόσβαση στο υψηλότερο όριο δειγματοληψίας, στην Εξερεύνηση, με την επιλογή "πιο λεπτομερή αποτελέσματα".

Σημείωση: Το φιλτράρισμα μεγάλων συνόλων δεδομένων με βάση τη χώρα μπορεί να οδηγήσει σε δειγματοληψία δεδομένων στις βασικές αναφορές και στην Εξερεύνηση του Google Analytics, ακόμα και όταν χρησιμοποιείτε αναπτυγμένα αιτήματα δεδομένων. Αυτό συμβαίνει επειδή το φιλτράρισμα ενεργοποιεί διαφορετικές μεθόδους επεξεργασίας δεδομένων, οι οποίες είναι πιο πιθανό να οδηγήσουν σε δειγματοληψία κατά τον χειρισμό συνόλων δεδομένων που υπερβαίνουν τα 100 εκατομμύρια συμβάντα. Για να ελαχιστοποιήσετε τη δειγματοληψία, εξετάστε το ενδεχόμενο να μειώσετε το εύρος ημερομηνιών των αναφορών σας ή να χρησιμοποιήσετε εναλλακτικές μεθόδους ανάλυσης, αν είναι απαραίτητο.

Τι γίνεται με τα δεδομένα χωρίς δειγματοληψία

Για αναφορές βάσει συνόλου δεδομένων, το Google Analytics χρησιμοποιεί το HyperLogLog++ (HLL++), για να εκτιμήσει τις ακριβείς ξεχωριστές μετρήσεις για τις μετρήσεις που χρησιμοποιούνται συχνότερα, όπως οι Ενεργοί χρήστες και οι Περίοδοι σύνδεσης. Η χρήση του HLL++ διασφαλίζει καλύτερη απόδοση, υψηλότερη ακρίβεια εκτίμησης και χαμηλότερα όρια σφάλματος. Μπορείτε, επίσης, να χρησιμοποιήσετε το HLL++ με τα δεδομένα του Google Analytics στο BigQuery. Μάθετε περισσότερα σχετικά με την προσέγγιση μοναδικού πλήθους στο Google Analytics.

Σημείωση: Στις περισσότερες περιπτώσεις, τα ποσοστά απόκλισης είναι μικρότερα από 1%, αλλά μπορεί να είναι υψηλότερα, ειδικά όταν συνδυάζονται περισσότερες από μία μετρήσεις HLL++. Το Google Analytics χρησιμοποιεί το σχέδιο HLL++ 14. Μάθετε περισσότερα σχετικά με τα σχέδια HLL++.

Σας βοήθησε αυτό;

Με ποιον τρόπο μπορούμε να το βελτιώσουμε;
Αναζήτηση
Διαγραφή αναζητήσεων
Κλείσιμο αναζήτησης
Εφαρμογές google
Κύριο μενού
12768878789609357395
true
Αναζήτηση στο Κέντρο Βοήθειας
false
true
true
true
true
true
69256
false
false
false
false