Was ist eine Stichprobenerhebung?
Bei der Stichprobenerhebung wird eine Teilmenge von Daten analysiert, um Rückschlüsse auf aussagekräftige Informationen in den Gesamtdaten zu ziehen. Auf diese Weise lassen sich Daten schneller abrufen, ohne dass die Datenqualität wesentlich beeinträchtigt wird.
Wenn Sie beispielsweise die Anzahl der Bäume auf einer Fläche von 100 Hektar mit relativ gleichmäßiger Baumverteilung schätzen wollten, könnten Sie die Bäume auf einem Hektar zählen und das Ergebnis mit 100 multiplizieren oder die Anzahl der Bäume auf einem halben Hektar mit 200 multiplizieren. So würden Sie eine recht genaue Angabe für die gesamten 100 Hektar erhalten.
Gründe für Stichprobenerhebungen
In Google Analytics können Stichprobenerhebungen eingesetzt werden, wenn die Anzahl der Ereignisse, die zum Erstellen eines Berichts, einer explorativen Datenanalyse oder einer Anfrage verwendet werden, das Kontingentlimit für Ihre Property überschreitet. Hierbei wird ein Teil der Daten analysiert und dann entsprechend hochgerechnet, um möglichst präzise Ergebnisse zu liefern, die für alle Daten repräsentativ sind.
Wenn für Ihre Ergebnisse Stichproben verwendet werden, wird im Symbol für die Datenqualität eine Warnung mit dem Prozentsatz der Daten angezeigt, auf dem die Ergebnisse beruhen. Je größer die Stichprobe, desto genauer die Ergebnisse.
Welche Limits gelten?
Das Kontingentlimit für Abfragen auf Ereignisebene beträgt 10 Millionen Ereignisse für Google Analytics-Standard-Properties und bis zu 1 Milliarde Ereignisse für Google Analytics 360-Properties.
Die Standardbegrenzung für Google Analytics 360-Properties liegt bei 100 Millionen Ereignissen pro Abfrage, um Ihnen schnellere und möglichst präzise Ergebnisse zu liefern. Wenn eine höhere Genauigkeit erforderlich ist, können Sie über das Symbol für die Datenqualität auf die höhere Datenbegrenzung bei der Stichprobenerhebung im explorativen Analysetool zugreifen. Wählen Sie dazu „Detailliertere Ergebnisse“ aus.
Was ist mit Gesamtdaten?
In Google Analytics wird für Gesamtdatenberichte HyperLogLog++ (HLL++) verwendet, um die genaue Anzahl der einzelnen Werte für die am häufigsten verwendeten Messwerte wie „Aktive Nutzer“ und „Sitzungen“ zu schätzen. HLL++ sorgt für eine bessere Leistung, eine höhere Schätzungsgenauigkeit und geringere Fehlergrenzen. Sie können HLL++ auch mit Ihren Google Analytics-Daten in BigQuery verwenden. Weitere Informationen zur Schätzung der eindeutigen Anzahl in Google Analytics