Como os dados são armazenados e mostrados

Sobre a amostragem de dados

O que é?

É a prática de analisar um subconjunto de dados para descobrir informações importantes de um conjunto maior. Com isso, é possível recuperar dados mais rápido com impacto mínimo na qualidade deles.

Por exemplo, para estimar o número de árvores em uma área de 100 acres em que a distribuição delas é bem uniforme, basta contar o número de árvores em 1 acre e multiplicar por 100 ou contar as árvores em meio acre e multiplicar por 200 para chegar a uma representação precisa dos 100 acres.

Por que usamos a amostragem de dados?

No Google Analytics, a amostragem de dados pode ocorrer quando o número de eventos usados para criar um relatório, uma análise detalhada ou uma solicitação excede o limite de cota da propriedade. Nesse caso, o Google Analytics usa uma parte dos dados e faz o escalonamento vertical para fornecer resultados direcionalmente precisos que representam todas as informações.

Quando os resultados usam amostragem, a porcentagem de dados utilizada para criar os resultados aparece no ícone da qualidade dos dados. Quanto maior é a amostra usada, mais precisos são os resultados.

Quais são os limites?

O limite de cota para consultas no nível do evento é de 10 milhões de eventos para propriedades padrão do Google Analytics e até 1 bilhão de eventos para propriedades do Google Analytics 360.

As propriedades do Google Analytics 360 têm um padrão inicial de 100 milhões de eventos por consulta para fornecer resultados mais rápidos e precisos. Quando o nível de precisão necessário for maior, use o ícone de qualidade de dados para acessar o limite de amostragem mais alto em "Explorar", selecionando "Resultados mais detalhados".

Observação: filtrar grandes conjuntos de dados por país pode gerar a amostragem de dados nos relatórios padrão do Google Analytics e na Análise, mesmo com o uso de solicitações de dados expandidas. Isso acontece porque a filtragem ativa diferentes métodos de tratamento de dados, que têm mais chances de resultar na amostragem ao processar conjuntos de dados com mais de 100 milhões de eventos. Para minimizar a amostragem, reduza o período dos seus relatórios ou use métodos de análise alternativos, se necessário.

E os dados sem amostragem?

Para relatórios sem dados de amostra, o Google Analytics usa o HyperLogLog++ (HLL++) para estimar contagens exatas das métricas mais usadas, como o número de usuários e sessões. O uso do HLL++ garante uma performance melhor, maior precisão da estimativa e limites de erro menores. Também é possível usar o HLL++ com seus dados do Google Analytics no BigQuery. Saiba mais sobre a estimativa da contagem única no Google Analytics.

Observação: na maioria dos casos, as taxas de discrepância são menores que 1%, mas podem ser maiores, principalmente ao combinar mais de uma métrica HLL++. O Google Analytics usa o esboço HLL++ 14. Saiba mais sobre esboços HLL++.

Isso foi útil?

Como podemos melhorá-lo?
Pesquisa
Limpar pesquisa
Fechar pesquisa
Google Apps
Menu principal
10381300431859449376
true
Pesquisar na Central de Ajuda
false
true
true
true
true
true
69256
false
false
false
false