데이터 샘플링 안내

데이터 분석에서 샘플링은 더 큰 데이터 세트에서 의미 있는 정보를 찾아내기 위해 모든 데이터의 일부 를 분석하는 방법입니다. 예를 들어 나무가 균일하게 분포되어 있는 100에이커 면적 임야의 나무 수를 계산하려면, 1에이커 면적의 나무 수를 세고 100을 곱하거나 1/2에이커 면적의 나무 수를 세고 200을 곱하는 방법을 사용하여 전체 100에이커의 나무 수를 정확하게 파악할 수 있습니다.

이 게시글에서는 애널리틱스에서 세션 샘플링을 데이터에 적용하여 정확한 보고서를 신속하게 제공하는 방법을 설명합니다.

 

이 도움말에서는 다음 내용을 다룹 니다.

샘플링 기준치

기본 보고서는 샘플링이 적용되지 않습니다.

데이터의 임시 쿼리에는 다음과 같은 일반적인 샘플링 기준치가 적용됩니다.

  • 애널리틱스 표준: 속성 수준에서 사용 중인 기간에 세션 50만 회
  • 애널리틱스 360: 보기 수준에서 사용 중인 기간에 세션 1억 회

경우에 따라 더 적은 수의 세션이 샘플링될 수도 있습니다. 애널리틱스 구현의 복잡성, 보기 필터 사용, 세분화를 위한 쿼리 복잡성 또는 이러한 요인의 조합으로 인해 이러한 경우가 발생할 수 있습니다. 최대한 위에 설명된 기준치에 따라 샘플링하기 위해 최선을 다하지만 임시 쿼리에는 약간 적은 수의 세션이 반환되는 경우도 있는 것이 일반적입니다.

샘플링이 적용되는 경우

다음 섹션에서는 애널리틱스 보고서에서 어떤 경우에 세션 샘플링이 적용되는지 설명합니다.

기본 보고서

애널리틱스의 왼쪽 메뉴에 잠재고객, 획득, 행동, 전환 아래에 미리 구성된 기본 보고서 집합이 있습니다.

애널리틱스는 계정별로 각 속성마다 필터링되지 않은 전체 데이터 집합을 저장합니다. 또한 애널리틱스는 속성의 각 보고서 보기에 필터링되지 않은 전체 데이터에서 집계 측정기준 및 측정항목의 표를 생성합니다. 기본 보고서를 실행하면 애널리틱스는 집계 데이터의 표를 쿼리하여 샘플링되지 않은 결과를 신속하게 제공합니다.

애널리틱스에서는 신규 보고서가 주기적으로 추가되며 측정항목의 집계 방식이 변경되기도 합니다. 보고서가 추가되기 전 또는 측정항목 계산법이 변경되기 전의 시간이 보고서의 기간에 포함되면 애널리틱스에서 임시 쿼리를 생성하여 데이터 샘플링이 발생할 수 있습니다.

사용자 및 활성 사용자 측정항목을 포함하는 보고서에 2016년 9월 이전의 데이터가 포함되어 있으면 데이터를 샘플링합니다. 자세히 알아보기

기본 보고서의 경우 애널리틱스 표준에서나 애널리틱스 360에서나 샘플링이 적용되지 않습니다. 그러나 자동 태그 추가 재정의 기능을 사용하면 일부 Google Ads 보고서에서 샘플링이 발생할 수 있습니다.

임시 보고서

세그먼트, 필터 또는 보조 측정기준을 적용하는 등의 방식으로 기본 보고서를 수정하거나, 기본 보고서에 존재하지 않는 측정기준과 측정항목의 조합을 이용해 맞춤 보고서를 만든 경우, 애널리틱스 데이터에 대한 임시 쿼리가 생성됩니다.

애널리틱스는 먼저 집계 데이터의 표로 이동하여 임시 쿼리에서 요청한 정보를 모두 여기에서 사용 가능한지 확인합니다. 정보를 사용할 수 없는 경우 애널리틱스는 필터링되지 않은 전체 데이터 집합을 쿼리 요청에 맞게 쿼리합니다.

임시 쿼리는 사용 중인 기간의 세션수가 속성 유형의 기준치를 초과하는 경우 샘플링이 적용될 수 있습니다.

샘플링 알고리즘은 사용 중인 기간의 속성에 세션의 일일 분포에 비례하는 전체 데이터 샘플을 사용합니다. 예를 들어 5일의 기간 동안 세션을 25%로 샘플링한 경우 샘플에는 각 날짜별로 세션의 25%씩이 포함됩니다.

  월요일 화요일 수요일 목요일 금요일
총 세션수 200,000회 100,000회 200,000회 300,000회 200,000회
25% 샘플 50,000회 25,000회 50,000회 75,000회 50,000회

 

샘플링 비율은 특정 보기의 기간 동안 세션 수에 따라 쿼리마다 다릅니다.

샘플링 실행 시 보고서 상단에 이 보고서는 전체 세션의 N%를 기반으로 작성되었습니다.라는 메시지가 표시됩니다.

메시지의 오른쪽에 샘플링 크기를 변경하는 다음 두 가지 옵션 중 하나를 선택할 수 있습니다.

  • 높은 정확도: 가능한 최대 샘플 크기를 사용하여 전체 데이터 세트를 가장 정확하게 나타내는 결과 제공
  • 빠른 응답: 더 작은 샘플링 크기를 사용하여 더 빠른 결과 제공
Sampling controls: Greater precision or Faster response
샘플링 제어

기타 보고서

샘플링은 다음 보고서에서 기본 보고서 또는 임시 쿼리와는 다르게 사용됩니다.

다중 채널 유입경로 보고서

기본 보고서와 마찬가지로 전환 확인 기간을 변경하거나, 포함된 전환을 변경하거나, 세그먼트 또는 보조 측정기준을 추가하는 등 보고서를 수정하지 않으면 샘플링이 적용되지 않습니다. 어떤 방식으로든 보고서를 수정하면 최대 1백만 건의 전환 샘플이 반환됩니다.

사이트 이용 경로 시각화 보고서

사이트 이용 경로 시각화 보고서(사용자 흐름, 동작 흐름, 이벤트 흐름, 목표 흐름)는 선택한 기간 동안 최대 10만 건의 세션 으로부터 생성됩니다.

사이트 이용 경로 시각화 보고서에 표시된 방문율, 종료율, 전환율 등의 데이터는 다른 샘플 집합을 기반으로 하는 기본 행동 및 전환 보고서의 결과와 다를 수 있습니다.

필터 및 세그먼트

애널리틱스 표준 및 애널리틱스 360은 보기 필터가 적용된 후에 보기 수준에서 세션 데이터를 샘플링합니다. 예를 들어 보기 필터가 세션을 포함하거나 제외하면 샘플은 해당 세션에서만 가져옵니다.

애널리틱스 표준 및 애널리틱스 360은 모두 보고서 필터를 적용하고 샘플링한 후에 세그먼트를 적용합니다. 즉, 세그먼트에 전체 샘플보다 적은 수의 세션이 포함될 수 있습니다.

샘플 크기 다루기

관리 기능을 사용하여 보고서의 정확성을 높이기 위해 최대 샘플 크기를 선택하거나, 쿼리에 대한 빠른 응답을 위해 작은 샘플 크기를 선택할 수 있습니다.

샘플링을 피하려면 데이터 양이 허용하는 경우 세션수가 샘플링 기준치 미만이 될 때까지 보고서의 기간을 줄입니다.

Google 애널리틱스 360를 사용할 경우 샘플링되지 않은 보고서를 받기 위한 방법이 다음과 같이 두 가지 더 있습니다.

도움이 되었나요?
어떻게 하면 개선할 수 있을까요?