[GA4] BigQuery Export

 

BigQuery는 대규모 데이터 세트에 대한 쿼리를 신속하게 처리할 수 있는 클라우드 데이터 웨어하우스입니다.

모든 원시 이벤트를 Google 애널리틱스 4 속성(하위 속성롤업 속성 포함에서 BigQuery로 내보낸 다음 SQL과 유사한 구문을 사용하여 해당 데이터를 쿼리할 수 있습니다. BigQuery에서 데이터를 외부 저장소로 내보내거나 외부 데이터를 가져와서 애널리틱스 데이터와 결합할 수 있습니다.

BigQuery로 데이터를 내보내면 해당 데이터를 소유하면서 BigQuery ACL을 이용해 프로젝트 및 데이터 세트에 대한 권한을 관리할 수 있습니다.

참고: 애널리틱스에서 BigQuery로 데이터를 내보낸 후에는 다시 내보낼 수 없습니다.

전체 데이터 내보내기는 하루에 한 번 진행되며, 데이터는 종일 지속적으로 내보내지기도 합니다(아래의 스트리밍 내보내기 참고).

무료 BigQuery 인스턴스(BigQuery 샌드박스)로 데이터를 내보낼 수 있지만 샌드박스 제한을 초과하여 내보내면 비용이 청구됩니다.

표준 속성의 일일 BigQuery Export 한도는 이벤트 100만 개입니다. 다른 BigQuery Export 한도에 대해 자세히 알아보기

Google 애널리틱스 인터페이스와 BigQuery Export의 차이점

BigQuery 이벤트 내보내기를 사용하면 원시 이벤트 및 사용자 수준 데이터에 대한 액세스를 제공할 수 있습니다. 단, Google 애널리틱스에서 표준 보고서 및 탐색 분석의 데이터에 추가한 값은 제외됩니다. 따라서 BigQuery 이벤트 내보내기의 데이터가 Google 애널리틱스 인터페이스의 데이터와 다를 수 있습니다.

BigQuery 이벤트 내보내기와 Google 애널리틱스 인터페이스의 차이점을 이해하고 가능한 경우 이러한 차이를 완화하는 방법을 알아보려면 Google 애널리틱스 UI와 BigQuery 내보내기 간의 격차 줄이기를 참고하세요.

스트리밍 내보내기

Google 애널리틱스 4 속성을 BigQuery에 연결할 때 스트리밍 내보내기 옵션을 선택할 수 있습니다.

BigQuery 스트리밍 내보내기를 사용하면 BigQuery Export를 통해 몇 분 이내에 당일 데이터를 사용할 수 있습니다.

이 내보내기 옵션을 사용하면 속성의 사용자 및 트래픽을 분석할 수 있는 최신 정보가 BigQuery에 전달됩니다.

스트리밍 내보내기를 통해 매일 다음과 같은 하나의 테이블이 새로 만들어집니다.

  • events_intraday_YYYYMMDD: 하루 동안 발생한 세션 활동 레코드가 포함된 내부 스테이징 테이블입니다. 스트리밍 내보내기는 최선의 노력으로 실행된 작업으로, 실패한 업로드, 지연된 이벤트 처리 등과 같은 이유로 일부 데이터를 포함하지 않을 수 있습니다. 데이터는 하루 종일 지속적으로 내보내집니다. 하나의 세션이 여러 내보내기 작업에 걸쳐 있는 경우 해당 세션에 대한 레코드가 이 테이블에 포함될 수 있습니다. 이 테이블은 events_YYYYMMDD가 완료되면 삭제됩니다.

BigQuery Export 설정 시 일일 옵션을 선택하면 다음 테이블도 매일 생성됩니다.

  • events_YYYYMMDD: 매일 진행되는 전체 이벤트 내보내기입니다.

events_intraday_YYYYMMDD가 아닌 events_YYYYMMDD를 쿼리하여 해당 날짜의 안정적인 데이터 세트를 쿼리해야 합니다.

events_YYYYMMDDevents_intraday_YYYYMMDD 테이블에 대한 자세한 내용은 BigQuery Export 스키마에서 확인하세요.

BigQuery 스트리밍 내보내기에는 신규 사용자에 대한 다음 사용자 기여 분석 데이터가 포함되지 않습니다.

  • traffic_source.name(보고 측정기준: 사용자 캠페인)
  • traffic_source.source(보고 측정기준: 사용자 소스)
  • traffic_source.medium(보고 측정기준: 사용자 매체)

기존 사용자에 대한 사용자 기여 분석 데이터는 포함되지만, 이 데이터를 완전히 처리하려면 약 24시간이 걸리므로 스트리밍 내보내기 대신 전체 일일 내보내기에서 사용자 기여 분석 데이터를 가져오는 것이 좋습니다.

스트리밍 내보내기를 사용하면 BigQuery 이용료에서 데이터 1GB당 $0.05의 비용이 추가로 발생합니다. 1GB는 약 60만 건의 Google 애널리틱스 이벤트에 해당합니다(건수는 이벤트 크기에 따라 달라질 수 있음). BigQuery 가격 책정에 대해 자세히 알아보기

표 업데이트 일정

BigQuery Export의 일부로 생성되는 표가 업데이트될 때 데이터를 내보내는 애널리틱스 속성의 시간대가 적용됩니다.

스트리밍 내보내기 표(events_intraday_YYYYMMDD)는 하루 종일 지속적으로 업데이트됩니다(예: 속성 시간대를 기준으로 오전 12:00:00부터 오후 11:59:59까지). 속성의 시간대에서 새 날짜가 시작되면 이벤트가 바뀐 새 날짜의 표에 기록됩니다.

애널리틱스에서 그날의 모든 이벤트를 수집한 후 일일 내보내기 표가 생성됩니다(events_YYYYMMDD). 애널리틱스에서는 표 날짜 이후 최대 72시간까지 반영하며, 표 날짜가 타임스탬프된 이벤트를 사용하여 일일 표를 업데이트합니다. 예를 들어 측정 프로토콜 또는 Firebase SDK에서 늦게 넘어온 여러 이벤트를 반영합니다. 가령 표 날짜가 20220101이면 애널리틱스에서는 20220101로 타임스탬프된 이벤트를 20220104까지 반영하여 표에 업데이트하게 됩니다.

필요에 따라 애널리틱스에서는 이전 데이터를 다시 처리해야 하는 경우 72시간 후라도 언제든지 일일 표를 업데이트할 수 있습니다(예: 처리 오류를 해결하는 버그 수정).

쿠키가 없는 핑과 고객 제공 데이터

동의 모드가 구현되면 애널리틱스에서 수집한 쿠키가 없는 핑이 user_id, 맞춤 측정기준처럼 고객이 제공한 데이터와 함께 BigQuery Export에 표시됩니다.

GA4 - Firebase 통합 및 BigQuery

GA4 속성과 Firebase 프로젝트가 통합된 경우에는 별도의 BigQuery 프로젝트에 연결할 수 없습니다.

Google 애널리틱스 4와 유니버설 애널리틱스의 BigQuery Export 기능 비교

Google 애널리틱스 4 유니버설 애널리틱스

표준(무료) 및 360(유료)에서 사용 가능

표준 한도: 일일 이벤트 100만 개

360 한도: 일일 이벤트 수십억 개

360에서 사용 가능(유료)

비용

샌드박스 한도 내에서 BigQuery 샌드박스로 무료 내보내기

샌드박스 한도를 초과하여 내보낸 데이터에는 계약 약관에 따라 요금이 청구됨

비용

샌드박스 한도 내에서 BigQuery 샌드박스로 무료 내보내기

샌드박스 한도를 초과하여 내보낸 데이터에는 계약 약관에 따라 요금이 청구됨

설정

특정 데이터 스트림을 포함하고 각 속성의 특정 이벤트를 제외할 수 있음

(내보내기 볼륨과 비용을 관리할 수 있음)

설정

속성당 하나의 뷰만 연결할 수 있음

(해당 보기의 모든 데이터를 내보냄)

스트리밍 내보내기

1GB당 0.05달러(BigQuery 가격 책정에 대해 자세히 알아보기)

테이블 생성됨:

events_intraday_YYYMMDD

테이블이 매일 삭제됨:

  • 스트리밍 외에 일일 내보내기 옵션도 사용하는 경우
  • 일일 테이블이 완료된 경우

신규 사용자의 사용자 캠페인, 사용자 소스 또는 사용자 매체 데이터는 포함하지 않음

스트리밍 내보내기

1GB당 0.05달러(BigQuery 가격 책정에 대해 자세히 알아보기)

테이블 생성됨:

ga_realtime_sessions_YYYYMMDD

BigQuery 뷰 생성됨:

ga_realtime_sessions_view_YYYYMMDD

일일 내보내기

테이블 생성됨:

events_YYYYMMDD

일일 내보내기

테이블 생성됨

ga_sessions_intraday_YYYYMMDD

  • 하루에 3회 이상 업데이트됨
  • 각 업데이트 시 이전 데이터를 덮어씀
  • 다음 날 전체 가져오기가 완료되면 삭제됨

ga_sessions_YYYYMMDD

  • 전체 일일 가져오기

내보내기, 일반

백필: 백필 없음

데이터 세트: 연결된 속성마다 데이터 세트 1개의 이름이 analytics_<속성 ID>로 지정됨

동의 모드를 구현한 경우 내보내기에 다음이 포함됩니다.

  • 쿠키를 이용하지 않는 핑
  • 고객 제공 데이터(user_id, 맞춤 측정기준)

내보내기, 일반

백필: 연결 시 13개월 분량 데이터의 백필 또는 100억 건의 조회 중 더 작은 값

(BigQuery 샌드박스로 백필하지 못할 수 있음)

데이터 세트: 연결된 뷰마다 데이터 세트 1개에 뷰와 같은 이름이 지정됨

스키마 내보내기

BigQuery 테이블의 각 행이 이벤트를 나타냄

Google 애널리틱스 4 고유의 이벤트 데이터

유니버설 애널리틱스 필드와 본질적으로 동일한 일부 Google 애널리틱스 4 필드가 있지만(예: device.category, device.deviceCategory) GA4 이벤트 데이터와 UA 조회 데이터는 공통점보다 차이가 더 많습니다.

스키마 내보내기

BigQuery 테이블의 각 행이 세션을 나타냄

유니버설 애널리틱스 고유의 조회 데이터

Google 애널리틱스 4 필드와 본질적으로 동일한 일부 유니버설 애널리틱스 필드가 있지만(예: device.deviceCategory, device.category) UA 조회 데이터와 GA4 이벤트 데이터는 공통점보다 차이가 더 많습니다.

 

관련 리소스

BigQuery 개발자 가이드에서 아래 내용에 대해 자세히 알아볼 수 있습니다.

도움이 되었나요?

어떻게 하면 개선할 수 있을까요?
검색
검색어 지우기
검색 닫기
Google 앱
기본 메뉴