BigQuery는 대규모 데이터 세트에 대한 쿼리를 신속하게 처리할 수 있는 클라우드 데이터 웨어하우스입니다.
모든 원시 이벤트를 Google 애널리틱스 4 속성에서 BigQuery로 내보낸 다음 SQL과 유사한 구문을 사용하여 데이터를 쿼리할 수 있습니다. BigQuery에서 데이터를 외부 저장소로 내보내거나 외부 데이터를 가져와서 애널리틱스 데이터와 결합할 수 있습니다.
BigQuery로 데이터를 내보내면 해당 데이터를 소유하면서 BigQuery ACL을 이용해 프로젝트 및 데이터 세트에 대한 권한을 관리할 수 있습니다.
전체 데이터 내보내기는 하루에 한 번 진행되며, 또한 하루 종일 데이터 내보내기가 지속적으로 실행됩니다(아래의 스트리밍 내보내기 참고).
무료 BigQuery 인스턴스(BigQuery 샌드박스)로 데이터를 내보낼 수 있지만 샌드박스 제한을 초과하여 내보내면 비용이 청구됩니다.
표준 속성의 일일 BigQuery Export 한도는 이벤트 100만 개입니다. 다른 BigQuery Export 한도에 대해 자세히 알아보기
스트리밍 내보내기
Google 애널리틱스 4 속성을 BigQuery에 연결할 때 스트리밍 내보내기 옵션을 선택할 수 있습니다.
BigQuery 스트리밍 내보내기를 사용하면 BigQuery Export를 통해 몇 분 이내에 당일 데이터를 사용할 수 있습니다.
이 내보내기 옵션을 사용하면 속성의 사용자 및 트래픽을 분석할 수 있는 최신 정보가 BigQuery에 전달됩니다.
스트리밍 내보내기를 통해 매일 다음과 같은 하나의 테이블이 새로 만들어집니다.
events_intraday_YYYYMMDD
: 하루 동안 발생한 세션 활동 레코드가 포함된 내부 스테이징 테이블입니다. 스트리밍 내보내기는 최선의 노력으로 실행된 작업으로, 실패한 업로드, 지연된 이벤트 처리 등과 같은 이유로 일부 데이터를 포함하지 않을 수 있습니다. 데이터는 하루 종일 지속적으로 내보내집니다. 하나의 세션이 여러 내보내기 작업에 걸쳐 있는 경우 해당 세션에 대한 레코드가 이 테이블에 포함될 수 있습니다. 이 테이블은events_YYYYMMDD
가 완료되면 삭제됩니다.
BigQuery Export 설정 시 일일 옵션을 선택하면 다음 테이블도 매일 생성됩니다.
events_YYYYMMDD
: 매일 진행되는 전체 이벤트 내보내기입니다.
events_intraday_YYYYMMDD
가 아닌 events_YYYYMMDD
를 쿼리하여 해당 날짜의 안정적인 데이터 세트를 쿼리해야 합니다.
events_YYYYMMDD
및 events_intraday_YYYYMMDD
테이블에 대한 자세한 내용은 BigQuery Export 스키마에서 확인하세요.
BigQuery 스트리밍 내보내기에는 신규 사용자에 대한 다음 사용자 기여 분석 데이터가 포함되지 않습니다.
- traffic_source.name(보고 측정기준: 사용자 캠페인)
- traffic_source.source(보고 측정기준: 사용자 소스)
- traffic_source.medium(보고 측정기준: 사용자 매체)
기존 사용자에 대한 사용자 기여 분석 데이터는 포함되지만, 이 데이터를 완전히 처리하려면 약 24시간이 걸리므로 스트리밍 내보내기 대신 전체 일일 내보내기에서 사용자 기여 분석 데이터를 가져오는 것이 좋습니다.
스트리밍 내보내기를 사용하면 BigQuery 이용료에서 데이터 1GB당 $0.05의 비용이 추가로 발생합니다. 1GB는 약 60만 건의 Google 애널리틱스 이벤트에 해당합니다(건수는 이벤트 크기에 따라 달라질 수 있음). BigQuery 가격 책정에 대해 자세히 알아보기
표 업데이트 일정
BigQuery Export의 일부로 생성되는 표가 업데이트될 때 데이터를 내보내는 애널리틱스 속성의 시간대가 적용됩니다.
스트리밍 내보내기 표(events_intraday_YYYYMMDD)는 하루 종일 지속적으로 업데이트됩니다(예: 속성 시간대를 기준으로 오전 12:00:00부터 오후 11:59:59까지). 속성의 시간대에서 새 날짜가 시작되면 이벤트가 바뀐 새 날짜의 표에 기록됩니다.
애널리틱스에서 그날의 모든 이벤트를 수집한 후 일일 내보내기 표가 생성됩니다(events_YYYYMMDD). 애널리틱스에서는 표 날짜 이후 최대 72시간까지 반영하며, 표 날짜가 타임스탬프된 이벤트를 사용하여 일일 표를 업데이트합니다. 예를 들어 측정 프로토콜 또는 Firebase SDK에서 늦게 넘어온 여러 이벤트를 반영합니다. 가령 표 날짜가 20220101이면 애널리틱스에서는 20220101로 타임스탬프된 이벤트를 20220104까지 반영하여 표에 업데이트하게 됩니다.
필요에 따라 애널리틱스에서는 이전 데이터를 다시 처리해야 하는 경우 72시간 후라도 언제든지 일일 표를 업데이트할 수 있습니다(예: 처리 오류를 해결하는 버그 수정).
쿠키가 없는 핑과 고객 제공 데이터
동의 모드가 구현되면 애널리틱스에서 수집한 쿠키가 없는 핑이 user_id, 맞춤 측정기준처럼 고객이 제공한 데이터와 함께 BigQuery Export에 표시됩니다.
Google 애널리틱스 4와 유니버설 애널리틱스의 BigQuery Export 기능 비교
Google 애널리틱스 4 | 유니버설 애널리틱스 |
---|---|
표준(무료) 및 360(유료)에서 사용 가능 표준 한도: 일일 이벤트 100만 개 360 한도: 일일 이벤트 수십억 개 |
360에서 사용 가능(유료) |
비용 샌드박스 한도 내에서 BigQuery 샌드박스로 무료 내보내기 샌드박스 한도를 초과하여 내보낸 데이터에는 계약 약관에 따라 요금이 청구됨 |
비용 샌드박스 한도 내에서 BigQuery 샌드박스로 무료 내보내기 샌드박스 한도를 초과하여 내보낸 데이터에는 계약 약관에 따라 요금이 청구됨 |
설정 특정 데이터 스트림을 포함하고 각 속성의 특정 이벤트를 제외할 수 있음 (내보내기 볼륨과 비용을 관리할 수 있음) |
설정 속성당 하나의 뷰만 연결할 수 있음 (해당 보기의 모든 데이터를 내보냄) |
스트리밍 내보내기 1GB당 0.05달러(BigQuery 가격 책정에 대해 자세히 알아보기) 테이블 생성됨: events_intraday_YYYMMDD 테이블이 매일 삭제됨:
신규 사용자의 사용자 캠페인, 사용자 소스 또는 사용자 매체 데이터는 포함하지 않음 |
스트리밍 내보내기 1GB당 0.05달러(BigQuery 가격 책정에 대해 자세히 알아보기) 테이블 생성됨: ga_realtime_sessions_YYYYMMDD BigQuery 뷰 생성됨: ga_realtime_sessions_view_YYYYMMDD |
일일 내보내기 테이블 생성됨: events_YYYYMMDD |
일일 내보내기 테이블 생성됨 ga_sessions_intraday_YYYYMMDD
ga_sessions_YYYYMMDD
|
내보내기, 일반 백필: 백필 없음 데이터 세트: 연결된 속성마다 데이터 세트 1개의 이름이 analytics_<속성 ID>로 지정됨 동의 모드를 구현한 경우 내보내기에 다음이 포함됩니다.
|
내보내기, 일반 백필: 연결 시 13개월 분량 데이터의 백필 또는 100억 건의 조회 중 더 작은 값 (BigQuery 샌드박스로 백필하지 못할 수 있음) 데이터 세트: 연결된 뷰마다 데이터 세트 1개에 뷰와 같은 이름이 지정됨 |
스키마 내보내기 BigQuery 테이블의 각 행이 이벤트를 나타냄 Google 애널리틱스 4 고유의 이벤트 데이터 유니버설 애널리틱스 필드와 본질적으로 동일한 일부 Google 애널리틱스 4 필드가 있지만(예: device.category, device.deviceCategory) GA4 이벤트 데이터와 UA 조회 데이터는 공통점보다 차이가 더 많습니다. |
스키마 내보내기 BigQuery 테이블의 각 행이 세션을 나타냄 유니버설 애널리틱스 고유의 조회 데이터 Google 애널리틱스 4 필드와 본질적으로 동일한 일부 유니버설 애널리틱스 필드가 있지만(예: device.deviceCategory, device.category) UA 조회 데이터와 GA4 이벤트 데이터는 공통점보다 차이가 더 많습니다. |
관련 리소스
BigQuery 개발자 가이드에서 아래 내용에 대해 자세히 알아볼 수 있습니다.