테이블 가이드라인 및 참조

테이블 이름 및 위치

Search Console 대량 데이터 내보내기를 사용하면 BigQuery 프로젝트에 다음 테이블이 생성됩니다.

데이터 세트 이름: searchconsole (맞춤설정이 가능하므로 설정 중에 본인이나 다른 사용자가 다른 이름을 선택했을 수 있음)

테이블 목록:

일괄 데이터 내보내기: 표 및 도움말 - Google Search Console 교육

테이블 저장 예약

Search Console은 하루에 한 번 대량 데이터를 내보내지만 각 테이블에 해당하는 데이터를 반드시 동시에 내보내지는 않습니다.

Search Console에 연결 문제와 같은 일시적인 오류가 발생하면 알림을 전송하지 않고 즉시 계속 다시 시도합니다.

작성 시도 중에 지속적인 오류(예: 권한 오류)가 발생하는 경우 Search Console에서는 다음 날 예약된 내보내기가 실행되기 전까지 테이블 내보내기를 다시 시도하지 않습니다. Search Console은 약 일주일 동안 누락된 날짜의 데이터 내보내기를 다시 시도하며 이후에는 해당 날짜의 데이터 저장 시도를 중지합니다. 예를 들어 Search Console에서 1일 차 데이터를 저장하려고 시도했으나 인증 오류가 발생했으며 오류가 9일 차 전까지 수정되지 않은 경우, 9일 차에 액세스 권한을 다시 얻으면 1일 차와 2일 차 데이터는 내보내지 않으나 나머지 날짜의 데이터를 추가합니다.

일부 처리 오류가 수정되어 Search Console에서 이전에 저장된 데이터를 수정해야 하는 경우, 모든 변경사항은 개별적으로 처리됩니다. 즉, Search Console에서 해당 날짜의 모든 데이터를 단일 커밋으로 업데이트합니다. 오래된 데이터를 수정하는 일은 자주 발생하지 않으며 이메일이 전송되지 않지만, 내보내기 로그에는 기록됩니다.

실적 데이터는 Search Console에서 점진적으로 누적하므로 중복 키가 있는 테이블 행이 생성됩니다. 이 데이터는 테이블로 내보내기 전에는 압축되지 않습니다. 따라서 거의 항상 모든 측정항목을 집계해야 합니다.

데이터 보관 기간

기본적으로 테이블은 파티션과 마찬가지로 영구적으로 보관되며 Google Cloud 프로젝트 또는 조직에서 설정한 모든 전역 기본값이 적용됩니다.

데이터가 무기한으로 누적되지 않도록 하려면 적정 기간(1개월, 6개월, 12개월 등)이 지난 후 또는 개인적인 필요, 누적하는 데이터양에 따라 파티션에 만료일을 지정하는 것이 좋습니다. 데이터가 모두 삭제되니 전체 테이블에 만료일을 지정하는 것은 적절하지 않습니다.

테이블 스키마

다음은 Search Console에서 내보낸 테이블의 스키마입니다. 모든 테이블에는 <your_project_ID>.searchconsole 형식의 접두사가 있습니다.

searchdata_site_impression 테이블

이 테이블에는 속성별로 집계된 데이터가 있습니다. 테이블에 포함되는 필드는 다음과 같습니다.

  • data_date: 이 행의 데이터가 생성된 날짜(태평양 표준시)입니다.
  • site_url: 속성의 URL입니다. 도메인 수준 속성의 URL은 sc-domain:속성-이름입니다. URL 접두사 속성의 URL은 속성 정의의 전체 URL입니다. : sc-domain:developers.google.com, https://developers.google.com/webmaster-tools/
  • query: 사용자 검색어입니다. is_anonymized_query가 true인 경우 사용자 검색어는 길이가 0인 문자열이 됩니다. 
  • is_anonymized_query: 드물게 발생하는 검색어(익명처리된 검색어라고 함)에는 이 불리언이 표시됩니다. 검색 사용자의 개인 정보를 보호하기 위해 이 불리언이 true인 경우 query 필드는 null이 됩니다.
  • Country: 검색어가 검색된 국가이며, 형식은 ISO-3166-1-Alpha-3입니다.
  • search_type: 다음 문자열 값 중 하나입니다.
    • web: Google 검색의 기본('전체') 탭입니다.
    • image: Google 검색의 '이미지' 탭입니다.
    • video: Google 검색의 '동영상' 탭입니다.
    • news: Google 검색의 '뉴스' 탭입니다.
    • discover: 디스커버 결과입니다.
    • googleNews: news.google.com 및 Android, iOS용 Google 뉴스 앱입니다.
  • device: 검색어가 검색된 기기입니다.
  • impressions: 이 행의 노출수입니다.
  • clicks: 이 행의 클릭수입니다.
  • sum_top_position: 테이블 행의 노출수별 사이트의 검색결과 최상위 게재순위 총합입니다. 검색결과에서 최상위 게재순위는 0입니다. 평균 게재순위(1부터 시작)를 계산하려면 SUM(sum_top_position)/SUM(impressions) + 1식을 사용하세요.

searchdata_url_impression 테이블

이 테이블에는 URL별로 집계된 데이터가 있습니다. 테이블에 포함되는 필드는 다음과 같습니다.

  • data_date: 위와 동일합니다.
  • site_url: 위와 동일합니다.
  • url: 사용자가 검색결과 또는 디스커버 스토리를 클릭할 때 최종적으로 연결되는 정규화된 URL입니다.
  • query: 위와 동일합니다.
  • is_anonymized_query: 위와 동일합니다.
  • is_anonymized_discover: 데이터 행이 디스커버 익명처리 기준점 미만인지를 나타냅니다. 기준점 미만이면 사용자 개인 정보 보호를 위해 일부 다른 필드(예: URL 및 국가)가 누락됩니다.
  • country: 위와 동일합니다.
  • search_type: 위와 동일합니다.
  • device: 위와 동일합니다.
  • is_[검색_노출_유형]: is_amp_top_stories, is_job_listing, is_job_details 등 검색 노출 유형을 나타내는 데 사용되는 여러 불리언 필드입니다. 행이 특정 리치 결과에 표시되면 불리언 필드는 true가 됩니다.
  • impressions위와 동일합니다.
  • clicks위와 동일합니다.
  • sum_position: 검색어의 검색결과에서 이 URL의 최상위 게재순위를 나타내는 숫자입니다(0부터 시작). 검색결과에서 최상위 게재순위는 0입니다. 평균 게재순위(1부터 시작)를 계산하려면 SUM(sum_position)/SUM(impressions) + 1식을 사용하세요.

ExportLog 테이블

이 테이블에는 특정 날짜에 저장된 데이터에 관한 기록이 나와 있습니다. 실패한 내보내기는 여기에 기록되지 않습니다. 추적 실패에 관해 자세히 알아보세요. 테이블에 포함되는 필드는 다음과 같습니다.

  • agenda: 저장된 데이터 유형입니다. 현재 유일한 값은 SEARCHDATA입니다.
  • namespace: 어떤 테이블에 저장되었는지 나타냅니다. Search Console은 일반적으로 각 테이블에 해당하는 데이터를 별도로 내보내므로, 매일 두 개의 내보내기 행이 있게 됩니다.
  • data_date: 클릭 또는 노출이 이루어진 날짜(태평양 표준시)입니다. 테이블에서 사용하는 파티션 날짜에 해당합니다.
  • epoch_version: 특정 날짜의 데이터가 이 테이블에 저장된 횟수를 나타내는 정숫값이며 데이터가 처음 저장되면 0으로 표시됩니다. 드물지만 데이터 이상치로 인해 Search Console에서 이전 데이터를 조정해야 하는 경우가 있습니다. 이때 해당 테이블과 날짜의 데이터가 업데이트될 때마다 이 값이 1씩 증가합니다.
  • publish_time: 내보내기가 완료된 시간(태평양 표준시)입니다.

도움이 되었나요?

어떻게 하면 개선할 수 있을까요?

도움이 더 필요하신가요?

다음 단계를 시도해 보세요.

검색
검색어 지우기
검색 닫기
기본 메뉴
6623292848586677563
true
도움말 센터 검색
true
true
true
true
true
83844
false
false