Nguyên tắc và tài liệu tham khảo về bảng

Tên bảng và vị trí

Tính năng xuất dữ liệu hàng loạt của Search Console sẽ tạo các bảng sau đây trong dự án BigQuery của bạn:

Tên tập dữ liệu: searchconsole (xin lưu ý rằng tên này có thể tuỳ chỉnh, vì vậy, có thể bạn hoặc một người khác đã chọn một tên khác trong quá trình thiết lập)

Danh sách bảng:

Xuất dữ liệu hàng loạt: Các bảng và mẹo – Chương trình đào tạo về Google Search Console

Lịch lưu bảng

Search Console xuất dữ liệu hàng loạt cho mỗi bảng một lần mỗi ngày, mặc dù không nhất thiết phải tại cùng một thời điểm.

Nếu gặp phải lỗi tạm thời (ví dụ: sự cố kết nối) Search Console sẽ tiếp tục thử lại ngay lập tức mà không kích hoạt thông báo nào.

Nếu xảy ra lỗi không phải lỗi tạm thời trong quá trình ghi (ví dụ: lỗi liên quan đến quyền), Search Console sẽ không thử xuất dữ liệu lại sang bảng cho đến lần xuất dữ liệu theo lịch của ngày tiếp theo. Search Console sẽ thử xuất lại dữ liệu của ngày bị thiếu trong khoảng một tuần, sau đó sẽ ngừng tìm cách lưu dữ liệu cho ngày đó. Ví dụ: nếu Search Console cố gắng lưu dữ liệu cho ngày 1, nhưng liên tục gặp lỗi xác thực cho đến ngày 9 mới khắc phục được, thì dữ liệu cho ngày 1 và 2 sẽ không được xuất, nhưng khi có lại quyền truy cập vào ngày 9 thì dữ liệu cho những ngày còn lại sẽ được thêm vào.

Nếu do một số lỗi xử lý đã được khắc phục mà Search Console phải sửa đổi dữ liệu đã lưu trước đó, thì sẽ không có vấn đề gì với những thay đổi này, nghĩa là tất cả dữ liệu cho ngày đó sẽ được Search Console cập nhật trong một lần duy nhất. Việc sửa dữ liệu cũ không xảy ra thường xuyên và sẽ không kích hoạt quy trình gửi email thông báo, nhưng sẽ được ghi chú trong nhật ký xuất dữ liệu.

Search Console sẽ tích luỹ dần dữ liệu hiệu suất. Do đó, trong bảng sẽ xuất hiện các hàng có mã khoá lặp lại. Dữ liệu này không bị nén trước khi xuất sang bảng. Do đó, hầu như bạn luôn phải tổng hợp tất cả chỉ số của mình.

Thời gian giữ lại dữ liệu

Theo mặc định, các bảng cũng như các phân vùng sẽ được giữ lại vĩnh viễn, tuân theo mọi chế độ mặc định chung do tổ chức của bạn hoặc dự án trên Google Cloud đặt ra.

Nếu muốn tránh việc tích luỹ dữ liệu diễn ra vô thời hạn, bạn nên đặt ngày hết hạn trên một phân vùng dữ liệu nhất định sau một khoảng thời gian hợp lý: 1 tháng, 6 tháng, 12 tháng, hoặc một khoảng thời gian nào đó phù hợp với nhu cầu và lượng dữ liệu tích luỹ được. Có thể bạn sẽ không muốn đặt ngày hết hạn cho toàn bộ bảng, vì thao tác này sẽ xoá tất cả dữ liệu của bạn.

Giản đồ về bảng

Sau đây là giản đồ cho các bảng do Search Console xuất. Tất cả bảng đều có tiền tố <your_project_ID>.searchconsole.

Bảng searchdata_site_impression

Bảng này chứa dữ liệu được tổng hợp theo tài sản. Bảng này chứa các trường sau:

  • data_date: ngày mà dữ liệu trong hàng này được tạo (theo giờ Thái Bình Dương).
  • site_url: URL của tài sản. Đối với các tài sản cấp miền, URL của tài sản sẽ là sc-domain:property-name. Đối với tài sản có tiền tố URL, URL của tài sản sẽ là URL đầy đủ theo định nghĩa của tài sản. Ví dụ: sc-domain:developers.google.com, https://developers.google.com/webmasters-tools/
  • query: Cụm từ tìm kiếm của người dùng. Khi is_anonymousd_query là true, đây sẽ là một chuỗi có độ dài bằng 0. 
  • is_anonymousd_query: Các cụm từ tìm kiếm hiếm gặp (còn gọi là cụm từ tìm kiếm ẩn danh) được đánh dấu bằng giá trị bool này. Để bảo vệ quyền riêng tư của người dùng tìm kiếm, nếu giá trị này là true thì trường cụm từ tìm kiếm (query) sẽ rỗng.
  • Country: Quốc gia nơi cụm từ tìm kiếm được đưa ra (ở định dạng ISO-3166-1-Alpha-3).
  • search_type – Một trong các giá trị chuỗi sau đây:
    • web: Thẻ mặc định ("Tất cả") trong Google Tìm kiếm.
    • image: Thẻ "Hình ảnh" trong Google Tìm kiếm.
    • video: Thẻ "Video" trong Google Tìm kiếm.
    • news: Thẻ "Tin tức" trong Google Tìm kiếm
    • discovery: Kết quả của Khám phá
    • googleNews: news.google.com và ứng dụng Google Tin tức trên Android và iOS
  • device: Thiết bị dùng để gửi cụm từ tìm kiếm.
  • impressions: Số lượt hiển thị cho hàng này.
  • clicks: Số lượt nhấp cho hàng này.
  • sum_top_position: Tổng của vị trí của trang web so với vị trí trên cùng trong các kết quả tìm kiếm đối với từng lượt hiển thị trong hàng trong bảng, trong đó 0 là vị trí trên cùng trong danh sách kết quả. Để tính toán vị trí trung bình (dựa trên vị trí số 1), hãy thực hiện phép tính SUM(sum_top_position)/SUM(impressions) + 1

Bảng searchdata_url_impression

Bảng này chứa dữ liệu được tổng hợp theo URL. Bảng này chứa các trường sau:

  • data_date: Tương tự như trên.
  • site_url: Tương tự như trên.
  • url: URL đủ điều kiện mà người dùng sẽ được đưa đến khi nhấp vào kết quả tìm kiếm hoặc câu chuyện trong Khám phá.
  • query: Tương tự như trên.
  • is_ webd_query: Tương tự như trên
  • is_anonymousd_discovery: Hàng dữ liệu có nằm dưới ngưỡng ẩn danh của Khám phá hay không. Khi nằm dưới ngưỡng, một số trường khác (ví dụ: URL và quốc gia) sẽ không xuất hiện, để bảo vệ quyền riêng tư của người dùng.
  • country: Tương tự như trên.
  • search_type: Tương tự như trên.
  • device: Tương tự như trên.
  • is_[search_appearance_type]: Có một số trường boolean dùng để cho biết loại giao diện tìm kiếm (ví dụ: is_amp_top_stories, is_job_listing, và is_job_details). Một trường sẽ có giá trị là true nếu hàng được đề cập xuất hiện đối với một kết quả nhiều định dạng cụ thể.
  • impressionsTương tự như trên.
  • clicksTương tự như trên.
  • sum_position: Một số được đánh số dựa trên số 0 cho biết vị trí của URL này so với vị trí trên cùng trong các kết quả tìm kiếm cho cụm từ tìm kiếm. (Vị trí số 0 là vị trí trên cùng trong các kết quả.) Để tính toán vị trí trung bình (dựa trên vị trí số 1), hãy thực hiện phép tính SUM(sum_position)/SUM(impressions) + 1.

Bảng ExportLog

Bảng này là để ghi nhận những dữ liệu đã được lưu vào ngày đó. Những lượt xuất dữ liệu không thành công sẽ không được ghi tại đây. Tìm hiểu thêm về việc theo dõi những lượt xuất dữ liệu không thành công. Bảng này chứa các trường sau:

  • agenda: Loại dữ liệu nào được lưu. Hiện tại, giá trị duy nhất là SEARCHDATA.
  • namespace: Dữ liệu được lưu vào bảng nào. Search Console thường xuất dữ liệu riêng rẽ cho từng bảng. Do đó, thường có hai hàng xuất dữ liệu cho mỗi ngày.
  • data_date: Ngày xảy ra lượt nhấp hoặc lượt hiển thị (theo giờ Thái Bình Dương). Đây là ngày phân vùng mà các bảng sử dụng.
  • epoch_version: Một số nguyên, trong đó giá trị 0 là dữ liệu đầu tiên được lưu vào bảng cho ngày này. Trong một trường hợp hiếm xảy ra, Search Console sẽ cần quay lại và điều chỉnh dữ liệu trước đó, (có thể là do có sự bất thường về dữ liệu), thì giá trị này sẽ tăng thêm 1 đối với mỗi lần dữ liệu được cập nhật cho bảng và ngày đó.
  • publish_time: Thời gian hoàn tất lượt xuất dữ liệu (tính theo giờ Thái Bình Dương).

Thông tin này có hữu ích không?

Chúng tôi có thể cải thiện trang này bằng cách nào?

Bạn cần trợ giúp thêm?

Hãy thử các bước tiếp theo sau:

Tìm kiếm
Xóa nội dung tìm kiếm
Đóng tìm kiếm
Trình đơn chính
13311665305486520604
true
Tìm kiếm trong Trung tâm trợ giúp
true
true
true
true
true
83844
false
false
false