[Google Analytics 4] Giới thiệu về tính năng Nhập dữ liệu

Tải dữ liệu lên từ các nguồn bên ngoài và kết hợp dữ liệu đó với dữ liệu Analytics của bạn

Tại sao bạn nên sử dụng tính năng Nhập dữ liệu?

Mỗi hệ thống doanh nghiệp mà bạn sử dụng sẽ tạo dữ liệu riêng. Hệ thống quản lý mối quan hệ khách hàng (CRM) của bạn có thể chứa thông tin như điểm xếp hạng mức độ trung thành của khách hàng, giá trị vòng đời và lựa chọn ưu tiên về sản phẩm. Nếu bạn là nhà xuất bản web, hệ thống quản lý nội dung của bạn có thể lưu trữ các thứ nguyên như tác giả và danh mục bài viết. Nếu điều hành một doanh nghiệp thương mại điện tử, bạn lưu trữ các thuộc tính của mặt hàng như mức giá, kiểu dáng và kích thước.

Ngoài ra, bạn sử dụng Analytics để đo lường lưu lượng truy cập và hiệu suất cho các trang web và ứng dụng của mình.

Thông thường, mỗi phần dữ liệu đều có một kho thông tin riêng mà dữ liệu khác không thể truy cập. Tính năng Nhập dữ liệu cho phép bạn kết hợp tất cả dữ liệu trong Analytics theo một lịch trình đã định sẵn để gỡ bỏ những kho thông tin riêng này, nhận được thông tin chi tiết mới và đại chúng hóa dữ liệu của bạn.

Cách hoạt động của tính năng Nhập dữ liệu

Tải dữ liệu lên

Bạn tải các tệp CSV chứa dữ liệu bên ngoài lên một tài sản Analytics. Bạn có thể xuất các tệp CSV đó từ một công cụ doanh nghiệp ngoại tuyến (như hệ thống CRM hoặc CMS của mình) hoặc đối với lượng dữ liệu nhỏ hơn, bạn có thể tự mình tạo các tệp trong trình chỉnh sửa văn bản hoặc bảng tính.

Tính năng Nhập dữ liệu kết hợp dữ liệu ngoại tuyến mà bạn tải lên với dữ liệu sự kiện mà Analytics thu thập. Dữ liệu đã nhập giúp cải thiện báo cáo, thông tin so sánh và đối tượng. Nhờ đó, bạn sẽ hiểu rõ hơn về hoạt động trực tuyến và ngoại tuyến.

Kết hợp dữ liệu

Dữ liệu được kết hợp theo 2 cách, tuỳ thuộc vào loại dữ liệu đã nhập:

  • Thời gian thu thập/xử lý: Hệ thống sẽ kết hợp dữ liệu đã nhập với dữ liệu Analytics vì dữ liệu Analytics được thu thập và xử lý giống như khi được thu thập cùng với sự kiện, rồi ghi dữ liệu được kết hợp vào bảng tổng hợp của Analytics. Hệ thống sẽ không kết hợp dữ liệu đã nhập với dữ liệu trong quá khứ của Analytics (dữ liệu đã được xử lý). Nếu bạn xóa tệp dữ liệu đã nhập, hệ thống sẽ không kết hợp thêm dữ liệu khác, nhưng vẫn duy trì dữ liệu đã được kết hợp.

    Dữ liệu người dùng và dữ liệu sự kiện ngoại tuyến được kết hợp tại thời điểm thu thập/xử lý.
  • Thời gian báo cáo/truy vấn: Dữ liệu bạn đã nhập được kết hợp với dữ liệu Analytics khi bạn mở một báo cáo và Analytics gửi truy vấn cho dữ liệu báo cáo. Đây là hình thức liên kết tạm thời: nếu bạn xoá tệp dữ liệu đã nhập thì hệ thống sẽ không thể tiếp tục liên kết dữ liệu được nữa và không thể truy cập vào dữ liệu đã liên kết trong Analytics nữa.

    Dữ liệu chi phí và dữ liệu mặt hàng được liên kết tại thời điểm báo cáo/truy vấn.

    Dữ liệu thời gian Báo cáo/Truy vấn không có sẵn khi bạn đang tạo đối tượng trong Analytics hoặc khi bạn tạo phân đoạn trong công cụ Khám phá.

Các loại siêu dữ liệu bạn có thể nhập

Siêu dữ liệu

Việc nhập siêu dữ liệu sẽ thêm dữ liệu mà một tài sản đã thu thập và xử lý. Thông thường, siêu dữ liệu được lưu trữ trong một thứ nguyên hoặc chỉ số tuỳ chỉnh, mặc dù trong một số trường hợp, bạn có thể muốn ghi đè thông tin mặc định đã được thu thập (ví dụ: nhập danh sách sản phẩm với danh mục đã cập nhật).

Bạn có thể nhập các loại dữ liệu sau:

  • Dữ liệu chi phí: Số lượt nhấp, chi phí và số lượt hiển thị trên mạng quảng cáo của bên thứ ba (không phải của Google)
  • Dữ liệu mặt hàng: siêu dữ liệu về sản phẩm như kích thước, màu sắc, kiểu dáng hoặc các thứ nguyên khác có liên quan đến sản phẩm
  • Dữ liệu người dùng: siêu dữ liệu về người dùng (ví dụ: điểm xếp hạng mức độ trung thành hoặc giá trị vòng đời của khách hàng) mà bạn có thể dùng để tạo phân khúc và danh sách tái tiếp thị
  • Sự kiện ngoại tuyến: sự kiện ngoại tuyến từ những nguồn không có kết nối Internet hoặc không hỗ trợ thu thập sự kiện theo thời gian thực

Các giới hạn

Tổng dung lượng lưu trữ

10 GB (Tài sản chuẩn)

1 TB (Tài sản 360)

Kích thước nguồn dữ liệu 1 GB
Số lượt tải lên hằng ngày

120 lượt tải lên cho mỗi tài sản mỗi ngày 

Cách nhập dữ liệu

Khi nhập dữ liệu, bạn sẽ tạo một nguồn dữ liệu. Nguồn dữ liệu là sự kết hợp giữa tệp CSV mà bạn muốn tải lên và mối liên kết các trường Analytics hiện có với các trường trong tệp CSV của bạn. Ví dụ:

 

Không tải tệp có chứa các khóa trùng lặp lên (ví dụ: 2 trường có tên là user_id).

Tìm hiểu thêm về nguồn dữ liệu

Điều kiện tiên quyết để sử dụng Giao thức truyền tệp bảo mật (SFTP) nhằm tải dữ liệu lên

Nếu muốn sử dụng giao thức SFTP ở Bước 5, hãy đảm bảo rằng máy chủ SFTP của bạn hỗ trợ thuật toán khoá máy chủ ssh-rsassh-dss. Tìm hiểu thêm về cách xác minh thuật toán khoá máy chủ mà bạn sử dụng và cách định dạng URL máy chủ SFTP.

Bắt đầu quá trình nhập

  1. Trong cột Tài sản, hãy nhấp vào Nhập dữ liệu.
  2. Tạo nguồn dữ liệu mới hoặc chọn một nguồn dữ liệu hiện có. (Xem các mục sau đây).

Tạo nguồn dữ liệu mới

  1. Nhấp vào Tạo nguồn dữ liệu.
  2. Nhập tên cho nguồn dữ liệu của bạn.
  3. Chọn loại dữ liệu:
    • Dữ liệu chi phí (chỉ nhập thời gian truy vấn)
    • Dữ liệu mục (báo cáo/nhập thời gian truy vấn)
    • Dữ liệu người dùng theo Mã nhận dạng khách hàng (thu thập/nhập thời gian xử lý)
    • Dữ liệu người dùng theo Mã ứng dụng (thu thập/nhập thời gian xử lý)
    • Dữ liệu sự kiện ngoại tuyến (thu thập/nhập thời gian xử lý)
  4. Nhấp vào Xem xét điều khoản nếu được nhắc. Thông báo nhắc này sẽ hiển thị nếu bạn đang nhập dữ liệu thiết bị hoặc dữ liệu người dùng.
  5. Làm một trong những việc sau:
    • Chọn Tải tệp CSV lên theo cách thủ công, chọn tệp CSV trên máy tính rồi nhấp vào Mở.
    Hoặc
    • Chọn SFTP.
    • Tên người dùng trên máy chủ SFTP: Nhập tên người dùng cho máy chủ SFTP.
    • URL máy chủ SFTP: Nhập URL cho máy chủ SFTP.
    • Tần suất: Chọn tần suất tải lên (Hằng ngày, Hằng tuần, Hằng tháng).
    • Thời gian bắt đầu: Chọn giờ bạn muốn bắt đầu quá trình tải lên.
    • Sau khi tạo nguồn dữ liệu, khoá công khai cho máy chủ SFTP của bạn sẽ hiển thị trong giao diện mà bạn đang tạo nguồn dữ liệu và sẽ có trong thông tin chi tiết về nguồn dữ liệu (xem bên dưới).
  6. Nhấp vào Tiếp theo để chuyển sang bước liên kết.
  7. Chọn những trường Analytics và những trường đã nhập mà bạn muốn liên kết với nhau. Chỉnh sửa tên của các trường đó (nếu cần).
  8. Nhấp vào Nhập.

Tải dữ liệu lên một nguồn dữ liệu hiện có

  1. Trong hàng chứa một nguồn dữ liệu hiện có, hãy nhấp vào Nhập ngay.
  2. Nếu nguồn dữ liệu đó được thiết lập để nhập CSV, hãy chọn tệp CSV mà bạn muốn nhập, rồi nhấp vào Mở.

    Tệp CSV phải chứa các trường hoặc một nhóm các trường giống như tệp gốc. Nếu muốn nhập các trường khác cho cùng loại dữ liệu, bạn cần xoá nguồn dữ liệu hiện có và tạo một nguồn dữ liệu mới.

Xác minh thuật toán khoá máy chủ SFTP; định dạng URL máy chủ SFTP

Xác minh thuật toán

Bạn có thể dùng nhiều phương pháp để xác minh xem máy chủ SFTP của bạn sử dụng thuật toán khoá máy chủ ssh-rsa hay ssh-dss. Ví dụ: bạn có thể dùng ứng dụng đăng nhập từ xa OpenSSH để kiểm tra nhật ký máy chủ của mình bằng lệnh sau đây:

ssh -vv <tên máy chủ SFTP của bạn>

Nếu máy chủ của bạn hỗ trợ một trong các thuật toán đó, thì bạn sẽ thấy một dòng như sau trong nhật ký máy chủ:

debug2: host key algorithms: rsa-sha2-512, rsa-sha2-256, ssh-rsa

Định dạng URL máy chủ SFTP

Nếu URL máy chủ SFTP của bạn bị định dạng không đúng cách, thì việc thiết lập tính năng nhập sẽ không thành công và một thông báo lỗi nội bộ sẽ xuất hiện.

URL máy chủ SFTP thường có 3 phần mà bạn cần cân nhắc khi tải tệp nhập dữ liệu lên. Ví dụ:

URL sftp://example.com//home/jon/upload.csv bao gồm các phần sau:

  • Miền: example.com
  • Thư mục gốc: //home/jon
  • Đường dẫn tệp: /upload.csv

Trong ví dụ trên, tệp tải lên nằm trong thư mục gốc.

Bạn có thể định dạng phần miền của URL theo nhiều cách, dựa vào tên miền hoặc địa chỉ IPv4 hay IPv6 của máy chủ (có hoặc không có số cổng):

  • Tên miền: sftp://example.com
  • IPv4 (có số cổng): sftp://142.250.189.4:1234
  • IPv4 (không có số cổng): sftp://142.250.189.4
  • IPv6 (có số cổng): sftp://[2607:f8b0:4007:817::2004]:1234
  • IPv6 (không có số cổng): sftp://[2607:f8b0:4007:817::2004]

Nếu bạn không thêm số cổng, thì cổng mặc định sẽ là 22.

Bạn có thể định dạng URL đúng cách để bao gồm hoặc loại trừ thư mục gốc. Các ví dụ sau đây về URL được định dạng đúng cách sử dụng nhiều định dạng để xác định miền. Các ví dụ này có số cổng, tuy nhiên, bạn có thể chọn không sử dụng số cổng.

  • Bao gồm thư mục gốc:
    • sftp://example.com//home/jon/upload.csv (tên miền)
    • sftp://142.250.189.4:1234//home/jon/upload.csv (IPv4 có số cổng)
  • Loại trừ thư mục gốc:
    • sftp://example.com/upload.csv (tên miền)
    • sftp://[2607:f8b0:4007:817::2004]:1234/upload.csv (IPv6 có số cổng)

Nếu tệp tải lên nằm trong một thư mục con của thư mục gốc, thì URL của bạn sẽ có dạng như sau:

sftp://example.com//home/jon/data/upload.csv

Trong trường hợp này, bạn có thể sử dụng các loại định dạng sau:

  • Bao gồm thư mục gốc:
    • sftp://example.com//home/jon/data/upload.csv
    • sftp://142.250.189.4:1234//home/jon/data/upload.csv (IPv4 có số cổng)
  • Loại trừ thư mục gốc:
    • sftp://example.com/data/upload.csv
    • sftp://[2607:f8b0:4007:817::2004]:1234/data/upload.csv (IPv6 có số cổng)

Nếu tệp tải lên không được lưu trữ trong thư mục gốc (//home/jon) hoặc thư mục con của thư mục gốc (//home/jon/data) nhưng lại được lưu trữ trong thư mục /foo/bar, thì URL được định dạng đúng cách cho tệp tải lên sẽ có dạng như sau:

sftp://example.com//foo/bar/upload.csv (//foo/bar thay thế cho thư mục gốc)

Xem thông tin chi tiết về nguồn dữ liệu, nhận khoá công khai của SFTP, nhập dữ liệu mới, xoá nguồn dữ liệu

  1. Trong cột Tài sản, hãy nhấp vào Nhập dữ liệu.
  2. Trong hàng chứa nguồn dữ liệu, hãy nhấp vào biểu tượng sau đó.

Bạn có thể xem tên, loại dữ liệu, khoá công khai và nhật ký của mỗi tệp tải lên.

  • Khoá công khai: Khoá công khai của máy chủ SFTP tương ứng với một khoá riêng tư trùng khớp mà Analytics lưu trữ (và tuyệt đối không chia sẻ). Khoá này được dùng để đảm bảo rằng máy chủ của bạn có kết nối bảo mật, riêng tư với các máy chủ nhập dữ liệu của Analytics. Bạn cần phải uỷ quyền cho khoá công khai này trên máy chủ của mình để đảm bảo rằng quá trình nhập dữ liệu có thể diễn ra một cách an toàn và bảo mật.
  • % dữ liệu đã nhập: Số hàng được nhập thành công chia cho số hàng trong tệp nhập. 100% có nghĩa là đã nhập thành công tất cả hàng.
  • Tỷ lệ khớp: Tỷ lệ các khóa trong tệp nhập mà hệ thống có thể tìm thấy trong tài sản của bạn trong vòng 90 ngày qua. 100% có nghĩa là dữ liệu này hoàn toàn hữu ích và có liên quan đến dữ liệu của bạn trong vòng 90 ngày qua.

Để nhập dữ liệu mới, hãy làm như sau:

Nhấp vào Nhập ngay và chọn tệp CSV phù hợp trên máy tính của bạn.

Để xóa nguồn dữ liệu, hãy làm như sau:

  1. Nhấp vào Xem thêm > Xóa nguồn dữ liệu.
  2. Đọc thông báo xoá, sau đó nhấp vào Xoá nguồn dữ liệu.

Bạn có thể xoá dữ liệu thời gian Thu nhập/Xử lý, nhưng nếu muốn xoá dữ liệu đã được tải lên trước đó khỏi tất cả các sự kiện do Analytics xử lý, thì bạn cũng cần phải xoá người dùng hoặc thuộc tính người dùng (tìm hiểu thêm). Việc xoá một tệp đã nhập sẽ không xoá dữ liệu đã xử lý được liên kết với các sự kiện được thu thập kể từ khi quá trình nhập hoàn tất.

 

Tên và tiền tố chuyên dụng

Các tên sự kiện, tên thông số sự kiện, tên thuộc tính người dùng và tiền tố sau đây chỉ được dùng riêng cho Analytics. Nếu bạn cố gắng tải dữ liệu chứa tên hoặc tiền tố chuyên dụng lên, thì dữ liệu đó sẽ không được tải lên.

Ví dụ:

  • Nếu bạn cố gắng nhập một sự kiện có tên dành riêng, sự kiện đó và các thông số của sự kiện đó sẽ không được nhập.
  • Nếu bạn cố gắng nhập một sự kiện có tên hợp lệ, nhưng một trong các thông số của sự kiện đó có tên dành riêng, thì sự kiện đó sẽ được nhập, nhưng thông số có tên dành riêng đó sẽ không được nhập.

Tên dành riêng của sự kiện

  • ad_activeview
  • ad_activeview
  • ad_exposure
  • ad_impression
  • ad_query
  • adunit_exposure
  • app_clear_data
  • app_install
  • app_remove
  • app_update
  • error
  • first_open
  • first_visit
  • in_app_purchase
  • notification_dismiss
  • notification_foreground
  • notification_open
  • notification_receive
  • os_update
  • screen_view
  • session_start
  • user_engagement

Tên thông số sự kiện chuyên dụng

  • firebase_conversion

Tên thuộc tính người dùng chuyên dụng

  • first_open_after_install
  • first_open_time
  • first_visit_time
  • last_deep_link_referrer
  • user_id

Tiền tố chuyên dụng (áp dụng cho các thông số sự kiện và thuộc tính người dùng)

  • ga_
  • google_
  • firebase_

Thông tin này có hữu ích không?

Chúng tôi có thể cải thiện trang này bằng cách nào?
false
Tìm kiếm
Xóa nội dung tìm kiếm
Đóng tìm kiếm
Trình đơn chính
15437438429518972660
true
Tìm kiếm trong Trung tâm trợ giúp
true
true
true
true
true
69256
false
false