Tại sao bạn nên sử dụng tính năng Nhập dữ liệu?
Mỗi hệ thống doanh nghiệp mà bạn sử dụng sẽ tạo dữ liệu riêng. Hệ thống quản lý mối quan hệ khách hàng (CRM) của bạn có thể chứa thông tin như điểm xếp hạng mức độ trung thành của khách hàng, giá trị vòng đời và lựa chọn ưu tiên về sản phẩm. Nếu bạn là nhà xuất bản web, hệ thống quản lý nội dung của bạn có thể lưu trữ các thứ nguyên như tác giả và danh mục bài viết. Nếu điều hành một doanh nghiệp thương mại điện tử, bạn lưu trữ các thuộc tính của mặt hàng như mức giá, kiểu dáng và kích thước.
Ngoài ra, bạn sử dụng Analytics để đo lường lưu lượng truy cập và hiệu suất cho các trang web và ứng dụng của mình.
Thông thường, mỗi phần dữ liệu đều có một kho thông tin riêng mà dữ liệu khác không thể truy cập. Tính năng Nhập dữ liệu cho phép bạn kết hợp tất cả dữ liệu trong Analytics theo một lịch trình đã định sẵn để gỡ bỏ những kho thông tin riêng này, nhận được thông tin chi tiết mới và đại chúng hóa dữ liệu của bạn.
Cách hoạt động của tính năng Nhập dữ liệu
Tải dữ liệu lên
Bạn tải các tệp CSV chứa dữ liệu bên ngoài lên một tài sản Analytics. Bạn có thể xuất các tệp CSV đó từ một công cụ doanh nghiệp ngoại tuyến (như hệ thống CRM hoặc CMS của mình) hoặc đối với lượng dữ liệu nhỏ hơn, bạn có thể tự mình tạo các tệp trong trình chỉnh sửa văn bản hoặc bảng tính.
Tính năng Nhập dữ liệu kết hợp dữ liệu ngoại tuyến mà bạn tải lên với dữ liệu sự kiện mà Analytics thu thập. Dữ liệu đã nhập giúp cải thiện báo cáo, thông tin so sánh và đối tượng. Nhờ đó, bạn sẽ hiểu rõ hơn về hoạt động trực tuyến và ngoại tuyến.
Kết hợp dữ liệu
Dữ liệu được kết hợp theo 2 cách, tuỳ thuộc vào loại dữ liệu đã nhập:
- Thời gian thu thập/xử lý: Hệ thống kết hợp dữ liệu đã nhập với dữ liệu Analytics vì dữ liệu Analytics được thu thập và xử lý giống như khi được thu thập cùng với sự kiện, sau đó ghi dữ liệu được kết hợp vào bảng tổng hợp của Analytics. Hệ thống sẽ không kết hợp dữ liệu đã nhập với dữ liệu trong quá khứ của Analytics (dữ liệu đã được xử lý). Nếu bạn xóa tệp dữ liệu đã nhập, hệ thống sẽ không kết hợp thêm dữ liệu khác, nhưng vẫn duy trì dữ liệu đã được kết hợp.
Dữ liệu người dùng và dữ liệu sự kiện ngoại tuyến được kết hợp tại thời điểm thu thập/xử lý.
- Thời gian báo cáo/truy vấn: Dữ liệu bạn đã nhập được kết hợp với dữ liệu Analytics khi bạn mở một báo cáo và Analytics gửi truy vấn cho dữ liệu báo cáo. Loại kết hợp này là tạm thời: nếu bạn xoá tệp dữ liệu đã nhập, hệ thống sẽ không kết hợp thêm dữ liệu khác và bạn sẽ không thể truy cập vào dữ liệu đã kết hợp trong Analytics được nữa.
Dữ liệu chi phí, mặt hàng và sự kiện tuỳ chỉnh được liên kết tại thời điểm báo cáo/truy vấn.
Dữ liệu thời gian Báo cáo/Truy vấn không có sẵn khi bạn đang tạo đối tượng trong Analytics hoặc khi bạn tạo phân đoạn trong công cụ Khám phá.
Khi bạn nhập dữ liệu, dữ liệu đã nhập trước đó sẽ vẫn tồn tại trong khi thêm bất kỳ dữ liệu mới nào đã nhập. Xin lưu ý rằng nếu dữ liệu đã nhập có cùng một tập hợp khoá với dữ liệu đã nhập trước đó, thì dữ liệu đó sẽ bị ghi đè.
Các loại siêu dữ liệu bạn có thể nhập
Siêu dữ liệu
Việc nhập siêu dữ liệu sẽ thêm dữ liệu mà một tài sản đã thu thập và xử lý. Thông thường, siêu dữ liệu được lưu trữ trong một phương diện hoặc chỉ số tuỳ chỉnh, mặc dù trong một số trường hợp, bạn có thể muốn ghi đè thông tin mặc định đã được thu thập (ví dụ: nhập một danh sách sản phẩm có các danh mục đã cập nhật).
Bạn có thể nhập các loại dữ liệu sau:
- Dữ liệu chi phí: Dữ liệu về số lượt nhấp, chi phí và số lượt hiển thị trên mạng quảng cáo của bên thứ ba (không phải của Google)
- Dữ liệu mặt hàng: Siêu dữ liệu về sản phẩm như kích thước, màu sắc, kiểu dáng hoặc các phương diện khác liên quan đến sản phẩm
- Dữ liệu người dùng: Siêu dữ liệu về người dùng (ví dụ: điểm xếp hạng mức độ trung thành hoặc giá trị vòng đời của khách hàng) mà bạn có thể dùng để tạo phân đoạn và danh sách tái tiếp thị
- Sự kiện ngoại tuyến: Sự kiện ngoại tuyến từ những nguồn không có kết nối Internet hoặc không hỗ trợ thu thập sự kiện theo thời gian thực
- Dữ liệu sự kiện tuỳ chỉnh: Nhập siêu dữ liệu sự kiện thông qua các trường chuẩn và/hoặc phương diện tuỳ chỉnh
Giới hạn
Kích thước nguồn dữ liệu | 1 GB |
Số lượt tải lên hằng ngày |
120 lượt tải lên cho mỗi tài sản mỗi ngày |
Loại dữ liệu nhập | Hạn mức nguồn dữ liệu trên mỗi tài sản | Hạn mức dung lượng lưu trữ cho mỗi loại dữ liệu |
---|---|---|
Dữ liệu chi phí | Tối đa là 5 | 1 GB trên tất cả các nguồn nhập |
Dữ liệu mặt hàng | Tối đa là 5 | 1 GB trên tất cả các nguồn nhập |
Dữ liệu người dùng | Tối đa 10 | Không áp dụng |
Sự kiện ngoại tuyến | Tối đa 10 | Không áp dụng |
Dữ liệu sự kiện tuỳ chỉnh | Tối đa là 5 | 1 GB trên tất cả các nguồn nhập |
Bạn có thể xem mức sử dụng hạn mức hiện tại trong sản phẩm thông qua nút "Thông tin về hạn mức".
Cách nhập dữ liệu
Khi nhập dữ liệu, bạn sẽ tạo một nguồn dữ liệu. Nguồn dữ liệu là sự kết hợp giữa tệp CSV mà bạn muốn tải lên và mối liên kết các trường Analytics hiện có với các trường trong tệp CSV của bạn. Ví dụ:
Không tải tệp có chứa các khoá trùng lặp lên (ví dụ: 2 trường có tên là user_id)
Bạn có thể tham khảo bài viết này nếu muốn tìm hiểu về nguồn dữ liệu
Điều kiện tiên quyết để sử dụng Giao thức truyền tệp bảo mật (SFTP) nhằm tải dữ liệu lên
Nếu muốn sử dụng giao thức SFTP ở Bước 5, hãy đảm bảo rằng máy chủ SFTP của bạn hỗ trợ thuật toán khoá máy chủ ssh-rsa
và ssh-dss
. Tìm hiểu thêm về cách xác minh thuật toán khoá máy chủ mà bạn sử dụng và cách định dạng URL máy chủ SFTP.
Bắt đầu quá trình nhập
- Trong trang Quản trị, hãy nhấp vào Nhập dữ liệu trong mục Thu thập và sửa đổi dữ liệu.
Đường liên kết trước đó sẽ mở ra tài sản Analytics mà bạn đã truy cập gần đây nhất. Bạn có thể thay đổi tài sản bằng bộ chọn tài sản. Bạn phải là Người chỉnh sửa (hoặc có vai trò cao hơn) ở cấp tài sản để bắt đầu quá trình nhập thành công.
- Tạo nguồn dữ liệu mới hoặc chọn một nguồn dữ liệu hiện có. (Xem các mục sau đây.)
Tạo nguồn dữ liệu mới
- Nhấp vào Tạo nguồn dữ liệu.
- Nhập tên cho nguồn dữ liệu của bạn.
- Chọn loại dữ liệu:
- Dữ liệu chi phí (chỉ nhập thời gian truy vấn)
- Dữ liệu mục (báo cáo/nhập thời gian truy vấn)
- Dữ liệu người dùng theo Mã nhận dạng khách hàng (thu thập/nhập thời gian xử lý)
- Dữ liệu người dùng theo Mã nhận dạng khách hàng (nhập thời gian thu thập/xử lý)
- Dữ liệu sự kiện ngoại tuyến (thu thập/nhập thời gian xử lý)
- Dữ liệu sự kiện tuỳ chỉnh (báo cáo/nhập thời gian truy vấn)
- Nhấp vào Xem lại điều khoản nếu được nhắc. Thông báo nhắc này sẽ hiển thị nếu bạn đang nhập dữ liệu thiết bị hoặc dữ liệu người dùng.
- Làm một trong những việc sau:
- Chọn Tải tệp CSV lên theo cách thủ công, chọn tệp CSV trên máy tính rồi nhấp vào Mở.
- Chọn SFTP.
- Tên người dùng trên máy chủ SFTP: Nhập tên người dùng cho máy chủ SFTP.
- URL máy chủ SFTP: Nhập URL cho máy chủ SFTP.
- Tần suất: Chọn tần suất tải lên (Hằng ngày, Hằng tuần, Hằng tháng).
- Thời gian bắt đầu: Chọn giờ bạn muốn bắt đầu quá trình tải lên.
- Sau khi bạn đã tạo nguồn dữ liệu, khoá công khai cho máy chủ SFTP của bạn sẽ hiển thị trong giao diện mà bạn đang tạo nguồn dữ liệu và có trong thông tin chi tiết về nguồn dữ liệu (tham khảo bên dưới).
- Nhấp vào Tiếp theo để chuyển sang bước liên kết.
- Chọn những trường Analytics và những trường đã nhập mà bạn muốn liên kết với nhau. Chỉnh sửa tên của các trường đó (nếu cần).
- Nhấp vào Nhập.
Tải dữ liệu lên một nguồn dữ liệu hiện có
- Trong hàng chứa một nguồn dữ liệu hiện có, hãy nhấp vào Nhập ngay.
- Nếu nguồn dữ liệu đó được định cấu hình để nhập tệp CSV, hãy chọn tệp CSV mà bạn muốn nhập rồi nhấp vào Mở.
Tệp CSV phải chứa các trường hoặc một nhóm các trường giống như tệp gốc. Nếu muốn nhập các trường khác cho cùng loại dữ liệu, bạn cần xoá nguồn dữ liệu hiện có và tạo một nguồn dữ liệu mới.
Dữ liệu được nhập trong Tài sản nguồn sẽ được tự động xuất sang cả tài sản tổng hợp và tài sản phụ.
Xác minh thuật toán khoá máy chủ SFTP; định dạng URL máy chủ SFTP
Xác minh thuật toán
Bạn có thể dùng nhiều phương pháp để xác minh xem máy chủ SFTP của bạn sử dụng thuật toán khoá máy chủ ssh-rsa hay ssh-dss. Ví dụ: bạn có thể dùng ứng dụng đăng nhập từ xa OpenSSH để kiểm tra nhật ký máy chủ của mình bằng lệnh sau đây:
ssh -vv <tên máy chủ SFTP của bạn>
Nếu máy chủ của bạn hỗ trợ một trong các thuật toán đó, thì bạn sẽ thấy một dòng như sau trong nhật ký máy chủ:
debug2: host key algorithms: rsa-sha2-512, rsa-sha2-256, ssh-rsa
Định dạng URL máy chủ SFTP
Nếu URL máy chủ SFTP của bạn bị định dạng không đúng cách, thì việc thiết lập tính năng nhập sẽ không thành công và một thông báo lỗi nội bộ sẽ xuất hiện.
Khi tải tệp nhập dữ liệu lên, URL máy chủ SFTP thường có 3 phần mà bạn cần cân nhắc. Ví dụ:
sftp://example.com//home/jon/upload.csv
bao gồm các phần sau:
- Miền:
example.com
- Thư mục gốc:
//home/jon
- Đường dẫn tệp:
/upload.csv
Trong ví dụ trên, tệp tải lên nằm trong thư mục gốc.
Bạn có thể định dạng phần miền của URL theo nhiều cách, dựa vào tên miền hoặc địa chỉ IPv4 hay IPv6 của máy chủ (có hoặc không có số cổng):
- Tên miền:
sftp://example.com
- IPv4 (có số cổng):
sftp://142.250.189.4:1234
- IPv4 (không có số cổng):
sftp://142.250.189.4
- IPv6 (có số cổng):
sftp://[2607:f8b0:4007:817::2004]:1234
- IPv6 (không có số cổng):
sftp://[2607:f8b0:4007:817::2004]
Nếu bạn không thêm số cổng, thì cổng mặc định sẽ là 22.
Bạn có thể định dạng URL đúng cách để bao gồm hoặc loại trừ thư mục gốc. Các ví dụ sau đây về URL được định dạng đúng cách sử dụng nhiều định dạng để xác định miền. Các ví dụ này có số cổng, nhưng bạn có thể chọn không sử dụng số cổng.
- Bao gồm thư mục gốc:
sftp://example.com//home/jon/upload.csv
(tên miền)sftp://142.250.189.4:1234//home/jon/upload.csv
(IPv4 có số cổng)
- Loại trừ thư mục gốc:
sftp://example.com/upload.csv
(tên miền)sftp://[2607:f8b0:4007:817::2004]:1234/upload.csv
(IPv6 có số cổng)
Nếu tệp tải lên nằm trong một thư mục con của thư mục gốc, thì URL của bạn sẽ có dạng như sau:
sftp://example.com//home/jon/data/upload.csv
Trong trường hợp này, bạn có thể sử dụng các loại định dạng sau:
- Bao gồm thư mục gốc:
sftp://example.com//home/jon/data/upload.csv
sftp://142.250.189.4:1234//home/jon/data/upload.csv
(IPv4 có số cổng)
- Loại trừ thư mục gốc:
sftp://example.com/data/upload.csv
sftp://[2607:f8b0:4007:817::2004]:1234/data/upload.csv
(IPv6 có số cổng)
Nếu tệp tải lên không được lưu trữ trong thư mục gốc (//home/jon
) hoặc thư mục con của thư mục gốc (//home/jon/data
) mà được lưu trữ trong thư mục /foo/bar, thì URL được định dạng đúng cách cho tệp tải lên của bạn sẽ có dạng như sau:
sftp://example.com//foo/bar/upload.csv
(//foo/bar
thay thế cho thư mục gốc)
Xem thông tin chi tiết về nguồn dữ liệu, nhận khoá công khai của SFTP, nhập dữ liệu mới, xoá nguồn dữ liệu
- Trong trang Quản trị, hãy nhấp vào Nhập dữ liệu trong mục Thu thập và sửa đổi dữ liệu.
Đường liên kết trước đó sẽ mở ra tài sản Analytics mà bạn đã truy cập gần đây nhất. Bạn có thể thay đổi tài sản bằng bộ chọn tài sản.
Bạn phải là Người xem (hoặc có vai trò cao hơn) ở cấp tài sản để xem thông tin chi tiết về nguồn dữ liệu.
- Trong hàng chứa nguồn dữ liệu, hãy nhấp vào biểu tượng .
Bạn có thể xem tên, loại dữ liệu, khoá công khai và nhật ký của mỗi tệp tải lên.
- Khoá công khai: Khoá công khai của máy chủ SFTP tương ứng với một khoá riêng tư trùng khớp mà Analytics lưu trữ (và tuyệt đối không chia sẻ). Khoá này được dùng để đảm bảo rằng máy chủ của bạn có kết nối bảo mật, riêng tư với các máy chủ nhập dữ liệu của Analytics. Bạn cần phải uỷ quyền cho khoá công khai này trên máy chủ của mình để đảm bảo rằng quá trình nhập dữ liệu có thể diễn ra một cách an toàn và bảo mật.
- % dữ liệu đã nhập: Số hàng được nhập thành công chia cho số hàng trong tệp nhập. 100% có nghĩa là đã nhập thành công tất cả hàng.
- Tỷ lệ khớp: Tỷ lệ các khóa trong tệp nhập mà hệ thống có thể tìm thấy trong tài sản của bạn trong vòng 90 ngày qua. 100% có nghĩa là dữ liệu này hoàn toàn hữu ích và có liên quan đến dữ liệu của bạn trong vòng 90 ngày qua.
Lưu ý: Mục % đã nhập và tỷ lệ khớp có liên quan đến việc nhập dữ liệu chi phí, mặt hàng và sự kiện tuỳ chỉnh, nhưng không áp dụng cho việc nhập dữ liệu người dùng hoặc nhập dữ liệu sự kiện ngoại tuyến.
Cách nhập dữ liệu mới:
Nhấp vào Nhập ngay và chọn tệp CSV phù hợp trên máy tính của bạn.
Để xóa nguồn dữ liệu, hãy làm như sau:
- Nhấp vào > Xóa nguồn dữ liệu.
- Đọc thông báo xoá, sau đó nhấp vào Xoá nguồn dữ liệu.
Bạn có thể xoá dữ liệu Thời gian thu nhập/xử lý, nhưng nếu muốn xoá dữ liệu đã được tải lên trước đó khỏi tất cả các sự kiện do Analytics xử lý, thì bạn cũng cần phải xoá người dùng hoặc thuộc tính người dùng. Việc xoá một tệp đã nhập sẽ không xoá dữ liệu đã xử lý được liên kết với các sự kiện được thu thập kể từ khi quá trình nhập hoàn tất. Bạn có thể sử dụng bài viết này để tìm hiểu thêm về yêu cầu xoá dữ liệu.
Tên và tiền tố dành riêng
Các tên sự kiện, tên thông số sự kiện, tên thuộc tính người dùng và tiền tố sau đây chỉ được dùng riêng cho Analytics. Nếu bạn cố gắng tải dữ liệu chứa tên hoặc tiền tố chuyên dụng lên, thì dữ liệu đó sẽ không được tải lên.
Ví dụ:
- Nếu bạn cố gắng nhập một sự kiện có tên dành riêng, sự kiện đó và các thông số của sự kiện đó sẽ không được nhập.
- Nếu bạn cố gắng nhập một sự kiện có tên hợp lệ, nhưng một trong các thông số của sự kiện đó có tên dành riêng, thì sự kiện đó sẽ được nhập, nhưng thông số có tên dành riêng đó sẽ không được nhập.
Tên dành riêng của sự kiện
- ad_activeview
- ad_activeview
- ad_exposure
- ad_impression
- ad_query
- adunit_exposure
- app_clear_data
- app_install
- app_remove
- app_update
- error
- first_open
- first_visit
- in_app_purchase
- notification_dismiss
- notification_foreground
- notification_open
- notification_receive
- os_update
- screen_view
- session_start
- user_engagement
Tên thông số sự kiện chuyên dụng
- firebase_conversion
Tên thuộc tính người dùng chuyên dụng
- first_open_after_install
- first_open_time
- first_visit_time
- last_deep_link_referrer
- user_id
Tiền tố chuyên dụng (áp dụng cho các thông số sự kiện và thuộc tính người dùng)
- ga_
- google_
- firebase_