Quản lý trang web

Giới thiệu về trình thu thập thông tin của AdSense

Trình thu thập thông tin, còn được gọi là trình thu thập dữ liệu hoặc bot, là phần mềm Google sử dụng để xử lý và lập chỉ mục nội dung của trang web. Trình thu thập thông tin của AdSense truy cập trang web của bạn để xác định nội dung của trang web nhằm cung cấp quảng cáo có liên quan.

Dưới đây là một số yếu tố quan trọng cần biết về trình thu thập thông tin của AdSense:

  • Báo cáo thu thập thông tin được cập nhật hàng tuần.

    Việc thu thập thông tin được thực hiện tự động và chúng tôi không thể đáp ứng các yêu cầu về thu thập thông tin thường xuyên hơn.

  • Trình thu thập thông tin của AdSense khác với trình thu thập thông tin của Google.

    Hai trình thu thập thông tin này riêng biệt, nhưng chúng chia sẻ bộ nhớ cache. Chúng tôi thực hiện điều này nhằm tránh trường hợp cả hai trình thu thập thông tin cùng yêu cầu các trang giống nhau, nhờ đó giúp nhà xuất bản tiết kiệm băng thông. Tương tự như vậy, trình thu thập thông tin của Search Console cũng riêng biệt.

  • Giải quyết các vấn đề thu thập thông tin của AdSense sẽ không giải quyết các vấn đề với thu thập thông tin của Google.

    Giải quyết các vấn đề được liệt kê trên trang Truy cập của trình thu thập thông tin sẽ không có tác động gì đến vị trí của bạn trong kết quả tìm kiếm của Google. Để biết thêm thông tin về xếp hạng trang web của bạn trên Google, hãy xem bài viết của chúng tôi về đưa trang web của bạn vào kết quả tìm kiếm của Google.

  • Trình thu thập thông tin lập chỉ mục theo URL.

    Trình thu thập thông tin của chúng tôi sẽ truy cập vào site.com và www.site.com một cách riêng biệt. Tuy nhiên, trình thu thập thông tin của chúng tôi sẽ không tính riêng site.com và site.com/#anchor.

  • Trình thu thập thông tin sẽ không truy cập vào các trang hoặc thư mục bị tệp robots.txt cấm.

    Cả trình thu thập thông tin của Google và AdSense Mediapartners đều tuân thủ tệp robots.txt của bạn. Nếu tệp robot.txt cấm truy cập vào các trang hoặc thư mục nhất định, thì các trang hoặc thư mục đó sẽ không được thu thập thông tin.

    Lưu ý rằng nếu bạn đang phân phát quảng cáo trên các trang bị chặn bởi tệp robots.txt có dòng User-agent: *, thì trình thu thập thông tin của AdSense sẽ vẫn thu thập thông tin của các trang đó. Để ngăn trình thu thập thông tin của AdSense truy cập các trang của mình, bạn cần chỉ định User-agent: Mediapartners-Google trong tệp robots.txt của bạn. Tìm hiểu thêm
  • Trình thu thập thông tin sẽ cố gắng truy cập vào các URL mà tại đó các thẻ quảng cáo của chúng tôi được thực hiện.

    Chỉ các trang hiển thị quảng cáo Google mới được gửi yêu cầu đến hệ thống của chúng tôi và được thu thập thông tin.

  • Trình thu thập thông tin sẽ cố gắng truy cập vào các trang chuyển hướng

    Khi bạn có "trang gốc" chuyển hướng tới các trang khác, trình thu thập thông tin của chúng tôi phải truy cập vào các trang gốc để xác định rằng chuyển hướng được sử dụng. Do đó, lượt truy cập vào các trang gốc của trình thu thập thông tin sẽ xuất hiện trong nhật ký truy cập của bạn.

  • Thu thập lại thông tin trang web

    Vào thời điểm này, chúng tôi không thể kiểm soát tần suất trình thu thập thông tin của chúng tôi lập chỉ mục nội dung trên trang web của bạn. Các rô bốt của chúng tôi thực hiện việc thu thập thông tin một cách tự động. Nếu bạn thực hiện các thay đổi cho một trang, có thể mất từ 1 đến 2 tuần trước khi những thay đổi này được phản ánh trong chỉ mục của chúng tôi.

Thông tin này có hữu ích không?
Chúng tôi có thể cải thiện trang này bằng cách nào?

Bạn cần trợ giúp thêm?

Đăng nhập để xem thêm tùy chọn hỗ trợ giúp nhanh chóng giải quyết sự cố