Thông báo

Gần đây, chúng tôi đã thông báo nội dung cập nhật về các trang ấn phẩm. Vui lòng đọc tại đây để biết thêm thông tin.

Chặn quyền truy cập vào nội dung trên trang web của bạn

Bài viết này giải thích cách chặn quyền truy cập vào nội dung trên trang web của bạn.

Một số nội dung mà bạn xuất bản có thể không phù hợp để xuất hiện trên Google Tin tức. Bạn có thể hạn chế Google truy cập vào một số nội dung bằng cách chặn quyền truy cập vào rô-bốt thu thập thông tin của Google, Googlebot và Googlebot-News.

Tạo tệp robots.txt

Hãy dùng tệp robots.txt để nâng cao mức độ kiểm soát đối với những phần của trang web có thể xuất hiện trong Google Tìm kiếm và Google Tin tức. Tìm hiểu thêm về tệp robots.txt.

Bạn có thể chặn quyền truy cập bằng những cách sau:

  • Để ngăn trang web của bạn xuất hiện trong Google Tin tức, hãy chặn quyền truy cập vào Googlebot-News bằng tệp robots.txt.

  • Để ngăn trang web của bạn xuất hiện trong Google Tin tức và Google Tìm kiếm, hãy chặn quyền truy cập vào Googlebot bằng tệp robots.txt.

Bạn cần cấp cho trình thu thập thông tin của chúng tôi quyền truy cập vào tệp robots.txt của bạn để chúng tôi biết được bạn đã chỉ định các phần nhất định của trang web mà bạn không muốn hệ thống thu thập thông tin hay chưa.

Tạo thẻ meta

Bạn có thể thêm thẻ meta vào trang HTML. Thẻ này cho công cụ tìm kiếm biết giới hạn nào sẽ áp dụng khi hiển thị trang trong kết quả tìm kiếm. Tìm hiểu cách chặn lập chỉ mục tìm kiếm bằng thẻ meta.

Dưới đây là một số thẻ meta phổ biến mà bạn có thể thêm vào trang HTML của mình:

  • Để ngăn các bài viết cụ thể trên trang web của bạn xuất hiện trong Google Tin tức, hãy chặn quyền truy cập vào Googlebot-News bằng thẻ meta sau: <meta name="Googlebot-News" content="noindex, nofollow">.

  • Để ngăn các bài viết cụ thể trên trang web của bạn xuất hiện trong Google Tin tức và Google Tìm kiếm, hãy chặn quyền truy cập vào Googlebot bằng thẻ meta sau: <meta name="googlebot" content="noindex, nofollow">.

  • Để ngăn tất cả các rô-bốt lập chỉ mục những bài viết cụ thể trên trang web của bạn, hãy sử dụng thẻ meta sau: <meta name="robots" content="noindex, nofollow">.

  • Để ngăn rô-bốt thu thập thông tin hình ảnh trên một bài viết cụ thể, hãy sử dụng thẻ meta sau: <meta name="robots" content="noimageindex">.

  • Để thông báo cho chúng tôi biết rằng chúng tôi nên xóa một bài viết khỏi chỉ mục của Google vào một thời điểm nhất định, hãy dùng thẻ meta sau: <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">.

  • Chỉ định thời gian và ngày theo định dạng RFC 850. Thẻ meta này được coi như một yêu cầu xóa. Khoảng 1 ngày sau khi xóa, trang đó sẽ không xuất hiện trong kết quả tìm kiếm nữa. Tuy nhiên, để thẻ hoạt động bình thường thì bạn phải đưa thẻ vào bài viết của mình ngay từ lần thu thập thông tin đầu tiên.

  • Có các tùy chọn khác để giới hạn nội dung hiển thị trong kết quả tìm kiếm. Tìm hiểu thêm trong tài liệu dành cho nhà phát triển.

Thông số tiêu đề HTTP

Bạn cũng có thể cung cấp hướng dẫn cho rô bốt trong tiêu đề phản hồi HTTP. Để tìm hiểu thêm, hãy đọc về thông số tiêu đề HTTP.

Quan trọng: Google áp dụng cách hiểu theo nghĩa hẹp nhất mà bot của bạn lựa chọn.

Tìm kiếm
Xóa nội dung tìm kiếm
Đóng tìm kiếm
Trình đơn chính
18111827868911032148
true
Tìm kiếm trong Trung tâm trợ giúp
true
true
true
true
true
100499
false
false