Thông báo

We’ve recently announced an update on publication pages. Please read here for more information.

Nguyên tắc kỹ thuật

Google sử dụng thuật toán máy tính để thu thập thông tin trang web tin tức. Để giúp hệ thống của chúng tôi xác định trang web nào của bạn là bài viết, hãy đảm bảo trang web của bạn tuân thủ các nguyên tắc kỹ thuật sau.

Yêu cầu đối với cấu trúc trang web

Google Tin tức khuyên nhà xuất bản tuân thủ các nguyên tắc về cấu trúc trang web bên dưới để chúng tôi có thể thu thập thông tin nội dung mới đúng cách.

Các trang chứa mục cố định

Nếu các URL trong mục tin tức chính của bạn thường xuyên thay đổi, thì Google Tin tức có thể không hiểu được trang web của bạn. Các URL không cố định ngăn chúng tôi thu thập thông tin nội dung mới vì chúng tôi không thể phát hiện thấy URL mới nhất để thu thập thông tin.

Trình thu thập thông tin tự động của chúng tôi, Googlebot-News, hoạt động hiệu quả nhất khi URL của các mục tin tức chính của bạn không thay đổi. Googlebot-News có thể thu thập thông tin hiệu quả nhất đối với các đường liên kết HTML. Công cụ này không thể thu thập thông tin đường liên kết hình ảnh hoặc đường liên kết được nhúng trong JavaScript. Hãy đảm bảo bài viết của bạn trên các trang chứa mục tin tức chỉ có các đường liên kết HTML.

Ngoài ra, hãy đảm bảo văn bản liên kết trỏ đến một bài viết trong các trang chứa mục tin tức của bạn khớp với tiêu đề của bài viết và tiêu đề trang. Nếu không thể đáp ứng những yêu cầu kỹ thuật này, bạn có thể sử dụng giải pháp chỉ thu thập thông tin sơ đồ trang web. Nếu bạn muốn thử thu thập thông tin trang web của riêng mình bằng các sơ đồ trang web, hãy liên hệ với nhóm của chúng tôi.

Nội dung có thể truy cập được

Trình thu thập thông tin của chúng tôi cần truy cập vào trang web của bạn để đưa nội dung vào Google Tin tức. Hãy đảm bảo các thư mục lưu trữ bài viết của bạn không bị tệp robots.txt chặn và thẻ meta hoặc thông số kỹ thuật của tiêu đề không chặn quyền truy cập vào các đường liên kết bài viết của bạn. Google Tin tức thu thập thông tin bằng chính rô-bốt được dùng trong Google Web Search, đó là Googlebot.

Yêu cầu về ngôn ngữ và phương thức mã hóa

Việc hiểu nguyên tắc về ngôn ngữ của nội dung và phương thức mã hóa trang web là vô cùng quan trọng.

Ngôn ngữ

Google Tin tức không hiển thị các trang web có bài viết sử dụng nhiều ngôn ngữ trong một bài viết. Hệ thống của chúng tôi gặp sự cố khi phân tích nội dung chứa nhiều ngôn ngữ, khiến chúng tôi khó đảm bảo hiển thị đúng ngôn ngữ cho nội dung liên quan.

Nếu trang web của bạn có các mục dành riêng cho ngôn ngữ, như example.com/frenchexample.com/english, hãy tạo các ấn bản riêng cho từng ngôn ngữ. Điều này đảm bảo nội dung hiển thị với người dùng bằng ngôn ngữ của họ. Tìm hiểu cách thiết lập ấn bản.

Mã hóa trang web của bạn

Để có kết quả tốt nhất, hãy mã hóa trang web của bạn bằng UTF-8. Để biết thêm thông tin về cách mã hóa, hãy truy cập vào www.w3.org.

Yêu cầu đối với từng trang bài viết

Để đảm bảo chúng tôi chỉ thu thập thông tin tin bài của bạn, Google Tin tức có một số yêu cầu đối với từng trang bài viết. Hãy làm theo các bước dưới đây để đảm bảo bạn tuân thủ nguyên tắc.

URL bài viết

URL bài viết của bạn là duy nhất và vĩnh viễn:

  • URL duy nhất: Mỗi trang hiển thị toàn bộ văn bản của bài viết cần có một URL duy nhất. Chúng tôi không thể đưa vào Google Tin tức các trang web hiển thị nhiều bài viết trong một URL hoặc trang web không có đường liên kết đến các trang chỉ dành riêng cho từng bài viết.

  • URL cố định: Để đảm bảo đường liên kết đến bài viết của chúng tôi hoạt động, mỗi bài viết trên trang web tin tức của bạn phải liên kết với một URL cố định duy nhất cho mỗi bài viết. Ví dụ: chúng tôi sẽ không thể thu thập thông tin trang www.yoursite.com/news1.html nếu mỗi ngày trang hiển thị một tin bài khác.


Quan trọng: Không xuất bản lại bài viết trong một URL mới.

Sau này, nếu một bài viết được xuất bản lại, URL của bài viết đó sẽ không thay đổi. Ví dụ: nếu bài viết được xuất bản lần đầu tiên theo www.example.com/news1.html, thì bài viết này không được xuất bản lại trong www.example.com/news2.html. Nếu trong quá trình thay đổi tên miền hoặc cấu trúc Hệ thống quản lý nội dung (CMS), mẫu URL của bạn sẽ thay đổi, hãy gửi cho chúng tôi quy tắc chuyển đổi mẫu của bạn. Chúng tôi có thể hỗ trợ thay đổi mẫu này.

Nguyên tắc về bố cục trang

Đảm bảo trình thu thập thông tin tự động của chúng tôi có thể dễ dàng nhận dạng tiêu đề bài viết và thời gian xuất bản của bạn. Các trang của bài viết của bạn nên sử dụng định dạng HTML và văn bản nội dung không được nhúng trong JavaScript.

Tìm kiếm
Xóa nội dung tìm kiếm
Đóng tìm kiếm
Trình đơn chính
341160564745996506
true
Tìm kiếm trong Trung tâm trợ giúp
true
true
true
true
true
100499
false
false