Bạn có thể dùng báo cáo Sơ đồ trang web để cho Google biết mọi sơ đồ trang web mới của tài sản, xem nhật ký gửi sơ đồ trang web cũng như xem mọi lỗi mà Google gặp phải khi phân tích cú pháp của sơ đồ trang web bạn gửi.
Sơ đồ trang web là gì? Tôi có cần báo cáo này không?
Sơ đồ trang web là một tệp nằm trên trang web của bạn. Tệp này cho Google biết những trang mà Google nên tìm hiểu trên trang web của bạn.
- Nếu bạn đang dùng một dịch vụ lưu trữ web như Squarespace hoặc Wix, thì có thể dịch vụ đó sẽ tạo sơ đồ trang web cho bạn. Trong trường hợp đó, bạn không cần tạo sơ đồ trang web riêng hoặc dùng báo cáo này. Hãy tìm kiếm nhà cung cấp dịch vụ lưu trữ của bạn để biết thông tin về sơ đồ trang web.
- Nếu bạn có một trang web nhỏ (ít hơn 100 trang) và có thể truy cập bất kỳ trang nào trên trang web của mình qua một hoặc vài đường liên kết trên trang chủ, thì bạn không cần dùng sơ đồ trang web hoặc báo cáo này. Trong trường hợp đó, bạn chỉ cần yêu cầu lập chỉ mục trang chủ (hoặc không cần làm gì nếu bạn đang dùng một dịch vụ lưu trữ web, như đã đề cập trước đó).
Quản lý sơ đồ trang web
Cách gửi sơ đồ trang web mới cho mục đích thu thập dữ liệu:
- Bạn phải có quyền của chủ sở hữu đối với một tài sản thì mới có thể gửi sơ đồ trang web bằng báo cáo Sơ đồ trang web. Nếu không có quyền của chủ sở hữu thì bạn có thể chuyển sang dùng tệp robots.txt để tham chiếu đến sơ đồ trang web đó.
- Đăng sơ đồ trang web trên trang web của bạn.
- Sơ đồ trang web phải sử dụng một trong các định dạng được chấp nhận. Hãy tuân theo nguyên tắc về sơ đồ trang web đối với cú pháp, vị trí tệp, v.v.
- Bạn nên đặt sơ đồ trang web ở thư mục gốc của trang web. Tuy nhiên, nếu đang dùng một dịch vụ lưu trữ trang web (như Blogger, Wix hoặc GoDaddy) thì bạn nên đọc tài liệu của dịch vụ đó để tìm hiểu vị trí và cách đăng sơ đồ trang web (hoặc liệu bạn có cần làm việc đó hay không).
- Googlebot phải truy cập được vào sơ đồ trang web và sơ đồ không bị chặn bởi bất kỳ yêu cầu đăng nhập nào. Bạn có thể kiểm tra xem Googlebot có truy cập được sơ đồ trang web hay không bằng cách xem bạn có thể duyệt xem URL của sơ đồ trang web đó ở chế độ ẩn danh hay không.
- Dùng trình tạo sơ đồ trang web XML để tạo sơ đồ trang web cũng như kiểm tra lỗi cú pháp trong sơ đồ trang web.
- Kiểm tra để đảm bảo rằng Google truy cập được sơ đồ trang web. Có hai cách để làm việc này:
- Cách hiệu quả: Mở URL của sơ đồ trang web trong trình duyệt. Bạn sẽ thấy sơ đồ trang web xuất hiện dưới dạng tệp XML trong trình duyệt. (Sơ đồ này sẽ trông giống như một tập hợp các khối lồng vào nhau, không giống như một trang web thông thường.)
- Cách hiệu quả hơn: Kiểm tra URL của sơ đồ trang web như nêu tại đây. So với việc truy cập trình duyệt một cách đơn giản thì cách này hiệu quả hơn vì xác nhận được rằng không có tệp robots.txt hay các hạn chế nào khác chặn Google truy cập sơ đồ trang web:
- Kiểm tra URL của sơ đồ trang web.
- Nhấp vào Kiểm tra phiên bản hoạt động: Đối với Khả năng lập chỉ mục, kết quả phải là "Có thể lập chỉ mục URL này". Nếu không, phần kiểm tra phải đưa ra lý do Google không thể truy cập hay lập chỉ mục trang (lý do thường thấy: quy tắc trong tệp robots.txt, URL không chính xác, tường lửa). Nếu Google không truy cập được sơ đồ trang web, hãy khắc phục vấn đề này.
- Nhấp vào Xem trang đã kiểm tra rồi nhấp vào thẻ Nguồn. Bạn sẽ thấy mã XML của sơ đồ trang web của mình. Thường thì sơ đồ này giống một cây giá trị có thể mở rộng trong trình duyệt. Nếu bạn không thấy sơ đồ trang web hoàn chỉnh, hãy xác định lý do máy chủ lưu trữ trang web không cho thấy sơ đồ trang web.
- Sau khi bạn đảm bảo rằng sơ đồ trang web của mình đã sẵn sàng, hãy Mở báo cáo Sơ đồ trang web.
- Sao chép URL mà bạn đã kiểm tra ở bước 3, dán URL đó vào hộp Thêm sơ đồ trang web mới trong báo cáo Sơ đồ trang web, rồi nhấp vào Gửi.
Hệ thống sẽ tìm nạp sơ đồ trang web ngay lập tức. Tuy nhiên, có thể mất một thời gian để Google thu thập dữ liệu các URL có trong sơ đồ trang web; và có thể chúng tôi sẽ không thu thập một số URL trong sơ đồ, tuỳ thuộc vào kích thước trang web, hoạt động, lưu lượng truy cập, v.v.
Hãy định kỳ kiểm tra lại để xác nhận xem Google có thể tìm nạp và xử lý sơ đồ trang web của bạn hay không.
Gửi lại sơ đồ trang web
Xoá sơ đồ trang web
Việc xoá một sơ đồ trang web sẽ xoá sơ đồ trang web đó khỏi báo cáo này, nhưng Google sẽ không quên sơ đồ trang web đó hay bất kỳ URL nào có trong đó. Nếu muốn Google dừng việc truy cập các URL có trong sơ đồ trang web thì bạn sẽ phải dùng quy tắc trong tệp robots.txt.
Cách xoá sơ đồ trang web khỏi báo cáo:
- Trong bảng trên báo cáo Sơ đồ trang web chính, hãy tìm rồi nhấp vào sơ đồ trang web bạn muốn xoá.
- Trong trang chi tiết về sơ đồ trang web, hãy nhấp vào nút tuỳ chọn khác
- Nhấp vào Xoá sơ đồ trang web.
- Để ngăn Google tiếp tục truy cập sơ đồ trang web hay URL nào đó có trong sơ đồ trang web, hãy dùng phương pháp bất kỳ sau đây cho sơ đồ trang web hoặc URL của trang:
- Dùng quy tắc trong tệp robots.txt để chặn Google đọc quy tắc đó, hoặc
- Xoá trang hoặc tệp sơ đồ trang web khỏi trang web của bạn, hoặc
- Thêm quy tắc noindex hoặc tiêu đề phản hồi. (Đối với sơ đồ trang web, bạn sẽ phải dùng tiêu đề phản hồi; đối với trang web, bạn có thể dùng thẻ meta hoặc tiêu đề phản hồi.)
Đọc báo cáo
Lưu ý quan trọng:
- Báo cáo này chỉ cho thấy các sơ đồ trang web mà bạn gửi bằng cách sử dụng báo cáo này hoặc API. Báo cáo này không cho thấy bất kỳ sơ đồ trang web nào mà Google phát hiện được thông qua mục tham chiếu trong tệp robots.txt hoặc các phương thức khám phá khác. Tuy nhiên, ngay cả khi Google đã phát hiện ra sơ đồ trang web thông qua các phương thức khác, bạn vẫn có thể gửi sơ đồ đó bằng báo cáo này để theo dõi tỷ lệ thành công và gặp lỗi của chúng tôi.
- Báo cáo chỉ cho thấy các sơ đồ trang web trong tài sản hiện tại. Nếu bạn không thấy sơ đồ trang web mà mình mong muốn, hãy đảm bảo rằng bạn không nhầm lẫn giữa các tài sản http/https hoặc www/không có www.
- Sau một số lần thử nhưng vẫn không đọc được sơ đồ trang web, Google sẽ dừng đọc sơ đồ trang web đó. Bạn nên sửa lỗi rồi gửi lại sơ đồ trang web.
- Bạn có thể gửi URL cho hình ảnh, video, hoặc tin tức trong sơ đồ trang web. Tuy nhiên, báo cáo này hiện không cho thấy bất kỳ dữ liệu nào cho các loại URL đó.
- Báo cáo này có thể cho thấy tối đa 1.000 yêu cầu đã gửi. Bạn có thể gửi thêm yêu cầu khác, nhưng báo cáo này vẫn chỉ có thể cho thấy 1.000 yêu cầu (không theo thứ tự gửi). Hiện tại, bạn không có cách nào để xem các yêu cầu khác trong Search Console.
Thông tin sau đây được trình bày cho từng sơ đồ trang web:
- URL Sơ đồ trang web
- URL chính xác được chỉ định khi bạn gửi sơ đồ trang web. Không tuân theo lệnh chuyển hướng. Chỉ những sơ đồ trang web được gửi bằng báo cáo này hoặc API mới xuất hiện tại đây.
- Loại
- Loại sơ đồ trang web. Các giá trị có thể là:
- Sơ đồ trang web: Sơ đồ trang web ở định dạng XML hoặc văn bản.
- Chỉ mục sơ đồ trang webtrong>: Một sơ đồ trang web chứa nhiều sơ đồ trang web khác.
- RSS: Sơ đồ trang web ở định dạng nguồn cấp dữ liệu RSS.
- Atom: Sơ đồ trang web ở định dạng nguồn cấp dữ liệu Atom.
- Không xác định: Tệp đã gửi không thuộc một loại sơ đồ trang web đã biết hoặc sơ đồ trang web chưa được xử lý.
- Ngày gửi
- Ngày gần đây nhất mà sơ đồ trang web được gửi cho Google bằng báo cáo này.
- Lần đọc gần nhất
- Lần gần đây nhất mà Google tìm nạp sơ đồ trang web này. Thông tin này chỉ xuất hiện nếu Google có thể tìm nạp được sơ đồ trang web.
- Trạng thái
- Trạng thái của lần thu thập dữ liệu gần đây nhất. Các giá trị có thể là:
- Thành công: Google đã tải và xử lý sơ đồ trang web thành công mà không gặp lỗi nào. Tất cả URL đều sẽ được đưa vào danh sách chờ thu thập dữ liệu.
- Có lỗi: Google có thể phân tích cú pháp sơ đồ trang web nhưng sơ đồ có ít nhất một lỗi; mọi URL mà Google có thể phân tích cú pháp sơ đồ trang web đều được đưa vào danh sách chờ thu thập dữ liệu. Hãy nhấp vào sơ đồ trang web trong bảng để xem danh sách lỗi kèm theo thông tin chi tiết tương ứng. Xem phần mô tả đầy đủ về lỗi dưới đây.
- Không thể tìm nạp: Không thể tìm nạp sơ đồ trang web vì một nguyên nhân chưa xác định. Để tìm hiểu lý do, hãy chạy quy trình kiểm tra phiên bản hoạt động trên sơ đồ trang web bằng Công cụ kiểm tra URL:
- Sao chép đường dẫn trên báo cáo Sơ đồ trang web để đảm bảo bạn đang kiểm tra đúng URL sơ đồ trang web mà bạn đã gửi cho Google.
- Nhấp vào Kiểm tra phiên bản hoạt động trong Công cụ kiểm tra URL. Quy trình kiểm tra này sẽ cung cấp cho bạn thông tin về việc liệu sơ đồ trang web có tồn tại và Google có thể tìm nạp sơ đồ hay không.
- Các URL đã được phát hiện
- Số lượng URL tìm thấy trong sơ đồ trang web. Nếu đây là chỉ mục sơ đồ trang web thì số này là tổng số URL trong tất cả sơ đồ trang web con. Các URL trùng lặp chỉ được tính một lần.
- Biểu tượng
- Mở một báo cáo trình bày trạng thái lập chỉ mục của tất cả URL trong sơ đồ trang web này. Đối với chỉ mục sơ đồ trang web, chỉ mục sẽ bao gồm tất cả các URL được liệt kê trong bất kỳ sơ đồ trang web con nào.
Sơ đồ trang web của tôi không có trong báo cáo!
Dưới đây là một vài lý do mà sơ đồ trang web của bạn có thể không được liệt kê trong báo cáo:
- Sơ đồ nằm trên một sản phẩm khác. Các sơ đồ trang web liên kết với một tài sản sẽ không xuất hiện trên tài sản khác. Do đó, sơ đồ trang web bạn đã gửi cho trang web
http://example.com
sẽ không xuất hiện trong báo cáo Sơ đồ trang web chohttp://m.example.com
hoặchttps://example.com
. Để giải quyết vấn đề này, hãy đảm bảo rằng bạn đã thêm tất cả phiên bản của trang web. - Bạn chưa gửi sơ đồ trang web bằng báo cáo này hoặc API. Chỉ những sơ đồ trang web được gửi bằng báo cáo này hoặc Search Console API mới được liệt kê; các sơ đồ trang web được tìm thấy hoặc gửi bằng các phương pháp khác sẽ không xuất hiện, ngay cả khi Google có thể tìm thấy và sử dụng chúng.
Lịch thu thập dữ liệu sơ đồ trang web
Google sẽ cố gắng thu thập dữ liệu sơ đồ trang web ngay khi bạn gửi. Nếu yêu cầu thành công thì Google sẽ tiếp tục thu thập lại dữ liệu sơ đồ trang web ở tốc độ độc lập với lịch thu thập dữ liệu trang web.
Nếu tìm nạp hoặc phân tích sơ đồ trang web không thành công thì Google sẽ tiếp tục cố gắng tìm nạp và xử lý sơ đồ trang web trong vài ngày. Nếu các lần thử vẫn tiếp tục không thành công thì Google sẽ ngừng cố gắng thu thập dữ liệu trên URL đó.
Lỗi sơ đồ trang web
Báo cáo sơ đồ trang web cung cấp thông tin về các lỗi sau đây. Danh sách này tuy chưa đầy đủ nhưng đủ dài và bao gồm hầu hết lỗi mà bạn có thể thấy.
URL không thể truy cập được
Google đã gặp lỗi khi cố thu thập dữ liệu một URL trong sơ đồ trang web của bạn. Hãy kiểm tra URL trong sơ đồ trang web bằng cách sử dụng Công cụ kiểm tra URL để biết Google có thể truy cập được URL này hay không.
URL không theo dõi được
Google không thể thu thập dữ liệu tất cả các URL được liệt kê trong sơ đồ trang web của bạn. Dưới đây là một số lý do có thể xảy ra:
- URL chứa quá nhiều lệnh chuyển hướng khiến trình thu thập dữ liệu web của Google không thể theo toàn bộ lệnh đó. Bạn nên thay thế mọi URL chuyển hướng trong sơ đồ trang web bằng các URL mà bạn thực sự cần Google thu thập dữ liệu.
- Nếu bạn chuyển hướng vĩnh viễn từ trang này sang trang khác, hãy dùng chuyển hướng vĩnh viễn.
- Tránh sử dụng chuyển hướng JavaScript hoặc meta-refresh.
- Google đang gặp vấn đề với các URL tương đối trong sơ đồ trang web của bạn. Nếu có thể, hãy sử dụng đường liên kết tuyệt đối hoặc đầy đủ thay vì đường liên kết tương đối. Ví dụ: khi liên kết đến một trang khác trong trang web của bạn, hãy liên kết đến
https://www.example.com/mypage.html
thay vìmypage.html
.
URL không được phép
Sơ đồ trang web của bạn có cả một số URL ở cấp cao hơn hoặc nằm trên miền khác so với tệp sơ đồ trang web.
Cấp cao hơn: Nếu sơ đồ trang web của bạn nằm tại http://www.example.com/mysite/sitemap.xml
, thì các URL sau không hợp lệ cho sơ đồ trang web đó:
http://www.example.com/
– Cấp cao hơn so với sơ đồ trang webhttp://www.example.com/yoursite/
– Trong một thư mục khác thuộc cùng sơ đồ trang web (bạn phải di chuyển lên và xuống để vào thư mục này).
Miền khác: Kiểm tra để đảm bảo tất cả URL đều bắt đầu với cùng một miền như vị trí sơ đồ trang web của bạn. Ví dụ, nếu sơ đồ trang web của bạn nằm tại http://www.example.com/sitemap.xml
, thì các URL sau không hợp lệ cho sơ đồ trang web đó:
http://example.com/
– Thiếu "www"www.example.com/
– Thiếu "http"https://www.example.com/
– Sử dụng https thay vì http
Lỗi nén
Google đã gặp lỗi khi tiến hành giải nén cho tệp nén sơ đồ trang web của bạn. Hãy nén lại tệp sơ đồ trang web của bạn (bằng công cụ như gzip), tải tệp đã nén lên trang web và gửi lại.
Sơ đồ trang web rỗng
Sơ đồ trang web của bạn không chứa bất kỳ URL nào. Hãy kiểm tra sơ đồ trang web của bạn và đảm bảo rằng sơ đồ không trống.
Lỗi kích thước tệp sơ đồ trang web: Sơ đồ trang web của bạn vượt quá giới hạn kích thước tệp tối đa.
Sơ đồ trang web của bạn lớn hơn 50MB khi giải nén. Nếu sơ đồ trang web của bạn lớn hơn giới hạn, hãy chia sơ đồ thành nhiều sơ đồ trang web nhỏ hơn và liệt kê chúng trong tệp chỉ mục sơ đồ trang web rồi gửi (các) tệp chỉ mục đó.
Giá trị thuộc tính không hợp lệ
Bạn chỉ định một giá trị không hợp lệ cho thuộc tính thẻ XML. Hãy kiểm tra sơ đồ trang web để đảm bảo rằng chỉ có thuộc tính được phép hiện diện và rằng bạn chỉ gán các giá trị được phép theo thông tin đặc tả của sơ đồ trang web. Bạn cũng nên kiểm tra thuộc tính và giá trị để xem có lỗi chính tả nào không.
Ngày không hợp lệ
Sơ đồ trang web của bạn có chứa một hoặc nhiều giá trị ngày không hợp lệ. Lỗi này có thể là vì ngày có định dạng không đúng hoặc ngày không hợp lệ. Giá trị ngày phải sử dụng Chuẩn mã hoá ngày giờ W3C, mặc dù bạn có thể bỏ qua phần giờ. Hãy đảm bảo rằng ngày của bạn khớp với một trong các định dạng ngày giờ W3C sau:
2005-02-21 2005-02-21T18:00:15+00:00
Bạn không bắt buộc phải chỉ định thời gian (thời gian mặc định là 00:00:00Z), nhưng nếu chỉ định thời gian thì bạn cũng phải xác định múi giờ.
Giá trị thẻ không hợp lệ
Sơ đồ trang web của bạn chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Kiểm tra đặc tả cho loại sơ đồ trang web của bạn (chỉ mục, tiêu chuẩn, video, v.v.).
URL không hợp lệ
Một URL trong sơ đồ trang web của bạn không hợp lệ. Lỗi này có thể là vì URL có chứa ký tự không được hỗ trợ, khoảng trắng hoặc các ký tự khác như dấu ngoặc kép hoặc có thể có định dạng không chính xác (ví dụ: htp://
thay vì http://
).
Hãy đảm bảo rằng các URL có trong sơ đồ trang web của bạn đều được mã hoá để dễ đọc và thoát đúng cách. Bạn nên kiểm tra xem có ký tự không đúng nào như khoảng trắng hay dấu ngoặc kép hay không. Bạn cũng có thể thử sao chép URL vào một trình duyệt để xem trình duyệt đó có thể hiểu được URL này và tải được trang không.
URL không hợp lệ trong tệp chỉ mục sơ đồ trang web: URL không đầy đủ
Tệp chỉ mục sơ đồ trang web của bạn không bao gồm URL đầy đủ cho mỗi tệp sơ đồ trang web trong chỉ mục. Khi thấy tệp chỉ mục sơ đồ trang web, chúng tôi sẽ tìm các tệp mà chỉ mục tham chiếu trong cùng thư mục đó. Ví dụ: nếu tệp chỉ mục sơ đồ trang web của bạn là http://www.example.com/folder1/sitemap_index.xml
và liệt kê một sơ đồ trang web là sitemap.xml
(không có /
ở đầu), thì chúng tôi sẽ tìm sơ đồ trang web này tại http://www.example.com/folder1/sitemap.xml
. Nếu chúng tôi không tìm thấy sơ đồ trang web tại đó, bạn sẽ thấy lỗi này.
Hãy cập nhật tệp chỉ mục sơ đồ trang web để bao gồm cả đường dẫn đầy đủ đến từng tệp sơ đồ trang web được liệt kê, sau đó gửi lại.
XML Không hợp lệ: quá nhiều thẻ
Sơ đồ trang web của bạn chứa các thẻ trùng lặp. Ví dụ: mục sau đây sẽ gây ra lỗi này vì thẻ <loc> được liệt kê hai lần:
<url> <loc>http://www.example.com/</loc> <loc>http://www.example.com/page1.html</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url>
Thông báo lỗi cho biết thẻ có vấn đề và số dòng. Hãy xóa thẻ trùng lặp và gửi lại sơ đồ trang web của bạn.
Thiếu thuộc tính XML
Một thẻ trong sơ đồ trang web của bạn bị thiếu một thuộc tính bắt buộc. Kiểm tra sơ đồ trang web của bạn để đảm bảo rằng không có thuộc tính bắt buộc nào bị thiếu. Khi bạn đã sửa giá trị thuộc tính, hãy gửi lại sơ đồ trang web của bạn.Thiếu thẻ XML
Ít nhất một mục trong sơ đồ trang web của bạn thiếu một thẻ bắt buộc. Thông báo lỗi sẽ liệt kê số dòng. Hãy xem lại trang kiến thức cơ bản về sơ đồ trang web để biết thông tin về thẻ bắt buộc.
Thiếu URL của hình thu nhỏ
Ít nhất một mục video bị thiếu URL của hình thu nhỏ. Hãy nhờ xác định vị trí của URL của mọi hình thu nhỏ bằng cách sử dụng thẻ <video:thumbnail_loc>.
Thiếu tiêu đề video
Ít nhất một mục video bị thiếu tiêu đề. Hãy đảm bảo mỗi video trong sơ đồ trang web của bạn đều có tiêu đề, được xác định trong thẻ <video:title>.
Định dạng chỉ mục sơ đồ trang web không chính xác: Các chỉ mục sơ đồ trang web ở dạng lồng ghép
Một hoặc nhiều mục nhập trong tệp chỉ mục sơ đồ trang web của bạn sử dụng URL của riêng mục dod hoặc URL của một tệp chỉ mục sơ đồ trang web khác. Một tệp chỉ mục sơ đồ trang web chỉ được liệt kê các tệp sơ đồ trang web, không được liệt kê các tệp chỉ mục sơ đồ trang web khác.
Xóa bất kỳ mục nhập nào trỏ đến tệp chỉ mục sơ đồ trang web rồi gửi lại sơ đồ trang web của bạn.Lỗi phân tích cú pháp
Google không phân tích được cú pháp XML của sơ đồ trang web.
Thường thì vấn đề này do một ký tự không thoát trong URL gây ra. Cũng như đối với mọi tệp XML, tất cả giá trị dữ liệu (bao gồm cả URL) đều phải dùng mã thoát của thực thể cho một số ký tự cụ thể, chẳng hạn như các ký hiệu & ' " < >. Hãy đảm bảo rằng URL của bạn được thoát đúng cách.
Lỗi tạm thời
Hệ thống của chúng tôi gặp phải vấn đề tạm thời ngăn chúng tôi xử lý sơ đồ trang web của bạn. Nói chung, khi bạn thấy lỗi này, bạn không cần phải gửi lại sơ đồ trang web của bạn. Google có thể cố gắng truy xuất lại sơ đồ trang web của bạn sau này. Nếu lỗi vẫn tồn tại sau vài giờ, hãy thử gửi lại sơ đồ trang web.
Có quá nhiều sơ đồ trang web
Tệp chỉ mục sơ đồ trang web của bạn liệt kê hơn 50.000 sơ đồ trang web. Hãy tách chỉ mục sơ đồ trang web thành nhiều tệp chỉ mục sơ đồ trang web và đảm bảo rằng mỗi danh sách có không quá 50.000 sơ đồ trang web.
Có quá nhiều URL
Sơ đồ trang web của bạn liệt kê hơn 50.000 URL. Hãy tách sơ đồ trang web thành nhiều sơ đồ trang web và đảm bảo rằng mỗi sơ đồ chứa không quá 50.000 URL. Bạn cũng có thể sử dụng tệp chỉ mục sơ đồ trang web để quản lý sơ đồ của mình.
Định dạng không được hỗ trợ
Sơ đồ trang web của bạn không có định dạng được hỗ trợ.
Một số lỗi XML thường gặp:
- Sơ đồ trang web của bạn phải sử dụng tiêu đề chính xác. Ví dụ: nếu có chứa thông tin video thì sơ đồ trang web sẽ có tiêu đề như sau:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
- Vùng chứa tên trong tiêu đề phải là "http://www.sitemaps.org/schemas/sitemap/0.9" (không phải .9).
- Tất cả thuộc tính XML phải nằm trong dấu nháy đơn (') hoặc dấu ngoặc kép (") và dấu ngoặc kép đó phải là dấu thẳng thay vì dấu móc. Chương trình xử lý văn bản như Microsoft Word có thể chèn dấu ngoặc móc.
Đường dẫn không khớp: Thiếu www
Đường dẫn tới sơ đồ trang web không chứa tiền tố www
(ví dụ: http://example.com/sitemap.xml
), nhưng URL trong sơ đồ trang web lại có tiền tố đó (ví dụ: http://www.example.com/myfile.html
).
Hãy sửa đổi sơ đồ trang web của bạn để xóa "www" khỏi tất cả các URL nhằm khớp với vị trí sơ đồ trang web.
Đường dẫn không khớp: Bao gồm www
Đường dẫn tới sơ đồ trang web chứa tiền tố www
(ví dụ: http://www.example.com/sitemap.xml
), nhưng URL trong sơ đồ trang web lại không có tiền tố đó (ví dụ: http://example.com/myfile.xml
).
Hãy sửa đổi sơ đồ trang web của bạn để thêm "www" vào tất cả các URL nhằm khớp với vị trí sơ đồ trang web.
Không gian tên không chính xác
Thành phần gốc của sơ đồ trang web không có không gian tên chính xác, hoặc không gian tên bị khai báo sai, có lỗi chính tả hoặc URL không chính xác.
Đảm bảo rằng bạn đang sử dụng vùng chứa tên chính xác cho loại tệp của bạn. Ví dụ:
- Tệp sơ đồ trang web:
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
- Tệp sơ đồ trang web dành cho video:
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
- Tệp chỉ mục sơ đồ trang web:
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
- Các loại sơ đồ trang web khác...
Bắt đầu bằng khoảng trắng
Sơ đồ trang web của bạn bắt đầu bằng khoảng trắng, thay vì phần khai báo về vùng chứa tên. Tệp XML phải bắt đầu bằng phần khai báo về XML nhằm xác định phiên bản XML được sử dụng.
Lỗi này sẽ không ngăn Google xử lý sơ đồ trang web của bạn, nhưng bạn nên xóa khoảng trắng để các tệp tuân theo chuẩn XML và bạn không còn thấy lỗi này.
Lỗi HTTP [mã cụ thể]
Google gặp lỗi HTTP cấp 400 khi cố gắng tải sơ đồ trang web xuống. Thông báo này cho thấy mã trạng thái chúng tôi nhận được (ví dụ: 404). Hãy đảm bảo rằng URL của sơ đồ trang web mà bạn chỉ định là chính xác và sơ đồ trang web đó ở đúng vị trí bạn chỉ định. Sau đó, hãy gửi lại sơ đồ trang web.
Lỗi HTTP chung
Google gặp một lỗi HTTP khác không thuộc danh sách lỗi nêu ở đây. Bạn có thể thử kiểm tra URL đang hoạt động để tái tạo lỗi đó, mặc dù có thể lỗi đó chỉ là tạm thời. Hãy đợi một lát rồi xem Google có tiếp tục gặp lỗi này trong các lần thu thập dữ liệu khác hay không.
Hình thu nhỏ quá lớn
Hình thu nhỏ video được xác định trong sơ đồ trang web có kích thước quá lớn. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn với thông tin mới rồi gửi lại. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.
Hình thu nhỏ quá nhỏ
Hình thu nhỏ video được xác định trong sơ đồ trang web có kích thước quá nhỏ. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn nếu cần thiết. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.
Vị trí video và vị trí trang phát giống nhau
Trong một sơ đồ trang web dành cho video, URL của nội dung video và URL của trình phát không được giống nhau. Nếu bạn cung cấp cả <video:player_loc>
và <video:content_loc>
thì các URL phải khác nhau. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.
URL của vị trí video có vẻ là URL của trang phát
Trong sơ đồ trang web dành cho video, URL <video:content_loc>
trỏ đến trang chứa trình phát. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.
Sơ đồ trang web chứa các URL bị tệp robots.txt chặn
Google không truy cập được sơ đồ trang web của bạn, hoặc không truy cập được tất cả nội dung có trong sơ đồ trang web của bạn vì bị tệp robots.txt chặn. Hãy sử dụng Công cụ kiểm tra URL để xác nhận tệp nào đang bị chặn và sửa đổi tệp robots.txt của bạn để cho phép Googlebot truy cập vào tệp đó.