Quản lý sơ đồ trang web bằng báo cáo Sơ đồ trang web

Bạn có thể dùng báo cáo Sơ đồ trang web để cho Google biết mọi sơ đồ trang web mới của tài sản, xem nhật ký gửi sơ đồ trang web cũng như xem mọi lỗi mà Google gặp phải khi phân tích cú pháp của sơ đồ trang web bạn gửi.

Mở báo cáo Sơ đồ trang web

 

Sơ đồ trang web là gì? Tôi có cần báo cáo này không?

Sơ đồ trang web là một tệp nằm trên trang web của bạn. Tệp này cho Google biết những trang mà Google nên tìm hiểu trên trang web của bạn.

  • Nếu bạn đang dùng một dịch vụ lưu trữ web như Squarespace hoặc Wix, thì có thể dịch vụ đó sẽ quản lý sơ đồ trang web cho bạn. Trong trường hợp đó, bạn không cần tạo sơ đồ trang web riêng hoặc dùng báo cáo này. Hãy tìm kiếm thông tin của nhà cung cấp dịch vụ lưu trữ đó về sơ đồ trang web.
  • Nếu bạn có một trang web nhỏ (ít hơn 100 trang) và có thể truy cập trang bất kỳ trên trang web của mình qua một hoặc vài đường liên kết trên trang chủ, thì bạn có lẽ không cần dùng sơ đồ trang web hoặc báo cáo này. Trong trường hợp đó, bạn chỉ cần yêu cầu lập chỉ mục trang chủ (hoặc không cần làm gì nếu bạn đang dùng một dịch vụ lưu trữ web, như đã đề cập trước đó).

Tìm hiểu thêm về sơ đồ trang web.

Quản lý sơ đồ trang web của bạn

Sitemaps API
Bạn cũng có thể dùng Search Console Sitemaps API để quản lý sơ đồ trang web. API đó cung cấp mọi chức năng và thông tin giống như báo cáo này.
Gửi sơ đồ trang web
Hành động "gửi" sơ đồ trang web có nghĩa là cho Google biết vị trí của tệp sơ đồ trang web trên trang web của bạn. Trong thực tế, bạn không thể tải sơ đồ trang web lên Google.

Cách gửi sơ đồ trang web mới cho mục đích thu thập dữ liệu:

  1. Bạn phải có quyền của chủ sở hữu đối với một tài sản thì mới có thể gửi sơ đồ trang web bằng báo cáo Sơ đồ trang web. Nếu không có quyền của chủ sở hữu, bạn có thể liệt kê sơ đồ trang web trong tệp robots.txt thay vì gửi sơ đồ đó trong báo cáo này.
  2. Đăng sơ đồ trang web trên trang web của bạn.
    • Sơ đồ trang web phải sử dụng một trong các định dạng được chấp nhận. Hãy tuân theo nguyên tắc về sơ đồ trang web đối với cú pháp, vị trí tệp, v.v.
    • Bạn nên đặt sơ đồ trang web ở thư mục gốc của trang web. Tuy nhiên, nếu đang dùng một dịch vụ lưu trữ trang web (như Blogger, Wix hay GoDaddy) thì bạn nên đọc tài liệu của dịch vụ đó để tìm hiểu vị trí và cách đăng sơ đồ trang web (hoặc liệu bạn có cần làm việc đó hay không).
    • Dùng trình tạo sơ đồ trang web XML để tạo sơ đồ trang web cũng như kiểm tra lỗi cú pháp trong sơ đồ trang web.
  3. Kiểm tra để đảm bảo rằng Google truy cập được sơ đồ trang web. Googlebot phải truy cập được vào sơ đồ trang web và sơ đồ không bị chặn bởi bất kỳ yêu cầu đăng nhập nào. Bạn có thể kiểm tra xem Googlebot có truy cập được sơ đồ trang web hay không bằng cách chạy công cụ kiểm tra URL đang hoạt động và kiểm tra để đảm bảo Tìm nạp trang "Thành công".
  4. Mở báo cáo Sơ đồ trang web, sao chép URL mà bạn đã kiểm tra ở bước 3, dán URL đó vào hộp Thêm sơ đồ trang web mới trong báo cáo Sơ đồ trang web, rồi nhấp vào Gửi.
  5. Hệ thống sẽ tìm nạp sơ đồ trang web ngay lập tức. Tuy nhiên, có thể mất một thời gian để Google thu thập dữ liệu các URL có trong sơ đồ trang web. Có thể chúng tôi sẽ không thu thập một số URL trong sơ đồ, tuỳ thuộc vào kích thước trang web, hoạt động, lưu lượng truy cập, v.v.
  6. Nếu trạng thái sơ đồ trang web là không Thành công, hãy nhấp vào hàng tương ứng trong báo cáo để tìm thông tin chi tiết về lỗi và đọc về các lỗi bên dưới.

Hãy định kỳ kiểm tra lại để xác nhận xem Google có thể tìm nạp và xử lý sơ đồ trang web của bạn hay không.

Gửi lại sơ đồ trang web

Sau khi thu thập thành công dữ liệu của một sơ đồ trang web, Google sẽ định kỳ thu thập lại dữ liệu của sơ đồ trang web đó theo một tốc độ không liên quan đến quy trình thu thập dữ liệu trang web thông thường.
Nếu thực hiện các thay đổi lớn đối với một sơ đồ trang web thì bạn nên gửi lại sơ đồ trang web bằng một yêu cầu mới. Ngược lại, nếu sơ đồ trang web của bạn không có các bản cập nhật thiết yếu phải được xử lý ngay lập tức, hãy để Google tuân theo lịch thu thập dữ liệu thông thường.
Khi tìm nạp sơ đồ trang web không thành công (dù là theo yêu cầu đầu tiên hay sau một lần thu thập lại dữ liệu theo lịch sau đó), Google sẽ thử lại trong vài ngày rồi ngừng lại nếu tiếp tục không truy cập được sơ đồ trang web đó hoặc sơ đồ trang web đó gặp lỗi nghiêm trọng. Trong trường hợp này, bạn nên khắc phục vấn đề rồi gửi lại sơ đồ trang web bằng một yêu cầu mới. Trạng thái của lần thu thập dữ liệu mới nhất đối với mỗi yêu cầu được trình bày trong báo cáo.

Xoá sơ đồ trang web

Việc xoá một sơ đồ trang web sẽ xoá sơ đồ trang web đó khỏi báo cáo này, nhưng Google sẽ không quên sơ đồ trang web đó hay bất kỳ URL nào có trong đó. Nếu muốn Google dừng việc truy cập các URL có trong sơ đồ trang web thì bạn sẽ phải dùng quy tắc trong tệp robots.txt.

Cách xoá sơ đồ trang web khỏi báo cáo:

  1. Trong bảng trên báo cáo Sơ đồ trang web chính, hãy tìm rồi nhấp vào sơ đồ trang web bạn muốn xoá.
  2. Trong trang chi tiết về sơ đồ trang web, hãy nhấp vào nút tuỳ chọn khác Xem thêm
  3. Nhấp vào Xoá sơ đồ trang web.
  4. Để ngăn Google tiếp tục truy cập sơ đồ trang web hay URL nào đó có trong sơ đồ trang web, hãy dùng phương pháp bất kỳ sau đây cho sơ đồ trang web hoặc URL của trang:

Lịch thu thập dữ liệu sơ đồ trang web

Google sẽ cố gắng thu thập dữ liệu sơ đồ trang web ngay khi bạn gửi. Nếu yêu cầu thành công thì Google sẽ tiếp tục thu thập lại dữ liệu sơ đồ trang web ở tốc độ độc lập với lịch thu thập dữ liệu trang web.

Nếu tìm nạp hoặc phân tích sơ đồ trang web không thành công thì Google sẽ tiếp tục cố gắng tìm nạp và xử lý sơ đồ trang web trong vài ngày. Nếu các lần thử vẫn tiếp tục không thành công thì Google sẽ ngừng cố gắng thu thập dữ liệu trên URL đó. Các vấn đề ảnh hưởng đến những URL riêng lẻ trong sơ đồ trang web sẽ không ngăn Google tiếp tục đọc sơ đồ trang web, miễn là nhìn chung thì vẫn tìm nạp và đọc được sơ đồ trang web.

Đọc báo cáo

  1. Trên trang báo cáo Sơ đồ trang web cấp cao nhất, hãy xem trạng thái yêu cầu của Google đối với mọi sơ đồ trang web đã gửi bằng báo cáo này hoặc API. Báo cáo này cho biết trạng thái của yêu cầu gần đây nhất đối với mỗi sơ đồ trang web. Mỗi sơ đồ trang web sẽ có một trong các giá trị sau đây, cho thấy trạng thái của yêu cầu gần nhất:
    1. Thành công: Google đã tìm nạp và đọc sơ đồ trang web mà không gặp bất kỳ lỗi nào.
    2. Không thể tìm nạp: Google không tìm nạp được sơ đồ trang web.
    3. Sơ đồ trang web có X lỗi: Có thể tìm nạp và đọc được một phần sơ đồ trang web nhưng gặp một số lỗi.
  2. Hãy nhấp vào một sơ đồ trang web cụ thể để xem trang chi tiết về thông tin về sơ đồ trang web và yêu cầu.
    • Nếu trang chi tiết cho biết Không thể đọc sơ đồ trang web, thì hoạt động tìm nạp không thành công vì một trong những lý do này, như cho thấy trên trang chi tiết. Hãy mở rộng phần bên dưới lỗi để xem thêm thông tin chi tiết. Hãy cố gắng khắc phục vấn đề đó rồi gửi lại sơ đồ trang web vào báo cáo. Nếu tìm nạp sơ đồ trang web không thành công thì Google sẽ thử thêm vài lần nữa nhưng cuối cùng cũng sẽ dừng đọc sơ đồ trang web đó.
    • Nếu trang chi tiết thông báo Sơ đồ trang web có thể đọc được, nhưng có lỗi, bạn sẽ thấy danh sách lỗi trên trang chi tiết cho sơ đồ trang web đó. Hãy mở rộng phần bên dưới lỗi để xem thêm thông tin chi tiết về lỗi. Đọc tại đây để tìm hiểu thêm về những lỗi này và cách khắc phục.

Lưu ý quan trọng:

  • Báo cáo này chỉ cho thấy các sơ đồ trang web mà bạn gửi bằng cách sử dụng báo cáo này hoặc API. Báo cáo này không cho thấy bất kỳ sơ đồ trang web nào mà Google phát hiện được thông qua việc tham chiếu tệp robots.txt hoặc các phương thức khám phá khác. Tuy nhiên, ngay cả khi Google đã phát hiện ra sơ đồ trang web thông qua các phương thức khác, bạn vẫn có thể gửi sơ đồ đó bằng báo cáo này để theo dõi tỷ lệ thành công và lỗi.
  • Báo cáo chỉ cho thấy các sơ đồ trang web trong tài sản hiện tại. Nếu bạn không thấy sơ đồ trang web mà mình mong muốn, hãy đảm bảo rằng bạn không nhầm lẫn giữa các tài sản http/https hoặc www/không có www.
  • Sau một số lần thử nhưng vẫn không tìm nạp được sơ đồ trang web, Google sẽ dừng đọc sơ đồ trang web đó. Bạn nên sửa lỗi rồi gửi lại sơ đồ trang web.
  • Nếu có thể đọc được sơ đồ trang web thì Google sẽ ghi nhớ thông tin đó. Việc một sơ đồ trang web không thành công hoặc không đọc được sau này sẽ không khiến Google "quên" thông tin trong các lần đọc trước. Tuy nhiên, thông tin mới về một URL nào đó sẽ thay thế thông tin cũ về chính URL đó.
  • Bạn có thể gửi URL cho hình ảnh, video, hoặc tin tức trong sơ đồ trang web. Tuy nhiên, báo cáo này hiện không cho thấy bất kỳ dữ liệu nào cho các loại URL đó.
  • Báo cáo này có thể cho thấy tối đa 1.000 yêu cầu đã gửi. Bạn có thể gửi thêm yêu cầu khác, nhưng báo cáo này vẫn chỉ có thể cho thấy 1.000 yêu cầu (không theo thứ tự gửi). Hiện tại, bạn không có cách nào để xem các yêu cầu khác trong Search Console.

 

Thông tin sau đây được trình bày cho từng sơ đồ trang web:

URL Sơ đồ trang web
URL chính xác được chỉ định khi bạn gửi sơ đồ trang web. Không tuân theo lệnh chuyển hướng. Chỉ những sơ đồ trang web được gửi bằng báo cáo này hoặc API mới xuất hiện tại đây.
Loại
Loại sơ đồ trang web. Các giá trị có thể là:
Ngày gửi
Ngày gần đây nhất mà sơ đồ trang web được gửi cho Google bằng báo cáo này.
Lần đọc gần nhất
Lần gần đây nhất mà Google tìm nạp sơ đồ trang web này. Thông tin này chỉ xuất hiện nếu Google có thể tìm nạp được sơ đồ trang web.
Trạng thái
Trạng thái của lần thu thập dữ liệu gần đây nhất. Các giá trị có thể là:
  • Thành công: Google đã tải và xử lý sơ đồ trang web thành công mà không gặp lỗi nào. Tất cả URL đều sẽ được đưa vào danh sách chờ thu thập dữ liệu.
  • Có lỗi: Sơ đồ trang web tìm nạp được nhưng có ít nhất một lỗi. Mọi URL có thể phân tích cú pháp mà không gặp lỗi trong sơ đồ trang web sẽ được đưa vào hàng đợi thu thập dữ liệu. Hãy nhấp vào sơ đồ trang web trong bảng để xem danh sách lỗi kèm theo thông tin chi tiết tương ứng. Xem phần mô tả đầy đủ về lỗi phân tích cú pháp bên dưới.
  • Không thể tìm nạp: Không thể tìm nạp sơ đồ trang web vì một nguyên nhân chưa xác định. Xem cách khắc phục lỗi tìm nạp.
Các trang đã được khám phá
Số lượng URL trang được phân tích cú pháp qua sơ đồ trang web. Nếu đây là chỉ mục sơ đồ trang web thì số này là tổng số URL trong tất cả sơ đồ trang web con. Các URL trùng lặp chỉ được tính một lần. Google không đảm bảo rằng Google đã thu thập dữ liệu hoặc lập chỉ mục một URL trang nào đó trong sơ đồ trang web. Bạn có thể lọc báo cáo Lập chỉ mục trang theo sơ đồ trang web để xem Google đã lập chỉ mục bao nhiêu URL trang trong sơ đồ trang web này.
Các video đã được khám phá
Số lượng URL video được phân tích cú pháp qua sơ đồ trang web. Điều này không đảm bảo rằng Google đã hoặc sẽ thu thập dữ liệu hoặc lập chỉ mục các URL này. Bạn có thể lọc báo cáo Lập chỉ mục trang video theo sơ đồ trang web để xem số lượng URL trang trong sơ đồ trang web đó có một video đã được lập chỉ mục. Hãy lưu ý rằng Search Console không cho biết liệu URL video khác trên trang có được lập chỉ mục hay không. Từng sơ đồ trang web trong danh sách này sẽ liên kết đến báo cáo Lập chỉ mục trang video nếu sơ đồ đó chứa trang bất kỳ đã được lập chỉ mục và chứa video bất kỳ mà Google đã thu thập dữ liệu.
Xem trạng thái lập chỉ mục
Hãy nhấp để mở một báo cáo trình bày trạng thái lập chỉ mục của tất cả URL trong sơ đồ trang web này. Đối với chỉ mục sơ đồ trang web, chỉ mục sẽ bao gồm tất cả URL được liệt kê trong sơ đồ trang web con bất kỳ.

 

Sơ đồ trang web của tôi không có trong báo cáo!

Dưới đây là một vài lý do mà sơ đồ trang web của bạn có thể không được liệt kê trong báo cáo:

  • Sơ đồ nằm trên một sản phẩm khác. Các sơ đồ trang web liên kết với một tài sản sẽ không xuất hiện trên tài sản khác. Do đó, sơ đồ trang web bạn đã gửi cho trang web http://example.com sẽ không xuất hiện trong báo cáo Sơ đồ trang web cho http://m.example.com hoặc https://example.com. Để giải quyết vấn đề này, hãy đảm bảo rằng bạn đã thêm tất cả phiên bản của trang web.
  • Bạn chưa gửi sơ đồ trang web bằng báo cáo này hoặc API. Chỉ những sơ đồ trang web được gửi bằng báo cáo này hoặc Search Console API mới được liệt kê; các sơ đồ trang web được tìm thấy hoặc gửi bằng các phương pháp khác sẽ không xuất hiện, ngay cả khi Google có thể tìm thấy và sử dụng chúng.

Lỗi sơ đồ trang web

Báo cáo sơ đồ trang web cung cấp thông tin về các lỗi sau đây. Danh sách này tuy chưa đầy đủ nhưng đủ dài và bao gồm hầu hết lỗi mà bạn có thể thấy.

Lỗi tìm nạp sơ đồ trang web
Nếu trạng thái sơ đồ trang web là Không thể tìm nạp trên trang Sơ đồ trang web cấp cao nhất, thì tức là Google không thể truy xuất tệp sơ đồ trang web đó. Có nhiều nguyên nhân khả dĩ như sau:
  • Tệp robots.txt đã chặn sơ đồ trang web. Google tuân theo tệp robots.txt khi tìm nạp sơ đồ trang web. Bạn phải xoá quy tắc ngăn Google tìm nạp sơ đồ trang web của mình.
  • Trang web của bạn bị áp dụng biện pháp thủ công. Sơ đồ trang web không được đọc khi trang web bị áp dụng biện pháp thủ công nhưng chưa giải quyết. Xem báo cáo về biện pháp thủ công. Hãy khắc phục vấn đề rồi gửi lại sơ đồ trang web.
  • Cung cấp URL không chính xác cho sơ đồ trang web (Lỗi HTTP 404: không tìm thấy sơ đồ trang web tại địa chỉ đã cung cấp). Hãy thử truy cập URL trong trình duyệt của bạn để xem URL đó có tồn tại hay không.
  • Một số lỗi chung khác: Đôi khi, có các lỗi khác có thể ngăn Google truy xuất sơ đồ trang web qua trang web của bạn, chẳng hạn như máy chủ không truy cập được. Một số lỗi trong số này có thể là tạm thời: hãy đợi một chút và xem Google có tiếp tục gặp lỗi này trong các lần thu thập dữ liệu sau này hay không.

Gỡ lỗi tìm nạp

  1. Nhấp vào sơ đồ trang web trong danh sách để xem thông tin chi tiết về yêu cầu tìm nạp gần đây nhất.
  2. Nhấp vào tên lỗi trong trang chi tiết để xem thêm chi tiết về lỗi.
  3. Xác nhận lỗi trong Công cụ kiểm tra URL:
    1. Sao chép URL của sơ đồ trang web trên trang chi tiết về báo cáo Sơ đồ trang web.
    2. Dán URL vào Công cụ kiểm tra URL rồi nhấn Enter.
    3. Nhấp vào Kiểm tra phiên bản hoạt động trong Công cụ kiểm tra URL.
    4. Mở rộng phần Khả năng lập chỉ mục trang để xem lý do Google không tìm nạp được sơ đồ trang web. Bạn có thể tìm thấy thông tin về tất cả các trường tại đây, nhưng về cơ bản, bạn nên xem phần Được phép thu thập dữ liệu? = "Có", Tìm nạp trang = "Thành công".
Lỗi phân tích cú pháp sơ đồ trang web

Có thể xảy ra các lỗi sau đây khi xử lý sơ đồ trang web đã tìm nạp:

URL không truy cập được

Google đã gặp lỗi khi cố thu thập dữ liệu một URL trong sơ đồ trang web của bạn. Hãy kiểm tra URL trong sơ đồ trang web bằng cách sử dụng Công cụ kiểm tra URL để biết Google có thể truy cập được URL này hay không.

URL không theo dõi được

Google không thể thu thập dữ liệu tất cả các URL được liệt kê trong sơ đồ trang web của bạn. Dưới đây là một số lý do có thể xảy ra:

  • URL chứa quá nhiều lệnh chuyển hướng khiến trình thu thập dữ liệu web của Google không thể theo toàn bộ lệnh đó. Bạn nên thay thế mọi URL chuyển hướng trong sơ đồ trang web bằng các URL mà bạn thực sự cần Google thu thập dữ liệu.
    • Nếu bạn chuyển hướng vĩnh viễn từ trang này sang trang khác, hãy dùng chuyển hướng vĩnh viễn.
    • Tránh sử dụng chuyển hướng JavaScript hoặc meta-refresh.
  • Google đang gặp vấn đề với các URL tương đối trong sơ đồ trang web của bạn. Nếu có thể, hãy sử dụng đường liên kết tuyệt đối hoặc đầy đủ thay vì đường liên kết tương đối. Ví dụ: khi liên kết đến một trang khác trong trang web của bạn, hãy liên kết đến https://www.example.com/trangwebcuatoi.html thay vì trangwebcuatoi.html.

URL không được phép

Sơ đồ trang web của bạn có cả một số URL ở cấp cao hơn hoặc nằm trên miền khác so với tệp sơ đồ trang web.

Cấp cao hơn: Nếu sơ đồ trang web của bạn nằm tại http://www.example.com/trangwebcuatoi/sodotrangweb.xml, thì các URL sau đây không hợp lệ cho sơ đồ trang web đó:

  • http://www.example.com/ – Cấp cao hơn so với sơ đồ trang web
  • http://www.example.com/trangwebcuaban/ – Trong một thư mục khác thuộc cùng sơ đồ trang web (bạn phải di chuyển lên và xuống để vào thư mục này).

Miền khác: Kiểm tra để đảm bảo tất cả URL đều bắt đầu với cùng một miền như vị trí sơ đồ trang web của bạn. Ví dụ, nếu sơ đồ trang web của bạn nằm tại http://www.example.com/sodotrangweb.xml, thì các URL sau đây không hợp lệ cho sơ đồ trang web đó:

  • http://example.com/ – Thiếu "www"
  • www.example.com/ – Thiếu "http"
  • https://www.example.com/ – Sử dụng https thay vì http

Lỗi nén

Google đã gặp lỗi khi giải nén tệp nén sơ đồ trang web của bạn. Hãy nén lại tệp sơ đồ trang web của bạn (bằng công cụ như gzip), tải tệp đã nén lên trang web rồi gửi lại.

Sơ đồ trang web rỗng

Sơ đồ trang web của bạn không chứa bất kỳ URL nào. Hãy kiểm tra sơ đồ trang web của bạn và đảm bảo rằng sơ đồ không trống.

Lỗi kích thước tệp sơ đồ trang web: Sơ đồ trang web của bạn vượt quá giới hạn kích thước tệp tối đa.

Sơ đồ trang web của bạn lớn hơn 50 MB khi giải nén. Nếu sơ đồ trang web của bạn lớn hơn giới hạn, hãy chia sơ đồ thành nhiều sơ đồ trang web nhỏ hơn và liệt kê chúng trong tệp chỉ mục sơ đồ trang web rồi gửi (các) tệp chỉ mục đó.

Giá trị thuộc tính không hợp lệ

Bạn chỉ định một giá trị không hợp lệ cho thuộc tính thẻ XML. Hãy kiểm tra sơ đồ trang web để đảm bảo rằng chỉ có thuộc tính được phép và rằng bạn chỉ gán các giá trị được phép theo thông tin đặc tả của sơ đồ trang web. Bạn cũng nên kiểm tra thuộc tính và giá trị để xem có lỗi chính tả nào không.

Ngày không hợp lệ

Sơ đồ trang web của bạn có chứa một hoặc nhiều giá trị ngày không hợp lệ. Lỗi này có thể là vì ngày có định dạng không đúng hoặc ngày không hợp lệ. Giá trị ngày phải sử dụng Chuẩn mã hoá ngày giờ W3C, dù vậy bạn có thể bỏ qua phần giờ. Hãy đảm bảo rằng ngày của bạn khớp với một trong các định dạng ngày giờ W3C sau:

2005-02-21 
2005-02-21T18:00:15+00:00

Bạn không bắt buộc phải chỉ định thời gian (thời gian mặc định là 00:00:00Z), nhưng nếu chỉ định thời gian thì bạn cũng phải xác định múi giờ.

Giá trị thẻ không hợp lệ

Sơ đồ trang web của bạn chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Kiểm tra đặc tả cho loại sơ đồ trang web của bạn (chỉ mục, tiêu chuẩn, video, v.v.).

URL không hợp lệ

Một URL trong sơ đồ trang web của bạn không hợp lệ. Lỗi này có thể là vì URL có chứa ký tự không được hỗ trợ, khoảng trắng hoặc các ký tự khác như dấu ngoặc kép hoặc có thể có định dạng không chính xác (ví dụ: htp:// thay vì http://).

Hãy đảm bảo rằng các URL có trong sơ đồ trang web của bạn đều được mã hoá để dễ đọc và thoát đúng cách. Bạn nên kiểm tra xem có ký tự không đúng nào như khoảng trắng hay dấu ngoặc kép hay không. Bạn cũng có thể thử sao chép URL vào một trình duyệt để xem trình duyệt đó có thể hiểu được URL này và tải được trang không.

URL không hợp lệ trong tệp chỉ mục sơ đồ trang web: URL không đầy đủ

Tệp chỉ mục sơ đồ trang web của bạn không bao gồm URL đầy đủ cho mỗi tệp sơ đồ trang web trong chỉ mục. Khi thấy tệp chỉ mục sơ đồ trang web, chúng tôi sẽ tìm các tệp mà chỉ mục tham chiếu trong cùng thư mục đó. Ví dụ: nếu tệp chỉ mục sơ đồ trang web của bạn là http://www.example.com/folder1/sitemap_index.xml và liệt kê một sơ đồ trang web là sitemap.xml (không có / ở đầu), thì chúng tôi sẽ tìm sơ đồ trang web này tại http://www.example.com/folder1/sitemap.xml. Nếu chúng tôi không tìm thấy sơ đồ trang web tại đó, bạn sẽ thấy lỗi này.

Hãy cập nhật tệp chỉ mục sơ đồ trang web để bao gồm cả đường dẫn đầy đủ đến từng tệp sơ đồ trang web được liệt kê, sau đó gửi lại.

XML Không hợp lệ: quá nhiều thẻ

Sơ đồ trang web của bạn chứa các thẻ trùng lặp. Ví dụ: mục sau đây sẽ gây ra lỗi này vì thẻ <loc> được liệt kê hai lần:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/page1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

Thông báo lỗi cho biết thẻ có vấn đề và số dòng. Hãy xoá thẻ trùng lặp rồi gửi lại sơ đồ trang web của bạn.

Thiếu thuộc tính XML

Một thẻ trong sơ đồ trang web của bạn bị thiếu một thuộc tính bắt buộc. Kiểm tra sơ đồ trang web của bạn để đảm bảo rằng không có thuộc tính bắt buộc nào bị thiếu. Khi bạn đã sửa giá trị thuộc tính, hãy gửi lại sơ đồ trang web của bạn.

Thiếu thẻ XML

Ít nhất một mục trong sơ đồ trang web của bạn thiếu một thẻ cần thiết. Thông báo lỗi sẽ liệt kê số dòng. Hãy xem lại trang kiến thức cơ bản về sơ đồ trang web để biết thông tin về thẻ bắt buộc.

Thiếu URL của hình thu nhỏ

Ít nhất một mục video bị thiếu URL của hình thu nhỏ. Hãy nhờ xác định vị trí của URL của mọi hình thu nhỏ bằng cách sử dụng thẻ <video:thumbnail_loc>.

Thiếu tiêu đề video

Ít nhất một mục video bị thiếu tiêu đề. Hãy đảm bảo mỗi video trong sơ đồ trang web của bạn đều có tiêu đề, được xác định trong thẻ <video:title>.

Định dạng chỉ mục sơ đồ trang web không chính xác: Các chỉ mục sơ đồ trang web ở dạng lồng ghép

Một hoặc nhiều mục nhập trong tệp chỉ mục sơ đồ trang web của bạn sử dụng URL của riêng mục dod hoặc URL của một tệp chỉ mục sơ đồ trang web khác. Một tệp chỉ mục sơ đồ trang web chỉ được liệt kê các tệp sơ đồ trang web, không được liệt kê các tệp chỉ mục sơ đồ trang web khác.

Xóa bất kỳ mục nhập nào trỏ đến tệp chỉ mục sơ đồ trang web rồi gửi lại sơ đồ trang web của bạn.

Lỗi phân tích cú pháp

Google không phân tích được cú pháp XML của sơ đồ trang web.

Thường thì vấn đề này do một ký tự không thoát trong URL gây ra. Cũng như đối với mọi tệp XML, tất cả giá trị dữ liệu (bao gồm cả URL) đều phải dùng mã thoát của thực thể cho một số ký tự cụ thể, chẳng hạn như các ký hiệu & ' " < >. Hãy đảm bảo rằng URL của bạn được thoát đúng cách.

Lỗi tạm thời

Hệ thống của chúng tôi gặp phải vấn đề tạm thời ngăn chúng tôi xử lý sơ đồ trang web của bạn. Nói chung, khi thấy lỗi này, bạn không cần phải gửi lại sơ đồ trang web. Google có thể cố gắng truy xuất lại sơ đồ trang web của bạn sau này. Nếu lỗi vẫn tồn tại sau vài giờ, hãy thử gửi lại sơ đồ trang web.

Có quá nhiều sơ đồ trang web

Tệp chỉ mục sơ đồ trang web của bạn liệt kê hơn 50.000 sơ đồ trang web. Hãy tách chỉ mục sơ đồ trang web thành nhiều tệp chỉ mục sơ đồ trang web và đảm bảo rằng mỗi danh sách có không quá 50.000 sơ đồ trang web.

Có quá nhiều URL

Sơ đồ trang web của bạn liệt kê hơn 50.000 URL. Hãy tách sơ đồ trang web thành nhiều sơ đồ trang web và đảm bảo rằng mỗi sơ đồ chứa không quá 50.000 URL. Bạn cũng có thể sử dụng tệp chỉ mục sơ đồ trang web để quản lý sơ đồ của mình.

Định dạng không được hỗ trợ

Sơ đồ trang web của bạn không có định dạng được hỗ trợ.

Một số lỗi XML thường gặp:

  • Sơ đồ trang web của bạn phải sử dụng tiêu đề chính xác. Ví dụ: nếu có chứa thông tin video thì sơ đồ trang web sẽ có tiêu đề như sau:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Vùng chứa tên trong tiêu đề phải là "http://www.sitemaps.org/schemas/sitemap/0.9" (không phải .9).
  • Tất cả thuộc tính XML đều phải nằm trong dấu nháy đơn (') hoặc dấu ngoặc kép (") và dấu ngoặc kép đó phải là dấu thẳng thay vì dấu cong. Chương trình xử lý văn bản như Microsoft Word có thể chèn dấu ngoặc móc.

Đường dẫn không khớp: Thiếu www

Đường dẫn tới sơ đồ trang web không chứa tiền tố www (ví dụ: http://example.com/sitemap.xml), nhưng URL trong sơ đồ trang web lại có tiền tố đó (ví dụ: http://www.example.com/tepcuatoi.html).

Hãy sửa đổi sơ đồ trang web của bạn để xóa "www" khỏi tất cả các URL nhằm khớp với vị trí sơ đồ trang web.

Đường dẫn không khớp: Bao gồm www

Đường dẫn tới sơ đồ trang web chứa tiền tố www (ví dụ: http://www.example.com/sitemap.xml), nhưng URL trong sơ đồ trang web lại không có tiền tố đó (ví dụ: http://example.com/myfile.xml).

Hãy sửa đổi sơ đồ trang web của bạn để thêm "www" vào tất cả các URL nhằm khớp với vị trí sơ đồ trang web.

Không gian tên không chính xác

Thành phần gốc của sơ đồ trang web không có không gian tên chính xác, hoặc không gian tên bị khai báo sai, có lỗi chính tả hoặc URL không chính xác.

Đảm bảo rằng bạn đang sử dụng vùng chứa tên chính xác cho loại tệp của bạn. Ví dụ:

  • Tệp sơ đồ trang web: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Tệp sơ đồ trang web dành cho video: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Tệp chỉ mục sơ đồ trang web: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Các loại sơ đồ trang web khác...

Bắt đầu bằng khoảng trắng

Sơ đồ trang web của bạn bắt đầu bằng khoảng trắng, thay vì phần khai báo về không gian tên. Tệp XML phải bắt đầu bằng phần khai báo về XML nhằm xác định phiên bản XML được sử dụng.

Lỗi này sẽ không ngăn Google xử lý sơ đồ trang web của bạn, nhưng bạn nên xoá khoảng trắng để các tệp tuân theo chuẩn XML và bạn không còn thấy lỗi này.

Lỗi HTTP [mã cụ thể]

Google gặp lỗi HTTP cấp 400 khi cố gắng tải sơ đồ trang web xuống. Thông báo này cho thấy mã trạng thái chúng tôi nhận được (ví dụ: 404). Hãy đảm bảo rằng URL của sơ đồ trang web mà bạn chỉ định là chính xác và sơ đồ trang web đó ở đúng vị trí bạn chỉ định. Sau đó, hãy gửi lại sơ đồ trang web.

Lỗi HTTP chung

Google gặp một lỗi HTTP khác không thuộc danh sách lỗi nêu ở đây. Hãy mở rộng thông tin chi tiết để xem loại lỗi đã xảy ra. Điều này cũng có thể do lỗi 404 (không có trang) gây ra, đây là lỗi tìm nạp.

Hình thu nhỏ quá lớn

Hình thu nhỏ video được xác định trong sơ đồ trang web có kích thước quá lớn. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn với thông tin mới rồi gửi lại. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Hình thu nhỏ quá nhỏ

Hình thu nhỏ video được xác định trong sơ đồ trang web có kích thước quá nhỏ. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn nếu cần thiết. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Vị trí video và vị trí trang phát giống nhau

Trong một sơ đồ trang web dành cho video, URL của nội dung video và URL của trình phát không được giống nhau. Nếu bạn cung cấp cả <video:player_loc><video:content_loc> thì các URL phải khác nhau. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

URL của vị trí video có vẻ là URL của trang phát

Trong sơ đồ trang web dành cho video, URL <video:content_loc> trỏ đến trang chứa trình phát. Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Quá nhiều URL Tin tức

Số URL mở trong tệp sơ đồ trang web vượt quá giới hạn tối đa được ấn định (1.000). Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Thiếu thẻ <publication> 

Mỗi URL trong một sơ đồ trang web Tin tức phải có một thẻ <publication>Tìm hiểu thêm về việc thêm thông tin video vào sơ đồ trang web.

Sơ đồ trang web chứa các URL bị tệp robots.txt chặn

Google không truy cập được sơ đồ trang web của bạn, hoặc không truy cập được tất cả nội dung có trong sơ đồ trang web của bạn vì bị tệp robots.txt chặn. Hãy sử dụng Công cụ kiểm tra URL để xác nhận tệp nào đang bị chặn và sửa đổi tệp robots.txt của bạn để cho phép Googlebot truy cập vào tệp đó.

Thông tin này có hữu ích không?

Chúng tôi có thể cải thiện trang này bằng cách nào?

Bạn cần trợ giúp thêm?

Hãy thử các bước tiếp theo sau:

Tìm kiếm
Xóa nội dung tìm kiếm
Đóng tìm kiếm
Các ứng dụng của Google
Trình đơn chính