Báo cáo Phạm vi lập chỉ mục

Xem Google đã tìm thấy những trang nào trên trang web của bạn, những trang nào đã được lập chỉ mục và quá trình lập chỉ mục đang gặp những vấn đề gì.

BÁO CÁO PHẠM VI LẬP CHỈ MỤC

 

Trạng thái phạm vi lập chỉ mục trong Search Console – Chương trình đào tạo về Google Search Console

Bắt đầu

Không phải chuyên gia

Nếu bạn mới làm quen với khái niệm lập chỉ mục hoặc SEO, vui lòng đọc những hướng dẫn sau đây. Nếu không, bạn có thể không hiểu được báo cáo này.

  1. Tìm hiểu về cách thức hoạt động của Google Tìm kiếm. Nếu bạn chưa hiểu rõ quá trình lập chỉ mục thì báo cáo này sẽ khiến bạn nhầm lẫn hoặc bối rối – chúng tôi chắc chắn như vậy.
  2. Quyết định xem bạn có cần sử dụng báo cáo này hay không. Nếu trang web của bạn có dưới 500 trang thì có lẽ bạn không cần sử dụng báo cáo này. Thay vào đó, hãy sử dụng một trong những cụm từ tìm kiếm sau đây trên Google để xem trang web của bạn đã được lập chỉ mục hay chưa:

    • site:<<đường_dẫn_hoặc_miền_gốc_của_trang_web>> – Xem một tập hợp con những trang mà Google đã biết trên trang web của bạn. Ví dụ: site:example.com hoặc site:example.com/petstore
    • site:<<trang_web_của_bạn>> từ tìm kiếm 1 từ tìm kiếm 2 – Tìm những trang đã được lập chỉ mục và chứa một số cụm từ cụ thể trên trang web của bạn. Ví dụ: site:example.com/petstore iguanas zebras.
    • site:<<url_chính_xác>> – Tìm URL chính xác của một trang trên trang web của bạn để xem Google đã lập chỉ mục trang đó hay chưa. Ví dụ: site:http://example.com/petstore/gerbil
    Nếu bạn không tìm thấy kết quả nào, hãy tham khảo báo cáo này để xác minh xem có đúng là trang web của bạn không có trang nào được lập chỉ mục hay không. Nếu báo cáo này cho biết không có trang nào hợp lệ (hoặc không trang nào có trạng thái), hãy xem phần khắc phục sự cố.
  3. Hãy sử dụng báo cáo này để nắm được trạng thái lập chỉ mục chung của trang web. Đừng sử dụng báo cáo này để đánh giá trạng thái lập chỉ mục của những trang cụ thể. Để xem trạng thái lập chỉ mục của một trang cụ thể, hãy sử dụng Công cụ kiểm tra URL.
  4. Những điểm cần chú ý trong báo cáo này:
    • Đa số URL có màu xanh lục (hợp lệ) và/hoặc màu xám (bị loại trừ)? Trang web của bạn chủ yếu sẽ có các trang hợp lệ và bị loại trừ: Hợp lệ, vì các trang đó nằm trong chỉ mục; Bị loại trừ vì Search Console cho rằng các URL đó bị loại trừ khỏi chỉ mục vì một lý do mà bạn có thể đồng ý.
    • Có rất ít (nếu có) URL màu đỏ (lỗi)? Hầu như URL lỗi lúc nào cũng là vấn đề. Tuy nhiên, thời gian bạn muốn dành ra để sửa lỗi lập chỉ mục phụ thuộc vào mức độ quan trọng của trang đó đối với trang web của bạn.
    • Lý do khiến URL màu xám (bị loại trừ) bị loại trừ có giống như bạn nghĩ không? URL bị loại trừ sẽ không được lập chỉ mục, nhưng chúng tôi nghĩ rằng có thể URL đó không bị lỗi. Có lý do bị loại trừ tức là có lý do rõ ràng khiến trang bị chặn (ví dụ: do một quy tắc trong tệp robots.txt trên trang web của bạn hoặc do một thẻ noindex trên trang đó). Các trang trùng lặp cũng sẽ bị loại trừ (Google chỉ lập chỉ mục một phiên bản của một nhóm các trang trùng lặp). Hãy đảm bảo rằng các trang của bạn bị loại trừ vì các lý do chấp nhận được. Nếu không, hãy khắc phục những trang đó theo tài liệu dành cho trạng thái bị loại trừ cụ thể.
    • Google có lập chỉ mục những URL quan trọng nhất trên trang web của bạn không? Báo cáo Phạm vi lập chỉ mục không dùng để kiểm tra các URL riêng lẻ. Tuy vậy, bạn có thể lọc kết quả để chỉ hiển thị những URL hợp lệ, rồi xem những URL quan trọng của bạn có được liệt kê không. (Xin lưu ý rằng danh sách URL mẫu trong báo cáo này chỉ chứa tối đa 1.000 mục và chúng tôi không đảm bảo rằng tất cả URL có trạng thái cụ thể đều xuất hiện, ngay cả khi có dưới 1.000 mục trong danh sách). Hãy kiểm tra trạng thái lập chỉ mục của trang chủ và các trang chính bằng Công cụ kiểm tra URL.
    • Google có tìm thấy phần lớn các URL của bạn không? Báo cáo này thể hiện tất cả URL mà Google đã biết trên trang web của bạn, cho dù các URL đó có được lập chỉ mục hay không. Nếu tổng số URL trong báo cáo này nhỏ hơn nhiều so với số lượng trang trên trang web của bạn, thì tức là Google không tìm thấy các trang trên trang web của bạn. Nguyên nhân của vấn đề này có thể là:
      • Những trang đó hoặc trang web của bạn mới được tạo. Có thể mất khoảng một tuần để Google bắt đầu thu thập dữ liệu và lập chỉ mục một trang hoặc trang web mới. Nếu trang web hoặc trang của bạn mới được tạo, hãy chờ một chút thời gian để Google tìm và thu thập dữ liệu trên trang đó. Trong tình huống khẩn cấp hoặc nếu việc chờ đợi có vẻ không hiệu quả, bạn có thể đưa ra yêu cầu rõ ràng để Google thu thập dữ liệu trên các trang riêng lẻ.
      • Google không tìm thấy những trang đó. Những trang đó nên được liên kết với những nơi mà Google đã biết, tức là trên các trang đã biết khác, ví dụ như: trang chủ, các trang đã biết khác trên trang web của bạn, các trang web khác hoặc sơ đồ trang web. Đối với một trang web mới, bước đầu tiên phù hợp nhất là yêu cầu lập chỉ mục trang chủ. Khi đó, Google sẽ bắt đầu thu thập dữ liệu trên trang web của bạn. Đối với những phần bị thiếu trên một trang web, hãy đảm bảo rằng những phần đó được liên kết đúng cách. Nếu bạn đang sử dụng một dịch vụ lưu trữ trang web chẳng hạn như Wix hoặc SquareSpace, hãy xem tài liệu của nhà cung cấp dịch vụ lưu trữ trang web để tìm hiểu cách xuất bản các trang của bạn và giúp các công cụ tìm kiếm tìm được các trang đó.
    • Đọc tài liệu về loại trạng thái cụ thể của bạn để nắm được lý do và mọi đề xuất khắc phục có thể áp dụng cho một trạng thái cụ thể. Việc đọc tài liệu có thể không mấy thú vị, nhưng sẽ giúp bạn tiết kiệm thời gian về lâu dài.
  5. Kết quả không nên mong đợi:
    • Đừng mong đợi Google sẽ lập chỉ mục mọi URL trên trang web của bạn. Một số URL có thể bị trùng lặp hoặc không cần thiết lập chỉ mục nếu chúng không chứa thông tin có ý nghĩa.
    • Thường thì các URL bị loại trừ đều không có vấn đề gì. Hãy đọc và tìm hiểu lý do cụ thể của từng URL bị loại trừ để chắc chắn rằng lý do loại trừ trang là thỏa đáng.
    • Bạn nên khắc phục các URL lỗi; hãy đọc lý do gặp lỗi để nắm được vấn đề và cách khắc phục.
    • Theo Google, các số liệu về tổng phạm vi trên biểu đồ là đầy đủ và chính xác, nhưng không phải lúc nào những số liệu đó cũng khớp chính xác với số URL ước tính trên trang web của bạn. Có thể có một số khác biệt nhỏ vì nhiều lý do.
    • Một trang đã được lập chỉ mục cũng chưa chắc sẽ xuất hiện trong kết quả tìm kiếm. Kết quả tìm kiếm được điều chỉnh theo nhật ký tìm kiếm, vị trí và nhiều yếu tố khác tùy theo người dùng. Vì vậy, ngay cả khi một trang đã được lập chỉ mục, không phải lúc nào trang đó cũng xuất hiện trong mọi lượt tìm kiếm hoặc ở cùng một thứ hạng. Do đó, nếu Search Console cho biết một URL đã được lập chỉ mục nhưng URL đó không xuất hiện trong kết quả tìm kiếm, thì bạn có thể tạm hiểu rằng URL đó đã được lập chỉ mục và đủ điều kiện xuất hiện trong kết quả tìm kiếm.

Câu hỏi thường gặp

Báo cáo này thể hiện thông tin gì?

Báo cáo Phạm vi lập chỉ mục cho biết Google đã thu thập dữ liệu và lập chỉ mục một số URL cụ thể hay chưa. (Nếu bạn không thật sự nắm được ý nghĩa của những cụm từ này, vui lòng tìm hiểu cách thức hoạt động của Google Tìm kiếm). Google tìm được URL theo nhiều cách và cố gắng thu thập dữ liệu trên hầu hết những URL đó. Nếu một URL không xuất hiện hoặc không truy cập được, có thể Google sẽ tiếp tục thử thu thập dữ liệu URL đó trong một thời gian.

Một URL trong báo cáo này có thể có một trong những trạng thái sau:

  • Hợp lệ: Google đã tìm thấy và lập chỉ mục trang đó. Bạn không cần làm gì thêm.
  • Cảnh báo: Google đã tìm thấy và có thể đã lập chỉ mục trang đó, nhưng chúng tôi cho rằng trang đó đang gặp vấn đề. Hãy đọc thông tin mô tả về cảnh báo đó ở bên dưới để nắm được bước cần làm tiếp theo.
  • Lỗi: URL đó chưa được lập chỉ mục và chúng tôi cho rằng có thể URL đó gặp phải một lỗi mà bạn có thể khắc phục. Hãy đọc thông tin mô tả về lỗi đó ở bên dưới để nắm được bước cần làm tiếp theo.
  • Bị loại trừ: URL đó không được lập chỉ mục, nhưng có thể đây là một quyết định đúng đắn. Có thể bạn đang chặn Google thu thập dữ liệu và lập chỉ mục trang đó hoặc trang đó được phân loại là trùng lặp với một trang khác đã được thu thập dữ liệu trên trang web của bạn.

Lập chỉ mục là gì?

Lập chỉ mục là khi Google tìm thấy (thu thập dữ liệu) trang của bạn rồi xử lý nội dung trên trang và đưa trang đó vào chỉ mục của Google (lập chỉ mục trang). Nhờ vậy, trang đó đủ điều kiện xuất hiện trong các kết quả trên Google Tìm kiếm cũng như trên các dịch vụ khác của Google (chẳng hạn như Khám phá). Để tìm hiểu thêm về quá trình lập chỉ mục, hãy đọc cách thức hoạt động của Google Tìm kiếm.

Làm thế nào để Google lập chỉ mục trang hoặc trang web của tôi?

Nếu bạn đang sử dụng một dịch vụ lưu trữ trang web chẳng hạn như Wix hoặc SquareSpace, có thể dịch vụ lưu trữ của bạn sẽ báo cho Google mỗi khi bạn xuất bản hoặc cập nhật trang. Hãy xem tài liệu của nhà cung cấp dịch vụ lưu trữ trang web để tìm hiểu cách xuất bản các trang của bạn và giúp các công cụ tìm kiếm tìm được những trang đó.

Nếu bạn đang tạo một trang web hoặc trang của bạn không dùng dịch vụ lưu trữ, thì bạn có thể sử dụng một sơ đồ trang web hoặc nhiều phương pháp khác để cho Google biết về trang web hoặc trang mới của bạn.

Bạn nên đảm bảo rằng trang chủ của bạn đã được lập chỉ mục. Bắt đầu từ trang chủ, Google sẽ có thể lập chỉ mục mọi trang khác trên trang web nếu trên trang chủ có các yếu tố điều hướng toàn diện và được triển khai đúng cách cho khách truy cập.

Một trang không được lập chỉ mục thì có sao không?

Không sao cả! Google không lập chỉ mục trang nếu trang đó chặn hoạt động lập chỉ mục một cách cụ thể (bằng cách sử dụng một quy tắc trong tệp robots.txt hoặc thẻ noindex), trang trùng lặp với trang khác trên trang web của bạn hoặc trang không phù hợp để lập chỉ mục (ví dụ: nhiều bộ lọc được áp dụng trên cùng một trang). Hãy sử dụng Công cụ kiểm tra URL để xem lý do khiến một trang cụ thể không được lập chỉ mục. Nếu có lỗi lập chỉ mục hoặc nếu trang bị loại trừ vì một lý do không hợp lý, hãy tham khảo tài liệu để hiểu và khắc phục vấn đề.

Chuyên viên SEO, nhà phát triển và chủ sở hữu trang web có kinh nghiệm

Nếu bạn là một chuyên viên SEO, nhà phát triển hoặc chủ sở hữu trang web có kinh nghiệm nhưng chưa từng sử dụng báo cáo Phạm vi lập chỉ mục, hãy:
  1. Tìm hiểu về cách thức hoạt động của Google Tìm kiếm. Nếu bạn chưa hiểu rõ quy trình lập chỉ mục thì báo cáo này sẽ chỉ gây nhầm lẫn hoặc gây khó chịu cho bạn, tin chúng tôi đi.
  2. Làm theo các nguyên tắc trong phần Khám phá nội dung báo cáo, bao gồm cả Những điểm cần chú ýKết quả không nên mong đợi.
  3. Đọc phần khắc phục sự cố để hiểu và khắc phục những vấn đề thường gặp.
  4. Hãy nhớ rằng Bị loại trừ chưa chắc là một trạng thái không tốt đối với một URL. Những URL này bị loại trừ và chúng tôi cho rằng có thể chính bạn muốn loại trừ chúng. Trong trường hợp có URL trùng lặp, hãy tìm hiểu lý do khiến URL đó bị trùng lặp và lý do khiến Google loại trừ URL đó. Nếu cho rằng Google đã chọn sai trang chính tắc, bạn có thể cung cấp cho Google các tín hiệu về URL chính tắc mà bạn muốn.
  5. Hãy đọc tài liệu về trạng thái và lý do cụ thể để nắm được vấn đề cũng như xem các mẹo khắc phục.

Khám phá nội dung báo cáo

Báo cáo Phạm vi lập chỉ mục thể hiện trạng thái lập chỉ mục của Google đối với mọi URL mà Google đã biết trong tài sản của bạn.

  • Trang tóm tắt cấp cao nhất hiển thị kết quả cho mọi URL trong tài sản của bạn, được nhóm theo trạng thái (lỗi, cảnh báo, hoặc hợp lệ) và lý do cụ thể cho trạng thái đó (chẳng hạn như Không tìm thấy URL đã gửi (404))
  • Hãy nhấp vào một hàng trong bảng trên trang tóm tắt để xem một trang chi tiết, nơi tập trung hiển thị thông tin về tất cả URL có cùng trạng thái/lý do.

Trang tóm tắt

Trang cấp cao nhất trong báo cáo thể hiện trạng thái lập chỉ mục của mọi trang mà Google đã thử thu thập dữ liệu trên trang web của bạn. Những trang này được nhóm theo trạng thái và nguyên nhân.

Trình thu thập dữ liệu chính

Giá trị Trình thu thập dữ liệu chính trên trang tóm tắt thể hiện loại tác nhân người dùng mặc định mà Google sử dụng để thu thập dữ liệu trên trang web của bạn. Hiện có những giá trị sau: Điện thoại thông minh hoặc Máy tính; những trình thu thập này mô phỏng một khách truy cập đang sử dụng thiết bị di động hoặc máy tính, tùy theo loại tác nhân người dùng tương ứng.

Google thu thập dữ liệu tất cả các trang trên trang web của bạn bằng loại trình thu thập dữ liệu chính này. Google có thể thu thập thêm dữ liệu trên một nhóm nhỏ các trang của bạn bằng một trình thu thập dữ liệu phụ (đôi khi được gọi là trình thu thập dữ liệu thay thế). Đây chính là loại tác nhân người dùng còn lại. Ví dụ: nếu trình thu thập dữ liệu chính cho trang web của bạn là Điện thoại thông minh thì trình thu thập dữ liệu phụ sẽ là Máy tính; còn nếu trình thu thập dữ liệu chính là Máy tính thì trình thu thập dữ liệu phụ sẽ là Điện thoại thông minh. Mục đích của các lần thu thập dữ liệu phụ là cố gắng thu thập thêm dữ liệu về cách hoạt động của trang web khi người dùng truy cập trang trên một loại thiết bị khác.

Những điểm cần chú ý

Lý tưởng nhất là bạn sẽ thấy số trang được lập chỉ mục hợp lệ tăng dần dần khi trang web của bạn phát triển thêm. Nếu bạn nhận thấy có sự sụt giảm hoặc gia tăng mạnh, hãy xem phần khắc phục vấn đề. Bảng trạng thái trên trang tóm tắt được phân nhóm và sắp xếp theo "trạng thái + lý do".

Mục tiêu của bạn là khiến Google lập chỉ mục phiên bản chính tắc của mọi trang quan trọng. Mọi trang trùng lặp hoặc thay thế sẽ có nhãn "Bị loại trừ" trong báo cáo này. Về cơ bản, các trang trùng lặp hoặc thay thế có nội dung giống như trang chính tắc. Nếu bạn có một trang được đánh dấu là trùng lặp hoặc thay thế, thường thì đó là một dấu hiệu tốt. Điều này có nghĩa là chúng tôi đã tìm thấy trang chính tắc và lập chỉ mục trang đó. Bạn có thể tìm thấy phiên bản chính tắc của mọi URL bằng cách chạy Công cụ kiểm tra URL. Tìm hiểu thêm về nguyên nhân khiến các trang có thể không xuất hiện trong chỉ mục.

Kết quả không nên mong đợi

  • Phạm vi lập chỉ mục đạt 100%: Bạn không nên kỳ vọng Google sẽ lập chỉ mục tất cả URL trên trang web của bạn mà chỉ nên tập trung vào các trang chính tắc như được mô tả ở trên.
  • Lập chỉ mục ngay lập tức: Khi bạn thêm nội dung mới, có thể mất vài ngày để Google lập chỉ mục nội dung đó. Bạn có thể giảm thời gian chờ lập chỉ mục bằng cách yêu cầu lập chỉ mục.

Trạng thái

Mỗi trang có thể có một trong các giá trị trạng thái sau:

  • Lỗi: Trang này chưa được lập chỉ mục. Hãy xem phần mô tả về loại lỗi cụ thể để tìm hiểu thêm và nắm được cách sửa lỗi đó. Bạn nên tập trung vào những vấn đề này trước tiên.
  • Cảnh báo: Trang này đã được lập chỉ mục, nhưng có một vấn đề bạn cần lưu ý.
  • Bị loại trừ: Trang này chưa được lập chỉ mục, nhưng chúng tôi nghĩ đó là ý muốn của bạn. (Ví dụ: có thể bạn đã cố tình loại trừ trang này bằng lệnh noindex hoặc trang này có thể là bản trùng lặp của một trang chính tắc mà chúng tôi đã lập chỉ mục trên trang web của bạn.)
  • Hợp lệ: Trang này đã được lập chỉ mục.

Lý do

Mỗi trạng thái (lỗi, cảnh báo, hợp lệ, bị loại trừ) đều có một nguyên nhân cụ thể. Hãy xem mục Mô tả loại trạng thái dưới đây để đọc phần mô tả về từng loại trạng thái và cách xử lý.

Xác thực

Trạng thái xác thực của vấn đề này. Bạn nên ưu tiên khắc phục các vấn đề có trạng thái xác thực "không thành công" hoặc "chưa bắt đầu".

Giới thiệu về quy trình xác thực

Sau khi khắc phục tất cả các trường hợp của một vấn đề cụ thể trên trang web của mình, bạn có thể yêu cầu Google xác thực các thay đổi. Nếu tất cả các trường hợp đã biết biến mất thì vấn đề sẽ được đánh dấu là đã khắc phục trong bảng trạng thái và đưa xuống cuối bảng. Search Console theo dõi trạng thái xác thực của vấn đề nói chung, cũng như trạng thái của từng trường hợp trong vấn đề đó. Khi tất cả các trường hợp của vấn đề biến mất, vấn đề sẽ được coi là đã khắc phục. (Để biết các trạng thái thực tế được ghi lại, hãy xem Trạng thái xác thực vấn đềTrạng thái xác thực trường hợp).

Thông tin khác về thời gian tồn tại của vấn đề...

Thời gian tồn tại của một vấn đề kéo dài từ lần đầu tiên phát hiện thấy bất kỳ trường hợp nào của vấn đề trên trang web của bạn cho đến 90 ngày sau khi trường hợp cuối cùng được đánh dấu là đã biến mất khỏi trang web. Nếu 90 ngày trôi qua mà không có trường hợp lặp lại nào, vấn đề sẽ bị xóa khỏi lịch sử báo cáo.

Ngày phát hiện đầu tiên của vấn đề là ngày đầu tiên phát hiện thấy vấn đề trong suốt thời gian tồn tại này và sẽ không thay đổi. Vì thế:

  • Nếu tất cả các trường hợp của một vấn đề đã được khắc phục, nhưng một trường hợp mới của vấn đề xảy ra 15 ngày sau đó, vấn đề vẫn sẽ được đánh dấu là chưa khắc phục và ngày "phát hiện đầu tiên" vẫn là ngày ban đầu.
  • Nếu vấn đề đó lặp lại sau 91 ngày kể từ khi trường hợp cuối cùng được khắc phục thì lúc này vấn đề trước đó đã được đóng lại. Do đó trường hợp này được ghi lại dưới dạng vấn đề mới, với ngày phát hiện đầu tiên được đặt thành "hôm nay".

Quy trình xác thực cơ bản

Dưới đây là tổng quan về quy trình xác thực sau khi bạn nhấp vào Xác thực khắc phục cho một vấn đề. Quy trình này có thể mất vài ngày và bạn sẽ nhận được thông báo tiến độ qua email.

  1. Khi bạn nhấp vào Xác thực khắc phục, Search Console ngay lập tức kiểm tra một vài trang.
    • Nếu vấn đề hiện tại xảy ra trên bất kỳ trang nào trong số này, quy trình xác thực sẽ kết thúc và trạng thái xác thực vẫn giữ nguyên.
    • Nếu lỗi hiện tại không xảy ra trên các trang mẫu, quy trình xác thực sẽ tiếp tục với trạng thái Đã bắt đầu. Nếu quy trình tìm thấy các vấn đề không liên quan khác, những trường hợp đó được tính riêng với loại vấn đề này và việc xác thực vẫn tiếp tục.
  2. Search Console sẽ xem qua danh sách các URL đã biết bị ảnh hưởng bởi vấn đề này. Chỉ những URL mà trên đó xảy ra các trường hợp đã biết của vấn đề này mới được đưa vào hàng đợi để thu thập lại dữ liệu, không phải toàn bộ trang web. Search Console lưu giữ bản ghi về tất cả các URL đã kiểm tra trong lịch sử xác thực và bạn có thể truy cập vào lịch sử này từ trang chi tiết vấn đề.
  3. Khi Search Console kiểm tra một vấn đề:
    1. Nếu không tìm thấy vấn đề, trạng thái xác thực trường hợp sẽ thay đổi thành Đạt chuẩn. Nếu đây là trường hợp đầu tiên được kiểm tra sau khi xác thực bắt đầu, trạng thái xác thực vấn đề sẽ thay đổi thành Trông có vẻ ổn.
    2. Nếu URL không thể truy cập được, trạng thái xác thực trường hợp sẽ thay đổi thành Khác (không phải là trạng thái lỗi).
    3. Nếu trường hợp vẫn còn tồn tại, trạng thái vấn đề sẽ thay đổi thành Không đạt và quy trình xác thực kết thúc. Nếu đây là một trang mới được phát hiện qua quá trình thu thập dữ liệu bình thường, trang sẽ được xem là một trường hợp khác của vấn đề hiện tại này.
  4. Khi tất cả các lỗi và URL cảnh báo đã được kiểm tra và số lượng vấn đề là 0, trạng thái của vấn đề sẽ thay đổi thành Đã vượt qua. Lưu ý quan trọng: Ngay cả khi số trang bị ảnh hưởng giảm xuống còn 0 trang và trạng thái vấn đề thay đổi thành Đạt, nhãn mức độ nghiêm trọng sẽ vẫn xuất hiện (Lỗi hoặc Cảnh báo).

Ngay cả khi bạn không bao giờ nhấp vào "bắt đầu xác thực" Google vẫn có thể phát hiện thấy các trường hợp đã khắc phục của một vấn đề. Nếu phát hiện thấy tất cả các trường hợp của một vấn đã được khắc phục trong quá trình thu thập dữ liệu thông thường, Google sẽ thay đổi trạng thái vấn đề thành "N/A" (Không áp dụng) trên báo cáo.

Khi nào vấn đề được xem là "đã khắc phục" cho một URL hay một mục?

Vấn đề được đánh dấu là đã khắc phục cho một URL hoặc một mục khi đáp ứng một trong các điều kiện sau:

  • Khi Google thu thập dữ liệu URL và không còn tìm thấy vấn đề trên trang. Đối với lỗi thẻ AMP, điều này có nghĩa là bạn đã khắc phục thẻ hoặc thẻ đã bị xóa (nếu thẻ không bắt buộc). Trong một lần xác thực, URL sẽ được xem là "đã vượt qua."
  • Nếu Google không thể truy cập vào trang vì bất kỳ lý do nào (trang đã bị xóa, trang có thẻ đánh dấu noindex, trang yêu cầu xác thực, v.v.), hệ thống sẽ xem là vấn đề đã được khắc phục cho URL đó. Trong một lần xác thực, trang sẽ được gán trạng thái xác thực là "khác".

Xác thực lại

Khi bạn nhấp vào Xác thực lại cho một quy trình xác thực không thành công, quy trình sẽ bắt đầu lại với tất cả các trường hợp không thành công, cộng thêm bất kỳ trường hợp mới nào của vấn đề mà Google phát hiện thấy trong quá trình thu thập dữ liệu thông thường.

Bạn nên đợi chu kỳ xác thực hoàn tất trước khi yêu cầu một chu kỳ khác, ngay cả khi bạn đã khắc phục một số vấn đề trong chu kỳ hiện tại.

Các trường hợp đã đáp ứng quá trình xác thực (đánh dấu là Đạt) hoặc không truy cập được nữa (đánh dấu là Khác) sẽ không được kiểm tra lại và sẽ bị xóa khỏi nhật ký khi bạn nhấp vào Xác thực lại.

Lịch sử xác thực

Bạn có thể xem tiến trình của yêu cầu xác thực bằng cách nhấp vào liên kết chi tiết xác thực trong trang chi tiết vấn đề.

Các mục trong lịch sử xác thực được nhóm theo URL cho báo cáo AMP và báo cáo Trạng thái lập chỉ mục. Trong báo cáo Khả năng sử dụng trên thiết bị di động và Kết quả nhiều định dạng, các mục được nhóm theo kết hợp URL + mục dữ liệu có cấu trúc (như được xác định bởi giá trị Tên của mục). Trạng thái xác thực sẽ áp dụng cho vấn đề cụ thể mà bạn đang kiểm tra. Bạn có thể thấy một vấn đề gắn nhãn "Đã vượt qua" trên một trang, nhưng các vấn đề khác lại bị gắn nhãn "Không đạt", "Đang chờ xử lý" hoặc "Khác".

Trạng thái xác thực vấn đề

Các trạng thái xác thực sau đây áp dụng cho một vấn đề nhất định:

  • Chưa bắt đầu: Có một hoặc nhiều trang xảy ra một trường hợp của vấn đề này và bạn chưa hề bắt đầu xác thực các trang đó. Các bước tiếp theo:
    1. Nhấp vào vấn đề để tìm hiểu chi tiết lỗi. Hãy kiểm tra các trang riêng lẻ để xem ví dụ về lỗi trên trang trực tuyến bằng cách sử dụng quy trình Kiểm tra AMP. (Nếu quy trình Kiểm tra AMP không hiển thị lỗi trên trang thì đó là vì bạn đã sửa lỗi trên trang thực tế sau khi Google tìm thấy lỗi và tạo báo cáo vấn đề này).
    2. Nhấp vào "Tìm hiểu thêm" trên trang chi tiết để xem chi tiết về quy tắc bị vi phạm.
    3. Nhấp vào dòng URL ví dụ trong bảng để biết chi tiết về lỗi cụ thể đó.
    4. Sửa lỗi các trang của bạn rồi nhấp vào Xác thực khắc phục để Google thu thập lại dữ liệu các trang của bạn. Google sẽ thông báo cho bạn về tiến trình xác thực. Quá trình xác thực thường mất tối đa khoảng hai tuần, tuy vậy một số trường hợp có thể mất nhiều thời gian hơn, vì vậy, xin hãy kiên nhẫn. 
  • Đã bắt đầu: Bạn đã bắt đầu một lượt xác thực và Google chưa tìm thấy trường hợp còn lại nào của vấn đề. Bước tiếp theo: Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết việc bạn cần làm, nếu cần thiết.
  • Trông có vẻ ổn: Bạn đã bắt đầu xác thực và tất cả các trường hợp của vấn đề mà Google đã kiểm tra đến giờ đều đã được khắc phục. Bước tiếp theo: Bạn không cần phải làm gì, nhưng Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết việc bạn cần làm.
  • Đã vượt qua: Tất cả các trường hợp đã biết của vấn đề đã biến mất (hoặc URL bị ảnh hưởng không còn truy cập được nữa). Bạn hẳn đã nhấp vào "Xác thực khắc phục" để có được trạng thái này (nếu trường hợp biến mất khi bạn chưa yêu cầu xác thực, trạng thái sẽ thay đổi thành N/A). Bước tiếp theo: Bạn không cần phải làm gì khác.
  • Không có: Google nhận thấy rằng vấn đề đã được khắc phục trên tất cả các URL, ngay cả khi bạn chưa hề bắt đầu xác thực. Bước tiếp theo: Bạn không cần phải làm gì khác.
  • Không thành công: Một số trang nhất định vẫn có vấn đề này sau khi bạn nhấp vào "Xác thực". Bước tiếp theo: Khắc phục vấn đề và xác thực lại.

Trạng thái xác thực trường hợp

Sau khi bạn yêu cầu xác thực, mọi trường hợp của vấn đề đều được chỉ định một trong các trạng thái xác thực sau đây:

  • Đang chờ xác thực: Đã đưa vào hàng đợi để xác thực. Trong lần cuối cùng Google kiểm tra, trường hợp này của vấn đề vẫn tồn tại.
  • Đã vượt qua: [Không hiển thị trong tất cả báo cáo] Google đã kiểm tra trường hợp của vấn đề và trường hợp không còn tồn tại. Bạn chỉ có thể đạt được trạng thái này nếu đã thể hiện rõ thao tác nhấp vào Xác thực cho trường hợp này.
  • Không đạt: Google đã kiểm tra trường hợp này của vấn đề và trường hợp vẫn tồn tại. Bạn chỉ có thể đạt được trạng thái này nếu đã nhấp vào Xác thực một cách rõ ràng cho trường hợp này.
  • Khác: [Không hiển thị trong tất cả báo cáo] Google không thể truy cập vào URL có trường hợp này hoặc không thể tìm thấy mục trên trang nữa (đối với dữ liệu có cấu trúc). Được xem là trạng thái tương đương với Đạt.

Xin lưu ý rằng cùng một URL có thể có nhiều trạng thái tùy theo loại vấn đề. Ví dụ: nếu một trang có cả vấn đề X và vấn đề Y, thì vấn đề X có thể thuộc trạng thái xác thực Đạt trong khi vấn đề Y trên chính trang đó có thể thuộc trạng thái xác thực Đang chờ xử lý.

Bộ lọc thả xuống theo phương thức phát hiện URL

Bạn có thể sử dụng bộ lọc thả xuống phía trên biểu đồ để lọc kết quả lập chỉ mục theo cách Google phát hiện ra URL. Bộ lọc này có những giá trị sau:

  • Tất cả các trang đã biết [Mặc định] – Hiển thị tất cả các URL mà Google đã phát hiện được bằng bất kỳ phương thức nào.
  • Tất cả các trang đã gửi – Chỉ hiển thị các trang đã gửi đến báo cáo này qua một sơ đồ trang web hoặc lệnh ping sơ đồ trang web.
  • URL trong một sơ đồ trang web cụ thể – Chỉ hiển thị các URL có trong một sơ đồ trang web cụ thể đã gửi qua báo cáo này. Dữ liệu này bao gồm mọi URL có trong các sơ đồ trang web được lồng trong báo cáo.

Một URL được xem là đã gửi qua sơ đồ trang web ngay cả khi Google đã phát hiện thấy URL đó bằng cơ chế khác (ví dụ như bằng cách thu thập dữ liệu tự nhiên từ trang khác).

Trang chi tiết

Hãy nhấp vào một hàng trên trang tóm tắt để mở trang chi tiết về trạng thái + lý do. Bạn có thể xem thông tin chi tiết về vấn đề đã chọn bằng cách nhấp vào phần Tìm hiểu thêm ở đầu trang.

Biểu đồ trên trang này cho thấy số trang bị ảnh hưởng theo thời gian.

Bảng hiển thị danh sách ví dụ về những trang chịu ảnh hưởng của trạng thái + lý do này. Bạn có thể nhấp vào những thành phần trong hàng như sau:

  • Nhấp vào hàng để xem thêm thông tin chi tiết về URL.
  • Nhấp vào để mở URL trong một thẻ mới.
  • Nhấp vào để mở công cụ Kiểm tra URL cho URL đó.
  • Nhấp vào để sao chép URL

Giá trị Nguồn trên trang chi tiết cho biết loại tác nhân người dùng (Điện thoại thông minh hoặc Máy tính) mà Google sử dụng để thu thập dữ liệu trên những URL trong danh sách.

Sau khi bạn khắc phục xong mọi trường hợp lỗi hoặc cảnh báo, hãy nhấp vào Xác thực bản sửa lỗi để báo cho Google về việc bạn đã khắc phục xong vấn đề.

Bạn thấy một URL bị đánh dấu là đang gặp phải một vấn đề mà bạn đã khắc phục? Có lẽ bạn đã khắc phục vấn đề SAU lần thu thập dữ liệu mới nhất của Google. Vì thế, nếu bạn thấy URL có một vấn đề mà bạn đã khắc phục, hãy kiểm tra ngày thu thập dữ liệu cho URL đó: Hãy kiểm tra và xác nhận kết quả sửa lỗi, sau đó yêu cầu Google lập chỉ mục lại

Chia sẻ báo cáo

Bạn có thể chia sẻ trang chi tiết vấn đề trong báo cáo phạm vi lập chỉ mục hoặc tính năng nâng cao bằng cách nhấp vào nút Chia sẻ trên trang. Đường liên kết này chỉ cho phép người có đường liên kết truy cập vào trang chi tiết vấn đề hiện tại và mọi trang lịch sử xác thực cho vấn đề này. Đường liên kết này không cấp quyền truy cập vào các trang khác về tài nguyên của bạn hoặc cho phép người dùng được chia sẻ thực hiện bất kỳ hành động nào đối với sản phẩm hay tài khoản của bạn. Bạn có thể thu hồi liên kết bất kỳ lúc nào bằng cách vô hiệu hóa chia sẻ cho trang này.

Xuất dữ liệu báo cáo

Nhiều báo cáo có nút xuất để xuất dữ liệu báo cáo. Dữ liệu biểu đồ và dữ liệu bảng sẽ đều được xuất. Những giá trị hiển thị dưới dạng ~ hoặc - trong báo cáo (không có sẵn/không phải số) sẽ đều là số 0 trong dữ liệu được tải xuống.

Khắc phục sự cố

Bạn có thể xác nhận trạng thái lập chỉ mục của mọi URL hiển thị trong báo cáo này bằng cách kiểm tra URL:

  1. Quyết định xem trạng thái lập chỉ mục có thực sự là vấn đề hay không dựa trên loại trạng thái, mục tiêu lập chỉ mục và lỗi cụ thể.
  2. Đọc thông tin cụ thể về vấn đề.
  3. Kiểm tra URL bằng Công cụ kiểm tra URL.
    1. Nhấp vào biểu tượng kiểm tra bên cạnh URL đó trong bảng ví dụ để mở Công cụ kiểm tra URL cho URL đó.
    2. Xem thông tin chi tiết về hoạt động thu thập dữ liệu và lập chỉ mục cho URL đó tại phần Phạm vi lập chỉ mục > Thu thập dữ liệu Phạm vi lập chỉ mục > Lập chỉ mục trong báo cáo Kiểm tra URL.
    3. Để kiểm tra phiên bản đang hoạt động của trang, hãy nhấp vào Kiểm tra URL đang hoạt động.

Những vấn đề thường gặp

Dưới đây là một số vấn đề phổ biến nhất về việc lập chỉ mục mà bạn có thể thấy trong báo cáo này:

Tổng số trang được lập chỉ mục giảm mà không có lỗi tương ứng

Nếu bạn thấy tổng số trang được lập chỉ mục bị giảm nhưng số lỗi lại không gia tăng ở mức tương ứng, thì có thể là do bạn đang chặn quyền truy cập vào các trang hiện có thông qua tệp robots.txt, lệnh "noindex" hoặc một yêu cầu đăng nhập bắt buộc. Hãy kiểm tra xem số URL Bị loại trừ có tăng ở mức tương ứng với mức sụt giảm số trang Hợp lệ hay không. Hãy lưu ý rằng nếu được gửi qua một sơ đồ trang web thì những URL này sẽ được đánh dấu là lỗi chứ không phải là bị loại trừ.

Số trang Bị loại trừ nhiều hơn số trang Hợp lệ

Nếu số trang Bị loại trừ lớn hơn số trang Hợp lệ, hãy xem nguyên nhân cho trạng thái Bị loại trừ. Các lý do loại trừ phổ biến bao gồm:

  • Có một quy tắc robots.txt đang chặn Google thu thập dữ liệu nhiều trang trên trang web của bạn. Hãy bỏ chặn nếu bạn đang chặn nhầm trang.
  • Trang web của bạn có số lượng lớn các trang trùng lặp, có thể là do trang web sử dụng các tham số để lọc hoặc sắp xếp một tập hợp chung (ví dụ: type=dress, color=green hoặc sort=price). Các trang này có thể sẽ bị loại trừ nếu chúng chỉ hiển thị nội dung giống nhau được sắp xếp, lọc hoặc tiếp cận theo các cách khác nhau. Nếu bạn là người dùng nâng cao và bạn nghĩ rằng Google đang hiểu nhầm các tham số trên trang web của bạn, hãy sử dụng công cụ Tham số URL để tùy chỉnh cách xử lý các tham số trên trang web.
Lỗi tăng đột biến

Nếu bạn thấy số lỗi tăng đột biến, thì lý do có thể là một thay đổi trong mẫu của bạn gây ra lỗi mới hoặc có thể bạn đã gửi một sơ đồ trang web có chứa các URL bị chặn khỏi quá trình thu thập dữ liệu do tệp robots.txt, lệnh noindex hay yêu cầu đăng nhập.

Nếu bạn thấy số lỗi tăng đột biến, hãy:

  1. Kiểm tra xem liệu có sự tương quan nào giữa tổng số lỗi lập chỉ mục hoặc tổng số trang đã lập chỉ mục và biểu đồ thu nhỏ bên cạnh một hàng lỗi cụ thể trên trang tóm tắt hay không để biết được vấn đề nào có thể đang ảnh hưởng đến tổng số lỗi hay tổng số trang đã lập chỉ mục.
  2. Nhấp vào trang chi tiết để tìm những lỗi có vẻ như đang góp phần khiến số lỗi tăng vọt. Đọc mô tả về loại lỗi cụ thể để tìm hiểu cách xử lý tốt nhất.
  3. Hãy nhấp vào một vấn đề và kiểm tra một trang ví dụ để xem lỗi đó là gì (nếu cần thiết).
  4. Khắc phục tất cả các trường hợp của mỗi lỗi và yêu cầu xác thực bằng cách nhấp vào Xác thực khắc phục trong trang chi tiết cho nguyên nhân đó. Đọc thêm về quy trình xác thực.
  5. Bạn sẽ nhận được thông báo khi quy trình xác thực diễn ra, nhưng bạn có thể kiểm tra lại sau vài ngày để xem liệu số lỗi đã giảm hay chưa.
Lỗi máy chủ
Lỗi máy chủ nghĩa là Googlebot không thể truy cập URL của bạn, yêu cầu đã hết thời gian chờ hoặc trang web của bạn đang quá tải. Kết quả là Googlebot bắt buộc phải từ bỏ yêu cầu.
Hãy kiểm tra kết quả trạng thái máy chủ cho trang web của bạn trong báo cáo Số liệu thống kê về hoạt động thu thập dữ liệu để xem liệu Google có báo cáo vấn đề nào về khả năng truy cập trang web mà bạn có thể xác nhận và khắc phục hay không.

Kiểm tra khả năng kết nối với máy chủ

Bạn có thể sử dụng Công cụ kiểm tra URL để xem liệu bạn có thể tái hiện một lỗi máy chủ trong báo cáo Phạm vi lập chỉ mục hay không.

Sửa lỗi về khả năng kết nối với máy chủ

  • Giảm hoạt động tải trang quá mức đối với các yêu cầu trang động.
    Một trang web được xem là phân phát nội dung động nếu trang web đó cung cấp cùng một nội dung cho nhiều URL (ví dụ: www.example.com/shoes.php?color=red&size=7 cung cấp cùng một nội dung như www.example.com/shoes.php?size=7&color=red). Các trang động cũng có thể mất nhiều thời gian để phản hồi, dẫn đến các vấn đề hết thời gian chờ. Hoặc máy chủ có thể trả về trạng thái quá tải để yêu cầu Googlebot thu thập dữ liệu trang web chậm hơn. Nói chung, chúng tôi khuyên bạn nên đặt các tham số ngắn và sử dụng chúng một cách thận trọng. Nếu chắc chắn về cách các tham số hoạt động cho trang web của mình, bạn có thể cho Google biết nên xử lý những tham số này theo cách nào.
  • Đảm bảo rằng máy chủ lưu trữ trang web của bạn không bị trục trặc, quá tải hay định cấu hình sai cách.
    Nếu vấn đề kết nối, hết thời gian chờ hoặc phản hồi vẫn tiếp diễn, hãy kiểm tra với nhà cung cấp dịch vụ lưu trữ web và cân nhắc tăng khả năng xử lý lưu lượng truy cập cho trang web của bạn.
  • Kiểm tra để đảm bảo bạn không vô tình chặn Google.
    Bạn có thể đang chặn Google do một vấn đề cấp hệ thống, chẳng hạn như vấn đề cấu hình DNS, tường lửa hay hệ thống bảo vệ DoS được định cấu hình không đúng cách hoặc cấu hình hệ thống quản lý nội dung. Hệ thống bảo vệ là một phần quan trọng của lưu trữ an toàn và thường được định cấu hình để tự động chặn các yêu cầu máy chủ ở mức cao bất thường. Tuy nhiên, do thường tạo ra nhiều yêu cầu hơn người dùng là con người nên Googlebot có thể kích hoạt các hệ thống bảo vệ này, dẫn đến các hệ thống này chặn Googlebot và ngăn Googlebot thu thập dữ liệu trang web của bạn. Để khắc phục các sự cố đó, hãy xác định phần nào trong cơ sở hạ tầng của trang web của bạn đang chặn Googlebot rồi bỏ chặn. Tường lửa có thể không thuộc quyền kiểm soát của bạn do đó bạn cần thảo luận việc này với nhà cung cấp dịch vụ lưu trữ của mình.
  • Kiểm soát hoạt động thu thập dữ liệu và lập chỉ mục trang web của công cụ tìm kiếm một cách hợp lý.
    Một số quản trị viên web chủ định ngăn Googlebot truy cập trang web của họ, có thể là bằng cách sử dụng tường lửa như được mô tả ở trên. Trong những trường hợp này, mục đích thường không phải là chặn hoàn toàn Googlebot mà là kiểm soát cách trang web được thu thập dữ liệu và lập chỉ mục. Nếu điều này đúng với bạn, hãy kiểm tra các điều sau:
Lỗi 404

Nói chung, bạn chỉ nên sửa các trang lỗi và bỏ qua các trang bị loại trừ. Các trang có lỗi 404 là những trang mà bạn đã yêu cầu Google lập chỉ mục nhưng Google lại không tìm thấy trang đó. Trường hợp này hiển nhiên là một lỗi. Các trang bị loại trừ 404 là những trang mà Google tìm thấy bằng một cơ chế khác, chẳng hạn như đường liên kết từ một trang khác. Nếu trang đã di chuyển, bạn nên sẽ trả về một lệnh chuyển hướng 3XX đến trang mới. Tìm hiểu thêm về cách đánh giá và sửa lỗi 404.

Trang hoặc trang web không có trong báo cáo

Nếu trang của bạn hoàn toàn không có trong báo cáo, thì điều này có thể do một trong những nguyên nhân sau:

  • Google không biết về trang này. Sau đây là một số lưu ý về khả năng phát hiện trang:
    • Nếu đây là một trang/trang web mới, hãy lưu ý rằng có thể mất một thời gian để Google tìm thấy và thu thập dữ liệu trên những trang/trang web đó.
    • Để Google tìm thấy một trang, bạn phải gửi sơ đồ trang web hoặc yêu cầu thu thập dữ liệu trang, hoặc Google phải tìm thấy đường liên kết đến trang của bạn ở một nơi nào đó.
    • Sau khi tìm thấy URL của một trang, có thể mất một thời gian (tối đa một vài tuần) để Google thu thập dữ liệu một phần hoặc toàn bộ trang web của bạn.
    • Google không bao giờ lập chỉ mục ngay, kể cả khi bạn đã trực tiếp gửi yêu cầu lập chỉ mục.
    • Google không đảm bảo tất cả các trang ở mọi nơi sẽ có trong Chỉ mục của Google.
  • Google không thể truy cập vào trang của bạn (trang này yêu cầu đăng nhập hoặc hạn chế quyền truy cập đối với một số người dùng trên Internet)
  • Trang có một thẻ noindex và thẻ này đã ngăn Google lập chỉ mục trang đó
  • Trang đã bị loại bỏ khỏi chỉ mục vì một lý do nào đó.

Để sửa lỗi:

Sử dụng Công cụ kiểm tra URL để kiểm tra vấn đề trên trang của bạn. Nếu trang không có trong báo cáo Phạm vi lập chỉ mục nhưng lại nằm trong danh sách đã lập chỉ mục trong báo cáo Kiểm tra URL, thì có lẽ Google chỉ mới lập chỉ mục trang trong thời gian gần đây và trang sẽ sớm xuất hiện trong báo cáo Phạm vi lập chỉ mục. Nếu trang thuộc danh sách chưa lập chỉ mục trong Công cụ kiểm tra URL (đúng như suy đoán của bạn), hãy kiểm tra trang đang hoạt động. Kết quả kiểm tra trang đang hoạt động sẽ cho bạn biết vấn đề cụ thể là gì: hãy dùng thông tin trong kết quả kiểm tra và tài liệu kiểm tra để tìm hiểu cách khắc phục vấn đề.

Lỗi "Đã gửi" và các trường hợp bị loại trừ
Nếu bạn thấy có từ "Đã gửi" trong tiêu đề cho lý do lập chỉ mục (ví dụ: "URL đã gửi trả về lỗi 403"), thì tức là URL đó có trong một sơ đồ trang web mà tệp robots.txt của bạn tham chiếu đến hoặc được gửi qua báo cáo Sơ đồ trang web.
Cách khắc phục vấn đề "Đã gửi":
  • Khắc phục vấn đề đang ngăn Google thu thập dữ liệu trên trang
    hoặc
  • Xóa URL khỏi sơ đồ trang web của bạn và gửi lại sơ đồ đó trong báo cáo Sơ đồ trang web (cách nhanh nhất)
    hoặc
  • Sử dụng báo cáo Sơ đồ trang web để xóa mọi sơ đồ trang web có chứa URL đó (và đảm bảo rằng không có sơ đồ trang web nào trong tệp robots.txt của bạn có chứa URL này).

Câu hỏi thường gặp

Tại sao trang của tôi có trong chỉ mục? Tôi không muốn trang được lập chỉ mục.

Google có thể lập chỉ mục bất kỳ URL nào đã tìm thấy trừ khi bạn bao gồm lệnh noindex trên trang (hoặc trang đã bị chặn tạm thời). Google có thể tìm thấy một trang theo nhiều cách, bao gồm cả việc ai đó liên kết đến trang của bạn từ một trang web khác.

  • Nếu muốn chặn trang của mình khỏi kết quả Google Tìm kiếm, bạn có thể yêu cầu một số hình thức đăng nhập cho trang hoặc sử dụng lệnh noindex trên trang.
  • Nếu muốn xóa trang của mình khỏi kết quả Google Tìm kiếm sau khi Google đã tìm thấy trang, bạn sẽ cần phải làm theo các bước sau.

Tại sao gần đây Google chưa lập chỉ mục lại trang web của tôi?

Google lập chỉ mục lại các trang dựa trên một số tiêu chí, bao gồm cả tần suất thay đổi của trang theo phỏng đoán của Google. Nếu trang web của bạn không thay đổi thường xuyên, thì có thể tốc độ làm mới với trang là chậm hơn. Do đó, bạn không cần phải lo lắng nếu trang chưa thay đổi. Nếu bạn nghĩ rằng trang web của bạn cần được làm mới, hãy yêu cầu Google thu thập lại dữ liệu đối với trang.

Google có thể thu thập lại dữ liệu về trang/trang web của tôi không?

Yêu cầu Google thu thập lại dữ liệu đối với trang.

Tại sao nhiều trang của tôi bị loại trừ?

Hãy xem chi tiết về các lý do loại trừ trong báo cáo Phạm vi lập chỉ mục. Hầu hết các trường hợp loại trừ là do một trong những nguyên nhân sau:

  • Có một quy tắc robots.txt đang chặn chúng tôi thu thập dữ liệu các phần lớn trên trang web của bạn. Hãy sử dụng công cụ Kiểm tra URL để xác nhận vấn đề.
  • Trang web của bạn có số lượng lớn các trang trùng lặp, thường là do trang sử dụng các tham số để lọc hoặc sắp xếp một tập hợp chung (ví dụ: type=dress, color=green hoặc sort=price). Các trang này sẽ bị gắn nhãn là "trùng lặp" hoặc "thay thế" trong báo cáo Phạm vi lập chỉ mục.
  • URL chuyển hướng đến một URL khác. URL chuyển hướng không được lập chỉ mục nhưng trang đích của lệnh chuyển hướng lại được lập chỉ mục.

Google không thể truy cập sơ đồ trang web của tôi

Hãy đảm bảo rằng sơ đồ trang web của bạn là hợp lệ, không bị tệp robots.txt chặn, và bạn đang sử dụng URL thích hợp trong tệp robots.txt hoặc báo cáo Sơ đồ trang web. Bạn có thể kiểm tra URL sơ đồ trang web của bạn bằng một công cụ kiểm tra sơ đồ trang web có sẵn công khai.

Tại sao Google tiếp tục thu thập dữ liệu một trang đã bị xóa?

Google tiếp tục thu thập dữ liệu tất cả các URL đã biết ngay cả sau khi chúng trả lại lỗi 4XX trong một thời gian, để phòng trường hợp đó là lỗi tạm thời. Trường hợp duy nhất mà chúng tôi không thu thập dữ liệu một URL là khi trang đó trả về lệnh noindex.

Để tránh hiển thị cho bạn danh sách lỗi 404 ngày càng tăng, báo cáo Phạm vi lập chỉ mục chỉ hiển thị các URL đã hiển thị lỗi 404 trong tháng qua.

Tôi có thể xem trang của mình, tại sao Google không thể?

Hãy sử dụng công cụ Kiểm tra URL để xem liệu Google có thể xem trang đang hoạt động không. Nếu không thể thì Google sẽ cho biết lý do. Nếu Google có thể xem trang thì vấn đề có thể là lỗi truy cập đã được khắc phục kể từ lần thu thập dữ liệu gần nhất. Hãy chạy quy trình thu thập dữ liệu với trang đang hoạt động bằng công cụ Kiểm tra URL và yêu cầu lập chỉ mục.

Công cụ Kiểm tra URL cho thấy không có vấn đề gì, nhưng báo cáo Phạm vi lập chỉ mục lại hiển thị lỗi. Vì sao lại thế?

Bạn có thể đã sửa lỗi sau lần gần nhất mà Google thu thập dữ liệu trang. Hãy xem ngày mà Google thu thập dữ liệu URL của bạn (ngày này có thể hiển thị trên trang chi tiết URL trong báo cáo Phạm vi lập chỉ mục hoặc hiển thị trong chế độ xem phiên bản đã lập chỉ mục trong công cụ Kiểm tra URL). Hãy xác định xem bạn có khắc phục lỗi nào kể từ lần thu thập dữ liệu gần nhất không.

Làm cách nào để tìm trạng thái lập chỉ mục của một URL cụ thể?

Để tìm hiểu trạng thái lập chỉ mục của một URL cụ thể, hãy sử dụng công cụ Kiểm tra URL. Bạn không thể tìm kiếm hoặc lọc theo URL trong báo cáo Phạm vi lập chỉ mục.

Nguyên nhân của trạng thái

Báo cáo Phạm vi lập chỉ mục hiển thị những trạng thái sau:

Lỗi

Google chưa lập chỉ mục các trang có lỗi

Lỗi máy chủ (5xx): Máy chủ của bạn đã trả về lỗi cấp 500 khi có yêu cầu về trang. Hãy xem phần Sửa lỗi máy chủ.

Lỗi chuyển hướng: Google gặp phải lỗi chuyển hướng thuộc một trong các loại sau: Chuỗi chuyển hướng quá dài; vòng lặp chuyển hướng; URL chuyển hướng vượt quá độ dài URL tối đa; có URL không hợp lệ hoặc trống trong chuỗi chuyển hướng. Hãy sử dụng một công cụ gỡ lỗi web, chẳng hạn như Lighthouse, để biết thêm chi tiết về vấn đề chuyển hướng đó.

URL đã gửi bị chặn bởi robots.txt: Bạn đã gửi trang này để lập chỉ mục, nhưng trang bị tệp robots.txt trên trang web của bạn chặn.

  1. Nhấp vào trang trong bảng Ví dụ để mở rộng bảng điều khiển bên của công cụ.
  2. Nhấp vào Kiểm tra lệnh chặn trong robots.txt để chạy trình kiểm tra robot.txt đối với URL đó. Công cụ sẽ chỉ rõ quy tắc đang chặn URL đó.
  3. Cập nhật tệp robots.txt của bạn để xóa hoặc thay đổi quy tắc này, nếu phù hợp. Bạn có thể tìm vị trí của tệp này bằng cách nhấp vào Xem robots.txt trực tiếp trên công cụ kiểm tra robots.txt. Nếu bạn đang sử dụng dịch vụ lưu trữ web và không có quyền sửa đổi tệp này, hãy tìm tài liệu của dịch vụ mà bạn sử dụng hoặc liên hệ với trung tâm trợ giúp của họ để thông báo cho họ về vấn đề.

URL đã gửi được đánh dấu ‘noindex’: Bạn đã gửi trang này để lập chỉ mục, nhưng trang có lệnh 'noindex' trong thẻ meta hoặc tiêu đề HTTP. Nếu muốn Google lập chỉ mục trang này, bạn phải xóa thẻ hoặc tiêu đề HTTP đó. Hãy sử dụng công cụ Kiểm tra URL để xác nhận lỗi:

  1. Nhấp vào biểu tượng kiểm tra bên cạnh URL trong bảng.
  2. Trong phần Trạng thái lập chỉ mục > Lập chỉ mục > Được phép lập chỉ mục?, báo cáo sẽ cho biết lệnh noindex đang ngăn Google lập chỉ mục.
  3. Xác nhận rằng thẻ noindex vẫn tồn tại trong phiên bản đang hoạt động:
    1. Nhấp vào Kiểm tra URL đang hoạt động
    2. Trong phần Khả năng lập chỉ mục > Lập chỉ mục > Được phép lập chỉ mục?, hãy xem còn có lệnh noindex hay không. Nếu lệnh noindex không còn nữa, bạn có thể nhấp vào Yêu cầu lập chỉ mục để yêu cầu Google thử lập chỉ mục trang lần nữa. Nếu lệnh noindex vẫn còn, bạn phải xóa lệnh đó để chúng tôi có thể lập chỉ mục trang.

URL đã gửi có vẻ đang gặp lỗi 404 mềm: Bạn đã gửi trang này để lập chỉ mục, nhưng máy chủ có vẻ đã trả về lỗi 404 mềm. Tìm hiểu cách khắc phục sự cố này.

URL đã gửi trả về yêu cầu không được ủy quyền (401): Bạn đã gửi trang này để lập chỉ mục, nhưng Google nhận được phản hồi 401 (không được ủy quyền). Hãy xóa yêu cầu ủy quyền cho trang này hoặc cho phép Googlebot truy cập vào các trang của bạn bằng cách xác minh danh tính. Bạn có thể xác minh lỗi này bằng cách truy cập trang ở chế độ ẩn danh.

Không tìm thấy URL đã gửi (404): Bạn đã gửi một URL không tồn tại để lập chỉ mục. Hãy xem phần Sửa lỗi 404.

URL đã gửi trả về mã 403: Máy chủ nhận ra việc Googlebot đã đăng nhập, tuy nhiên máy chủ không cho phép Google truy cập vào nội dung. Nếu bạn muốn chúng tôi lập chỉ mục trang này, vui lòng cấp quyền truy cập cho khách truy cập ẩn danh; nếu không thì bạn không nên yêu cầu đưa trang này vào chỉ mục.

URL đã gửi bị chặn do lỗi 4xx khác: Máy chủ trả về một mã phản hồi 4xx không thuộc loại vấn đề nào đã nêu ở đây cho URL đã gửi. Bạn nên sửa lỗi này hoặc không nên yêu cầu đưa URL này vào chỉ mục. Hãy thử gỡ lỗi trang của bạn bằng Công cụ kiểm tra URL.

Cảnh báo

Các trang có trạng thái cảnh báo có thể cần bạn chú ý và có thể đã được lập chỉ mục hoặc chưa, tùy theo kết quả cụ thể.

Đã lập chỉ mục mặc dù bị chặn bởi robots.txt: Trang đã được lập chỉ mục mặc dù bị tệp robots.txt trên trang web của bạn chặn. Google luôn tuân theo lệnh trong tệp robots.txt, nhưng không có nghĩa là tệp này sẽ ngăn được Google lập chỉ mục trang của bạn nếu có một trang khác liên kết đến trang của bạn Google sẽ không yêu cầu và thu thập dữ liệu trên trang, nhưng chúng tôi vẫn có thể lập chỉ mục trang đó dựa trên thông tin trên trang liên kết đến trang bị chặn của bạn. Do quy tắc của tệp robots.txt, nội dung cho đoạn trích xuất hiện trong kết quả tìm kiếm trên Google cho trang đó có thể sẽ rất hạn chế.

Bước tiếp theo:

Đã lập chỉ mục nhưng không thể đọc nội dung trang: Trang này xuất hiện trong chỉ mục của Google nhưng Google không đọc được nội dung trên trang vì lý do nào đó. Có thể do một số nguyên nhân như trang bị che giấu trước Google hoặc trang ở một định dạng mà Google không lập chỉ mục được. Đây không phải là do lệnh chặn trong tệp robots.txt. Hãy kiểm tra trang và xem phần Phạm vi lập chỉ mục để biết thông tin chi tiết.

Hợp lệ

Các trang có trạng thái hợp lệ đã được lập chỉ mục.

Đã được gửi và lập chỉ mục: Bạn đã gửi URL để lập chỉ mục và Google đã lập chỉ mục trang.

Đã được lập chỉ mục, chưa được gửi trong sơ đồ trang web: Google đã phát hiện và lập chỉ mục URL. Bạn nên gửi tất cả các URL quan trọng bằng cách sử dụng sơ đồ trang web.

Bị loại trừ

Các trang này thường không được lập chỉ mục, nhưng chúng tôi nghĩ điều đó là phù hợp. Các trang này trùng lặp với các trang được lập chỉ mục, bị một số cơ chế trên trang web của bạn chặn lập chỉ mục hoặc không được lập chỉ mục vì một lý do mà chúng tôi cho rằng không phải là lỗi.

Bị loại trừ bởi thẻ 'noindex': Khi cố gắng lập chỉ mục trang, Google đã gặp phải lệnh 'noindex' và do đó không lập chỉ mục trang. Nếu không muốn Google lập chỉ mục trang này thì bạn đã đạt được mục đích của mình. Còn nếu muốn Google lập chỉ mục trang thì bạn nên xóa lệnh 'noindex' đó. Để xác nhận sự hiện diện của thẻ hoặc lệnh này, hãy yêu cầu trang trong một trình duyệt và tìm từ "noindex" trong nội dung phản hồi và tiêu đề phản hồi. 

Bị công cụ xóa trang chặn: Trang hiện bị một yêu cầu xóa URL chặn. Nếu là chủ sở hữu trang web đã được xác minh, bạn có thể sử dụng công cụ xóa URL để xem ai đã gửi yêu cầu xóa URL. Yêu cầu xóa chỉ có hiệu lực trong khoảng 90 ngày tính từ ngày xóa. Sau thời gian đó, Googlebot có thể quay lại và lập chỉ mục trang, ngay cả khi bạn không gửi yêu cầu lập chỉ mục khác. Nếu bạn không muốn Google lập chỉ mục trang, hãy sử dụng lệnh 'noindex', yêu cầu ủy quyền đối với trang hoặc xóa trang.

Bị tệp robots.txt chặn: Trang này đã bị tệp robots.txt chặn khỏi Googlebot. Bạn có thể xác minh điều này bằng trình kiểm tra robots.txt. Xin lưu ý rằng điều này không có nghĩa là trang sẽ không được lập chỉ mục bằng một số phương thức khác. Nếu có thể tìm thấy thông tin khác về trang này mà không cần tải trang, Google vẫn có thể lập chỉ mục trang (mặc dù điều này ít gặp hơn). Để đảm bảo rằng Google không lập chỉ mục một trang, hãy xoá quy tắc chặn trong robots.txt và sử dụng lệnh 'noindex'.

Bị chặn do yêu cầu trái phép (401): Trang đã bị chặn khỏi Googlebot do có yêu cầu ủy quyền (phản hồi 401). Nếu bạn muốn Googlebot có thể thu thập dữ liệu trang này, hãy xoá yêu cầu ủy quyền hoặc cho phép Googlebot truy cập vào trang của bạn.

Đã thu thập dữ liệu – hiện không được lập chỉ mục: Google đã thu thập dữ liệu nhưng chưa lập chỉ mục trang. Trang có thể được hoặc không được lập chỉ mục trong tương lai; bạn không cần phải gửi lại URL này để thu thập dữ liệu.

Đã phát hiện – hiện chưa được lập chỉ mục: Google đã phát hiện thấy trang nhưng chưa thu thập dữ liệu. Thông thường, Google muốn thu thập dữ liệu URL này nhưng quy trình này có thể sẽ làm quá tải trang web; do đó Google đã lên lịch thu thập lại dữ liệu. Đây là lý do ngày thu thập dữ liệu gần đây nhất được để trống trên báo cáo.

Trang thay thế có thẻ chuẩn thích hợp: Trang này trùng lặp với một trang mà Google công nhận là trang chuẩn. Trang này trỏ đến trang chuẩn thích hợp, do vậy bạn không cần phải làm gì.

Trang trùng lặp không có trang chuẩn do người dùng chọn: Trang này có các trang trùng lặp nhưng không trang nào trong số đó được đánh dấu là chuẩn. Chúng tôi nghĩ rằng trang này không phải là trang chuẩn. Bạn nên đánh dấu trang chuẩn cho trang này một cách rõ ràng. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

Trang trùng lặp, Google chọn trang chuẩn khác với người dùng: Trang này được đánh dấu là trang chuẩn cho một tập hợp trang, nhưng Google nghĩ rằng một URL khác là phiên bản chuẩn thích hợp hơn. Google đã lập chỉ mục trang mà chúng tôi xem là trang chuẩn chứ không phải trang này. Chúng tôi khuyên bạn đánh dấu trang này là bản sao của URL chính tắc một cách rõ ràng. Google phát hiện thấy trang này mặc dù chưa có yêu cầu rõ ràng về việc thu thập dữ liệu. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

Không tìm thấy (404): Trang này đã trả về lỗi 404 khi được yêu cầu. Google đã phát hiện thấy URL này mặc dù không có yêu cầu rõ ràng hay sơ đồ trang web nào. Google có thể đã phát hiện thấy URL dưới dạng đường liên kết từ một trang web khác hoặc có thể trang đã tồn tại trước đó và đã bị xóa. Googlebot có thể sẽ tiếp tục thử thu thập dữ liệu URL này trong một khoảng thời gian. Không có cách nào để yêu cầu Googlebot quên một URL vĩnh viễn, mặc dù Googlebot sẽ thu thập dữ liệu URL đó ít thường xuyên hơn. Phản hồi 404 không phải là vấn đề nếu đó là chủ đích của bạn. Nếu trang của bạn đã di chuyển, hãy sử dụng lệnh chuyển hướng 301 tới vị trí mới. Hãy đọc phần Sửa lỗi 404

Trang có lệnh chuyển hướng: URL là một đường liên kết chuyển hướng và do đó không được thêm vào chỉ mục.

404 mềm: Yêu cầu trang trả về lỗi mà chúng tôi nghĩ là phản hồi 404 mềm. Điều này có nghĩa là trang trả về thông báo "not found" (không tìm thấy) thân thiện với người dùng mà không kèm theo mã phản hồi 404 tương ứng. Bạn nên trả về mã phản hồi 404 cho các trang "not found" (không tìm thấy) thực sự hoặc thêm thông tin khác vào trang để cho chúng tôi biết rằng đó không phải là mã 404 mềm. Tìm hiểu thêm

URL đã gửi không được chọn là trang chuẩn: URL thuộc một tập hợp các URL trùng lặp mà trong đó không có trang chuẩn được đánh dấu rõ ràng. Bạn đã yêu cầu URL này được lập chỉ mục một cách rõ ràng, nhưng vì URL là trang trùng lặp và Google nghĩ rằng một URL khác là trang chuẩn thích hợp hơn, Google đã không lập chỉ mục URL này. Thay vào đó, chúng tôi đã lập chỉ mục trang chuẩn mà chúng tôi chọn. (Google chỉ lập chỉ mục trang chuẩn trong một nhóm các trang trùng lặp.) Sự khác nhau giữa trạng thái này và "Google chọn trang chuẩn khác với người dùng" là bạn đã yêu cầu lập chỉ mục một cách rõ ràng trong trường hợp này. Bạn sẽ thấy URL chính tắc do Google chọn khi kiểm tra URL này.

Bị chặn do lỗi truy cập bị cấm (403): Tác nhân người dùng đã cung cấp thông tin đăng nhập nhưng vẫn không được cấp quyền truy cập. Tuy nhiên, Googlebot không bao giờ cung cấp thông tin đăng nhập, vì vậy, máy chủ của bạn trả lại lỗi này là do nhầm lẫn. Bạn phải khắc phục lỗi này hoặc chặn trang bằng tệp robots.txt hoặc lệnh noindex.

Bị chặn do lỗi 4xx khác: Máy chủ gặp một lỗi 4xx không thuộc bất kỳ loại vấn đề nào khác đã nêu ở đây.

Thông tin này có hữu ích không?
Chúng tôi có thể cải thiện trang này bằng cách nào?
Tìm kiếm
Xóa tìm kiếm
Đóng tìm kiếm
Các ứng dụng của Google
Menu chính
Tìm kiếm trong Trung tâm trợ giúp
true
83844
false