Xem những trang mà Google có thể tìm thấy và lập chỉ mục trên trang web của bạn, đồng thời tìm hiểu về mọi vấn đề xảy ra trong quá trình lập chỉ mục.
Trạng thái phạm vi lập chỉ mục trong Search Console – Chương trình đào tạo về Google Search Console
Bắt đầu
Hướng dẫn sử dụng dành cho người không chuyên
Nếu bạn mới làm quen với khái niệm lập chỉ mục hoặc SEO hay bạn có một trang web nhỏ, hãy làm theo hướng dẫn sau đây:
- Quyết định xem bạn có cần sử dụng báo cáo này hay không. Nếu trang web của bạn có dưới 500 trang thì có lẽ bạn không cần dùng báo cáo này. Thay vào đó, hãy sử dụng những cụm từ tìm kiếm sau đây trên Google để xem liệu các trang chính (hoặc trang bất kỳ) trên trang web của bạn đã được lập chỉ mục hay chưa. Chỉ khi những cụm từ tìm kiếm này không trả về kết quả nào cho trang web của bạn và bạn sẵn sàng dành thời gian để hiểu rõ báo cáo này, thì bạn mới nên sử dụng báo cáo Lập chỉ mục trang để xem lý do khiến trang web của mình không được lập chỉ mục (xem phần khắc phục sự cố).
- Xem tập hợp mẫu các trang mà Google đã biết trên trang web của bạn:
Cú pháp:site:<<đường_dẫn_hoặc_miền_gốc_của_trang_web>>
Ví dụ:site:vidu.com
hoặcsite:vidu.com/cuahangthucung
- Tìm kiếm các chủ đề mà trang web của bạn đề cập đến (tìm kiếm cụm từ trên các trang quan trọng nhất, bao gồm cả trang chủ):
Cú pháp:site:<<đường_dẫn_hoặc_miền_gốc_của_trang_web>> cụm_từ1 cụm_từ2
Ví dụ:site:vidu.com/cuahangthucung chó mèo
. - Tìm URL chính xác của một trang trên trang web của bạn để xem Google đã lập chỉ mục trang đó hay chưa (tìm những trang quan trọng nhất trên trang web, bao gồm cả trang chủ):
Cú pháp:site:<<url-chính-xác>
Ví dụ:site:http://vidu.com/cuahangthucung/meo
- Xem tập hợp mẫu các trang mà Google đã biết trên trang web của bạn:
- Đọc hướng dẫn sử dụng tóm tắt này để nắm được nội dung giải thích ngắn gọn và dễ hiểu về báo cáo này.
- Nếu bạn muốn tìm hiểu sâu hơn:
- Đọc cách thức hoạt động của Google Tìm kiếm. Nếu bạn chưa hiểu rõ quá trình lập chỉ mục thì báo cáo này sẽ khiến bạn nhầm lẫn hoặc bối rối – chúng tôi chắc chắn như vậy.
- Báo cáo này không dùng để điều tra trạng thái lập chỉ mục của các trang cụ thể. Để xem trạng thái lập chỉ mục của một trang cụ thể, hãy dùng Công cụ kiểm tra URL.
- Những điểm cần chú ý trong báo cáo này:
- Có phải tất cả URL quan trọng của bạn đều có màu xanh lục (đã được lập chỉ mục) không? Phần lớn các trang web đều có ít nhất một vài trang chưa được lập chỉ mục, nhưng các trang quan trọng của bạn thì nên được lập chỉ mục toàn bộ. Đừng quên rằng bạn không nên lập chỉ mục các URL trùng lặp. Hãy kiểm tra trạng thái lập chỉ mục của trang chủ và các trang chính bằng Công cụ kiểm tra URL. Xin lưu ý rằng danh sách URL mẫu trong báo cáo này chỉ chứa tối đa 1.000 mục và chúng tôi không đảm bảo rằng tất cả URL có trạng thái cụ thể đều xuất hiện, ngay cả khi có dưới 1.000 mục trong danh sách.
- Lý do khiến các URL có màu xám (không được lập chỉ mục) có chính đáng không? Khi Google không lập chỉ mục một URL nào đó thì cũng không thành vấn đề nếu có lý do thích hợp – ví dụ: do quy tắc trong tệp robots.txt trên trang web của bạn, thẻ noindex trên trang, URL trùng lặp hoặc mã 404 cho một trang mà bạn đã xoá mà không thay thế.
- Nếu tổng số URL trong báo cáo này nhỏ hơn nhiều so với số lượng trang trên trang web của bạn, thì tức là Google không tìm thấy các trang trên trang web của bạn. Nguyên nhân của vấn đề này có thể là:
- Những trang bị thiếu hoặc trang web của bạn mới được tạo. Có thể mất khoảng một tuần để Google bắt đầu thu thập dữ liệu và lập chỉ mục một trang hoặc trang web mới. Nếu trang hoặc trang web của bạn mới được tạo, hãy chờ một vài ngày để Google tìm và thu thập dữ liệu. Trong tình huống khẩn cấp hoặc nếu việc chờ đợi có vẻ không hiệu quả, bạn có thể đưa ra yêu cầu rõ ràng để Google thu thập dữ liệu trên từng trang.
- Google không tìm thấy những trang bị thiếu đó. Phải có cách thì Google mới tìm được một trang để thu thập dữ liệu trên đó. Tức là trang đó phải được liên kết với một trang đã biết hoặc qua một sơ đồ trang web. Đối với trang web mới, bước đầu tiên phù hợp nhất là yêu cầu lập chỉ mục trang chủ. Khi đó, Google sẽ bắt đầu thu thập dữ liệu trên trang web của bạn. Đối với những phần bị thiếu trên một trang web, hãy đảm bảo rằng những phần đó được liên kết đúng cách. Nếu bạn đang sử dụng một dịch vụ lưu trữ trang web, chẳng hạn như Wix hay SquareSpace, có thể họ sẽ cho Google biết về mọi trang mới sau khi bạn xuất bản các trang đó. Hãy xem tài liệu của nhà cung cấp dịch vụ lưu trữ trang web để tìm hiểu cách xuất bản trang và giúp công cụ tìm kiếm tìm được các trang đó.
- Đọc tài liệu về vấn đề cụ thể khi lập chỉ mục để hiểu và khắc phục vấn đề (nếu cần). So với việc đọc tài liệu, thì việc không đọc tài liệu sẽ khiến bạn tốn nhiều thời gian và công sức hơn sau này.
- Kết quả không nên mong đợi:
- Đừng mong đợi Google sẽ lập chỉ mục mọi URL trên trang web của bạn. Một số URL có thể bị trùng lặp hoặc không chứa thông tin có ý nghĩa. Bạn chỉ cần đảm bảo rằng các trang quan trọng trên trang web của mình được lập chỉ mục.
- Các URL không được lập chỉ mục có thể vẫn ổn. Hãy đọc và tìm hiểu lý do cụ thể của từng URL không được lập chỉ mục để chắc chắn rằng lý do không lập chỉ mục trang là thoả đáng.
- Không phải lúc nào số liệu tổng cộng ở đây cũng khớp chính xác với số lượng URL ước tính trên trang web của bạn. Về phía Google, số liệu tổng (đã lập chỉ mục + không được lập chỉ mục) phía trên biểu đồ là đầy đủ và chính xác, nhưng có thể có chênh lệch nhỏ vì nhiều lý do.
- Trang đã được lập chỉ mục cũng chưa chắc sẽ xuất hiện trong kết quả tìm kiếm. Kết quả tìm kiếm được điều chỉnh theo nhật ký tìm kiếm, vị trí và nhiều yếu tố khác tuỳ theo người dùng. Vì vậy, ngay cả khi một trang đã được lập chỉ mục, không phải lúc nào trang đó cũng xuất hiện trong mọi lượt tìm kiếm hoặc ở cùng một thứ hạng. Do đó, nếu Search Console cho biết một URL đã được lập chỉ mục nhưng URL đó không xuất hiện trong kết quả tìm kiếm, thì bạn có thể tạm hiểu rằng URL đó đã được lập chỉ mục và đủ điều kiện xuất hiện trong kết quả tìm kiếm.
Câu hỏi thường gặp
Báo cáo này thể hiện thông tin gì?
Báo cáo Lập chỉ mục trang cho biết số lượng URL trên trang web của bạn đã được Google thu thập dữ liệu và lập chỉ mục. (Nếu bạn không biết rõ những thuật ngữ này, hãy đọc cách thức hoạt động của Google Tìm kiếm). Google tìm được URL theo nhiều cách và cố gắng thu thập dữ liệu trên hầu hết những URL đó. Nếu một URL không xuất hiện hoặc không truy cập được, thì có thể Google sẽ tiếp tục thử thu thập dữ liệu URL đó trong một thời gian.
Lập chỉ mục là gì?
Làm thế nào để Google lập chỉ mục trang hoặc trang web của tôi?
Nếu bạn đang sử dụng một dịch vụ lưu trữ trang web (chẳng hạn như Wix hoặc SquareSpace), thì có thể dịch vụ lưu trữ của bạn sẽ báo cho Google mỗi khi bạn xuất bản hoặc cập nhật trang. Hãy xem tài liệu của nhà cung cấp dịch vụ lưu trữ trang web để tìm hiểu cách xuất bản các trang của bạn và giúp các công cụ tìm kiếm tìm được những trang đó.
Nếu đang tạo một trang hoặc trang web mà không dùng dịch vụ lưu trữ, thì bạn có thể dùng sơ đồ trang web hoặc nhiều phương pháp khác để cho Google biết về trang hoặc trang web mới đó.
Bạn nên đảm bảo rằng trang chủ của mình đã được lập chỉ mục. Bắt đầu từ trang chủ, Google có thể lập chỉ mục mọi trang khác trên trang web nếu trang web có các yếu tố điều hướng toàn diện và được triển khai đúng cách cho khách truy cập.
Một trang không được lập chỉ mục thì có sao không?
Hướng dẫn sử dụng dành cho chuyên viên SEO, nhà phát triển và chủ sở hữu trang web có kinh nghiệm
- Đọc cách thức hoạt động của Google Tìm kiếm. Nếu bạn chưa hiểu rõ quá trình lập chỉ mục thì báo cáo này sẽ khiến bạn nhầm lẫn hoặc bối rối – chúng tôi chắc chắn như vậy.
- Làm theo nguyên tắc trong phần Khám phá nội dung báo cáo, bao gồm cả Những điểm cần chú ý và Kết quả không nên mong đợi.
- Đọc phần khắc phục sự cố để nắm được và khắc phục các vấn đề thường gặp.
- Nhớ rằng trạng thái Không được lập chỉ mục chưa hẳn là xấu. Hãy kiểm tra lý do khiến một URL cụ thể không được lập chỉ mục.
- Đọc tài liệu về vấn đề cụ thể để hiểu được vấn đề đó và xem cách khắc phục.
Sử dụng báo cáo này
Báo cáo Lập chỉ mục trang cho thấy trạng thái lập chỉ mục của Google đối với mọi URL mà Google đã biết trong tài sản của bạn.
Trang tóm tắt
Trang tóm tắt cấp cao nhất trong báo cáo trình bày một biểu đồ và số lượng trang đã được lập chỉ mục và không được lập chỉ mục (nhưng đã yêu cầu), cũng như các bảng cho biết lý do không thể lập chỉ mục URL, hoặc các điểm cải thiện khác về việc lập chỉ mục.
- Bảng Lý do trang không được lập chỉ mục cho thấy những vấn đề khiến Google không thể lập chỉ mục các URL trên trang web của bạn. Hãy nhấp vào một dòng để xem trang chi tiết về những URL chịu ảnh hưởng của vấn đề này và những lần mà trang web của bạn gặp phải vấn đề này.
- Bảng Cải thiện trải nghiệm trên trang cho thấy những vấn đề không ngăn việc lập chỉ mục trang, nhưng bạn nên khắc phục để Google có thể hiểu trang của bạn rõ hơn. Hãy nhấp vào một dòng để xem trang chi tiết, nơi tập trung thông tin về tất cả URL có cùng vấn đề.
- Đường liên kết Xem dữ liệu về các trang đã lập chỉ mục cho thấy dữ liệu quá khứ về số lượng trang đã được lập chỉ mục cũng như danh sách mẫu gồm tối đa 1.000 URL đã được lập chỉ mục.
Những điểm cần chú ý
Lý tưởng nhất là bạn sẽ thấy số trang được lập chỉ mục tăng dần dần khi trang web của bạn ngày càng phát triển. Nếu bạn nhận thấy có sự sụt giảm hoặc gia tăng mạnh, hãy xem phần khắc phục vấn đề.
Mục tiêu của bạn là khiến Google lập chỉ mục phiên bản chính tắc của mọi trang quan trọng. Bạn không nên lập chỉ mục các trang trùng lặp hoặc các trang thay thế. Nếu bạn có một trang được đánh dấu là trùng lặp hoặc thay thế, thường thì đó là một dấu hiệu tốt. Điều này có nghĩa là chúng tôi đã tìm thấy trang chính tắc và lập chỉ mục trang đó. Bạn có thể tìm thấy phiên bản chính tắc của mọi URL bằng cách chạy Công cụ kiểm tra URL.
Xem thêm lý do tại sao có thể trang không xuất hiện trong chỉ mục.
Kết quả không nên mong đợi
- Phạm vi lập chỉ mục đạt 100%: Bạn không nên kỳ vọng Google sẽ lập chỉ mục tất cả URL trên trang web của bạn mà chỉ nên tập trung vào các trang chính tắc như được mô tả ở trên.
- Lập chỉ mục ngay lập tức: Khi bạn thêm nội dung mới, Google có thể mất vài ngày để lập chỉ mục nội dung đó. Bạn có thể giảm thời gian chờ lập chỉ mục bằng cách yêu cầu lập chỉ mục.
Trạng thái
URL có thể có một trong những trạng thái sau:
- Không được lập chỉ mục: URL chưa được lập chỉ mục do lỗi lập chỉ mục hoặc vì lý do chính đáng (ví dụ: trang đó là trang trùng lặp, hoặc bị tệp robots.txt chặn lập chỉ mục). Lý do khiến URL không được lập chỉ mục được liệt kê trong bảng Lý do trang không được lập chỉ mục. Hãy đọc tài liệu về từng lý do để xác định xem bạn có thể khắc phục vấn đề nào không. Giá trị Nguồn cho biết liệu đây có phải là vấn đề mà bạn có thể khắc phục hay không.
- Đã lập chỉ mục: Các URL này đã được lập chỉ mục thành công. Xem một mẫu gồm các URL được lập chỉ mục bằng cách nhấp vào Xem dữ liệu về các trang đã lập chỉ mục bên dưới biểu đồ trên trang tóm tắt cho báo cáo.
Lý do
Lý do không thể lập chỉ mục một URL. Hãy xem phần mô tả lý do dưới đây để biết nội dung mô tả về từng vấn đề và cách xử lý (nếu cần).
Nguồn:
Giá trị Nguồn trong bảng cho biết nguồn gốc của vấn đề là do Google hay trang web. Nhìn chung, bạn chỉ có thể khắc phục các vấn đề có giá trị Nguồn là "Trang web".
Xác thực
Cho dù bạn đã yêu cầu xác thực bản sửa lỗi cho vấn đề này hay chưa và trạng thái của lần xác thực đó là gì (nếu đã yêu cầu), bạn nên ưu tiên khắc phục các vấn đề có trạng thái xác thực là "không thành công" hoặc "chưa bắt đầu" và nguồn là "Trang web".
Lý do cần xác thực
Việc thông báo cho Google rằng bạn đã khắc phục tất cả vấn đề trong một danh mục hoặc trạng thái vấn đề cụ thể sẽ có những lợi ích sau:
- Bạn sẽ nhận được email khi Google xác nhận xong kết quả khắc phục của bạn cho tất cả các URL hoặc nếu Google tìm thấy trường hợp chưa giải quyết của vấn đề đó.
- Bạn có thể theo dõi tiến độ của Google trong quá trình xác nhận kết quả khắc phục và xem nhật ký của tất cả các trang trong hàng đợi kiểm tra cũng như trạng thái khắc phục của từng URL.
Không phải lúc nào bạn cũng có thể khắc phục và xác thực một vấn đề cụ thể trên trang web của mình. Ví dụ: có thể các URL bị robots.txt chặn là do có chủ ý. Hãy suy xét kỹ khi quyết định xem có nên giải quyết một vấn đề nhất định hay không.
Bạn cũng có thể khắc phục vấn đề mà không cần xác thực; Google sẽ cập nhật số lượng trường hợp mỗi khi thu thập dữ liệu một trang có vấn đề đã biết, dù bạn có thể hiện rõ yêu cầu xác thực hay không.
Bắt đầu xác thực
Cách thông báo cho Search Console rằng bạn đã khắc phục vấn đề:
- Khắc phục mọi trường hợp của vấn đề trên trang web của bạn. Nếu bạn sửa sót một trường hợp, quá trình xác thực sẽ dừng khi Google tìm thấy trường hợp còn lại bất kỳ của vấn đề đó.
- Mở trang chi tiết về vấn đề mà bạn đã khắc phục. Nhấp vào vấn đề đó trên danh sách vấn đề trong báo cáo của bạn.
- ⚠️ Nếu bạn bị xếp vào một sơ đồ trang web cụ thể trong báo cáo, thì việc xác thực sẽ chỉ áp dụng cho những mục trong sơ đồ trang web tại thời điểm yêu cầu xác thực. Đây có thể là điều bạn mong đợi hoặc không. Hãy lưu ý điều này.
- Nhấp vào Xác thực kết quả khắc phục. Đừng nhấp vào Xác thực kết quả khắc phục cho đến khi quá trình xác thực kết thúc thành công hoặc không thành công. Tìm hiểu thêm về cách Google kiểm tra kết quả khắc phục của bạn.
- Bạn có thể theo dõi tiến độ xác thực. Quá trình xác thực thường mất tối đa khoảng hai tuần, nhưng một số trường hợp có thể mất nhiều thời gian hơn, vì vậy, xin hãy kiên nhẫn. Bạn sẽ nhận được thông báo khi quá trình xác thực kết thúc thành công hoặc không thành công.
- Nếu xác thực không thành công, bạn có thể xem URL nào khiến quá trình xác thực không thành công bằng cách nhấp vào Xem chi tiết trong trang chi tiết về vấn đề đó. Hãy khắc phục lỗi cho trang này, xác nhận rằng bạn khắc phục mọi URL ở trạng thái Đang chờ xử lý và bắt đầu xác thực lại.
Khi nào vấn đề được xem là "đã khắc phục" cho một URL hay một mục?
Vấn đề được đánh dấu là đã khắc phục cho một URL hoặc một mục khi đáp ứng một trong các điều kiện sau:
- Khi Google thu thập dữ liệu URL và không còn tìm thấy vấn đề trên trang. Đối với lỗi thẻ AMP, điều này có nghĩa là bạn đã khắc phục lỗi cho thẻ hoặc thẻ đã bị xoá (nếu là thẻ không bắt buộc). Trong quá trình xác thực, email đó sẽ có nhãn Đạt.
- Nếu Google không truy cập được vào trang vì bất kỳ lý do nào (trang bị xoá, trang có thẻ đánh dấu noindex, trang yêu cầu xác thực, v.v.), thì hệ thống sẽ coi như vấn đề đã được khắc phục cho URL đó. Trong quá trình xác thực, trang sẽ được gán trạng thái xác thực là Khác.
Thời gian tồn tại của vấn đề
Thời gian tồn tại của một vấn đề là tính từ lần đầu tiên phát hiện thấy trường hợp bất kỳ của vấn đề trên trang web cho đến 90 ngày sau khi trường hợp cuối cùng được đánh dấu là đã biến mất khỏi trang web. Nếu 90 ngày đã qua mà không có trường hợp lặp lại nào, thì vấn đề đó sẽ bị xoá khỏi bảng vấn đề.
Ngày phát hiện đầu tiên của một vấn đề là ngày đầu tiên phát hiện thấy vấn đề trong thời gian tồn tại của vấn đề. Ngày này không thay đổi. Vì thế:
- Nếu bạn đã khắc phục mọi trường hợp của một vấn đề nhưng một trường hợp mới của vấn đề xảy ra 15 ngày sau đó, thì vấn đề đó vẫn sẽ được đánh dấu là chưa khắc phục và ngày phát hiện đầu tiên vẫn là ngày ban đầu.
- Nếu cùng một vấn đề xảy ra sau 91 ngày kể từ khi trường hợp cuối cùng được khắc phục, thì vấn đề trước đó đã bị đóng, và do đó, vấn đề này được ghi lại là một vấn đề mới, ngày phát hiện đầu tiên được thiết lập thành ngày phát hiện mới.
Dưới đây là tổng quan về quy trình xác thực sau khi bạn nhấp vào Xác thực kết quả khắc phục cho một vấn đề. Quy trình này có thể mất vài ngày hoặc thậm chí lâu hơn và bạn sẽ nhận được thông báo tiến độ qua email.
- Khi bạn nhấp vào Xác thực kết quả khắc phục, thì Search Console sẽ ngay lập tức kiểm tra một vài trang.
- Nếu vấn đề hiện tại xảy ra trên bất kỳ trang nào trong số này, quy trình xác thực sẽ kết thúc và trạng thái xác thực vẫn giữ nguyên.
- Nếu lỗi hiện tại không xảy ra trên các trang mẫu, quy trình xác thực sẽ tiếp tục với trạng thái Đã bắt đầu. Nếu quy trình xác thực tìm thấy các vấn đề không liên quan khác, các vấn đề đó được tính theo loại vấn đề tương ứng và quy trình xác thực vẫn tiếp tục.
- Search Console sẽ kiểm tra hết danh sách URL mà hệ thống đã xác định là bị vấn đề này ảnh hưởng. Chỉ những URL chứa các trường hợp đã biết của vấn đề này mới được đưa vào hàng đợi để thu thập lại dữ liệu, chứ không phải toàn bộ trang web. Search Console lưu giữ bản ghi về tất cả URL đã kiểm tra trong nhật ký xác thực và bạn có thể truy cập vào nhật ký này từ trang chi tiết vấn đề.
- Khi Search Console kiểm tra một URL:
- Nếu không tìm thấy vấn đề, trạng thái xác thực trường hợp sẽ thay đổi thành Đạt. Nếu đây là trường hợp đầu tiên được kiểm tra sau khi quy trình xác thực bắt đầu, trạng thái xác thực vấn đề sẽ thay đổi thành Trông có vẻ ổn.
- Nếu Search Console không truy cập được URL nữa, trạng thái xác thực trường hợp sẽ thay đổi thành Khác (không phải là trạng thái lỗi).
- Nếu trường hợp vẫn còn tồn tại, trạng thái vấn đề sẽ thay đổi thành Không đạt và quy trình xác thực kết thúc. Nếu đây là một trang mà hệ thống mới phát hiện qua quá trình thu thập dữ liệu bình thường, thì trang sẽ được xem là một trường hợp khác của vấn đề hiện tại này.
- Khi hệ thống đã kiểm tra URL trong hàng đợi cho vấn đề này và nhận thấy vấn đề này đã được khắc phục, trạng thái của vấn đề sẽ thay đổi thành Đạt. Tuy nhiên, ngay cả khi mọi trường hợp đã được khắc phục, nhãn mức độ nghiêm trọng của vấn đề vẫn không thay đổi (Lỗi hoặc Cảnh báo), mà chỉ thay đổi số lượng các mục bị ảnh hưởng (0).
Ngay cả khi bạn chưa từng nhấp vào Bắt đầu xác thực, Google vẫn có thể phát hiện các trường hợp đã khắc phục của một vấn đề. Nếu phát hiện thấy tất cả trường hợp của một vấn đề đã được khắc phục trong quá trình thu thập dữ liệu thông thường, Google sẽ thay đổi số lượng vấn đề thành 0 trên báo cáo.
⚠️ Bạn nên đợi chu kỳ xác thực hoàn tất trước khi yêu cầu một chu kỳ khác, ngay cả khi bạn đã khắc phục một số vấn đề trong chu kỳ hiện tại.
Cách bắt đầu lại quá trình xác thực không thành công:
- Chuyển đến nhật ký xác thực cho lần xác thực không thành công: Mở trang chi tiết của vấn đề không vượt qua quy trình xác thực rồi nhấp vào Xem chi tiết.
- Nhấp vào Bắt đầu lần xác thực mới.
- Quy trình xác thực sẽ bắt đầu lại cho tất cả URL được đánh dấu là Đang chờ xử lý hoặc Không đạt, cộng với mọi trường hợp mới của vấn đề này được phát hiện thông qua hoạt động thu thập dữ liệu thông thường kể từ lần xác thực gần nhất. Các URL được đánh dấu Đạt hoặc Khác sẽ không được kiểm tra lại.
- Quá trình xác thực thường mất tối đa khoảng hai tuần, nhưng một số trường hợp có thể mất nhiều thời gian hơn, vì vậy, xin hãy kiên nhẫn.
Xem tiến độ xác thực
Để xem tiến độ của yêu cầu xác thực hiện tại hoặc nhật ký của yêu cầu gần nhất nếu không có quy trình xác thực nào đang diễn ra:
- Mở trang chi tiết về vấn đề. Nhấp vào hàng của vấn đề trong trang báo cáo chính để mở trang chi tiết về vấn đề.
- Trạng thái của yêu cầu xác thực xuất hiện cả trong trang chi tiết về vấn đề và cả trong hàng Xác thực của bảng Thông tin chi tiết.
- Nhấp vào Xem chi tiết để mở trang chi tiết xác thực cho yêu cầu đó.
- Trạng thái trường hợp của mỗi URL có trong yêu cầu được trình bày trong bảng.
- Trạng thái trường hợp áp dụng cho vấn đề cụ thể mà bạn đang kiểm tra. Bạn có thể thấy một vấn đề có nhãn Đạt trên một trang, nhưng các vấn đề khác thì có nhãn Không đạt, Đang chờ xử lý hoặc Khác trên cùng một trang.
- Trong báo cáo AMP và báo cáo Lập chỉ mục trang, các mục trong trang nhật ký xác thực được nhóm theo URL.
- Trong báo cáo Kết quả nhiều định dạng, các mục được nhóm bằng cách kết hợp URL + mục dữ liệu có cấu trúc (xác định bằng giá trị Tên của mục).
Các trạng thái xác thực sau đây áp dụng cho quá trình xác thực đối với một vấn đề nhất định:
- Chưa bắt đầu: Một hoặc nhiều trường hợp của vấn đề này chưa từng có trong yêu cầu xác thực cho vấn đề này.
Bước tiếp theo- Nhấp vào vấn đề để tìm hiểu chi tiết về lỗi. Hãy kiểm tra các trang riêng lẻ để xem ví dụ về lỗi trên trang thực tế.
- Nhấp vào Tìm hiểu thêm trên trang chi tiết để xem thông tin chi tiết về vấn đề.
- Nhấp vào dòng URL ví dụ trong bảng để biết thông tin chi tiết về lỗi cụ thể đó.
- Khắc phục các trang của bạn rồi nhấp vào Xác thực bản sửa lỗi để bắt đầu xác thực. Quá trình xác thực thường mất tối đa khoảng hai tuần, nhưng một số trường hợp có thể mất nhiều thời gian hơn, vì vậy, xin hãy kiên nhẫn.
- Đã bắt đầu: Bạn đã bắt đầu một lượt xác thực và Google chưa tìm thấy trường hợp còn lại nào của vấn đề.
Bước tiếp theo: Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết việc bạn nên làm (nếu cần thiết). - Trông có vẻ ổn: Bạn đã bắt đầu xác thực và tất cả trường hợp của vấn đề mà Google đã kiểm tra đến giờ đều đã được khắc phục.
Bước tiếp theo: Bạn không cần phải làm gì, nhưng Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết việc bạn nên làm. - Đạt: Tất cả trường hợp đã biết của vấn đề đã biến mất (hoặc URL bị ảnh hưởng không còn truy cập được nữa). Bạn hẳn đã nhấp vào Xác thực bản sửa lỗi để có được trạng thái này (nếu vấn đề biến mất khi bạn chưa yêu cầu xác thực, trạng thái sẽ thay đổi thành Không áp dụng).
Bước tiếp theo: Bạn không cần phải làm gì khác. - Không áp dụng: Google nhận thấy vấn đề đã được khắc phục trên tất cả URL, ngay cả khi bạn chưa hề bắt đầu xác thực.
Bước tiếp theo: Bạn không cần phải làm gì khác. - Không đạt: Một số lượng trang vẫn chứa vấn đề này sau khi bạn nhấp vào Xác thực.
Bước tiếp theo: Khắc phục vấn đề và bắt đầu xác thực lại.
Sau khi bạn yêu cầu xác thực, mọi trường hợp của vấn đề đều sẽ được gán một trong các trạng thái xác thực sau đây:
- Đang chờ xử lý: Đã đưa vào hàng đợi xác thực. Trong lần cuối cùng Google kiểm tra, trường hợp này của vấn đề vẫn tồn tại.
- Đạt: [Không phải báo cáo nào cũng có] Google đã kiểm tra trường hợp này của vấn đề và trường hợp này không còn tồn tại. Bạn chỉ có thể đạt được trạng thái này nếu đã nhấp rõ ràng vào Xác thực cho trường hợp này.
- Không đạt: Google đã kiểm tra trường hợp này của vấn đề và trường hợp này vẫn còn đó. Bạn chỉ có thể đạt được trạng thái này nếu đã nhấp rõ ràng vào Xác thực cho trường hợp này.
- Khác: [Không phải báo cáo nào cũng có] Google không truy cập được vào URL có trường hợp này hoặc không tìm thấy mục đó trên trang nữa (đối với dữ liệu có cấu trúc). Được xem là trạng thái tương đương với Đạt.
Xin lưu ý rằng cùng một URL có thể có nhiều trạng thái tuỳ theo loại vấn đề. Ví dụ: nếu một trang có cả vấn đề X và vấn đề Y, thì vấn đề X có thể thuộc trạng thái xác thực Đạt trong khi vấn đề Y trên chính trang đó có thể thuộc trạng thái xác thực Đang chờ xử lý.
Bộ lọc sơ đồ trang web
Bạn có thể sử dụng bộ lọc thả xuống phía trên biểu đồ để lọc kết quả lập chỉ mục theo tình trạng đã đưa vào sơ đồ trang web hay chưa. Bạn có các tuỳ chọn sau đây:
- Tất cả các trang đã biết [Mặc định] – Cho thấy tất cả URL mà Google đã biết, dù cho có được liệt kê trong sơ đồ trang web hay không.
- Tất cả trang đã gửi – Chỉ cho thấy những URL có trong một sơ đồ trang web hoặc chỉ mục sơ đồ trang web được gửi bằng báo cáo Sơ đồ trang web hoặc tệp robots.txt trên trang web của bạn.
- Chỉ các trang chưa gửi – Chỉ cho thấy các URL không được liệt kê trong sơ đồ trang web được gửi bằng báo cáo Sơ đồ trang web hoặc tệp robots.txt trên trang web của bạn.
- URL trong sơ đồ trang web cụ thể – Chỉ cho thấy các URL có trong một sơ đồ trang web hoặc chỉ mục sơ đồ trang web cụ thể được gửi bằng báo cáo Sơ đồ trang web hoặc tệp robots.txt trên trang web của bạn.
Một URL được xem là đã gửi qua sơ đồ trang web ngay cả khi Google đã phát hiện thấy URL đó bằng cơ chế khác (ví dụ: bằng cách thu thập dữ liệu tự nhiên qua trang khác).
Trang chi tiết
Hãy nhấp vào một dòng trong trang tóm tắt để mở trang chi tiết về các URL có cùng vấn đề hoặc trạng thái trên trang web đó. Bạn có thể xem thông tin chi tiết về vấn đề đã chọn bằng cách nhấp vào phần Tìm hiểu thêm ở đầu trang.
Biểu đồ trên trang này cho thấy số trang bị ảnh hưởng theo thời gian.
Bảng Ví dụ cho thấy danh sách ví dụ về những trang chịu ảnh hưởng của vấn đề này. Danh sách này không nhất thiết cho thấy tất cả URL có vấn đề đã chọn và bị giới hạn trong 1.000 hàng. Mỗi hàng trong danh sách ví dụ có chức năng sau:
- Nhấp vào hàng để xem thêm thông tin chi tiết về URL.
- Nhấp vào để mở URL trong một thẻ mới.
- Nhấp vào để mở công cụ Kiểm tra URL cho URL đó.
- Nhấp vào để sao chép URL
Sau khi bạn khắc phục xong mọi trường hợp lỗi hoặc cảnh báo, hãy nhấp vào Xác thực bản sửa lỗi để báo cho Google về việc bạn đã khắc phục xong vấn đề.
Bạn thấy một URL bị đánh dấu là đang gặp phải một vấn đề mà bạn đã khắc phục? Có lẽ bạn đã khắc phục vấn đề SAU lần thu thập dữ liệu mới nhất của Google. Vì thế, nếu bạn thấy URL có một vấn đề mà bạn đã khắc phục, hãy kiểm tra ngày thu thập dữ liệu cho URL đó: Hãy kiểm tra và xác nhận kết quả sửa lỗi, sau đó yêu cầu Google lập chỉ mục lại
Chia sẻ báo cáo
Bạn có thể chia sẻ trang chi tiết vấn đề trong báo cáo phạm vi lập chỉ mục hoặc tính năng nâng cao bằng cách nhấp vào nút Chia sẻ trên trang. Đường liên kết này chỉ cho phép người có đường liên kết truy cập vào trang chi tiết vấn đề hiện tại và mọi trang lịch sử xác thực cho vấn đề này. Đường liên kết này không cấp quyền truy cập vào các trang khác về tài nguyên của bạn hoặc cho phép người dùng được chia sẻ thực hiện bất kỳ hành động nào đối với sản phẩm hay tài khoản của bạn. Bạn có thể thu hồi liên kết bất kỳ lúc nào bằng cách vô hiệu hóa chia sẻ cho trang này.
Xuất dữ liệu báo cáo
Nhiều báo cáo có nút xuất để xuất dữ liệu báo cáo. Dữ liệu biểu đồ và dữ liệu bảng sẽ đều được xuất. Những giá trị xuất hiện dưới dạng ~ hoặc - trong báo cáo (không có dữ liệu/không phải số) sẽ được biểu thị bằng số 0 trong dữ liệu được tải xuống.
Khắc phục sự cố
Bảng này được sắp xếp theo vấn đề mà chúng tôi cho là quan trọng nhất cần giải quyết. Cách điều tra một lý do cụ thể trong bảng lỗi lập chỉ mục:
- Nhấp vào một dòng trong bảng Lý do các trang không được lập chỉ mục. Xác định xem dòng đó có vấn đề hay không dựa trên nguyên nhân của trạng thái không được lập chỉ mục và mục tiêu lập chỉ mục, cũng như liệu bạn có thể khắc phục vấn đề dựa trên giá trị nguồn hay không.
- Đọc thông tin cụ thể về vấn đề.
- Kiểm tra một URL mẫu chịu ảnh hưởng của vấn đề này:
- Nhấp vào biểu tượng kiểm tra bên cạnh URL đó trong bảng ví dụ để mở Công cụ kiểm tra URL cho URL đó.
- Xem thông tin chi tiết về hoạt động thu thập dữ liệu và lập chỉ mục cho URL đó trong phần Phạm vi lập chỉ mục > Thu thập dữ liệu và Phạm vi lập chỉ mục > Lập chỉ mục trong báo cáo Kiểm tra URL.
- Để kiểm tra phiên bản đang hoạt động của trang, hãy nhấp vào Kiểm tra URL đang hoạt động.
Hiểu và khắc phục các vấn đề thường gặp khi lập chỉ mục
Sau đây là một số vấn đề phổ biến nhất về việc lập chỉ mục mà bạn có thể thấy trong báo cáo này:
Tổng số trang được lập chỉ mục giảm mà không có lỗi tương ứng
Số trang không được lập chỉ mục nhiều hơn số trang được lập chỉ mục
Nếu bạn thấy số trang không được lập chỉ mục nhiều hơn số trang được lập chỉ mục, hãy xem lý do nêu trong báo cáo. Sau đây là những lý do phổ biến khiến các nhóm trang lớn không được lập chỉ mục:
- Có một quy tắc robots.txt đang chặn Google thu thập dữ liệu nhiều trang trên trang web của bạn. Hãy bỏ chặn nếu bạn đang chặn nhầm trang.
- Trang web của bạn có số lượng lớn các trang trùng lặp, có thể là do trang web sử dụng các tham số để lọc hoặc sắp xếp một tập hợp chung (ví dụ:
type=dress
,color=green
hoặcsort=price
). Các trang này có thể sẽ không được lập chỉ mục nếu chỉ cho thấy cùng nội dung được sắp xếp, lọc hoặc tiếp cận theo nhiều cách.
Nếu bạn thấy số lỗi tăng đột biến, thì có thể lý do là một thay đổi trong mẫu của bạn gây ra lỗi mới hoặc có thể bạn đã gửi một sơ đồ trang web có chứa các URL bị tệp robots.txt, lệnh noindex hay yêu cầu đăng nhập chặn khỏi quá trình thu thập dữ liệu.
Nếu bạn thấy số lỗi tăng đột biến, hãy:
- Kiểm tra xem liệu có sự tương quan nào không giữa tổng số lỗi lập chỉ mục hoặc tổng số trang đã lập chỉ mục và biểu đồ thu nhỏ bên cạnh một hàng lỗi cụ thể trên trang tóm tắt. Nhờ vậy, bạn có thể biết được vấn đề nào có thể đang ảnh hưởng đến tổng số lỗi hay tổng số trang đã lập chỉ mục.
- Nhấp vào trang chi tiết để tìm những lỗi có vẻ như đang góp phần khiến số lỗi tăng vọt. Đọc mô tả về loại lỗi cụ thể để tìm hiểu cách xử lý tốt nhất.
- Hãy nhấp vào một vấn đề và kiểm tra một trang ví dụ để xem lỗi đó là gì (nếu cần thiết).
- Khắc phục mọi trường hợp của mỗi lỗi và yêu cầu xác thực bằng cách nhấp vào Xác thực bản sửa lỗi trong trang chi tiết cho nguyên nhân đó. Đọc thêm về quy trình xác thực.
- Bạn sẽ nhận được thông báo khi quy trình xác thực diễn ra, nhưng bạn có thể kiểm tra lại sau vài ngày để xem liệu số lỗi đã giảm hay chưa.
Kiểm tra khả năng kết nối với máy chủ
Sửa lỗi về khả năng kết nối với máy chủ
- Kiểm tra khả năng truy cập vào máy chủ thời gian gần đây trong báo cáo Số liệu thống kê về hoạt động thu thập dữ liệu để xem trang web của bạn có liên tục gặp vấn đề hay bị sự cố ở quy mô lớn không.
- Giảm hoạt động tải trang quá mức đối với các yêu cầu trang động.
Một trang web được xem là phân phát nội dung động nếu trang web đó cung cấp cùng một nội dung cho nhiều URL (ví dụ:www.example.com/shoes.php?color=red&size=7
phân phát cùng một nội dung nhưwww.example.com/shoes.php?size=7&color=red
). Các trang động cũng có thể mất nhiều thời gian để phản hồi, dẫn đến các vấn đề hết thời gian chờ. Hoặc máy chủ có thể trả về trạng thái quá tải để yêu cầu Googlebot thu thập dữ liệu trang web chậm hơn. Nói chung, bạn nên dùng tham số thật hạn chế và dùng các tham số một cách thận trọng. - Đảm bảo rằng máy chủ lưu trữ trang web của bạn không bị trục trặc, quá tải hay định cấu hình sai cách.
Nếu vấn đề kết nối, hết thời gian chờ hoặc phản hồi vẫn tiếp diễn, hãy kiểm tra với nhà cung cấp dịch vụ lưu trữ web và cân nhắc việc tăng khả năng xử lý lưu lượng truy cập cho trang web. - Kiểm tra để đảm bảo bạn không vô tình chặn Google.
Có thể bạn đang chặn Google do một vấn đề cấp hệ thống, chẳng hạn như vấn đề cấu hình DNS, tường lửa hay hệ thống bảo vệ DoS được định cấu hình không đúng cách hoặc cấu hình hệ thống quản lý nội dung. Hệ thống bảo vệ là một phần quan trọng của dịch vụ lưu trữ chất lượng cao và thường được thiết lập để tự động chặn các yêu cầu máy chủ ở mức cao bất thường. Tuy nhiên, do thường tạo ra nhiều yêu cầu hơn so với người dùng là con người nên Googlebot có thể kích hoạt các hệ thống bảo vệ này, khiến chúng chặn và ngăn Googlebot thu thập dữ liệu trên trang web của bạn. Để khắc phục các vấn đề như vậy, hãy xác định phần nào trong cơ sở hạ tầng của trang web của bạn đang chặn Googlebot rồi bỏ chặn. Tường lửa có thể không thuộc quyền kiểm soát của bạn do đó bạn cần thảo luận việc này với nhà cung cấp dịch vụ lưu trữ của mình. - Kiểm soát hoạt động thu thập dữ liệu và lập chỉ mục trang web của công cụ tìm kiếm một cách hợp lý.
Một số quản trị viên web chủ định ngăn Googlebot truy cập trang web của họ, có thể là bằng cách sử dụng tường lửa như được mô tả ở trên. Trong những trường hợp này, mục đích thường không phải là chặn hoàn toàn Googlebot mà là kiểm soát cách trang web được thu thập dữ liệu và lập chỉ mục. Nếu điều này đúng với bạn, hãy kiểm tra các điều sau:- Để kiểm soát việc Googlebot thu thập dữ liệu nội dung của bạn, hãy sử dụng tệp robots.txt.
- Nếu lo ngại về việc các bot xấu sử dụng tác nhân người dùng Googlebot, bạn có thể xác minh xem trình thu thập dữ liệu có thực sự là Googlebot không.
- Nếu muốn thay đổi tần suất Googlebot thu thập dữ liệu trang web của mình, bạn có thể yêu cầu thay đổi tốc độ thu thập dữ liệu của Googlebot. Nhà cung cấp dịch vụ lưu trữ cũng có thể xác minh quyền sở hữu đối với các địa chỉ IP của họ để cho phép bạn yêu cầu.
Nói chung, bạn chỉ nên sửa các trang bị lỗi 404 có liên kết với các trang khác của bạn hoặc có liệt kê trong sơ đồ trang web. Nếu trang đã di chuyển, bạn nên sẽ trả về một lệnh chuyển hướng 3XX đến trang mới. Tìm hiểu thêm về cách đánh giá và sửa lỗi 404.
Nếu trang của bạn hoàn toàn không có trong báo cáo, thì điều này có thể do một trong những nguyên nhân sau:
- Google không biết về trang này. Sau đây là một số lưu ý về khả năng phát hiện trang:
- Nếu đây là một trang/trang web mới, hãy lưu ý rằng có thể mất một thời gian để Google tìm thấy và thu thập dữ liệu trên những trang/trang web đó.
- Để Google tìm thấy một trang, bạn phải gửi sơ đồ trang web hoặc yêu cầu thu thập dữ liệu trang, hoặc Google phải tìm thấy đường liên kết đến trang của bạn ở một nơi nào đó.
- Sau khi tìm thấy URL của một trang, có thể mất một thời gian (tối đa một vài tuần) để Google thu thập dữ liệu một phần hoặc toàn bộ trang web của bạn.
- Google không bao giờ lập chỉ mục ngay, kể cả khi bạn đã trực tiếp gửi yêu cầu lập chỉ mục.
- Google không đảm bảo tất cả các trang ở mọi nơi sẽ có trong Chỉ mục của Google.
- Google không thể truy cập vào trang của bạn (trang này yêu cầu đăng nhập hoặc hạn chế quyền truy cập đối với một số người dùng trên Internet)
- Trang có một thẻ noindex, và thẻ này đã ngăn Google lập chỉ mục trang đó.
- Trang đã bị loại bỏ khỏi chỉ mục vì một lý do nào đó.
Để sửa lỗi:
Sử dụng Công cụ kiểm tra URL để kiểm tra vấn đề trên trang của bạn. Nếu trang không có trong báo cáo Lập chỉ mục trang nhưng lại nằm trong danh sách đã lập chỉ mục của báo cáo Kiểm tra URL, thì có lẽ Google chỉ mới lập chỉ mục trang trong thời gian gần đây và trang sẽ sớm xuất hiện trong báo cáo Lập chỉ mục trang. Nếu trang thuộc danh sách chưa lập chỉ mục trong Công cụ kiểm tra URL (đúng như suy đoán của bạn), hãy kiểm tra trang đang hoạt động. Kết quả kiểm tra trang đang hoạt động sẽ cho bạn biết vấn đề cụ thể là gì: hãy dùng thông tin trong kết quả kiểm tra và tài liệu kiểm tra để tìm hiểu cách khắc phục vấn đề.
Câu hỏi thường gặp
Tại sao trang của tôi có trong chỉ mục? Tôi không muốn trang được lập chỉ mục.
Google có thể lập chỉ mục mọi URL đã tìm thấy, trừ trường hợp bạn có một lệnh noindex trên trang (hoặc trang đã bị chặn tạm thời). Google có thể tìm thấy một trang theo nhiều cách, bao gồm cả việc có ai đó liên kết đến trang của bạn qua một trang web khác.
- Nếu muốn chặn trang của mình khỏi kết quả của Google Tìm kiếm, bạn có thể yêu cầu việc đăng nhập trên trang theo hình thức nào đó hoặc sử dụng lệnh noindex trên trang. Bạn không nên sử dụng quy tắc trong tệp robots.txt để chặn một trang, vì điều này sẽ ngăn không cho Google tìm thấy lệnh noindex.
- Nếu muốn xoá trang của mình khỏi kết quả Google Tìm kiếm sau khi Google đã tìm thấy trang, bạn sẽ cần phải làm theo các bước sau.
Tại sao gần đây Google chưa lập chỉ mục lại trang web của tôi?
Google lập chỉ mục lại các trang dựa trên một số tiêu chí, bao gồm cả tần suất thay đổi của trang theo phỏng đoán của Google. Nếu trang web của bạn không thay đổi thường xuyên, thì có thể tốc độ làm mới cho trang sẽ chậm hơn. Điều này cũng không thành vấn đề nếu trang chưa thay đổi. Nếu trang có thay đổi đáng kể từ lần thu thập lại dữ liệu gần đây nhất, bạn có thể yêu cầu Google thu thập lại dữ liệu trên trang đó. Tuy nhiên, hãy nhớ rằng Google tự động thu thập lại dữ liệu các trang của bạn. Vì vậy, đừng bận tâm đến việc yêu cầu thu thập lại dữ liệu, trừ phi có thay đổi quan trọng và có vẻ như Google chưa nhận thấy điều này trong một thời gian (một tuần trở lên).
Google có thể thu thập lại dữ liệu trên trang/trang web của tôi không?
Yêu cầu Google thu thập lại dữ liệu đối với trang.
Tại sao nhiều trang của tôi không được lập chỉ mục?
Hãy xem chi tiết về các lý do trong báo cáo Lập chỉ mục trang. Sau đây là những lý do phổ biến nhất khiến Google không lập chỉ mục một lượng lớn URL trên trang web:
- Có một quy tắc robots.txt đang chặn Google thu thập dữ liệu các phần lớn trên trang web của bạn. Những trang này nên được đánh dấu trong báo cáo Lập chỉ mục trang là bị tệp robots.txt chặn. Hãy theo dõi và xoá quy tắc chặn trong tệp robots.txt.
- Trang web của bạn có số lượng lớn các trang trùng lặp, thường là do trang sử dụng các tham số để lọc hoặc sắp xếp một tập hợp chung (ví dụ:
type=dress
hoặccolor=green
hoặcsort=price
). Các trang này sẽ bị gắn nhãn là "trùng lặp" hoặc "thay thế" trong báo cáo Lập chỉ mục trang. Google không lập chỉ mục các phiên bản trùng lặp của một trang. - URL chuyển hướng đến một URL khác. URL chuyển hướng không được lập chỉ mục, chỉ có trang đích của lệnh chuyển hướng mới được lập chỉ mục.
Google không thể truy cập sơ đồ trang web của tôi
Hãy đảm bảo rằng sơ đồ trang web của bạn là hợp lệ, không bị tệp robots.txt chặn và bạn đang sử dụng URL thích hợp trong tệp robots.txt hoặc báo cáo Sơ đồ trang web. Bạn có thể kiểm tra URL sơ đồ trang web của bạn bằng một công cụ kiểm tra sơ đồ trang web có sẵn công khai.
Tại sao Google tiếp tục thu thập dữ liệu một trang đã bị xoá?
Google tiếp tục thu thập dữ liệu tất cả URL đã biết trong một thời gian (ngay cả sau khi các URL đó trả về lỗi 4XX) để phòng trường hợp đó là lỗi tạm thời. Trường hợp duy nhất mà chúng tôi không thu thập dữ liệu một URL là khi trang đó trả về lệnh noindex.
Để tránh cho bạn thấy danh sách lỗi 404 ngày càng tăng, báo cáo Lập chỉ mục trang chỉ cho thấy những URL đã hiện lỗi 404 trong tháng qua.
Tôi có xem được trang của mình, tại sao Google không xem được?
Hãy sử dụng công cụ Kiểm tra URL để xem liệu Google có thể xem trang đang hoạt động không. Nếu không thể thì Google sẽ cho biết lý do. Nếu Google có thể xem trang thì vấn đề có thể là lỗi truy cập đã được khắc phục kể từ lần thu thập dữ liệu gần nhất. Hãy chạy quy trình thu thập dữ liệu với trang đang hoạt động bằng công cụ Kiểm tra URL và yêu cầu lập chỉ mục.
Tại sao Công cụ kiểm tra URL cho thấy không có vấn đề gì nhưng báo cáo Lập chỉ mục trang lại cho thấy có lỗi?
Có thể bạn đã sửa lỗi sau lần gần nhất Google thu thập dữ liệu trang. Hãy xem ngày mà Google thu thập dữ liệu URL của bạn (bạn có thể thấy ngày này trên trang chi tiết URL trong báo cáo Lập chỉ mục trang hoặc trong chế độ xem phiên bản đã lập chỉ mục trong Công cụ kiểm tra URL). Hãy xác định xem bạn có khắc phục lỗi nào kể từ lần thu thập dữ liệu gần nhất không.
Ngoài ra, quy trình Kiểm tra URL đang hoạt động không kiểm tra mọi vấn đề có trong báo cáo Lập chỉ mục trang. Điều đáng chú ý nhất là quy trình kiểm tra phiên bản hoạt động không kiểm tra các điều kiện về trang trùng lặp hoặc trang chính tắc.
Làm cách nào để tìm trạng thái lập chỉ mục của một URL cụ thể?
Để tìm hiểu trạng thái lập chỉ mục của một URL cụ thể, hãy sử dụng Công cụ kiểm tra URL. Bạn không thể tìm kiếm hoặc lọc theo URL trong báo cáo Lập chỉ mục trang.
Lý do lập chỉ mục
Báo cáo Lập chỉ mục trang có thể cho thấy những lý do sau đây khiến quá trình lập chỉ mục gặp sự cố hoặc không thể lập chỉ mục:
Không được lập chỉ mục
Các trang này không được lập chỉ mục, nhưng không hẳn là do lỗi. Hãy đọc nội dung mô tả cụ thể để xem đây có phải là lỗi mà bạn cần giải quyết hay không.
Lỗi máy chủ (5xx)
Máy chủ của bạn đã trả về lỗi cấp 500 khi có yêu cầu tải trang. Xem nội dung Sửa lỗi máy chủ.
Lỗi chuyển hướng
Google gặp phải một trong các lỗi chuyển hướng sau:
- Chuỗi chuyển hướng quá dài
- Vòng lặp chuyển hướng
- URL chuyển hướng cuối cùng đã vượt quá độ dài URL tối đa
- Một URL không hợp lệ hoặc bị trống trong chuỗi chuyển hướng
Hãy sử dụng một công cụ gỡ lỗi web, chẳng hạn như Lighthouse, để biết thêm chi tiết về lệnh chuyển hướng.
URL bị tệp robots.txt chặn
Trang này bị tệp robots.txt của trang web của bạn chặn. Bạn có thể xác minh việc này bằng trình kiểm tra robots.txt. Xin lưu ý rằng điều này không đảm bảo rằng trang sẽ không được lập chỉ mục bằng một số phương thức khác. Nếu có thể tìm thấy thông tin khác về trang này mà không cần tải trang, Google vẫn có thể lập chỉ mục trang (mặc dù điều này ít gặp hơn). Để đảm bảo Google không lập chỉ mục một trang, hãy xoá quy tắc chặn trong robots.txt và sử dụng lệnh "noindex".
URL có đánh dấu "noindex"
Trong quá trình lập chỉ mục trang này, Google gặp phải lệnh "noindex" và do đó không lập chỉ mục trang. Nếu không muốn Google lập chỉ mục trang này thì bạn đã đạt được mục đích. Còn nếu muốn Google lập chỉ mục trang thì bạn nên xoá lệnh "noindex" đó.
Cách xác nhận vấn đề:
- Nhấp vào biểu tượng kiểm tra bên cạnh URL trong bảng.
- Trong phần Phạm vi lập chỉ mục > Lập chỉ mục > Được phép lập chỉ mục?, báo cáo sẽ cho biết lệnh noindex đang ngăn Google lập chỉ mục. Bạn có thể tìm kiếm từ "noindex" ở nguồn trang hoặc tiêu đề phản hồi.
- Xác nhận rằng thẻ noindex vẫn tồn tại trong phiên bản đang hoạt động:
- Nhấp vào Kiểm tra URL đang hoạt động
- Trong phần Khả năng lập chỉ mục > Lập chỉ mục > Được phép lập chỉ mục?, hãy xem còn có lệnh noindex hay không. Nếu lệnh noindex không còn nữa, bạn có thể nhấp vào Yêu cầu lập chỉ mục để yêu cầu Google thử lập chỉ mục trang lần nữa. Nếu lệnh noindex vẫn còn, bạn phải xoá lệnh đó để chúng tôi có thể lập chỉ mục trang.
- Nếu muốn Google lập chỉ mục trang này, bạn phải xoá thẻ hoặc tiêu đề HTTP đó.
Lỗi 404 mềm
Yêu cầu trang trả về lỗi mà chúng tôi cho là phản hồi 404 mềm. Tức là trang trả về thông báo "not found" (không tìm thấy) thân thiện với người dùng nhưng không trả về mã phản hồi 404. Bạn nên trả về mã phản hồi 404 cho các trang thực sự "not found" (không tìm thấy) và thêm thông tin khác vào trang để cho chúng tôi biết rằng đó không phải là lỗi 404 mềm. Để biết cách Google xem trang, hãy chạy quy trình kiểm tra URL đang hoạt động trên trang và nhấp vào Xem trang đã kiểm tra để xem ảnh chụp màn hình cho thấy cách Google hiển thị trang. Tìm hiểu cách khắc phục lỗi 404 mềm.
Bị chặn do yêu cầu trái phép (401)
Trang đã bị chặn khỏi Googlebot do có yêu cầu uỷ quyền (phản hồi 401). Nếu bạn muốn Googlebot lập chỉ mục được trang này, hãy xoá yêu cầu uỷ quyền trên trang này, hoặc cho phép Googlebot truy cập vào các trang của bạn bằng cách xác minh danh tính. Bạn có thể xác minh lỗi này bằng cách truy cập trang ở chế độ ẩn danh.
Không tìm thấy (404)
Trang này trả về lỗi 404 khi được yêu cầu. Google phát hiện thấy URL này mặc dù không có yêu cầu rõ ràng hay sơ đồ trang web nào. Có thể Google đã phát hiện thấy URL dưới dạng đường liên kết qua một trang khác hoặc có thể trang từng tồn tại và đã bị xoá. Có thể Googlebot sẽ tiếp tục thử thu thập dữ liệu URL này trong một khoảng thời gian. Không có cách nào để yêu cầu Googlebot quên một URL vĩnh viễn, mặc dù Googlebot sẽ thu thập dữ liệu URL đó ít thường xuyên hơn. Phản hồi 404 chưa hẳn đã là vấn đề nếu trang đã bị xoá mà không có trang nào thay thế. Nếu trang của bạn đã di chuyển, hãy sử dụng lệnh chuyển hướng 301 tới vị trí mới. Xem nội dung Sửa lỗi 404
Bị chặn do quyền truy cập bị cấm (403)
HTTP 403 có nghĩa là: tác nhân người dùng đã cung cấp thông tin đăng nhập nhưng chưa được cấp quyền truy cập. Tuy nhiên, Googlebot không bao giờ cung cấp thông tin đăng nhập, vì vậy, máy chủ của bạn trả về lỗi này là do nhầm lẫn. Trang này sẽ không được lập chỉ mục.
Nếu muốn Googlebot lập chỉ mục trang này, bạn nên cho phép người dùng truy cập mà không cần đăng nhập, hoặc cho phép một cách rõ ràng đối với các yêu cầu của Googlebot mà không cần xác thực (mặc dù bạn nên xác minh danh tính).
URL bị chặn do lỗi 4xx khác
Máy chủ gặp một lỗi 4xx không thuộc loại vấn đề nào trình bày ở đây. Hãy thử gỡ lỗi trang của bạn bằng công cụ Kiểm tra URL.
Đã thu thập dữ liệu – hiện chưa được lập chỉ mục
Google đã thu thập dữ liệu trang này nhưng chưa lập chỉ mục. Sau này trang có thể được hoặc không được lập chỉ mục; bạn không cần phải gửi lại URL này để được thu thập dữ liệu.
Đã phát hiện thấy – hiện chưa được lập chỉ mục
Google đã tìm thấy trang này, nhưng chưa thu thập dữ liệu. Thường thì Google muốn thu thập dữ liệu URL này nhưng quy trình này có thể sẽ làm quá tải trang web; do đó Google đã lên lịch thu thập lại dữ liệu. Đây là lý do ngày thu thập dữ liệu gần đây nhất được để trống trên báo cáo.
Trang thay thế có thẻ chính tắc thích hợp
Trang này được đánh dấu là trang thay thế cho một trang khác (nghĩa là trang AMP có trang chính tắc dành cho máy tính, hoặc phiên bản dành cho thiết bị di động của trang chính tắc dành cho máy tính, hoặc phiên bản dành cho máy tính của trang chính tắc dành cho thiết bị di động). Trang này trỏ đến trang chính tắc thích hợp đã được lập chỉ mục, do vậy bạn không cần làm gì. Search Console không phát hiện được các trang ngôn ngữ thay thế.
Trang trùng lặp, người dùng chưa chọn trang chính tắc
Trang này trùng lặp với một trang khác, mặc dù không có chỉ báo trang chính tắc ưu tiên. Google đã chọn một trang khác làm trang chính tắc cho trang này, do đó sẽ không phân phát trang này trên Tìm kiếm. Bạn có thể Kiểm tra URL này để xem URL nào được Google xem là chính tắc cho trang này.
Đây là hành vi đúng như dự kiến chứ không phải là lỗi, vì Google không phân phát các trang trùng lặp. Tuy nhiên, nếu cho rằng Google đã chọn nhầm URL làm trang chính tắc, bạn có thể đánh dấu trang chính tắc một cách rõ ràng. Mặt khác, nếu bạn cho rằng trang này không trùng lặp với trang chính tắc do Google chọn, thì bạn nên đảm bảo rằng nội dung giữa các trang có sự khác biệt đáng kể.
Trang trùng lặp, Google đã chọn một trang chính tắc khác với lựa chọn của người dùng
Trang này được đánh dấu là trang chính tắc cho một tập hợp trang, nhưng Google cho rằng có một URL khác phù hợp hơn để làm trang chính tắc. Google đã lập chỉ mục trang mà chúng tôi xem là trang chính tắc chứ không phải trang này.
- Hãy kiểm tra URL này để thấy URL chính tắc do Google chọn trong phần Lập chỉ mục trang > URL chính tắc do Google chọn.
- Hãy xem trang chính tắc do bạn chọn trong phần Lập chỉ mục trang > Trang chính tắc do người dùng khai báo.
- Trong trình duyệt, hãy xem trang hiện tại, trang chính tắc do người dùng khai báo và trang chính tắc do Google chọn.
- Lỗi này nghĩa là Google cho rằng trang được kiểm tra không trùng với trang chính tắc do người dùng khai báo. Thay vào đó, Google cho rằng trang được kiểm tra trùng với trang chính tắc do Google chọn.
- Nếu trang được kiểm tra cũng chính là trang chính tắc do Google chọn, thì tức là Google cho rằng trang được kiểm tra không giống với bất cứ trang nào khác.
- Nếu trang hiện tại không giống như trang chính tắc do người dùng khai báo, thì Google sẽ không chọn URL đó làm URL chính tắc. Trang trùng lặp phải tương tự như trang chính tắc. (Đó chính là lý do trang đó được xem là trùng lặp.)
Trang có lệnh chuyển hướng
Đây là một URL không chính tắc, URL này chuyển hướng đến một trang khác. Do đó, URL này sẽ không được lập chỉ mục. URL đích của lệnh chuyển hướng có thể được lập chỉ mục hoặc không, tuỳ thuộc vào đánh giá của Google về URL đích đó.
Google có thể lập chỉ mục một URL chính tắc có lệnh chuyển hướng.
Nếu bạn xem URL này trong Báo cáo kiểm tra URL, thì thông tin về URL được lập chỉ mục sẽ tương ứng với URL được kiểm tra (bỏ qua mọi lệnh chuyển hướng). Để xem trạng thái lập chỉ mục của URL chính tắc được liên kết với URL này (URL nằm trong Chỉ mục của Google), hãy nhấp vào nút KIỂM TRA trong báo cáo, ở phần Lập chỉ mục trang > Lập chỉ mục.
Công cụ kiểm tra URL đang hoạt động sẽ tuân theo các lệnh chuyển hướng, sau đó kiểm tra URL cuối cùng, mặc dù công cụ kiểm tra phiên bản hoạt động này không cho biết về việc tuân theo lệnh chuyển hướng.
Cảnh báo
Các cảnh báo được liệt kê trong bảng Cải thiện trải nghiệm trên trang trên trang tóm tắt của báo cáo Lập chỉ mục trang. Những vấn đề này không ngăn Google lập chỉ mục một trang, nhưng làm giảm khả năng Google hiểu được và lập chỉ mục các trang.
Đã lập chỉ mục, mặc dù bị robots.txt chặn
Trang đã được lập chỉ mục mặc dù bị tệp robots.txt trên trang web của bạn chặn lại. Google luôn tuân theo lệnh trong tệp robots.txt, nhưng không có nghĩa là tệp này sẽ ngăn được Google lập chỉ mục trang của bạn nếu có một trang khác liên kết đến trang của bạn Google sẽ không yêu cầu và thu thập dữ liệu trên trang, nhưng chúng tôi vẫn có thể lập chỉ mục trang đó dựa trên thông tin trên trang liên kết đến trang bị chặn của bạn. Do quy tắc của tệp robots.txt, nội dung cho đoạn trích xuất hiện trong kết quả của Google Tìm kiếm cho trang đó có thể sẽ rất hạn chế.
Bước tiếp theo:
- Nếu bạn thực sự muốn chặn trang này khỏi Google Tìm kiếm, thì tệp robots.txt không phải là cơ chế phù hợp để ngăn việc lập chỉ mục. Để tránh việc lập chỉ mục, hãy xoá lệnh chặn trong tệp robots.txt và dùng thẻ "noindex".
- Nếu bạn không muốn chặn trang này, hãy cập nhật tệp robots.txt để bỏ chặn trang. Bạn có thể sử dụng trình kiểm tra robots.txt để xác định quy tắc nào đang chặn trang này.
Đã lập chỉ mục nhưng không thể đọc nội dung trang
Trang này xuất hiện trong chỉ mục của Google nhưng Google không đọc được nội dung trên trang vì lý do nào đó. Có thể do một số nguyên nhân như trang bị che giấu trước Google hoặc trang ở một định dạng mà Google không lập chỉ mục được. Đây không phải là do lệnh chặn trong tệp robots.txt. Hãy kiểm tra trang và xem phần Phạm vi lập chỉ mục để biết thông tin chi tiết.
Được lập chỉ mục
Bạn có thể xem số lượng URL được lập chỉ mục trong biểu đồ trên trang tóm tắt. Bạn có thể xem một danh sách mẫu gồm các URL và thông tin khác về các URL đó bằng cách nhấp vào Xem dữ liệu về các trang đã được lập chỉ mục bên dưới biểu đồ.
Trang đã lập chỉ mục
Trang đã được lập chỉ mục thành công. Tuy nhiên, có thể trang này có các vấn đề khác cần được giải quyết, chẳng hạn như vấn đề về dữ liệu có cấu trúc. Các vấn đề khác sẽ được mô tả trong phần thích hợp trong báo cáo kiểm tra URL.