“索引涵盖范围状态”报告

借助该报告,您可知晓自己的哪些网页已被编入索引以及如何修正无法编入索引的网页。

 

打开“索引涵盖范围”报告

 

如何使用该报告

如果您已经先阅读了 Google 搜索的工作方式一文,您便能更轻松地理解该报告。

该报告会显示您的资源中已被 Google 访问或尝试访问过的所有网址的索引编制状态。摘要页面会按状态(“错误”、“警告”或“有效”)分组显示您网站中所有网址的结果,以及出现这种情况的具体原因(例如,“网址已提交,但会返回‘未找到’(404) 错误”)。点击表格中的相应行,即可查看具有相同状态/原因的所有网址并详细了解相关问题。

摘要视图

摘要报告会按状态和原因分组显示 Google 已尝试在您网站上抓取的所有网页的索引状态。

需要关注的内容

  • 理想情况下,随着您的网站规模不断扩大,您应该会看到已编入索引的有效网页的数量逐渐增多
  • 如果您看到索引编制错误猛增,则可能是由于以下原因造成的:模板变更引入了新错误,或者您提交的站点地图包含禁止抓取的网址(例如,被 robots.txt 文件、“noindex”指令或登录要求禁止抓取)。点击相应问题,然后进入某页面进行检查,以确定具体错误。
  • 如果您看到已编入索引的网页总数减少但无相应错误,则可能是因为您已(通过设置 robots.txt 文件、“noindex”指令或身份验证要求)禁止访问您尚未提请我们编入索引的现有网页。请查看已排除的网址,看看是否有与您的网页总数减少对应的猛增现象。
  • 如果您的“已排除”网页多于“有效”网页,请查看排除类型。常见的排除原因包括:
    • 您有一条 robots.txt 规则会阻止我们抓取您网站的大部分内容。
    • 您的网站上有大量的重复网页,通常是因为它使用参数对同一个集合进行了过滤或排序(例如:type=dresscolor=greensort=price)。如果这些网页仅显示按不同方式排序或过滤的相同内容,则很可能应被排除。

继续阅读下文,了解更多的问题排查提示。

不需要关注的内容

  • 您不应期望您网站上的所有网址都会被编入索引。您的目标应是将每个网页的 1 个版本编入索引:规范版本在该报告中,所有的重复网页或备用网页都会被标记为“已排除”。重复网页或备用网页的内容与规范网页的内容在实质上是相同的。将网页标记为“重复”或“备用”是件好事,这意味着我们已找到规范网页并已将其编入索引。您可以通过运行网址检查工具找到任何网址所对应的规范网页。
  • 如果您添加了新内容,那么 Google 要过一段时间才能将您新添加的网页编入索引。您可以通过请求编入索引来缩短这两项操作之间的延迟。

状态

每个网页都可能会具有下述常规状态类型之一:

  • 错误该网页尚未被编入索引。请参阅具体错误类型说明,详细了解相应错误及修正方法。您应首先关注这类问题。
  • 警告该网页已被编入索引或直到最近才被编入索引,但包含需要您注意的问题。
  • 已排除该网页未被纳入到索引中,但我们认为这不是错误。该网页可能正处于索引编制流程的中间阶段,也可能已被您特意排除(例如,通过使用“noindex”指令),因此其行为符合预期。
  • 有效该网页已被编入索引。

原因

每种状态(“有效”、“警告”、“错误”、“已排除”)都有对应的具体原因。表格中的数据会按原因分组;每一行都可能会描述一个或多个网址。请参阅下文中的状态类型说明,详细了解每种状态类型及处理方式。

验证

该问题的验证状态。您应优先处理未能通过验证或尚未开始验证的问题。

关于验证

在修正了您网站上某个具体问题的所有实例后,您可以请求 Google 验证您的更改。如果所有已知实例都不复存在了,系统就会在状态表中将该问题标记为“已修正”,并会将其移动到表格底部。Search Console 会跟踪该问题的整体验证状态及其每个实例的状态。如果相应问题的所有实例都已不复存在,系统就会将该问题视为“已修正”。(如需详细了解系统所记录的各种实际状态,请参阅问题验证状态实例验证状态。)

关于问题生命周期的更多信息…

问题的生命周期从系统在您网站上第一次检测到该问题的任何实例时开始,到该问题的最后一个实例被标记为已从您的网站中消失时的 90 天后结束。如果 90 天过去了,该问题并没有再次出现,系统就会从报告记录中移除该问题。

问题的“首次检测到此问题时的日期”是指系统在该问题的生命周期中首次检测到该问题时的时间,所以这一日期并不会变化。因此:

  • 如果某个问题的所有实例都已被修正,但 15 天后又出现了该问题的新实例,那么该问题就会被标记为“待解决”,并且“首次检测到此问题时的日期”将保持不变(仍是原来的日期)。
  • 如果某个问题的最后一个实例已被修正,但 91 天后又出现了相同的问题,在这种情况下,由于之前的问题已被关闭,因此系统就会将此问题记录为新问题,并会将“首次检测到此问题时的日期”设为“今天”。

基本验证流程

在您针对某个问题点击验证修复后,系统即会启动验证流程。以下是对验证流程的概述。此流程可能需要花费几天的时间,我们会通过电子邮件向您发送进度通知。

  1. 当您点击验证修复后,Search Console 会立即抽查几个网页。
    • 如果检测到其中任何网页含有当前问题的实例,系统便会结束验证流程,并且验证状态将保持不变。
    • 如果系统在所抽查的网页中没有发现当前错误,就会继续进行验证,并会将验证状态更改为“已开始”。如果在验证过程中发现了其他不相关的问题,系统则会将这些问题计入对应的其他问题类型,并会继续进行验证。
  2. Search Console 会按照已知受该问题影响的网址的列表进行检查。只有包含该问题的已知实例的具体网址(而非整个网站)会被加入到等待重新抓取的队列中。Search Console 会在验证记录(可从相应问题的详情页面内查看)中记录已检查过的所有网址。
  3. 在检查网址时:
    1. 如果系统没有发现该问题,实例验证状态会更改为“已通过”。如果这是验证开始后检查的第一个实例,问题验证状态会更改为“未发现问题”。
    2. 如果相应网址已不再可被访问,实例验证状态会更改为“其他”(此状态并不表示存在错误)。
    3. 如果实例仍然存在,问题验证状态会更改为“失败”,并且系统会结束验证。如果出现问题的网页是由 Google 通过常规抓取发现的新网页,系统会将其视为现有问题的新实例。
  4. 如果系统检查了所有处于“错误”和“警告”状态的网址,且未发现任何问题,问题验证状态会更改为“已通过”。重要提示:即使受影响的网页数已降至 0,且问题验证状态已更改为“已通过”,系统仍会显示最初的严重程度标记(“错误”或“警告”)。

即使您从未点击“开始验证”,Google 也可能会检测到相应问题的实例已被修正。如果在常规抓取过程中检测到某个问题的所有实例都已被修正,Google 便会在报告中将该问题的状态更改为“未知”。

在什么情况下,网址或内容的问题会被视为“已修正”?

只要满足了以下条件中的任一项,网址或内容的问题就会被标记为“已修正”:

  • 系统在抓取该网址时发现,相关问题已从该网页中消失。对于 AMP 标记错误,这可能意味着您已修正相应标记,也可能意味着此标记已被移除(如果此标记不是必需标记的话)。在进行验证尝试的过程中,系统会将该网页的问题验证状态视为“已通过”。
  • 如果 Google 已不再能够访问该网页(无论是由于什么原因,例如该网页已被移除、带有“noindex”标记、要求进行身份验证,等等),系统会认为该网址的问题已得到修正。在进行验证尝试的过程中,系统会将该网页的问题验证状态记为“其他”。

重新验证

当您针对失败的验证点击“重新验证”后,系统便会重新开始验证所有未通过验证的实例,以及在常规抓取过程中发现的与该问题相关的新实例。

您应等到当前的验证周期结束后再请求新的验证周期(即使您已在当前周期内修正了一些问题)。

系统不会再次检查已通过验证的实例(被标记为“已通过”)或已不再能够访问的内容(被标记为“其他”);如果您点击“重新验证”,系统就会从记录中移除它们。

验证记录

您只需点击问题详情页面中的“验证详情”链接,即可查看验证请求的进展情况。

对于 AMP 报告和“索引状态”报告,验证记录页面中的条目按网址进行分组。对于“移动设备易用性”报告和“富媒体搜索结果”报告,验证记录中的内容则根据由网址 + 结构化数据项(取决于相应项的 Name 值)构成的组合进行分组。验证状态适用于您要检查的特定问题。您可以在一个网页上将某个问题标记为“已通过”,但将其他问题标记为“失败”、“待验证”或“其他”。

问题验证状态

对于某个给定的问题,系统可能会显示以下验证状态:

  • 未启动:有一个或多个网页包含该问题的实例,而您从未针对这个/这些网页启动验证尝试。后续步骤:
    1. 点击该问题以了解错误详情。使用“AMP 测试”工具检查各个网页,以查看实际网页上的错误示例。(如果“AMP 测试”工具没有显示网页上存在该错误,则是因为在 Google 发现该错误并生成这份问题报告之后,您已在实际网页上修正了该错误。)
    2. 点击详情页面上的“了解详情”以查看所违反的规则的详细信息。
    3. 点击表格中的示例网址行以获取与相应错误有关的详细信息。
    4. 修正您的网页,然后点击验证修复以请求 Google 重新抓取您的网页。Google 会将验证进度告知您。整个验证流程需要的时间可能会短至几天,也可能会长达两周左右,所以请耐心等待。
  • 已开始:您已启动验证尝试,并且系统尚未发现该问题的任何余留实例。后续步骤:Google 会在验证过程中向您发送通知;如有必要,还会在通知中告诉您需要执行什么操作。
  • 未发现问题:您已启动验证尝试,并且系统发现目前已检查的所有问题实例都已被修正。后续步骤:您暂且无需执行任何操作,但在验证过程中,Google 会向您发送通知,告诉您需要执行什么操作。
  • 已通过:该问题的所有已知实例都已消失(或是受影响的网址已不再可被访问)。要想使系统显示此状态,您必须先点击“验证修复”(如果您从未请求验证但实例消失了,相应状态将会变为“未知”)。后续步骤:您无需再执行任何操作。
  • 未知:虽然您从未启动验证尝试,但 Google 发现该问题在所有网址上的实例都已被修正。后续步骤:您无需再执行任何操作。
  • 失败:在您点击“验证”之后,仍包含该问题的网页的数量达到了一定的阈值。后续步骤:修正该问题,然后重新验证。

实例验证状态

在收到验证请求之后,系统会为具体问题的每个已知问题实例分配下列验证状态之一(“索引状态”报告中没有“已通过”和“其他”状态):

  • 待验证:已加入待验证队列。Google 上次检查时,该问题实例仍存在。
  • 已通过:Google 已检查该问题实例,并且发现该实例已不复存在。只有当您针对这一问题实例明确点击了“验证”后,系统才会显示此状态。
  • 失败:Google 已检查该问题实例,并且发现该实例仍存在。只有当您针对这一问题实例明确点击了“验证”后,系统才会显示此状态。
  • 其他:Google 已无法再访问包含该实例的网址,或者(对于结构化数据)已无法再在相应网页上找到这项内容。此状态被视为与“已通过”状态等同。

请注意,同一网址中的不同问题可能会有不同的状态;例如,如果某个网页中既有问题 X 又有问题 Y,那么就可能会出现以下情况:问题 X 的验证状态是“已通过”,而同一网页上的问题 Y 的验证状态却是“待验证”。

网址发现下拉式过滤器

借助图表上方的下拉式过滤器,您可以根据 Google 对相应网址采用的发现机制来过滤索引结果。以下是可用值:

  • 所有已知网页 [默认值] - 显示 Google 通过任何方式发现的所有网址。
  • 所有已提交的网页 - 仅显示通过使用 Search Console 或站点地图 ping 在站点地图中提交的网页。
  • 特定的站点地图网址 - 仅显示在使用 Search Console 提交的特定站点地图中列出的网址。对于站点地图索引,系统会报告其涵盖的所有站点地图中列出的所有网址。

即使某个网址也是 Google 通过某种其他机制(例如,通过从另一网页进行自然抓取)发现的,它仍会被视为是通过站点地图提交的。

详情视图

点击摘要页面中的任一行即可查看相应“状态 + 原因”组合的详情视图。您可在详情页面上点击了解详情,以查看所选问题的详细信息。

图表中会显示一段时间内受影响的网页。

表格会显示受相应问题影响的网页的列表示例:

  • 点击表格行内的跳转链接 可打开对应的网址。
  • 点击表格行内的“检查”图标 搜索检查对应的网址。
  • 待修正错误或警告的所有实例后,您可请求 Google 验证您的修正效果。

看到某个网址标有您已修正过的问题? 这可能是因为您是在 Google 上次抓取该网址之后修正了此问题。因此,如果您看到某个网址标有您已修正过的问题,请务必查看该网址的抓取日期。检查并确认您的修正效果,然后请求重新编入索引

 

分享报告

您只需点击这个网页上的分享按钮,即可分享该问题的详情。通过此链接,分享对象将只能访问当前网页以及该问题的验证记录页面,而无法访问您的资源中的其他网页,也无法对您的媒体资源或帐号执行任何操作。您可以随时撤消此链接 - 只需停止分享这个网页即可。

问题排查

错误猛增

如果您发现错误数量急剧增加,请:

  1. 看看您是否可在索引编制错误总数/已编入索引的网页总数与某个具体错误的火花谱线图之间找出任何关联,以便以此作为线索来了解哪个问题可能影响了您的错误总数/已编入索引的网页总数。
  2. 修正问题:
    1. 按错误严重程度和警告分组的网址表格可按严重程度、受影响网页数以及它们目前是否正在接受验证等多项因素排序。我们建议您按所示的默认顺序处理这些网址。
    2. 在表格中的问题行内查找与顶级图表中的任何错误猛增现象同时发生的猛增情况
    3. 点击相应的错误行,以转到包含更多信息的详情页面。阅读有关具体错误类型的说明,以了解最佳处理方式。
    4. 修正错误的所有实例,并通过点击该原因对应的详情页面中的验证修复来请求验证。详细了解验证
    5. 系统会在验证过程中向您发送进度通知,但您可以过几天再回来查看您的错误数是否已有所减少。
  3. 定期移除过滤条件以使系统显示已排除的网址,按受影响网页数对这些网址进行排序,然后检查这些网址是否含有任何出乎意料的问题。

查找特定网址的索引状态

要了解特定网址的索引状态,请使用网址检查工具。在“索引涵盖范围”报告中,您无法按网址进行搜索或过滤。
修正服务器错误
服务器错误意味着 Googlebot 无法访问您的网址、相应请求已超时或您的网站当时正处于忙碌状态。因此,Googlebot 不得不放弃相应请求。

测试服务器连接

您可以使用网址检查工具来检查能否重现“索引涵盖范围状态”报告中所列的服务器错误。

修正服务器连接错误

  • 针对动态网页请求,缩短过长的网页加载用时
    如果同一个网站在多个网址上提供了相同的内容,即会被视为动态提供内容(例如,www.example.com/shoes.php?color=red&size=7 所提供的内容与 www.example.com/shoes.php?size=7&color=red 相同)。动态网页可能要过很长时间才能做出响应,因此会导致超时问题。或者,服务器可能会返回超载状态,因此 Googlebot 不得不以更缓慢的速度抓取相应网站。一般来说,我们的建议是:尽量使用简短的参数列表,而且要尽量少用。如果您非常了解参数对您网站的作用,则可告知 Google 应如何处理相关参数
  • 确保您网站的托管服务器没有停止运行、超载或配置不当。
    如果连接问题、超时问题或响应问题持续存在,请与您的网络托管服务提供商联系,并考虑提升您网站处理流量的能力。
  • 确认您没有在无意中禁止 Google 访问
    您可能会由于某个系统级问题(例如 DNS 配置问题、防火墙或 DoS 防御系统配置问题、内容管理系统配置问题)而禁止 Google 访问。防御系统是能够保证托管服务正常运行的关键因素之一,且通常会配置为自动屏蔽超量的服务器请求。然而,由于 Googlebot 发出的请求通常会比人类用户多,因此可能会触发这些防御系统,从而导致它们禁止 Googlebot 访问和抓取您的网站。要修复此类问题,请找到您网站上禁止 Googlebot 进行访问的相关基础架构部分,然后撤消之前的禁止操作。如果您无权控制防火墙,则可能需要与您的托管服务提供商讨论此问题。
  • 明智地控制搜索引擎对您网站的抓取和编入索引
    某些网站站长会刻意(比如通过按照上述方式使用防火墙)禁止 Googlebot 访问他们的网站。在这些情况下,他们的目的通常不是为了完全禁止 Googlebot 访问,而是为了控制自己网站被抓取和编入索引的方式。如果您属于这种情况,请参阅以下内容:
修正 404 错误

一般情况下,我们的建议是:花时间修正 404 错误网页,而不是 404 已排除网页。404 错误网址是指您已明确请求 Google 编入索引但 Google 未找到的网址。404 已排除网址是指 Google 通过某种其他机制发现的网址。

您应通过以下方法来处理 404 错误:

  1. 判断错误是否值得修正。 许多(大多数?)404 错误都不值得修正,因为 404 错误不会对您网站的索引编制状态或排名产生不良影响
    • 如果是已提交的网址(出错),则值得修正。
    • 如果是无任何替换网页/对等网页的已删除网页,返回 404 是正确的做法。待 1 个月左右过后,该报告应该就会停止显示此类 404 错误了。
    • 如果是由脚本生成的错误网址,或者是您网站上未曾存在过的网址,那么您大可不必担心。虽然此类问题显示在您的报告中可能会给您带来困扰,但只要相应网址不属于经常拼错的链接(参阅下文),则无需修正。待 1 个月左右过后,该报告应该就会停止显示此类 404 错误了。
  2. 如果网址已被提交以供编入索引(状态显示为错误
    1. 请点击相应网址旁边的“提交”图标 搜索 以检查网址的提交位置,并查看发现信息。然后酌情更新站点地图。
    2. 如果相应内容已移到新位置,请添加重定向。
    3. 如果您已永久删除相应内容,并且不打算将其替换为更新的相关内容,请让旧网址返回 404 或 410。目前,Google 对 410(已删除)与 404(未找到)采用相同的处理方式。如果针对不存在的网页返回除 404 或 410 以外的代码(或将用户重定向至另一网页(如首页),而不是返回 404 代码),则可能会出现问题。此类网页称为软 404 网页,可能会令用户和搜索引擎感到困惑。
    4. 如果相应网址是未知网址:您可能偶尔会看到您网站上未曾存在过的网址返回 404 错误。如果有人尝试在您网站上查看某个不存在的网址(可能是因为他/她在浏览器中输错了网址,或者点击了拼写有误的链接网址),就可能会发生此类错误。如果这是一个很常见的错误,您可为其创建重定向。
      导致生成意外网址的另一个原因可能是:Googlebot 尝试跟踪在 JavaScript、Flash 文件或其他嵌入式内容中发现的链接,或者尝试跟踪可能仅存在于站点地图中的链接。例如,您的网站可能会使用如下代码跟踪在 Google Analytics(分析)中下载的文件:
      <a href="helloworld.pdf"
        onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
        Hello World PDF</a>

      当 Googlebot 看到此代码时,它可能会尝试抓取网址 http://www.example.com/download-helloworld,即使这并不是一个实际网页。在这种情况下,该链接可能会在“抓取错误”报告中显示为 404(未找到)错误。Google 正在努力杜绝此类抓取错误。此错误不会影响您网站的抓取或排名。

  3. 请不要创建虚假内容、重定向到您的首页或使用 robots.txt 屏蔽 404 网址,否则我们会更加难以识别您网站的结构,并且无法适当地处理它。我们将此类错误称为软 404 错误。(一旦 Google 成功抓取了某个网址,就可能会一直尝试抓取该网址。创建 300 级重定向会延迟下一次的重复抓取尝试,而且可能会延迟很长一段时间)。使用网址移除工具提交网址移除请求不会从该报告中移除此错误。

常见问题解答

为什么我的网页(或网站)(尚)未被编入索引?

如果您有新网站,Google 可能要过一段时间才能找到并抓取该网站。

  1. 为便于 Google 了解新网页,您必须提交站点地图或网页抓取请求,否则 Google 必须在别处找到指向您网页的链接。
  2. 在了解网页网址之后,Google 可能要过一段时间(最长为几个星期)才能抓取您网站上的部分或全部内容。

即使您直接提交抓取请求,系统也不会即刻就将相应网页编入索引。

为什么我的网页位于索引中?我不希望它被编入索引。

Google 可将它找到的任何网址编入索引,除非您在相应网页上添加“noindex”指令(或者暂时屏蔽相应网页),而且 Google 可以通过多种不同的方式查找网页,包括跟踪从另一网站指向您网页的链接。

  1. 如果您希望阻止自己的网页出现在 Google 搜索结果中,则可为相应网页设置某种登录要求,也可在相应网页上使用“noindex”指令
  2. 如果您希望系统在找到您的网页后将其从 Google 搜索结果中移除,则需按照这些步骤操作

为什么我的网站最近没被重新编入索引?

Google 会根据多项条件(包括网页更改频率)将网页重新编入索引。如果您的网站不经常更改,它的刷新频率可能会较慢(这是没问题的,如果您的网页未发生变化)。如果您认为自己的网站需要刷新,则可请求 Google 重新抓取它

能否重新抓取我的网页/网站?

您需要请求 Google 重新抓取它

为什么排除了我的如此多个网页?

请查看“索引涵盖范围”报告中详述的排除原因。大部分排除都是由下列原因之一所致:

  • 您有一条 robots.txt 规则会阻止我们抓取您网站的大部分内容。请使用网址检查工具确认此问题。
  • 您的网站上有大量的重复网页,通常是因为它使用参数对同一个集合进行了过滤或排序(例如:type=dresscolor=greensort=price)。在“索引涵盖范围”报告中,这些网页会被标记为“重复”或“备用”。
  • 网址会重定向到另一个网址。重定向网址本身不会被编入索引,但重定向目标会被编入索引。

Google 无法访问我的站点地图

请确保您的站点地图未被 robots.txt 屏蔽、有效,并且您在 robots.txt 条目中或在所提交的站点地图报告中使用的网址正确无误。您可以使用公开提供的站点地图测试工具测试您的站点地图网址。

为什么 Google 会不断抓取已被移除的网页?

只要相应网址是已知网址,即使它们返回了 4XX 错误,Google 对它们的抓取也会持续一段时间,以防所返回的错误是临时错误。不会抓取网址的唯一情况是:相应网址返回了“noindex”指令

为避免向您显示一个规模与日俱增的 404 错误列表,“索引涵盖范围”报告仅会显示在过去一个月内出现 404 错误的网址。

我能看到我的网页,为什么 Google 看不到?

使用网址检查工具可查看 Google 能否看到实际网页。如果它看不到,此工具的界面中应该会说明原因。如果它能看到,则可能意味着在上次抓取之后访问错误已被修正。请使用网址检查工具抓取实际网页,并请求编入索引

网址检查工具未显示任何问题,但“索引涵盖范围”报告显示了错误,这是为什么?

在 Google 上次抓取该网址后,您可能修正了此错误。请查看网址的抓取日期(应该会显示在“索引涵盖范围”报告中的网址详情页面内,或显示在网址检查工具中的索引版本视图内)。另请确定您是否在系统上次抓取相应网页之后对该网页进行了任何修正。

状态原因

以下是您的每个网页之所以会处于当前状态的可能原因。

“已提交”与“未提交”

每当您看到使用“已提交”字词的索引原因时,就意味着您已通过将相应网址包含在站点地图中,明确请求 Google 将该网址编入索引。只要标记为“未提交”,即表示该网址是 Google 自行找到的(例如,通过跟踪从另一网页上指向该网址的链接),而且该网址不在任何已被编入索引的站点地图中。

错误


处于“错误”状态的网页未被编入索引。


服务器错误 (5xx):当相应网页被请求时,您的服务器返回了 500 类错误。请参阅修正服务器错误

重定向错误:打开相应网址时发生了重定向错误。原因可能是以下类型之一:此网址是一个过长的重定向链;此网址导致了重定向循环;最终的重定向网址超出了网址长度上限;此重定向链中含有错误网址或空网址。

网址已提交,但被 robots.txt 屏蔽了:您提交了相应网页以供编入索引,但该网页被 robots.txt 屏蔽了。请尝试使用 robots.txt 测试工具来测试该网页。

网址已提交,但带有“noindex”标记:您提交了相应网页以供编入索引,但它的元标记或 HTTP 标头中带有“noindex”指令。如果您想将该网页编入索引,则必须移除相关的标记或 HTTP 标头。

网址已提交,但貌似会返回软 404 错误:您提交了相应网页以供编入索引,但服务器貌似返回了软 404 错误

网址已提交,但会返回“未授权的请求”(401) 错误:您提交了相应网页以供编入索引,但 Google 收到了 401(未授权)响应。请撤消该网页的授权要求,或允许 Googlebot 通过验证自己的身份访问该网页

网址已提交,但会返回“未找到”(404) 错误:您提交了相应网址以供编入索引,但该网址不存在。请参阅修正 404 错误

网址已提交,但存在抓取错误:您提交了相应网页以供编入索引,但 Google 遇到了不明抓取错误(不属于任何其他原因类型)。请尝试使用网址检查工具来调试该网页。

警告


您可能需要注意处于“警告”状态的网页,这类网页未必已被编入索引,具体因相应的结果条目而异。


已编入索引,尽管遭到 robots.txt 屏蔽:该网页已被编入索引,尽管它遭到 robots.txt 屏蔽(Google 始终都会遵从 robots.txt 中的指令,但如果有其他网页链接到该网页,Google 依然能够抓取该网页并将其编入索引)。该网页的状态之所以会被标记为“警告”,是因为我们不确定您的初衷是否是要从搜索结果中屏蔽该网页。如果您确实想屏蔽该网页使用 robots.txt 并不能完全防止该网页被编入索引。 要想彻底防止该网页被编入索引,您应该使用“noindex”,或使用身份验证机制禁止匿名访问该网页。您可以使用 robots.txt 测试工具来确定哪条规则会使该网页被屏蔽。由于存在 robots.txt,系统显示的任何与该网页相关的摘要都可能不是最理想的。如果您不想屏蔽该网页,请更新您的 robots.txt 文件以取消屏蔽该网页。

有效


处于“有效”状态的网页已被编入索引。

已提交,且已编入索引:您提交了相应网址以供编入索引;系统已将该网址编入索引。

已编入索引,但未在站点地图中提交:相应网址已被 Google 发现,且已被编入索引。我们建议使用站点地图提交所有重要网址。

已排除


处于“已排除”状态的网页通常不会被编入索引,这在我们看来是合理的。此类网页要么是与已编入索引的网页重复,要么是被您网站上采用的某种机制禁止编入索引,或者是因在我们看来不是错误的某种原因而未被编入索引。


被“noindex”标记排除了:Google 在尝试将网页编入索引时收到了“noindex”指令,因此未将该网页编入索引。如果您确实不希望该网页被编入索引,那么恭喜您得偿所愿!如果您希望该网页被编入索引,您则应移除该“noindex”指令。

被网页移除工具屏蔽了:相应网页目前已被网址移除请求屏蔽。如果您是一位经过验证的网站所有者,则可以使用网址移除工具查看是谁提交了网址移除请求。移除请求只在移除日期后的 90 天内有效。待此时间段过后,即使您未另行提交索引编制请求,Googlebot 也可能会再次访问该网页并将其编入索引。如果您不希望该网页被编入索引,请使用“noindex”、为该网页设置授权要求或移除该网页。

已被 robots.txt 屏蔽:robots.txt 文件禁止 Googlebot 访问相应网页。您可以使用 robots.txt 测试工具检查是否确实存在此情况。请注意,这并不意味着该网页不会被通过某些其他方式编入索引。 如果 Google 不必加载该网页就能找到与它相关的其他信息,那么该网页仍然可能会被编入索引(尽管这种情况不太常见)。为确保 Google 不会将该网页编入索引,请移除 robots.txt 中的屏蔽指令,然后改用“noindex”指令

被屏蔽了,因为会返回“未授权的请求”(401) 错误:Googlebot 无法访问相应网页,因为该网页设有授权要求(返回了 401 响应)。如果您希望 Googlebot 能够抓取该网页,请移除授权要求,或允许 Googlebot 访问您的网页

抓取异常:抓取相应网址时发生了不明的异常情况。这可能意味着返回了 4xx 或 5xx 级别的响应代码;请尝试使用网址检查工具抓取该网页,看看是否会遇到任何抓取问题。该网页未被编入索引。

已抓取 - 尚未编入索引:Google 已抓取相应网页,但尚未将其编入索引。日后,该网页可能会被编入索引,也可能不会被编入索引;无论如何,您都无需重新提交该网址以供抓取。

已发现 - 尚未编入索引:Google 已发现相应网页,但尚未将其编入索引。这通常意味着:Google 尝试抓取该网址了,但当时相应网站正处于超载状态;因此,Google 不得不重新安排抓取时间。这就是该网页的上次抓取日期在报告中为空的原因。

备用网页(有适当的规范标记):相应网页与 Google 所识别出的规范网页重复。该网页正确地指向了这个规范网页,因此您无需执行任何操作。

重复网页(未被用户选为规范网页):相应网页与其他网页重复,并且这些网页都未被标记为规范网页。因此,我们认为该网页不是规范网页。您应明确地为该网址标记规范网页检查该网址应该会显示 Google 选择的规范网址。

重复网页,Google 选择的规范网页与用户指定的不同:相应网页被标记为一组网页的规范网页,但 Google 认为另一网址更适合作为规范网页。Google 已将其认为是规范网页的网页(而非该网页)编入索引。我们建议您将该网页明确标记为相应规范网址的重复网页。该网页是在没有任何明确抓取请求的情况下被发现的。检查该网址应该会显示 Google 选择的规范网址。

未找到 (404):相应网页在收到请求时返回了 404 错误。该网址是 Google 在没有任何明确请求或站点地图的情况下发现的。可能是 Google 通过来自其他网站的链接发现了该网址,也可能是该网页先前存在过但后来又被删除了。Googlebot 可能会继续尝试访问该网址,这种行为可能会持续一段时间;虽然 Googlebot 会逐渐降低对该网址的抓取频率,但我们无法让它永久地忘记某个网址。如果此情况是有意为之,那么您可以忽略 404 响应。如果您的网页已不在原位置,请使用 301 重定向将用户转到新位置。请参阅修正 404 错误

网页因法律投诉被移除了:相应网页已被从索引中移除,因为我们收到了法律投诉

网页会自动重定向:相应网址是重定向网页,因此未被添加到索引中。

软 404:在我们看来,针对相应网页发出的请求返回了软 404 响应。这意味着所返回的内容只是一条便于用户理解的“未找到”消息,其中并未包含相应的 404 响应代码。我们建议仅为“未找到”网页返回 404 响应代码,或者向相应网页中添加更多信息以告知我们这不是软 404。了解详情

重复网页,网址已提交但未被选为规范网址:相应网址是一组重复网址中的一个网址,并且这些网址均未被明确标记为规范网页。尽管您已明确要求将该网址编入索引,但由于它是重复网址,且 Google 认为另一网址更适合作为规范网页,因此 Google 没有将该网址编入索引,而是将我们选择的规范网址编入了索引。(Google 只会将一组重复内容中的规范网址编入索引。)此状态与“Google 选择的规范网页与用户指定的不同”状态的区别在于:在这种情况下,您已明确请求将该网址编入索引。检查此网址应该会显示 Google 选择的规范网址。

 

已知问题

以下是新版 Search Console(测试版)中存在的已知问题。您无需向我们报告这些问题,但我们希望能够收到您对任何其他功能或所发现的问题的反馈。请使用导航栏中的反馈机制提交反馈。

  • 索引数据不会每日更新,因此这些数据可能会有几天的延迟(与实际数据相较而言),且其中可能会插入一些数据点。
  • 图表应涵盖过去 90 天的数据,但目前可能不会完整地显示这些数据。
  • 站点地图下拉式过滤器只包含使用 Search Console 或 robots.txt 指令提交的站点地图。
  • 我们正在优化状态列表,因此该列表可能会不断发生变化,例如:标有“错误”的项混用了不同类型的响应 (4xx/5xx)。
本文是否对您有帮助?
您有什么改进建议?