Feed 报告会显示对 Feed 的最新提取尝试的详情。其中包括总体状态、组成该 Feed 的每个文件的可用性状态,以及在该 Feed 中找到的所有实体的计数和状态。您可以查看该 Feed 在过去 90 天内的所有 Feed 提取的历史记录。资源中的每个 Feed 都会有单独的 Feed 报告。
如果资源只有一个 Feed,Feed 报告直接标记为 Feed。如果资源有多个 Feed,每个 Feed 都会有各自的 Feed 报告,并使用该 Feed 的唯一名称进行标记。
常见问题解答
下面介绍了如何查找关于 Feed 的最常用信息:
最新提取的状态
查看提取历史记录
具有指定状态的实体数量
给定实体类型的状态历史记录
Google 中的实体数量
- 点击 Feed 报告着陆页上的查看提取历史记录,然后在提取历史记录中找到最近一次成功的提取。记下这次提取的日期和时间。
- 返回 Feed 报告着陆页,然后找到“检测到的实体”表格。
- 点击进入该表格中的每一行(其他实体行除外)
- 选择图表上方的有效和有效,但存在警告,然后取消选择无效。
- 找到您在第 1 步中记录的日期和时间。
- 汇总“检测到的实体”表格中每个项类型的数量。
- 在 Feed 报告中找到检测到的实体表格
- 点击某个实体类型以查看属于相应类型的问题的表格。在问题表格中查找特定问题。
- 点击问题表格中的相应行,以查看受该问题影响的实体的不完全列表。
最新提取中的实体问题
- 点击该表格中的某一行,以查看相应类型的实体的历史记录。
- 选择图表顶部的“无效”或“有效,但存在警告”,以查看影响您 Feed 的问题列表。
- 点击实体计数值大于 0 的任意行,以查看受该问题影响的实体列表。(如果计数为 0,则表示该问题已在最新提取中得到解决;但如果最新提取失败,则表示该问题或许曾在上次成功的提取中出现过。)
- 点击示例实体表格中的某个实体以查看错误代码。请注意,示例实体表格可能不会显示受某个问题影响的所有实体。
提取状态
在 Feed 报告顶部,您会看到最新提取尝试的认定结果。这取决于多种因素,包括请求和解析文件的能力,以及在 Feed 中找到的实体的有效性。如果 Feed 中存在一个文件级问题或过多实体问题,提取就会失败。
提取可能需要过几个小时才会体现在 Feed 报告中。尽管大多数提取会定期安排触发,但有些 Feed 提取可能会由于各种原因而自动触发。
实时 Feed 状态
标记为实时的 Feed 可获得以下状态:
- 数据已处理并推送给 Google
Feed 已通过验证。Feed 中的所有有效实体可能都已录入知识图谱。此认定结果表明在 Feed 中至少检测到 1 个有效实体,但不能保证成功 Feed 中的某个有效实体一定会录入知识图谱。此外,如果错误微不足道或可以修正,有些无效实体可能仍会录入知识图谱。了解详情。 - 数据已处理,但无法推送给 Google
由于实体不一致、自上次提取后有效实体数量发生明显变化或其他某种原因而导致提取被拒。请与您的 Google Feed 联系人联系,了解发生的情况以及如何解决此问题。上次成功的 Feed 中的有效实体在知识图谱中将仍然有效。 - 数据处理失败:Feed 文件问题
由于文件级问题而导致提取被拒。此 Feed 中的任何实体都不会推送到知识图谱中。此提取中的任何实体都不会显示在 Feed 报告的“检测到的实体”部分中。显示的实体来自上次有效的提取,或上次获得“数据已处理,但无法推送给 Google”状态的提取。 - 数据处理失败:空 Feed
所有 Feed 文件均为空或不含任何可解析的实体。如果实体存在但均含有错误,系统会显示提取状态为数据已处理,但无法推送给 Google。
非实时 Feed 状态
非实时 Feed 可存在以下状态:
- 数据已处理
Google 可以读取、解析您的 Feed 并对其进行初始验证。请检查并修正在 Feed 中发现的所有警告或错误问题,如 Feed 报告上的实体表格中所示。 - 数据处理失败:空 Feed
所有 Feed 文件均为空或不含任何可解析的实体。 - 数据处理失败:Feed 文件问题
由于文件级问题而导致提取被拒。此提取中的任何实体都不会显示在 Feed 报告的“检测到的实体”部分中。
其他信息
- “LIVE”标记
- 当 Feed 已被成功推送给 Google 至少一次后,该 Feed 上就会显示“LIVE”标记。
- 时间
- 认定结果报告的提取时间是 Google 提取 Feed 中第一个文件的(用户当地)时间。
Feed 文件
Feed 文件部分会显示您 Feed 中的文件是否可被读取。如果任何文件都无法被读取,提取就会失败。
Feed 文件问题
可能会出现以下文件级错误:
- 未找到 (404):在提供的网址中找不到 Feed 文件。
- 被屏蔽了,因为会返回“未授权的请求”(401) 错误:请务必添加所需的任何身份验证信息,以便 Google 访问您 Feed 配置中的文件。
- 已被 robots.txt 屏蔽:robots.txt 规则屏蔽了 Feed。找到并修改或移除该规则。
- 服务器错误 (5xx):尝试读取您的 Feed 文件时发生服务器错误。
- 重定向错误:读取文件时发生某种重定向错误,例如重定向循环或重定向到无效网址(而不是有效的非自适应网址)。Feed 文件阅读器会跟踪重定向,但如果您的 Feed 文件已永久移动,您应该更新 Feed 文件设置,而不是指定重定向。
- 由于禁止访问 (403) 而被屏蔽了:由于被限制访问,Google 无法读取您的文件。请务必添加所需的任何身份验证信息,以便 Google 访问您 Feed 配置中的文件。
- 由于遇到其他 4xx 问题而被屏蔽了:其他某种问题导致 Google 无法访问此 Feed 文件。
- 解析问题:严重解析问题导致整个文件无法被读取。点击问题说明即可查看包含解析错误的摘要。
- 内部错误:Google 发生了不明问题,稍后会重试。
- DNS 服务器无响应:DNS 服务器未响应我们的请求。Google 会定期重新尝试读取您的 Feed。
- DNS 错误:主机未知:DNS 服务未理解您提供的 Feed 网址。这可能是暂时性错误,但请检查所提供的网址进行确认。
- DNS 错误:提供的是专用 IP:DNS 服务返回的是为专用地址预留的 IP 地址(例如 10.0.0.1)。请与您的 DNS 服务提供商联系。
- 服务器连接错误:发生了 5XX 级错误(服务器不可访问、连接遭拒或无法响应)。
- 服务器响应无效:服务器不支持请求的协议、响应/标头被截断,或者响应无法解析(可能是因为压缩错误)。
- 服务器 SSL 证书无效:网站的 SSL 证书无效。如果 SSL 证书无效,Google 不会处理请求。
- 已提取,但未处理:如果 Feed 中有任何无法提取或处理的文件,Google 将尝试提取其余文件,但不会处理它们,并且 Feed 提取将失败。系统会为在这种情况下成功提取的文件加上“已提取,但未处理”标签。
检测到的实体
此部分会显示在相应提取中检测到的您的类别的所有顶级实体(按类型分组)。
顶级实体表格
对于每个顶级实体类型,该表格会按状态显示实体数量。如需查看某个实体类型的详细信息,请点击该表格中的相应实体行以打开实体详情页面。
如果由于任何文件都无法被读取而导致提取失败,该表格中的值都将为零,不过,您仍然可以点击某个实体行,以查看相应实体类型的提取历史记录。请注意,Google 会继续提供上次成功的提取中的实体。
其他实体
其他实体类型(如果显示)列出了无法正确分类的实体,可能是因为它们缺少类型说明,或者相应 Feed 中已存在具有相同 ID 的重复实体。无法解析的实体根本不会被纳入报告中。
实体详情页面
点击 Feed 实体表格中的某一行,即可查看所点击实体类型的详细信息。
实体提取历史记录图表
某个实体类型的历史记录图表会显示各次提取中具有每种状态的该类型实体的数量。该图表中的数据点是提取数据,无论更新成功与否。该图表并不会显示 Google 上的条目列表,而是显示某次提取中具有指定状态的实体数量。
虽然该图表会显示各提取点之间的向上或向下坡度,但所有更改都是在提取时即时完成的,因此您可以将其看作条形图(而非折线图),其中各个条形代表一次提取与下一次提取相隔的时间长度。
图表注解会标记失败的提取。如果任何文件都无法被读取,该图表中与相应提取的所有状态对应的值会降至零。
实体表格
该表格会显示最新提取尝试中所选实体类型的状态详情。
- 点击该表格中的某一行即可详细了解具有相应状态和说明的实体,包括示例实体(最多 1,000 个实体)列表以及具有相应状态和说明的实体的历史记录图表。
- 点击该表格中的某个示例实体即可查看更多详情,包括带有突出显示(如果可能)的错误的实体代码。
实体状态
问题分为以下状态之一。实体按照它包含的最严重问题进行归类。因此,如果一个实体中包含两个问题,一个为无效,另一个为有效,但存在警告,那么实体状态为无效。
- 无效:此实体无法以 Feed 中提供的状态使用。如果您希望此实体可供使用,请在下一次 Feed 提取中更新此实体。如果 Feed 状态为成功,并且此 Feed 为实时 Feed,那么无效实体将会从 Google 中移除。
- 有效,但存在警告:此实体能以提供的状态使用;不过,您可能需要修正某些问题。警告可能与您应更改的内容(例如,使用已弃用的字段)有关,也可能与您为了获得额外信息(例如价格)而可能需要提供的内容有关。其中一些问题将来可能会变为错误。
- 有效:此类实体能够纳入知识图谱中。如需查看有效实体的列表,请在 Feed 报告的摘要页面中点击图表下方的“查看关于有效实体的数据”。
调试 Feed
调试 Feed 是一个迭代过程。您可以使用 Feed 报告来查找和修正错误,然后在该报告的下一次 Feed 提取中跟踪修正效果。
问题按顶级实体类型分组。通过在单个个案中检查问题并修正实体生成代码,您或许能够修正特定类型的很多问题。
如需验证单项内容,您可以使用数据 Feed 验证工具。
如需修正实体问题,请执行以下操作:
- 在 Feed 报告底部的表格中查看实体类型列表。点击某一显示零个以上无效项的行。
- 确保已选择无效标签页,以查看 Feed 中处于错误状态的实体的历史记录。
- 在报告底部的错误详情表格中查看错误列表。
- 点击进入某一错误以查看含有该错误的实体的历史记录,以及最新提取尝试中含有该错误的实体的示例。由于各种原因,示例实体列表未必完整;但是,图表中显示的受该错误影响的实体计数应该是完整的。
- 点击示例列表中的某个实体,查看带有突出显示的错误的代码(并非所有错误都支持突出显示)。点击了解详情链接,详细了解该错误。在某些情况下,您可能会在“其他信息”面板中看到修正建议。您还应阅读特定实体的文档,了解要求的值或格式。
- 生成更新后的 Feed,然后使用数据 Feed 验证工具检查对之前损坏的一两个实体的修正效果。
- 如果一切正常,请更新 Feed 并等待下一次提取,看看这些错误是否已消失。如需查看特定实体类型中特定错误类型的历史记录,请点击 Feed 报告“检测到的实体”表格中的相应实体类型,然后点击“详情”表格中的问题。
问题类型
Feed 可能存在 Feed 问题和实体问题。
- Feed 问题涉及读取和解析文件。任何文件问题都会导致提取失败。查看文件问题列表。
- 实体问题可能是语法错误或缺少必填字段。实体问题也可能是 Feed 中实体与知识图谱中实体的匹配问题。了解详情
实体问题
实体可能有一个或多个问题,并且/或者多次出现同一问题。如需调试实体问题,请点击最新 Feed 的报告以查看错误和警告,然后点击进入特定实体以查看受特定问题影响的实体的示例列表。
- 如果您要调试某个特定的错误类型(例如,缺少“name”属性的所有实体),请找出您需要深入了解的特定实体类型的错误。
实体问题类型
实体可能存在解析/合规性问题或匹配问题。Feed 报告不会区分这两类问题,但了解问题类别有助于修正问题:
- 解析或合规性问题表示实体无法解析、缺少必需值或包含给定字段不支持的值。对于这些类型的问题,请参阅问题名称以了解具体问题,并阅读特定实体类型的文档以了解给定实体需要满足的要求。
- [实验性] 匹配问题会在 Google 无法将 Feed 中的实体与知识图谱中的实体相匹配时出现。导致这种情况的主要原因是:我们缺少 Feed 实体的相关数据,或者有关 Feed 实体的某些信息与 Google 中有关该实体的信息不符。针对这些问题的触发器仍在开发中,因此您应该首先侧重于修正解析或合规性问题。了解如何调试匹配问题。