软 404 错误

什么是软 404?

软 404 是一种网址,会在返回的页面中向用户表明目标网页不存在,同时还会返回 200 级(成功)代码。在某些情况下,软 404 可能会返回一个内容很少或不含任何内容的网页(例如,一个只含零星内容的网页或空网页)。

它为何重要?

返回成功代码,而不是 404/410(未找到)或 301(已移动),这是一种不好的做法。成功代码等于告知搜索引擎,通过该网址可以找到实际的网页。因此,该网页可能会列在搜索结果中,搜索引擎将继续尝试抓取这个不存在的网址,而不是将时间用于抓取您的实际网页。

我该怎么做?

  • 如果您的网页不再可用且没有明确的替换网页,应返回 404(未找到)410(已删除)响应代码。上述代码明确告知浏览器和搜索引擎:该网页不存在。您还可在适当的情况下向用户显示自定义 404 网页 - 例如:包含您网站上最热门网页的列表的网页,或包含指向您网站首页的链接的网页。
  • 如果您的网页已移动或有明确的替换网页,请返回 301(永久重定向),以酌情重定向用户。
  • 如果您认为自己的网页被错误地标记为“软 404”错误,请使用网址检查工具检查呈现的内容和返回的 HTTP 代码。如果呈现的是空白或几乎空白的网页,则可能是因为该网页引用了许多无法加载的资源(图片、脚本和其他非文字元素),这种情况可能会被解读为“软 404”。无法加载资源的原因包括:资源被禁止抓取(遭到 robots.txt 屏蔽)、网页包含的资源过多/过大,或者资源加载速度缓慢。网址检查工具会列出无法加载的资源,也会向您显示呈现的实际网页。

请使用网址检查工具来验证您的网址是否确实返回了正确的代码。

该内容对您有帮助吗?
您有什么改进建议?