一般来说,404 错误不会影响您网站的搜索排名,如果您确信这些网址并非来源于自己的网站,可放心地忽略它们。请务必确保这些和其他无效网址返回正确的 404 HTTP 响应代码,且不会被网站的 robots.txt 文件屏蔽。
您应通过以下方法处理 404 错误:
- 判断错误是否值得修正。很多(可能大多数)404 错误都不值得修正,因为 404 错误不会对网站的索引编制状态或排名产生不良影响。
- 如果是已提交的网址(出错),则值得修正。
- 如果是无任何替换网页/对等网页的已删除网页,返回 404 是正确的做法。1 个月左右过后,该报告应该就会停止显示此类 404 错误了。
- 如果是您网站上未曾存在过的错误网址,那么您大可不必担心。虽然此类问题显示在报告中可能会给您带来困扰,但只要相应网址不属于经常拼错的链接,则无需更正。1 个月左右过后,该报告应该就会停止显示此类 404 错误了。
- 如果网址包含经常拼错或有另一种拼写方式的字词(例如应该是 example.com/flights/canceling 而非 example.com/flights/cancelling - 注意“cancelling”中多拼的“l”;或者应该是 example.com/f00 而非 example.com/foo - 注意辨别数字“0”与字母“o”),那么请使用重定向或其他机制将存在此类情况的网页映射到您网站上的对等网页。
- 如果网址已提交以供编入索引(状态为错误),那么:
- 请点击网址旁边的“提交”图标 以检查该网址是从何处提交的,并查看发现部分中的信息。然后酌情更新站点地图。
- 如果相应内容已移到新位置,请添加重定向。
- 如果您已永久删除相应内容,并且不打算将其替换为更新的相关内容,请让旧网址返回 404 或 410。目前,Google 对 410(已删除)的处理方式与 404(未找到)相同。如果针对不存在的网页返回 404 或 410 以外的代码(或者将用户重定向至另一网页[如首页],而不是返回 404 代码),则可能有问题。此类网页称为软 404 网页,可能会给用户和搜索引擎造成混淆。
- 如果网址是未知网址:您可能偶尔会看到您网站上未曾存在过的网址返回 404 错误。如果有人尝试在您的网站上查看某个不存在的网址(可能是因为他/她在浏览器中输错了网址,或者点击了拼写有误的链接网址),就可能会发生此类错误。如果这是一个很常见的错误,您可为其创建重定向。
导致生成意外网址的另一个原因可能是:Googlebot 尝试跟踪在 JavaScript、Flash 文件或其他嵌入式内容中发现的链接,或者尝试跟踪可能仅存在于站点地图中的链接。例如,您的网站可能会使用如下代码在 Google Analytics(分析)中跟踪下载的文件:<a href="helloworld.pdf" onClick="_gaq.push(['_trackPageview','/download-helloworld']);"> Hello World PDF</a>
当 Googlebot 看到此代码时,它可能会尝试抓取网址
http://www.example.com/download-helloworld
,尽管这并不是一个真实网页。在这种情况下,该链接可能会在“抓取错误”报告中显示为 404(未找到)错误。Google 正在努力杜绝此类抓取错误。此错误不会影响网站的抓取或排名。
- 请不要创建虚假内容、重定向到您网站的首页或使用 robots.txt 屏蔽 404 网址,否则我们会更加难以识别您网站的结构和正确处理您的网站。我们将此类错误称为软 404 错误。(一旦 Google 成功抓取了某个网址,就可能会一直尝试抓取该网址。创建 300 重定向会延迟尝试重新抓取,而且可能会延迟很长一段时间)。使用网址移除工具提交网址移除请求不会从该报告中移除此错误。