第 1 步:查找无法抓取的网址
无法抓取的网页通过以下 3 种方式影响动态搜索广告:
- 如果您选择
URL-Equals
作为定位类型,而您的网址不可抓取,则对于相应的动态广告定位条件,将显示“已拒登:无法抓取着陆页”状态。 - 如果您使用页面 Feed,而 Feed 中的某个网址不可抓取,则在共享库中该网址对应的行中,将显示“已拒登:无法抓取着陆页”状态。
- 如果您使用其他任何定位机制,且没有抓取或无法抓取某个网址,Google Ads 将不会发现,因此不会显示任何错误消息。如果您尝试定位到的网址没有获得流量,您可以先通过
URL-Equals
或页面 Feed 来定位该网址,以此进行问题排查。如果该网址确实没有获得流量,系统将显示错误消息,其中解释了未获得流量的原因。
第 2 步:确保 Google AdsBot 可以抓取着陆页
- 复制网址并将其粘贴到网络浏览器的地址栏中。
- 在域名末尾添加
/robots.txt
,然后按 Enter 键。(例如,如果您的着陆页为http://www.example.com/folder1/folder2/
,则可通过访问以下网址查看允许哪些漫游器抓取该网域:http://www.example.com/robots.txt
。) - 查找
User-agent: AdsBot-Google
这一行。- 如果该行不存在,请与网站站长合作来添加它。
- 如果页面为空白页,请与网站站长合作,为网域添加
robots.txt
文件。 - 如果
User-agent: AdsBot-Google
存在,请确保它后面没有跟着包含Disallow: /
的行。此外,还要确保 AdsBot-Google 不受文件中其他行的限制。关于robots.txt
文件和 Google 抓取工具
- 如果着陆页是子网域,请检查该子网域是否具有单独的
robots.txt
文件。例如https://subdomain.domain.com/robots.txt
。请确保该robots.txt
还允许User-agent: AdsBot-Google
。 - 打开网址的源代码。在 Chrome 浏览器中,打开
view-source:THE_URL
,即可打开网址的源代码。(例如,如果您的着陆页为http://www.example.com/folder1/folder2/
,则可通过访问以下网址查看允许哪些漫游器抓取该网域:view-source:http://www.example.com/folder1/folder2/
。) - 查找“
AdsBot-Google
”字符串- 如果该字符串不存在,则无法确定问题的来源。
- 如果该字符串位于
<meta name="AdsBot-Google" content="noindex" />
之类的标记内,请与网站站长合作来删除该标记。详细了解 Google 可以识别的元标记
导致着陆页无法被抓取的其他原因
如果已允许 Google AdsBot 抓取着陆页(User-agent: AdsBot-Google
已包含在网站的 robots.txt
文件中),则可能是其他原因导致无法抓取着陆页:
- 着陆页无法加载。如果您使用网络浏览器打开着陆页时看到错误消息(例如,404(未找到)、网站无法访问、您的会话已过期),请与网站站长联系,确保着陆页可在任何位置、环境(移动设备和桌面设备)或浏览器中加载。
- 着陆页要求登录。所有广告着陆页都必须可以公开访问。请使用其他着陆页,或与网站站长合作,从页面中移除登录要求。
- 着陆页包含过多转址或重定向。着陆页包含的重定向必须少于 10 个。请与网站站长合作,减少重定向数量。详细了解网站转址