管理多区域和多语言网站

如果您的网站以多种语言面向不同国家/地区或区域的用户提供不同的内容,您可以优化您网站的 Google 搜索结果。

背景信息:

  • 多语言网站是指使用多种语言提供内容的网站。例如,一家加拿大企业同时提供了英语版本和法语版本的网站。Google 搜索会尝试查找与搜索用户的语言匹配的网页。
  • 多区域网站是指明确地以不同国家/地区的用户为目标受众的网站。例如,一家产品制造商同时向加拿大和美国发货。Google 搜索会尝试查找与搜索用户的语言区域匹配的网页。

有些网站既属于多区域网站,又属于多语言网站(例如:某个网站可能向美国用户和加拿大用户提供了不同版本,而该网站上面向加拿大用户呈现的内容又同时提供了英语版本和法语版本)。

管理网站的多种语言版本

如果您的网站上有以多种语言提供的相同内容,请参阅以下提示,了解如何帮助用户(和 Google 搜索)找到正确的网页:

对不同的语言版本使用不同的网址

Google 建议对每种语言版本的网页使用不同的网址,而不是使用 Cookie 或浏览器设置来调整网页上的内容语言。

如果您对不同的语言版本使用不同的网址,请使用 hreflang 注释来帮助 Google 搜索结果链接到网页的正确语言版本。

如果您希望根据语言设置来动态更改内容或重新路由用户,则请注意,Google 可能无法找到并抓取您的所有变体。这是因为,Googlebot 抓取工具通常来自美国。另外,该抓取工具在发送 HTTP 请求时并不会在请求标头中设置 Accept-Language

将您的不同语言版本告知 Google

Google 支持使用多种不同的方法为网页的语言或区域变体添加标签,包括 hreflang 注释和站点地图。请以适当的方式标记您的网页。

确保网页语言显而易见

Google 会依据网页的可见内容来确定网页的语言。我们不会使用任何代码级语言信息,例如 lang 属性或网址。您只需确保各网页的内容和导航元素都使用同一种语言,且避免原文和译文并行显示,就能帮助 Google 正确地确定网页语言。

如果仅翻译网页的样板文字,而以同一种语言显示网页的大部分内容(这种情况在包含用户生成的内容的网页中经常出现),则可能会导致同样的内容以不同的样板语言重复显示在搜索结果中,令用户体验大打折扣。

使用 robots.txt 阻止搜索引擎在您的网站上抓取自动翻译的网页。自动翻译的内容有时会让人觉得“不知所云”,而且还可能被视为网络垃圾。更重要的是,劣质或生硬的翻译可能会破坏访问者对网站的印象。

让用户切换网页语言

如果您的某个网页有多个版本:

  • 不妨考虑添加超链接以指向该网页的其他语言版本。这样,用户便可通过点击超链接来选择网页的另一语言版本。
  • 避免根据检测到的用户语言进行自动重定向。这些重定向可能会阻止用户(和搜索引擎)浏览网站的所有版本。

使用基于语言的网址

您既可在网址中使用已本地化的字词,也可使用国际化域名 (IDN)。但是,请务必确保网址使用了 UTF-8 编码(事实上,我们建议尽可能使用 UTF-8),并在链接至这些网址时对其进行正确转义。

将网站内容定位到特定国家/地区(地理位置定位)

您可将整个网站或其中的部分内容定位到某个特定国家/地区境内说某种特定语言的用户。这样可以提高网页在目标国家/地区的排名,但目标用户将无法看到以其他语言区域/语言显示的结果。

要在 Google 上对网站进行地理位置定位,请执行以下操作:

  • 网页级或网站级对网站或网页使用基于语言区域的网址
  • 网页级使用 hreflang 或站点地图告知 Google 哪些网页适用于哪些地理位置或语言。
  • 网站级:如果网站有一个通用顶级域名(例如 .com、.org 或 .eu),请使用“国际定位”报告指定网站的目标语言区域。如果您的网站面向多个国家/地区,请使用此工具。例如,如果相应网站与蒙特利尔的餐馆有关,则可将其定位到加拿大;但如果该网站还以生活在法国、加拿大和马里的法语用户为目标受众,将其定位到加拿大就不合适了。

请注意,地理位置定位并不能做到完全精确,因此,应考虑到用户可能会访问您网站的“错误”版本。一种可解决此问题的方法是:在所有网页上显示各个语言版本的链接,以便用户选择相应的区域和/或语言。

请勿使用 IP 分析来调整内容。 IP 位置信息分析难以实施,并且通常并不可靠。此外,Google 可能无法正确抓取网站变体。大多数(但不是全部)Google 抓取都来自美国,并且我们不会试图改变位置信息以检测网站变体。请使用以下任一显式方法:hreflang、备用网址和显式链接。

使用基于语言区域的网址

请考虑使用一种便于将您的整个网站或其中的部分内容定位到不同地理区域的网址结构。下表介绍了可用的选项:

网址结构 示例网址 优点 缺点
针对特定国家/地区的网域 example.de
  • 地理位置定位明确
  • 与服务器位置无关
  • 便于区分网站
  • 价格昂贵(并且可能存在使用限制)
  • 需有更多基础架构
  • ccTLD 要求严格(有时)
使用 gTLD 的子域名 de.example.com
  • 易于设置
  • 可以使用 Search Console 地理位置定位
  • 允许使用不同的服务器位置
  • 便于区分网站
  • 用户可能无法根据网址本身确定地理位置定位(“de”代表的是语言还是国家/地区?)
使用 gTLD 的子目录 example.com/de/
  • 易于设置
  • 可以使用 Search Console 地理位置定位
  • 维护费用低(同一主机)
  • 用户可能无法根据网址本身确定地理位置定位
  • 只有一个服务器位置
  • 更难以区分网站
网址参数 site.com?loc=de
  • 不推荐
  • 很难根据网址进行细分
  • 用户可能无法根据网址本身确定地理位置定位
  • 无法在 Search Console 中使用地理位置定位功能

 

Google 如何确定目标语言区域?

Google 会根据众多因素来确定网页的最佳目标受众群体:

  • 使用 Search Console 的“国际定位”报告指定的目标语言区域。如果您使用通用顶级域名 (gTLD) 并使用另一国家/地区境内的托管服务提供商,我们建议您使用 Search Console 告知我们应将您的网站与哪个国家/地区关联(如果您想对您的网站进行地理位置定位)。
  • 国家/地区代码顶级域名 (ccTLD)。这些域名都与特定的国家/地区相关联(例如,.de 代表德国,.cn 代表中国),因此可以明确告知用户和搜索引擎,您的网站是专门面向特定国家/地区的(某些国家/地区会对哪些用户可以使用 ccTLD 加以限制,因此请务必先进行相关调查)。我们也会将某些个性化 ccTLD(例如 .tv、.me 等)作为 gTLD 处理,因为我们发现,用户和网站站长经常会认为这些域名比定位到具体国家/地区的域名更通用(我们无法提供一个完整的列表来汇总被作为 gTLD 处理的个性化 ccTLD,因为此类列表是不断变化的)。请参阅 Google 的 gTLD 列表
  • hreflang 语句,无论是在标记、标头还是站点地图中。
  • 服务器位置(通过服务器的 IP 地址判断)。 服务器的实际位置通常位于您用户的附近,因此可在某种程度上反映您网站的目标受众。不过,由于某些网站使用的是分散式内容分发网络 (CDN),或者在拥有较好的网络服务器基础架构的国家/地区进行托管,因此服务器的位置并不能作为一种可靠的线索。
  • 其他线索。 有关您网站的目标受众的其他线索来源还包括:网页上的本地地址和电话号码、所使用的本地语言和货币、从其他本地网站上指向该网站的链接和/或所使用的 Google 我的商家(若适用)。

Google 不会做什么:

  • Google 会从世界各地的不同地理位置抓取网页。我们不会为了查找某个网页中所有可能的变体而尝试改变对同一网站使用的抓取工具来源。因此,您应通过上述方法(例如 hreflang 条目、ccTLD 或显式链接)将您的网站会呈现的所有语言区域或语言变体明确告知 Google。
  • Google 会忽略地理位置元标记(例如 geo.positiondistribution),并忽略地理位置定位 HTML 属性。

处理多语言/多区域网站中的重复网页

如果您在同一个多区域网站的不同网址上以同一种语言提供类似内容或重复内容(例如,如果 example.de/example.com/de/ 都显示类似的德语内容),则应设定一个首选版本,然后使用 rel=canonical elementhreflang 标记来确保向搜索用户提供正确的语言或区域网址。

 

通用顶级域名

通用顶级域名 (gTLD) 是指未与具体地理位置关联的域名。如果您的网站使用通用顶级域名(例如 .com、.org 或下方列出的任何域名),并想以特定地理位置的用户为目标受众,则应使用上述方法之一明确地指定目标国家/地区。

Google 会将以下域名视为可在 Search Console 中进行地理位置定位的 gTLD:

  • 通用顶级域名 (gTLD):Google 会将所有通过 IANA DNS 根区进行解析的 TLD(已在 ICANN 注册为国家/地区代码顶级域名 (ccTLD) 的顶级域名除外)视为 gTLD。示例
    • .com
    • .org
    • .edu
    • .gov
    • 还有更多…
  • 通用区域性顶级域名:虽然此类域名会与具体地理区域关联,但一般仍会被视为通用顶级域名(与 .com 或 .org 很相似):
    • .eu
    • .asia
  • 通用国家/地区代码顶级域名 (ccTLD):Google 会将某些 ccTLD(例如 .tv、.me 等)视为 gTLD,因为我们发现,用户和网站站长经常会认为这些域名比定位到具体国家/地区的域名更通用。下面列出了这些 ccTLD(该列表可能会不时更新)。
    • .ad
    • .as
    • .bz
    • .cc
    • .cd
    • .co
    • .dj
    • .fm
    • .io
    • .la
    • .me
    • .ms
    • .nu
    • .sc
    • .sr
    • .su
    • .tv
    • .tk
    • .ws
该内容对您有帮助吗?
您有什么改进建议?