了解重复网址的影响

某些网站偶尔会使用会话 ID 或其他网址参数通过不同的网址提供相同的内容。会话ID是附加到网址路径以生成新网页的数字,该新网页可为与此ID对应的网站访问者提供自定义体验。例如,会话ID可让购物网站区分客户,以便每个人都能在浏览该网站目录时看到自己购物车内的内容。然而,网址参数却不那么侧重于用户识别:例如,客户在宠物商店网站搜索“小狗”时,可以按年龄、品种、颜色和价格范围对搜索结果进行过滤或排序。每种过滤条件组合都代表了不同的网址(尽管这些网址通常包含相似或重复的结果),因为过滤条件会将新的字符串或参数附加到原始网址路径以更改客户看到的结果。

示例

以下网址指向相同的内容:绿色礼服系列(尽管其中部分网页在内容的整理或过滤方面可能会略有不同)。

 http://www.example.com/products/women/dresses/green.htm
 http://www.example.com/products/women?category=dresses&color=green
 http://example.com/shop/index.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123&affid=431

当Google检测到重复内容(例如上述示例中的网页)时,Google算法会将重复的网址划分到一个群集,并从中选择该算法认为最能在搜索结果中代表该集群的网址(例如,Google可能会选择内容最多的那个网址)。然后,Google 会尝试根据我们对该集群中各个网址的了解(例如链接热门程度)来改进这个代表网址,以最终提高该网址在 Google 搜索中的网页排名和结果的准确性。

不过,如果 Google 无法找到集群中的所有网址,或者无法选择您首选的代表网址,那么您可以使用网址参数 工具告知 Google 如何处理包含特定参数的网址。

请注意,您应该谨慎使用网址参数工具。如果您在向我们指明不应抓取的重复内容时犯了错,Google可能会停止抓取您希望在Google搜索中显示的网页。

例如,若您告知Google仅在值为food=savory时抓取包含food参数的网址,那么Google可能不会抓取路径中包含food=sweet的网址。如此一来,用户便无法通过Google搜索找到您网站上与甜食有关的网页。

下一篇:为网址参数分类

本文是否对您有帮助?
您有什么改进建议?