Tìm kiếm
Xóa tìm kiếm
Đóng tìm kiếm
ứng dụng Google
Menu chính

Sử dụng URL chuẩn

Bài viết này mô tả cách bạn có thể sử dụng URL chuẩn để cải thiện liên kết và tín hiệu xếp hạng cho nội dung có sẵn qua nhiều cấu trúc URL hoặc qua phân phối.

Trong thế giới của hệ thống quản lý nội dung và mua sắm trực tuyến, việc một nội dung được truy cập qua nhiều URL rất phổ biến. Với dịch vụ phân phối nội dung, nội dung cũng dễ dàng được phân phối hoàn toàn đến các URL và miền khác nhau. Ví dụ:

Cùng một trang sản phẩm có URL động do phiên người dùng và/hoặc tùy chọn tìm kiếm
https://www.example.com/products?category=dresses&color=green

https://example.com/dresses/cocktail?gclid=ABCD 

https://www.example.com/dresses/green/greendress.html
Hệ thống blog của bạn tự động lưu nhiều URL làm vị trí cho cùng một bài đăng dưới nhiều mục.
https://blog.example.com/dresses/green-dresses-are-awesome/

https://blog.example.com/green-things/green-dresses-are-awesome/
Máy chủ của bạn được định cấu hình để phân phối cùng một nội dung cho tên miền phụ www hay giao thức http.
http://example.com/green-dresses

https://example.com/green-dresses

http://www.example.com/green-dresses
Nội dung bạn cung cấp trên blog đó để phân phối đến các trang web khác được sao chép một phần hoặc toàn bộ trên các miền đó.
https://news.example.com/green-dresses-for-every-day-155672.html (bài đăng được phân phối)

https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (bài đăng gốc)

Mặc dù các hệ thống này giúp việc phát triển và phân phối nội dung trở nên thuận tiện hơn, chúng gây ra một số thách thức khi mọi người sử dụng công cụ tìm kiếm để tiếp cận trang của bạn. Ví dụ:

  • Hợp nhất tín hiệu liên kết cho nội dung trùng lặp hoặc tương tự. Điều này giúp công cụ tìm kiếm hợp nhất thông tin có được cho từng URL riêng lẻ (chẳng hạn như liên kết đến các URL này) trên một URL duy nhất ưa thích. Điều này nghĩa là liên kết từ các trang web khác đến http://example.com/dresses/cocktail?gclid=ABCD được hợp nhất với liên kết đến https://www.example.com/dresses/green/greendress.html.
  • Theo dõi chỉ số cho một sản phẩm/chủ đề. Với nhiều URL khác nhau, việc hợp nhất chỉ số cho một nội dung cụ thể trở nên khó khăn hơn.
  • Xác định URL mà bạn muốn mọi người nhìn thấy. Bạn muốn mọi người truy cập trang sản phẩm váy màu xanh lá của bạn thông qua https://www.example.com/dresses/green/greendress.html hơn là https://example.com/dresses/cocktail?gclid=ABCD.
  • Xử lý nội dung được phân phối. Nếu bạn phân phối nội dung để xuất bản trên các miền khác, bạn muốn hợp nhất xếp hạng trang cho URL ưa thích của bạn.

Để giải quyết các vấn đề này, chúng tôi khuyên bạn nên xác định một URL chuẩn cho nội dung (hoặc nội dung tương đương) có sẵn qua nhiều URL. Bạn có thể thực hiện điều này cho Google Tìm kiếm theo một số cách:

Mặc dù chúng tôi khuyến khích bạn sử dụng bất kỳ phương pháp nào trong số này, không phương pháp nào là bắt buộc. Nếu bạn không chỉ định URL chuẩn, chúng tôi sẽ xác định URL mà chúng tôi nghĩ là phiên bản tốt nhất của URL đó.

Không sử dụng tệp robots.txt cho mục đích chuẩn hóa.
Không sử dụng công cụ xóa URL cho chuẩn hóa: công cụ này xóa tất cả các phiên bản của một URL khỏi tìm kiếm.
Không chỉ định các URL khác nhau làm phiên bản chuẩn cho cùng một trang (chẳng hạn như một URL trong một sơ đồ trang web và một URL khác cho cùng trang đó bằng cách sử dụng rel="canonical").

Đặt miền ưa thích của bạn

Cho Google biết phiên bản URL nào của trang web bạn muốn sử dụng cho miền của mình:

  • https://www.example.com
  • https://example.com

Nếu bạn đặt miền ưa thích của mình là https://example.com, Google xử lý các liên kết đến https://www.example.com y hệt như các liên kết đến https://example.com.

Ðọc Đặt miền ưa thích của bạn để biết chi tiết.

Chỉ ra URL ưa thích với yếu tố liên kết rel="canonical"

Giả sử bạn muốn https://blog.example.com/dresses/green-dresses-are-awesome/ là URL ưa thích, mặc dù nhiều URL khác có thể truy cập nội dung này. Bạn có thể chỉ báo điều này cho công cụ tìm kiếm như sau:

  • Đánh dấu trang chuẩn và bất kỳ biến thể nào khác bằng yếu tố liên kết rel="canonical".
    Thêm một phần tử <link> với thuộc tính rel="canonical" vào phần head> của các trang này: 
    <link rel="canonical" href="https://blog.example.com/dresses/green-dresses-are-awesome" />

    Điều này chỉ báo URL ưa thích cần dùng nhằm truy cập vào bài đăng về váy màu xanh lá, để kết quả tìm kiếm có khả năng hiển thị cho người dùng cấu trúc URL đó hơn. (Lưu ý: Chúng tôi cố gắng tôn trọng điều này, nhưng không thể đảm bảo điều này trong mọi trường hợp.)

Tránh lỗi: Sử dụng đường dẫn tuyệt đối chứ không phải đường dẫn tương đối với yếu tố liên kết rel="canonical".

Sử dụng cấu trúc này:  https://www.example.com/dresses/green/greendresss.html
Không cấu trúc này: /dresses/green/greendress.html).

Sử dụng sơ đồ trang web để chỉ ra URL ưa thích cho cùng một nội dung

Chọn một URL chuẩn (ưa thích) cho mỗi trang của bạn và cho chúng tôi biết về tùy chọn của bạn bằng cách gửi URL chuẩn trong một sơ đồ trang web.

Chúng tôi không đảm bảo rằng chúng tôi sẽ sử dụng các URL bạn gửi trong sơ đồ trang web, nhưng việc gửi sơ đồ trang web là một cách hữu ích để cho Google biết về các trang trên trang web của bạn mà bạn coi là quan trọng nhất.

Sử dụng chuyển hướng 301 cho các URL không phải chuẩn

Giả sử trang của bạn có thể truy cập bằng nhiều cách:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Một ý tưởng hay là chọn một trong những địa chỉ URL này làm đích đến ưa thích (chuẩn) của bạn và sử dụng chuyển hướng 301 để gửi lưu lượng truy cập từ các URL khác tới URL ưa thích của bạn. Chuyển hướng 301 phía máy chủ là cách tốt nhất để đảm bảo rằng người dùng và công cụ tìm kiếm được chuyển đến đúng trang. Mã trạng thái 301 nghĩa là một trang đã được di chuyển vĩnh viễn tới vị trí mới.

Chỉ ra cách xử lý thông số động

Sử dụng Xử lý thông số để cho Google biết về bất kỳ thông số nào bạn muốn bỏ qua. Việc bỏ qua một số thông số nhất định có thể làm giảm nội dung trùng lặp trong chỉ mục của Google và khiến trang web của bạn dễ thu thập dữ liệu hơn. Ví dụ: nếu bạn xác định rằng thông số sessionid nên được bỏ qua, Google sẽ xem https://www.example.com/dresses/green.php?sessionid=273749 giống như https://www.example.com/dresses/green.php.

Chỉ định liên kết chuẩn trong tiêu đề HTTP của bạn

Nếu bạn có thể định cấu hình máy chủ của bạn, bạn có thể sử dụng tiêu đề HTTP rel="canonical" để chỉ ra URL chuẩn cho các tài liệu HTML và tệp khác như tệp PDF. Giả sử trang web của bạn cung cấp cùng một tệp PDF qua các URL khác nhau (ví dụ nhằm mục đích theo dõi), như thế này:

https://www.example.com/downloads/white-paper.pdf
https://www.example.com/downloads/partner-1/white-paper.pdf
https://www.example.com/downloads/partner-2/white-paper.pdf
https://www.example.com/downloads/partner-3/white-paper.pdf

Trong trường hợp này, bạn có thể sử dụng tiêu đề HTTP rel="canonical" để chỉ cho Google biết URL chuẩn cho tệp PDF, như sau:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

Google hiện chỉ hỗ trợ các yếu tố tiêu đề liên kết cho Tìm kiếm trên web. 

Ưu tiên HTTPS cho liên kết chuẩn hơn HTTP

Google ưu tiên các trang HTTPS làm phiên bản chuẩn hơn trang HTTP tương đương, trừ khi có tín hiệu xung đột chẳng hạn như sau:

  • Các trang HTTPS có chứng chỉ SSL không hợp lệ.
  • Các trang HTTPS chứa yếu tố phụ thuộc không an toàn.
  • Các trang HTTPS được robot hóa (còn trang HTTP thì không).
  • Các trang HTTPS chuyển hướng người dùng đến hay qua một trang HTTP.
  • Các trang HTTPS có liên kết rel="canonical" đến trang HTTP.
  • Các trang HTTPS chứa thẻ meta robot noindex (không lập chỉ mục).

Mặc dù hệ thống của chúng tôi ưu tiên các trang HTTPS hơn trang HTTP theo mặc định, bạn có thể đảm bảo hành vi này bằng cách thực hiện bất kỳ hành động nào sau đây:

  • Thêm chuyển hướng 301 hoặc 302 từ trang HTTP đến trang HTTPS.
  • Thêm liên kết rel="canonical" từ trang HTTP đến trang HTTPS.
  • Triển khai HSTS.

Để ngăn Google đặt nhầm trang HTTP làm trang chuẩn, bạn nên tránh các phương pháp sau đây:

  • Chứng chỉ SSL không hợp lệ và chuyển hướng từ HTTPS đến HTTP khiến chúng tôi thường ưu tiên cho trang HTTP. Việc triển khai HSTS cũng không thể ghi đè tùy chọn thường trực này.
  • Bao gồm trang HTTP trong sơ đồ trang web hoặc mục nhập hreflang của bạn chứ không phải phiên bản HTTPS.
  • Triển khai chứng chỉ SSL/TLS của bạn cho host-variant (biến thể máy chủ) không chính xác: chẳng hạn như example.com phân phối chứng chỉ cho www.example.com.  Chứng chỉ này phải khớp với URL trang web hoàn chỉnh của bạn hoặc là chứng chỉ ký tự đại diện có thể được sử dụng cho nhiều miền phụ trên một miền.
Nếu bạn chặn một tài nguyên bằng tệp robots.txt, hãy đảm bảo chặn cả phiên bản HTTP và HTTPS của tài nguyên đó.

 

 

Bài viết này có hữu ích không?
Chúng tôi có thể cải thiện trang này bằng cách nào?