Các thẻ đặc biệt mà Google hiểu

 

Google hỗ trợ cả thẻ meta ở cấp độ trang cũng như các lệnh nội dòng nhằm giúp bạn kiểm soát cách các trang thuộc trang web của bạn xuất hiện trên Tìm kiếm.

Thẻ meta ở cấp độ trang là một cách hữu ích mà quản trị viên web có thể sử dụng để cung cấp thông tin về trang web cho công cụ tìm kiếm. Có thể dùng thẻ meta để cung cấp thông tin cho tất cả các loại máy khách. Đồng thời, mỗi hệ thống chỉ xử lý thẻ meta mà hệ thống đó hiểu được và bỏ qua các thẻ meta còn lại. Thẻ meta phải nằm trong phần <head> trên trang HTML của bạn và thường có dạng như sau:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <meta name="Description" CONTENT="Tác giả: Không Tên, Hoạ sĩ vẽ minh hoạ: P. Picture, Danh mục: Sách, Giá: 268.000 VND, Số trang: 784 trang">
    <meta name="google-site-verification" content="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/>
    <title>Sách mẫu – sách cũ chất lượng cao dành cho trẻ em</title>
    <meta name="robots" content="noindex,nofollow">

 

Google hiểu các thẻ meta sau (danh sách này không đầy đủ):

<meta name="description" content="Mô tả về trang" /> Sử dụng thẻ này để cung cấp đoạn mô tả ngắn về trang. Trong một số trường hợp, Google dùng đoạn mô tả này để tạo đoạn trích hiển thị trên kết quả tìm kiếm. Thông tin khác
<meta name="robots" content="..., ..." />
<meta name="googlebot" content="..., ..." />

Các thẻ meta này kiểm soát hành vi của công cụ tìm kiếm khi thu thập dữ liệu và lập chỉ mục.

Thẻ <meta name="robots"> áp dụng cho tất cả các công cụ tìm kiếm, trong khi <meta name="googlebot"> chỉ áp dụng cho Google.

Các giá trị mặc định là "index, follow" (lập chỉ mục, theo) và không cần chỉ định. Chúng tôi hiểu các giá trị sau (khi bạn chỉ định nhiều giá trị, hãy phân tách các giá trị đó bằng dấu phẩy):

  • index (lập chỉ mục) – Cho phép lập chỉ mục trang
  • follow (theo) – Theo mọi đường dẫn liên kết trên trang trong quá trình thu thập dữ liệu.
  • noindex (ngăn lập chỉ mục) – Ngăn lập chỉ mục trang.
  • nofollow (không theo) – Không theo các đường dẫn liên kết trên trang này trong quá trình thu thập dữ liệu.
  • nosnippet (ngăn hiển thị đoạn trích) – Ngăn không cho hiển thị một đoạn trích hay xem trước video trong kết quả tìm kiếm. Đối với video, một hình ảnh tĩnh sẽ được hiển thị để thay thế, nếu có thể. Ví dụ: <meta name="robots" content="nosnippet">
  • max-snippet:[số] (độ dài đoạn trích tối đa) – Đặt giới hạn độ dài đoạn trích văn bản cho trang này ở mức [số] ký tự; chỉ định 0 nếu không có đoạn trích hoặc -1 để cho phép độ dài bất kỳ.
  • max-image-preview:[loại] (loại kích thước tối đa của hình ảnh xem trước) – Đặt giới hạn kích thước của mọi hình ảnh liên kết với trang này. [loại] có thể là none (không có), standard (chuẩn) hoặc large (lớn).
  • max-video-preview:[số] (Thời lượng xem trước video tối đa) – Đặt giới hạn thời lượng xem trước là [number] giây cho bất kỳ video nào liên kết với trang này; chỉ định 0 để chỉ cho phép hình ảnh tĩnh hoặc -1 để cho phép thời lượng bất kỳ
  • noarchive (không hiển thị kết quả trong bộ nhớ đệm) – Không hiển thị đường dẫn liên kết đã lưu trong bộ nhớ đệm cho một trang trong kết quả tìm kiếm.
  • unavailable_after:[ngày] (ngày kết thúc) – Cho phép bạn chỉ định chính xác thời gian và ngày mà bạn muốn dừng thu thập dữ liệu và lập chỉ mục trang này.
  • noimageindex (không lập chỉ mục hình ảnh) – Không hiển thị trang dưới dạng trang giới thiệu cho một hình ảnh trong kết quả tìm kiếm của Google Hình ảnh. Lệnh này có tác dụng ngăn Google lập chỉ mục tất cả các hình ảnh trên trang này. Nếu hình ảnh đó xuất hiện trên một trang khác thì Google có thể thu thập dữ liệu và lập chỉ mục hình ảnh theo quyền mà trang đó chỉ định. Xin lưu ý rằng đây chưa phải là cách làm phổ biến trên Internet. Cách thông thường để chặn hình ảnh vẫn là sử dụng quy tắc robots.txt.
  • none (không) – Tương đương với noindex, nofollow (ngăn lập chỉ mục, không theo).
  • all (tất cả) – [Mặc định] Tương đương với "index, follow" (lập chỉ mục, theo).

Hiện bạn có thể xác định thông tin này trong phần tiêu đề của trang của bạn bằng cách sử dụng lệnh "X-Robots-Tag" trong tiêu đề HTTP. Điều này đặc biệt hữu ích nếu bạn muốn hạn chế việc lập chỉ mục với các tệp không phải HTML như tệp đồ họa hoặc các loại tài liệu khác. Thêm thông tin về thẻ meta robot

<meta name="google" content="nositelinkssearchbox" /> Khi người dùng tìm kiếm trang web của bạn, đôi khi, kết quả trên Google Tìm kiếm hiển thị một hộp tìm kiếm riêng cho trang web của bạn, cùng với các đường dẫn liên kết trực tiếp khác đến trang web của bạn. Thẻ này thông báo cho Google không hiển thị hộp tìm kiếm liên kết trang web. Tìm hiểu thêm về hộp tìm kiếm liên kết trang web.
<meta name="google" content="notranslate" /> Khi Google nhận ra nội dung của một trang viết bằng ngôn ngữ mà người dùng có thể không muốn đọc thì chúng tôi thường cung cấp một đường dẫn liên kết đến bản dịch trong kết quả tìm kiếm. Nói chung, việc này đem đến cho bạn cơ hội để cung cấp nội dung hấp dẫn và độc đáo của mình tới một nhóm người dùng lớn hơn rất nhiều. Tuy nhiên, có thể có những trường hợp mà bạn không muốn dùng tính năng này. Thẻ meta này cho Google biết rằng bạn không muốn chúng tôi cung cấp bản dịch cho trang này.
<meta name="google-site-verification" content="..." /> Bạn có thể sử dụng thẻ này trên trang cấp cao nhất của trang web để xác minh quyền sở hữu trang web với Search Console. Xin lưu ý rằng mặc dù các giá trị của thuộc tính "name" (tên) và "content" (nội dung) phải hoàn toàn khớp với thông tin cung cấp cho bạn (kể cả chữ hoa và chữ thường), thì việc bạn thay đổi thẻ từ XHTML sang HTML hay định dạng của thẻ có khớp với định dạng của trang hay không đều không gây ra vấn đề gì. Thông tin khác
<meta http-equiv="Content-Type" content="...; charset=..." />
<meta charset="..." >
Thẻ này xác định loại nội dung và bộ ký tự của trang. Đảm bảo rằng bạn đưa giá trị của thuộc tính nội dung vào trong ngoặc kép, nếu không thuộc tính bộ ký tự có thể bị thông dịch sai. Bạn nên sử dụng Unicode/UTF-8 khi có thể. Thông tin khác
<meta http-equiv="refresh" content="...;url=..." /> Thẻ này đưa người dùng tới URL mới sau một khoảng thời gian nhất định và đôi khi được dùng như một hình thức chuyển hướng đơn giản. Tuy nhiên, một số trình duyệt không hỗ trợ thẻ này và người dùng có thể thấy khó hiểu. Tổ chức W3C khuyến cáo không nên sử dụng thẻ này. Thay vào đó, bạn nên sử dụng lệnh chuyển hướng 301 phía máy chủ.
<meta name="viewport" content="..."> Thẻ này thông báo cho trình duyệt cách hiển thị một trang trên thiết bị di động. Sự hiện diện của thẻ này cho Google biết rằng trang thân thiện với thiết bị di động. Đọc thêm về cách định cấu hình thẻ meta cửa sổ xem.

<meta name="rating" content="adult" />

<meta name="rating" content="RTA-5042-1996-1400-1577-RTA" />

Gắn nhãn một trang là có chứa nội dung người lớn để chỉ báo rằng trang được lọc theo kết quả Tìm kiếm an toàn. Tìm hiểu thêm về cách gắn nhãn các trang Tìm kiếm an toàn.

Các điểm khác cần lưu ý

  • Google có thể đọc cả thẻ meta dạng HTML và XHTML, bất kể trang sử dụng mã nào.
  • Ngoại trừ thẻ google-site-verification, các thẻ meta thường không phân biệt chữ hoa chữ thường.
  • Đây không phải là danh sách đầy đủ tất cả các thẻ meta hiện có. Bạn có thể sử dụng các thẻ meta khác nếu chúng quan trọng với trang web của bạn. Tuy nhiên, bạn nên lưu ý rằng Google sẽ bỏ qua thẻ meta nếu không nhận ra các thẻ này.

Lệnh nội dòng

Ngoài các thẻ meta ở cấp độ trang, bạn có thể yêu cầu Google không sử dụng một số phần của một trang HTML trong đoạn trích. Để làm điều đó, bạn có thể sử dụng thuộc tính HTML data-nosnippet trên các phần tử HTML span, div hoặc section. Ví dụ:

<p>Có thể đưa đoạn văn bản này vào đoạn trích <span data-nosnippet>và không hiển thị phần này</span>.</p>

Để đảm bảo máy đọc được thì đoạn văn bản đó phải là một phần tử HTML hợp lệ và bạn phải đóng chính xác tất cả các thẻ. Thông tin khác.

Thông tin này có hữu ích không?
Chúng tôi có thể cải thiện trang này bằng cách nào?