Etiquetas especiales que Google entiende

 

Google admite tanto metaetiquetas a nivel de página como directivas insertadas para controlar cómo aparecerán las páginas de tu sitio web en la Búsqueda.

Las metaetiquetas a nivel de página son una forma perfecta con la que los webmasters pueden facilitar a los buscadores información sobre sus sitios web. Además, pueden utilizarse para ofrecer información a todo tipo de clientes, y cada sistema procesa solo aquellas que entiende e ignora el resto. Las metaetiquetas se añaden a la sección <head> de la página HTML y suelen tener el aspecto siguiente:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <meta name="Description" CONTENT="Autor: A.N. Autor, Ilustrador: I. Ilustración, Categoría: Libros, Precio: 10 €, Número de páginas: 784">
    <meta name="google-site-verification" content="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/>
    <title>Libros de ejemplo: libros de segunda mano pero primera calidad para niños</title>
    <meta name="robots" content="noindex,nofollow">

 

A continuación, se muestra una lista no exhaustiva de las metaetiquetas de las que Google puede extraer información:

<meta name="description" content="Descripción de la página" /> Con esta etiqueta, puedes añadir una breve descripción de la página que, en algunos casos, se utiliza en el fragmento que se muestra en los resultados de búsqueda. Más información
<meta name="robots" content="..., ..." />
<meta name="googlebot" content="..., ..." />

Estas metaetiquetas controlan el comportamiento de rastreo e indexación de los buscadores.

La etiqueta <meta name="robots"> afecta a todos los buscadores, mientras que la etiqueta <meta name="googlebot"> es específica de Google.

Los valores predeterminados son "index, follow" y no hace falta ponerlos. Entendemos los siguientes valores (si indicas varios, sepáralos con comas):

  • index: permite que la página se indexe.
  • follow: permite que se sigan todos los enlaces de la página mientras se rastrea.
  • noindex: impide que la página se indexe.
  • nofollow: no permite que se siga ningún enlace de la página mientras se rastrea.
  • nosnippet: no permite que se muestre ningún fragmento de texto ni la vista previa de ningún vídeo en los resultados de búsqueda. En el caso de los vídeos, se mostrará una imagen estática si es posible. Ejemplo: <meta name="robots" content="nosnippet">
  • max-snippet:[número]: permite limitar la longitud del fragmento de texto de esta página a [número] caracteres; indica 0 si no quieres que se muestre ningún fragmento o -1 para permitir fragmentos de cualquier longitud.
  • max-image-preview: [tipo]: limita el tamaño de cualquier imagen asociada a esta página. [tipo] puede ser none, standard o large.
  • max-video-preview:[número]: limita las vistas previas de vídeo asociadas a esta página a [número] segundos; indica 0 para permitir solo una imagen fija o -1 para permitir vistas previas de cualquier longitud.
  • noarchive: no permite que se muestre ningún enlace en caché de la página en los resultados de búsqueda.
  • unavailable_after:[fecha]: te permite indicar la hora y la fecha exactas en las que quieres que se deje de rastrear e indexar tu página.
  • noimageindex: no permite que la página se muestre como página de referencia de ninguna imagen en los resultados de la Búsqueda de imágenes de Google. Esto impide que todas las imágenes de una página se indexen en ella; así, si la imagen aparece en otra página, es probable que se rastree e indexe de acuerdo con los permisos correspondientes de esa otra página. Ten en cuenta que esta opción aún no es un estándar de Internet. La forma estándar de bloquear imágenes es mediante una regla robots.txt.
  • none: es equivalente a los valores noindex, nofollow.
  • all [valor predeterminado]: es equivalente a los valores index, follow.

Esta información también se puede incluir en el encabezado de las páginas mediante la directiva de encabezados HTTP "X-Robots-Tag". Esto resulta especialmente útil para limitar la indexación de archivos que no sean HTML, como gráficos y otro tipo de documentos. Más información sobre las metaetiquetas robots

<meta name="google" content="nositelinkssearchbox" /> Cuando los usuarios buscan tu sitio web, en los resultados de la Búsqueda de Google a veces aparece un cuadro de búsqueda específico de tu sitio web, junto con enlaces directos a algunas de sus páginas. Con esta etiqueta, indicas a Google que no muestre el cuadro de búsqueda de enlaces de sitio. Más información sobre el cuadro de búsqueda de enlaces de sitio
<meta name="google" content="notranslate" /> Si Google reconoce que el contenido de una página no está en el idioma que probablemente quiera el usuario que ha hecho la consulta, suele proporcionar un enlace a una traducción en los resultados de búsqueda. Por lo general, esta función te permite ofrecer tu contenido único y atractivo a más usuarios. Sin embargo, es posible que haya casos en los que no desees utilizar esta opción. Esta metaetiqueta indica a Google que no quieres que proporcionemos una traducción de esta página.
<meta name="google-site-verification" content="..." /> Puedes utilizar esta etiqueta en la página de nivel superior de tu sitio web para verificar su propiedad en Search Console. Recuerda que, aunque los valores de los atributos "name" y "content" deben coincidir exactamente con los datos que se te proporcionen (incluidas mayúsculas y minúsculas), no importa que cambies la etiqueta de XHTML a HTML ni que el formato de la etiqueta coincida con el de tu página. Más información
<meta http-equiv="Content-Type" content="...; charset=..." />
<meta charset="..." >
Esta metaetiqueta define el conjunto de caracteres y el tipo de contenido de la página. Asegúrate de delimitar el valor del atributo de contenido con comillas; de lo contrario, el atributo del conjunto de caracteres podría interpretarse de manera incorrecta. Recomendamos utilizar Unicode/UTF‑8 siempre que sea posible. Más información
<meta http-equiv="refresh" content="...;url=..." /> Esta etiqueta redirige a los usuarios a otra URL pasado un tiempo, por lo que a veces se utiliza como forma sencilla de redirección. Sin embargo, no es compatible con todos los navegadores y puede confundir a los usuarios. El W3C recomienda no usar esta etiqueta. En lugar de ella, sugerimos que se utilicen redirecciones 301 de servidor.
<meta name="viewport" content="..."> Esta etiqueta indica a los navegadores cómo renderizar páginas en dispositivos móviles. Google considera que las páginas que incluyen esta etiqueta están optimizadas para móviles. Más información sobre cómo configurar la metaetiqueta viewport

<meta name="rating" content="adult" />

<meta name="rating" content="RTA-5042-1996-1400-1577-RTA" />

Esta etiqueta indica que hay contenido para adultos en una página, por lo que debe excluirse de los resultados de Búsqueda Segura. Más información sobre cómo etiquetar páginas de Búsqueda Segura

Notas adicionales:

  • Google puede leer metaetiquetas similares a HTML y a XHTML, independientemente del código que se utilice en la página.
  • Salvo en el caso de google-site-verification, en las metaetiquetas no se suele distinguir entre mayúsculas o minúsculas.
  • Recuerda que las metaetiquetas que se incluyen más arriba no son las únicas disponibles y que puedes utilizar otras si son importantes para tu sitio web. Recuerda también que Google ignora las metaetiquetas que no conoce.

Directivas insertadas

Independientemente de las metaetiquetas a nivel de página, puedes indicar que haya partes de una página HTML que no se utilicen en los fragmentos. Puedes hacerlo mediante el atributo HTML data-nosnippet en elementos HTML span, div o section. Por ejemplo:

<p>Este texto se puede incluir en un fragmento, <span data-nosnippet>pero esta parte no se mostraría</span>.</p>

Para habilitar la lectura automática, la sección debe tener un código HTML válido y todas las etiquetas deben estar cerradas según corresponda. Más información

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?