Comprobar que los archivos ads.txt se pueden rastrear

Cuando se cree un archivo ads.txt en su dominio, el rastreador de Google hará lo siguiente:

  • Tratar de rastrear dicho archivo cada 24 horas.
  • Analizar su contenido para determinar los ID de los vendedores autorizados a monetizar su inventario.

Puede supervisar el estado del archivo ads.txt de un dominio con la herramienta de gestión de ads.txt de Ad Manager. En algunos casos, es posible que haya un archivo ads.txt publicado en su dominio, pero que en Ad Manager se indique que no se ha encontrado ninguno. Si el archivo ya lleva 24 horas publicado, por lo general indica que, aunque exista, Google no ha podido encontrarlo, rastrearlo o analizarlo.

Si se da esta situación, le recomendamos que siga los pasos que se indican a continuación con la ayuda de su webmaster para solucionar el problema.

Confirmar que el archivo no ha dejado de estar disponible temporalmente

Si el rastreador detecta un archivo ads.txt, pero no es capaz de encontrarlo en los siguientes rastreos, se seguirá este proceso con las entradas anteriores:

  • Si la respuesta es un error hard 404 (la página no existe; estado HTTP 404), se eliminarán definitivamente.
  • Si la respuesta es un error soft 404 (se devuelve una página real en una URL que no existe; estado HTTP 200) o un error de servidor 500, se retendrán durante cinco días. En ese caso, el tiempo de la última visualización que se indica en Ad Manager puede ser anterior al periodo de actualización de 24 horas habitual.

Verificar que se puede acceder al archivo desde el dominio raíz

Es habitual que domain.com/ads.txt redireccione a www.domain.com/ads.txt. El rastreo de archivos ads.txt comienza en el dominio raíz y, a continuación, este debe devolver un resultado del archivo ads.txt o redirigir a él.

  • En el caso de que un archivo ads.txt se encuentre en www.domain.com/ads.txt, solo se rastreará si domain.com/ads.txt redirige a él.
  • Solo se rastrean los archivos que estén a una redirección del dominio raíz original. Por ejemplo, si en el dominio raíz example1.com/ads.txt se incluye una redirección a example2.com/ads.txt, el ads.txt de esa URL se rastreará, pero no se seguirá ninguna redirección que contenga, aunque su destino se encuentre en ese mismo dominio.

Comprobar que robots.txt permite el rastreo

Puede que los rastreadores ignoren el archivo ads.txt de un dominio si su archivo robots.txt no permite alguno de los siguientes elementos:

  • El rastreo de la ruta URL en la que se ha publicado el archivo ads.txt.
  • La línea user-agent del rastreador.
Ejemplo: Rastreo no permitido en la ruta del archivo ads.txt

En example1.com:

  1. Se publica un archivo ads.txt en example1.com/ads.txt.
  2. Se incluyen las siguientes líneas en example1.com/robots.txt:
    User-agent: *
    Disallow: /ads
  3. Los rastreadores que cumplen el estándar robots.txt ignorarán el archivo ads.txt.
  4. Puede modificar el archivo robots.txt como se indica a continuación para que pueda rastrearse (puede haber otras formas de hacerlo):
    • Opción 1: Modificar la ruta no permitida.
      User-agent: *
      Disallow: /ads/
    • Opción 2: Permitir el archivo ads.txt explícitamente. Esta opción depende de la compatibilidad del rastreador con la directiva Allow de robots.txt.
      User-agent: *
      Allow: /ads.txt
      Disallow: /ads
Ejemplo: Rastreo no permitido al user-agent en todo un sitio web

En example2.com:

  1. Se publica un archivo ads.txt en example2.com/ads.txt.
  2. Se incluyen las siguientes líneas en example2.com/robots.txt:
    User-agent: Googlebot
    Disallow: /
  3. El rastreador de Google ignorará el archivo ads.txt.

Confirmar que el archivo devuelve un resultado con un código de estado HTTP 200 OK

Las solicitudes de archivos ads.txt pueden recibir el contenido del archivo en el cuerpo de la respuesta. Sin embargo, si el código de estado que aparece en el encabezado indica que no se ha encontrado el archivo (por ejemplo, código de estado 404) sucederá lo siguiente:

  • Se ignorará la respuesta.
  • El archivo se considerará inexistente.

Compruebe que el archivo tiene un código de estado HTTP 200 OK.

Verificar que no hay errores de formato ni caracteres no válidos en el archivo

Los errores de formato (como los caracteres de espacio en blanco no válidos) pueden ser difíciles de detectar, pero pueden provocar que los rastreadores tengan dificultades para analizar los archivos ads.txt y que, por tanto, los ignoren. Le recomendamos que utilice un editor de texto sin formato cuando copie y pegue entradas de ads.txt.

Permitir el acceso a un archivo ads.txt mediante HTTP y HTTPS

El rastreador de Google intenta rastrear todos los archivos ads.txt a través de HTTP y HTTPS. Sin embargo, si la respuesta es 404 o 40X, se eliminarán definitivamente las entradas anteriores, aunque el archivo ads.txt se haya rastreado mediante HTTP. Por tanto, si el rastreo mediante HTTPS devuelve un resultado 404 o 40X:

  • Se eliminará definitivamente la entrada rastreada anterior.
  • En Ad Manager se mostrará el estado "No se ha encontrado ningún archivo ads.txt".

Compruebe que se puede acceder al archivo ads.txt mediante HTTP y HTTPS.

Confirmar que el servidor o red CDN no está devolviendo una respuesta no válida al rastreador de Google

Cuando se ve en el navegador, es posible que parezca que un archivo ads.txt válido se ha devuelto. Sin embargo, si se devuelve un archivo ads.txt no válido cuando el user-agent indica que el rastreador es el robot de Google, puede ocurrir lo siguiente:

  • Google no detectará el archivo ads.txt.
  • Ad Manager indicará el estado "No se ha publicado ningún archivo ads.txt".

Para cambiar esta situación, pídale a su webmaster que ejecute los siguientes comandos de shell (sustituya midominio.com por su dominio):

  1. Para confirmar que se puede llegar al archivo ads.txt, ejecute esta opción:
    curl -iL http://midominio.com>/ads.txt

    El contenido del archivo ads.txt se debe devolver como se ve en el navegador al ir a midominio.com/ads.txt.
  2. Para confirmar que el rastreador de Google puede encontrar el archivo ads.txt, ejecute esta opción:
    curl -iL -A "'Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html).'"
    http://midominio.com/ads.txt

    Si se devuelve una respuesta non-ads.txt, significa que su servidor o la red de distribución de contenido (CDN) está devolviendo una respuesta no válida cuando el rastreador de Google intenta obtener su archivo ads.txt.

Tenga en cuenta que puede haber otras razones, además de que el user-agent del rastreador comprueba todas las mencionadas anteriormente, por las que su servidor no devuelve una respuesta válida al rastreador de Google. Colabore con su webmaster para investigar y solucionar estos problemas revisando los registros de su servidor en busca de rastreos fallidos de Google de midominio.com/ads.txt o de midominio.com/robots.txt.

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?