Es posible que las funciones en fase beta no estén disponibles en su red. Para saber cuándo tendrá disponibilidad general, consulte las notas de la versión.
Los archivos de los informes de Data Transfer ofrecen datos no agregados y a nivel de evento de sus campañas publicitarias. Estos datos son, básicamente, contenido sin procesar de los registros del servidor de anuncios de Ad Manager e incluyen un archivo independiente para cada tipo de evento. Los archivos de Data Transfer contienen datos de eventos con una precisión al segundo. Puede optar por incluir otro tipo de información en los archivos para ver datos sobre el dispositivo, la ubicación geográfica o cualquier otro detalle relacionado con el evento. Los partners tienen que aprobar bloques de anuncios de Ad Manager para que aparezcan en sus archivos de Data Transfer.
Primeros pasos
Los archivos de los informes de Data Transfer tienen un coste adicional. Póngase en contacto con su gestor de cuentas para habilitar la función. Una vez habilitada la función, puede configurar los tipos de archivo de Data Transfer. Google Ad Manager ofrece dos opciones para transferir datos: CSV y Parquet.
Le recomendamos que colabore con un partner aprobado de Google Marketing Platform si su organización no tiene capacidad para gestionar el proceso de extracción, transformación y carga (ETL), admitir archivos de gran tamaño, manipular archivos de texto, diseñar y administrar un almacén de datos mediano, ni para diseñar e implementar secuencias de comandos.
Archivos de informes de Data Transfer disponibles
Cada archivo de Data Transfer contiene información sobre diferentes eventos. Puede añadir campos a cada tipo de archivo para ver información contextual sobre esos eventos.
Backfill
correspondiente, el archivo Network
no incluirá las impresiones servidas desde Ad Exchange o AdSense mediante la asignación dinámica. Use el archivoBackfill
para obtener información sobre las impresiones asignadas de forma dinámica.Acerca de los datos contenidos en los archivos de Data Transfer
- Datos retrasados
Los retrasos de unas pocas horas son normales, pero a veces el procesamiento de los archivos de Data Transfer tarda más de lo habitual. Si los datos llegan tarde, aparecerán en el archivo por lotes de la siguiente hora con una marca de tiempo exacta. Esto podría significar, por ejemplo, que en un archivo haya principalmente marcas de tiempo entre las 8:00 y las 9:00 con una dispersión de las marcas de tiempo anteriores si el tratamiento se retrasó. -
Horas sin actividad
Si no hay actividad en una hora determinada, se envía un archivo de Data Transfer vacío en el que solo constan los datos del encabezado. - Límites de fecha y hora
El primer archivo por horas de un día determinado suele incluir eventos registrados desde la medianoche hasta la 01:00 (UTC-8), pero las marcas de tiempo de los eventos figuran en las zonas horarias de la red del editor. Por ejemplo, si el editor tiene configurada la zona horaria EST (UTC-5), verá los eventos registrados de 3:00 a 4:00 en el primer archivo por horas. Las tres horas anteriores aparecerían en el archivo del día anterior. Por tanto, puede tener marcas de tiempo de una fecha diferente a la representada en el nombre de archivo. Tome siempre como referencia las marcas de tiempo de los eventos del archivo, no la hora en que se publicó el archivo ni su nombre. - Informes maestros/complementarios en Data Transfer
Los archivos de Data Transfer muestran impresiones tanto de las creatividades maestras como de las complementarias. Sin embargo, la Herramienta de consulta solo cuenta una impresión servida por el conjunto de creatividades maestras/complementarias (no una impresión por cada creatividad) a menos que la información se desglose por maestra/complementaria.
IsCompanion tiene el valor "TRUE" (verdadero) en la impresión de la creatividad complementaria. El campo CreativeId contiene los IDs de creatividad de cada creatividad maestra y complementaria, no el ID del conjunto de creatividades. No hay ningún otro campo en Data Transfer que indique el ID del conjunto de creatividades para asociar impresiones complementarias con maestras. - Discrepancias con los informes de Ad Manager
El tráfico no válido (datos de spam) se retira periódicamente de los informes de Ad Manager o de los informes generados con la API. Debido a la programación de la publicación de archivos de Data Transfer, es posible que no se lleve a cabo la limpieza al completo. Como consecuencia, Data Transfer mostrará un número ligeramente superior de impresiones, clics u otros eventos. Si se producen discrepancias, normalmente rondan el 1 %.Los archivos de Data Transfer de
CodeServes
pueden mostrar un valor superior al de la métrica "Total de códigos servidos" de los informes de Ad Manager, ya que Data Transfer cuenta un código servido por cada impresión servida, mientras que en los informes solo se cuenta un código servido por solicitud. Algunos formatos de creatividad, como los anuncios de texto de Google Ads, pueden contener varias impresiones para una sola solicitud. Agrupe sus archivos de Data Transfer según los valores del campoKeyPart
para encontrar las impresiones únicas y poder compararlas.
Ventajas y desventajas de los formatos de salida CSV y Parquet
CSV (valores separados por comas) | Parquet (almacenamiento en columnas) | |
---|---|---|
Legibilidad y accesibilidad | Fácilmente legible para los humanos; se puede abrir y editar fácilmente con editores de texto básicos o software de hojas de cálculo. | Requiere herramientas especializadas para verlos y editarlos, por lo que no es tan fácil de utilizar para los usuarios que no tienen conocimientos técnicos. |
Universalidad y compatibilidad | Es compatible con prácticamente todas las herramientas de análisis y procesamiento de datos. | Puede que se necesiten bibliotecas o softwares adicionales para que sea totalmente compatible, especialmente en sistemas antiguos. |
Simplicidad y facilidad de uso | Estructura sencilla, fácil de entender y de usar, especialmente con conjuntos de datos pequeños o análisis rápidos y específicos. | Puede ser más complejo de implementar inicialmente, sobre todo para los usuarios que no estén familiarizados con el almacenamiento en columnas. |
Rendimiento y eficiencia | Puede ser más lento con conjuntos de datos grandes debido al almacenamiento basado en filas y a la falta de compresión. | Ofrece un rendimiento superior para el procesamiento y el análisis de datos a gran escala gracias al almacenamiento en columnas y a las técnicas de compresión eficientes. |
Eficiencia del almacenamiento | Menos eficiente en cuanto al almacenamiento, ya que no incluye compresión y puede almacenar datos redundantes. | Alta eficiencia de almacenamiento gracias al almacenamiento en columnas y a algoritmos de compresión avanzados, lo que reduce los costes de almacenamiento. Parquet puede ser un 50-75 % más pequeño que los archivos CSV, especialmente en el caso de los conjuntos de datos grandes. |
Si ya tiene Data Transfer habilitado en CSV, póngase en contacto con su gestor de cuentas para obtener acceso a Parquet.
Descargar un archivo de muestra
Puede descargar estos archivos de muestra en formato CSV o Parquet para previsualizar los datos y los campos que contiene cada uno de sus archivos del informe de Data Transfer.
Tipo de evento | Nombre y tipo de archivo | Contenido | Archivos de ejemplo |
---|---|---|---|
Pujas combinables | NetworkBackfillBidsJoinable |
Información sobre las pujas. Se puede unir con otros archivos de Data Transfer. 1 archivo por hora. |
|
CodeServe | NetworkCodeServes |
Registra cada respuesta de Ad Manager, ya sea descargada o sin descargar. 2 archivos por hora. Nota: Los archivos Request y CodeServe están incluidos con el archivo Impression sin coste adicional. |
|
Impresión | NetworkImpressions |
Da información sobre impresiones descargadas. 2 archivos por hora. |
|
Solicitud | NetworkRequests |
Registra cada solicitud de anuncio que recibe Ad Manager, ya sea completada o sin completar. 2 archivos por hora. Nota: Los archivos Request y CodeServe están incluidos con el archivo Impression sin coste adicional. |
|
Active View | NetworkActiveViews |
Da información sobre impresiones basadas en Ad Manager aptas para Active View. 2 archivos por hora. |
|
Pujas | NetworkBackfillBids (Beta) |
Da información sobre pujas de subastas de Authorized Buyers y Puja Abierta. 1 archivo por hora. |
|
Clic | NetworkClicks |
Da información sobre clics. 2 archivos por hora. |
|
Puja mínima para ganar | NetworkMinimumBidToWin (Beta) |
Registra los compradores de puja mínima necesarios para ganar la subasta cuando compite al menos una línea de pedido remanente. 1 archivo por hora. |
|
Conversión de Rich Media | NetworkRichMediaConversions |
Da información sobre eventos de Studio, como acciones estándar y personalizadas (por ejemplo, reproducir y pausar) o duraciones de las acciones, entre otros. 2 archivos por hora. |
|
Conversión de vídeo | NetworkVideoConversions |
Da información sobre eventos específicos de vídeos, incluidas las acciones (por ejemplo, reproducir y pausar), los IDs de contenido y el posicionamiento de pods de anuncios, entre otros. Ver todos los eventos de vídeo 2 archivos por hora. |
|
Cómo se entregan los archivos
Los archivos de Data Transfer se envían cada hora a los grupos de almacenamiento en la nube de Ad Manager. Se recomienda consultarlos de forma periódica para comprobar si hay cambios. La mayor parte de los datos se envían y están disponibles entre 5 y 15 horas después de la hora de registro, aunque es posible que en algunos casos se tarde hasta 8 días en publicar los datos de eventos retrasados. Ad Manager no muestra información de Data Transfer a servidores externos.
Los nombres de los archivos incluyen la hora de inicio de los eventos en la zona horaria del Pacífico estadounidense (teniendo en cuenta el horario de verano), pero las marcas de tiempo presentes en cada archivo siempre aparecen indicadas en la zona horaria de la red de Ad Manager, que es posible que no se acoja al horario de verano. Esta situación puede hacer que se generen archivos vacíos o que falten archivos, o bien que algunos archivos contengan datos correspondientes a más de una hora, en función de cómo se haya configurado la interacción entre esas zonas horarias.
Nombres de archivo
Los nombres de los archivos de Data Transfer siguen una nomenclatura predecible:
- CSV:
[Tipo]_[ID de red]_[AAAAMMDD]_[HH].gz
- Parquet:
[Tipo][ID de red][AAAAMMDD]_[HH]-[Índice de partición]-of-[Número total de particiones].parquet
AAAAMMDD
corresponde a la fecha (año, mes y día).HH
es la hora de inicio, expresada en formato de 24 horas.El número de hora (01, 02, 03) especificado en cada nombre de archivo indica la hora en la zona horaria del Pacífico, pero los editores pueden ver los datos concretos en la zona horaria de su red con las marcas de tiempo incluidas en los archivos de Data Transfer. Tenga en cuenta esta diferencia a la hora de calcular la entrega de los archivos.
[Índice de partición]
indica en qué partición se encuentra el archivo en relación con el número total de archivos (particiones) creados, empezando por cero[Número total de particiones]
es el número de archivos (particiones) que se han usado para crear el archivo
Archivos de Data Transfer en el proceso de solicitud de anuncios
Revise el siguiente gráfico para comprender los tipos de archivo de Data Transfer asociados a diversas etapas del proceso de solicitud de anuncios.
Utilizar archivos de informes de Data Transfer
Una vez que se haya configurado Data Transfer, los archivos se guardan en los grupos de almacenamiento en la nube de Ad Manager. Se puede acceder a ellos desde Internet, con una herramienta de línea de comandos, o bien a través de una API. Más información sobre cómo acceder a grupos de almacenamiento en la nube de Ad Manager
Si limita la ingestión y el análisis de datos a un conjunto concreto de archivos de Data Transfer según la hora de inicio que aparezca en el nombre del archivo, puede que pase por alto los datos que se dan en un archivo posterior debido al horario de verano, al retraso en la recogida de datos o a otras situaciones similares. Es recomendable leer todos los archivos de Data Transfer en otro sistema, como un almacén de datos o un motor de consultas, y restringir el análisis en función de la marca de tiempo de los eventos.
Los archivos de Data Transfer están disponibles en dos formatos: CSV o Parquet.
Los usuarios pueden elegir CSV, Parquet o ambas opciones de salida para cada archivo. Parquet es el formato óptimo para los casos prácticos y la ingestión de datos de los almacenes de datos, mientras que los archivos CSV se pueden utilizar en un editor de hojas de cálculo, en función del tamaño del archivo. A continuación se indican algunos ejemplos de usos habituales de la información de Data Transfer:
- Acumulación de eventos y actividades de usuario por dimensión (por ejemplo, por creatividad)
- Cálculo de conversiones únicas a lo largo de varios días
- Correspondencia de usuarios con una base de datos de clientes
- Registro de datos geográficos y demográficos de los usuarios
Puede usar tablas de coincidencias para hacer búsquedas de correspondencias entre ID y nombres de los valores contenidos en archivos de Data Transfer, lo que le permite hacer la correspondencia entre la información del servicio de anuncios (como un bloque de anuncios o una línea de pedido) y los valores asignados previamente y almacenados en la base de datos.
Almacenar archivos de forma local
Como regla general, cada evento utiliza entre 25 y 35 bytes en un archivo comprimido. En consecuencia, 10 millones de impresiones requerirían unos 300 MB de espacio en disco en un archivo CSV comprimido. Los archivos resultantes del formato de salida Parquet tendrán un tamaño menor. Tenga en cuenta que esto es solo un cálculo aproximado y que el tamaño de su archivo podría ser mayor. Además, debido a que este es el tamaño de los datos en formato comprimido, se necesita espacio adicional para descomprimir los archivos y poder usarlos.
Los archivos de Data Transfer que tengan más de 60 días de antigüedad se eliminarán definitivamente de Ad Manager. Si quiere almacenar sus archivos durante más tiempo, le recomendamos que almacene los archivos de forma local o los traslade a una herramienta de almacenamiento en la nube, como una cuenta independiente de Google Cloud Storage en la que pueda tener todo el control.
Más información sobre BigQuery Data Transfer Service
Facilitar el procesamiento de archivos de Data Transfer de gran tamaño
Google Code ha lanzado CRUSH (Custom Reporting Utilities for Shell), un kit de herramientas de software libre para tratar datos de texto delimitado de la línea de comandos o de scripts de shell. Las herramientas CRUSH se han sometido a un exhaustivo proceso de desarrollo y pruebas y funcionan mejor en los sistemas operativos Linux o Unix. La asistencia para CRUSH está disponible en la comunidad de software libre.
Hay una alternativa que no es de software libre llamada DMX, un software de integración de datos desarrollado por Syncsort.