Le funzionalità in fase beta potrebbero non essere disponibili nella tua rete. Controlla le note di rilascio per sapere quando questa funzionalità sarà disponibile per tutti.
I file dei report Data Transfer forniscono dati non aggregati a livello di evento provenienti dalle campagne pubblicitarie. In sostanza, questi dati sono contenuti non elaborati provenienti dai log dell'ad server di Ad Manager, con un file separato generato per ciascun tipo di evento. I file Data Transfer contengono dati sugli eventi che sono accurati al secondo: puoi scegliere di includere altre informazioni nei file per vedere il dispositivo, l'area geografica e altre informazioni relative all'evento. I partner devono approvare le unità pubblicitarie in Ad Manager affinché vengano mostrate nei file Data Transfer.
Per iniziare
I file dei report Data Transfer hanno un costo aggiuntivo. Contatta il tuo account manager per attivare la funzionalità. Una volta attivata la funzionalità, puoi configurare i tipi di file Data Transfer. Google Ad Manager offre due opzioni per il trasferimento di dati: CSV e Parquet.
Se la tua organizzazione non è in grado di gestire le elaborazioni ETL (Extract, Transform and Load), supportare file di grandi dimensioni, manipolare file di testo, progettare e amministrare un datastore di medie dimensioni e progettare e implementare script, valuta la possibilità di collaborare con un partner di Google Marketing Platform approvato.
File dei report Data Transfer disponibili
Ogni file di Data Transfer contiene informazioni su diversi eventi. Puoi aggiungere campi a ciascun tipo di file per visualizzare informazioni contestuali relative a questi eventi.
Backfill
corrispondente, il file Network
non include le impressioni pubblicate da Ad Exchange o AdSense tramite allocazione dinamica. Per informazioni sulle impressioni con allocazione dinamica, utilizza il file Backfill
.Informazioni sui dati contenuti nei file Data Transfer
- Dati in ritardo
Ritardi di poche ore sono normali, ma a volte può capitare che l'elaborazione dei file Data Transfer richieda più tempo del solito. Se i dati sono in ritardo, vengono visualizzati nel file batch dell'ora successiva con un timestamp preciso. Questo può significare, ad esempio, che un file include principalmente timestamp che vanno dalle 08:00 alle 09:00, più alcuni timestamp precedenti in caso di ritardo nell'elaborazione. -
Ore senza attività
Qualora non dovesse verificarsi alcuna attività durante una determinata ora, viene pubblicato un file Data Transfer vuoto contenente solo dati di intestazione. - Limiti di data e giorno
In genere, il primo file orario di un determinato giorno include gli eventi da mezzanotte all'01:00 (Ora del Pacifico USA), ma i timestamp degli eventi vengono indicati nel fuso orario della rete del publisher. Se, ad esempio, per il publisher è impostato il fuso orario Ora orientale USA, nel primo file orario il publisher troverà gli eventi dalle 03:00 alle 04:00. Le tre ore precedenti vengono incluse nel file del giorno precedente. Pertanto, potresti avere timestamp di una data diversa da quella indicata dal nome del file. Fai sempre riferimento al timestamp indicato per gli eventi nel file, non all'orario di pubblicazione del file o al nome del file. - Report sulle creatività principali/companion in Data Transfer
I file Data Transfer mostrano le impressioni delle creatività sia companion sia principali, ma lo strumento Query Tool conteggia solo un'impressione pubblicata per il set creatività principale/companion (non un'impressione per ogni creatività), a meno che le informazioni siano suddivise per creatività principali/companion.
IsCompanion è "TRUE" per l'impressione della creatività companion. Il campo CreativeId contiene i singoli ID creatività per le creatività principali e companion, non l'ID del set creatività. Non è presente un campo aggiuntivo nel file Data Transfer per l'ID del set creatività per associare le impressioni companion a quelle della creatività principale. - Discrepanze con i report di Ad Manager
Il traffico non valido o i dati di spam vengono periodicamente rimossi dai report di Ad Manager o da quelli generati tramite l'API. A causa della pianificazione di pubblicazione dei file Data Transfer, queste operazioni di pulizia potrebbero, almeno in parte, non riflettersi nei file. Questo può comportare l'inclusione di un numero leggermente maggiore di impressioni, clic o altri eventi nei file Data Transfer. Quando si verificano queste discrepanze, la loro portata tende a essere dell'1% circa.Nei tuoi file Data Transfer
CodeServes
potrebbe essere presente un valore superiore rispetto alla metrica di conteggio pubblicazione del codice nei report di Ad Manager perché Data Transfer conteggia una pubblicazione del codice per ogni impressione pubblicata, mentre il report ne conteggia solo una per richiesta. Alcuni formati delle creatività, come gli annunci di testo di Google Ads, possono contenere più impressioni per una singola richiesta. Raggruppa i file Data Transfer in base ai valori del campoKeyPart
per trovare le impressioni uniche da confrontare.
Vantaggi e svantaggi dei formati di output CSV e Parquet
CSV (valori separati da virgole) | Parquet (spazio di archiviazione colonnare) | |
---|---|---|
Leggibilità e accessibilità | Estremamente leggibile; può essere facilmente aperto e modificato con editor di testo di base o software per fogli di lavoro. | Richiede strumenti specializzati per la visualizzazione e la modifica; non è facilmente accessibile agli utenti non tecnici. |
Universalità e compatibilità | Ampiamente supportato da quasi tutti gli strumenti di analisi ed elaborazione dei dati. | Potrebbe essere necessari software o librerie aggiuntive per la piena compatibilità, in particolare nei sistemi meno recenti. |
Semplicità e facilità d'uso | Struttura semplice, facile da comprendere e da utilizzare, in particolare per set di dati più piccoli o analisi ad hoc rapide. | Può essere più complesso da implementare inizialmente, in particolare per gli utenti che non hanno dimestichezza con lo spazio di archiviazione colonnare. |
Prestazioni ed efficienza | Può essere più lento per set di dati di grandi dimensioni a causa dell'archiviazione basata su righe e della mancanza di compressione. | Offre prestazioni superiori per l'elaborazione e l'analisi dei dati su larga scala grazie allo spazio di archiviazione colonnare e a tecniche di compressione efficienti. |
Efficienza di archiviazione | Meno efficiente in termini di spazio di archiviazione a causa della mancanza di compressione integrata e del potenziale di archiviazione di dati ridondanti. | Altamente efficiente in termini di spazio di archiviazione grazie all'archiviazione in colonne e agli algoritmi di compressione avanzati, riducendo i costi di archiviazione. I file Parquet possono essere inferiori del 50-75% rispetto ai file CSV, in particolare per i set di dati di grandi dimensioni. |
Se hai già attivato Data Transfer in CSV, contatta il tuo account manager per ottenere l'accesso a Parquet.
Scaricare un file di esempio
Puoi scaricare questi file di esempio in formato CSV o Parquet per visualizzare l'anteprima dei dati e dei campi contenuti in ciascuno dei file dei report Data Transfer.
Tipo di evento | Nome e tipo di file | Informazioni riportate | File di esempio |
---|---|---|---|
Offerte a cui è possibile partecipare | NetworkBackfillBidsJoinable |
Informazioni sulle offerte. Questo file può essere unito ad altri file Data Transfer. 1 file all'ora. |
|
CodeServe | NetworkCodeServes |
Registra ogni risposta da Ad Manager, che sia scaricata o meno. 2 file all'ora. Nota: i file Request e CodeServe sono inclusi nel file Impression senza costi aggiuntivi. |
|
Impression | NetworkImpressions |
Informazioni sulle impressioni scaricate. 2 file all'ora. |
|
Request | NetworkRequests |
Registra ogni richiesta di annuncio ricevuta da Ad Manager, che sia evasa o meno. 2 file all'ora. Nota: i file Request e CodeServe sono inclusi nel file Impression senza costi aggiuntivi. |
|
Visualizzazione attiva | NetworkActiveViews |
Informazioni sulle impressioni idonee di Visualizzazione attiva basate su Ad Manager. 2 file all'ora. |
|
Offerte | NetworkBackfillBids (beta) |
Informazioni sulle offerte per le aste di Authorized Buyers e Open Bidding. 1 file all'ora. |
|
Clic | NetworkClicks |
Informazioni sui clic. 2 file all'ora. |
|
Offerta minima per vincere | NetworkMinimumBidToWin (beta) |
Indica l'offerta minima necessaria agli acquirenti per aggiudicarsi l'asta quando compete almeno un elemento pubblicitario residuo. 1 file all'ora. |
|
Conversione Rich Media | NetworkRichMediaConversions |
Informazioni sugli eventi di Studio, incluse azioni standard e personalizzate (come riproduzione e pausa), durata dell'azione e altro ancora. 2 file all'ora. |
|
Conversione video | NetworkVideoConversions |
Informazioni su eventi specifici del video, incluse azioni (come riproduzione e pausa), ID contenuti, posizionamento dei pod e altro ancora. Vedi tutti gli eventi video. 2 file all'ora. |
|
Come vengono pubblicati i file
I file Data Transfer vengono trasferiti nei bucket Cloud Storage di Ad Manager con frequenza oraria. Consigliamo di eseguire il polling a intervalli regolari per controllare gli aggiornamenti. La maggior parte dei dati viene pubblicata e resa disponibile tra 5 e 15 ore dopo l'ora di registrazione, anche se alcuni eventi in ritardo possono richiedere fino a 8 giorni dopo l'evento. Ad Manager non comunica informazioni sul trasferimento di dati ai server di terze parti.
I nomi dei file includono l'ora di inizio degli eventi nel fuso orario Ora del Pacifico USA (che osserva l'ora legale), ma i timestamp presenti in quel file vengono sempre assegnati in base al fuso orario della rete Ad Manager (che potrebbe non osservare l'ora legale). Questo può causare file vuoti, mancanti o contenenti dati relativi a un periodo più lungo di un'ora, a seconda dell'interazione tra le impostazioni dei fusi orari.
Nomi dei file
I nomi dei file Data Transfer seguono una convenzione prevedibile:
- CSV:
[Type]_[Network ID]_[YYYYMMDD]_[HH].gz
- Parquet:
[Type][Network ID][YYYYMMDD]_[HH]-[Partition Index]-of-[Total Number of Partitions].parquet
AAAAMMGG
indica l'anno, il mese e il giorno.HH
indica l'ora di inizio nel formato 24 ore.L'ora (01, 02, 03) specificata in ogni nome di file è espressa nel fuso orario Ora del Pacifico USA, ma i publisher ricevono dati nel fuso orario specifico della propria rete dai timestamp contenuti nei file Data Transfer. Tieni presente questa differenza quando calcoli la pubblicazione dei file.
[Partition Index]
indica la partizione del file in relazione al numero totale di file (partizioni) creati, a partire da zero[Total Number of Partitions]
è il numero di file (partizioni) utilizzati per creare il file
File Data Transfer nella procedura di richiesta degli annunci
Esamina l'immagine che segue per comprendere i tipi di file Data Transfer associati alle varie fasi della procedura di richiesta degli annunci.
Utilizzare i file dei report Data Transfer
Dopo che hai configurato Data Transfer, i file vengono conservati nei bucket Cloud Storage di Ad Manager. Puoi accedere ai bucket dal Web, con uno strumento a riga di comando o tramite un'API. Scopri di più su come accedere ai bucket Cloud Storage di Ad Manager
Se limiti l'importazione e l'analisi dei dati a un set specifico di file Data Transfer in base all'ora di inizio nel nome del file, potresti trascurare i dati forniti in un file successivo a causa dell'ora legale, di un ritardo nella raccolta dei dati o di altri scenari simili. Un approccio migliore consiste nel leggere tutti i file Data Transfer in un sistema separato (come un data warehouse o motore di query) e limitare la tua analisi in base al timestamp degli eventi.
I file Data Transfer sono disponibili in due formati: file CSV o Parquet.
Gli utenti possono selezionare CSV, Parquet o entrambi gli output per ogni file. Parquet è il formato ottimale per i casi d'uso e l'importazione dei data warehouse, mentre i file CSV possono essere utilizzati in un editor di fogli di lavoro a seconda delle dimensioni del file. I seguenti sono alcuni esempi di metodi comuni che permettono di applicare le informazioni di Data Transfer:
- Aggregazione dimensionale, eseguita dall'utente, di eventi e attività (ad esempio, per creatività)
- Calcolo di conversioni uniche su più giorni
- Individuazione di corrispondenze tra gli utenti e il contenuto di un database di clienti
- Creazione di report sulle informazioni geografiche e demografiche degli utenti
Puoi utilizzare le tabelle delle corrispondenze per fornire un sistema di ricerca nome-ID per i valori contenuti nei file Data Transfer, in modo da ottenere una corrispondenza tra le informazioni sulla pubblicazione di annunci (ad esempio, unità pubblicitaria o elemento pubblicitario) e i valori precedentemente assegnati memorizzati nel database.
Archiviare i file localmente
Secondo un'efficace regola empirica, ogni evento utilizza 25-35 byte in un file compresso. Pertanto, 10 milioni di impressioni occuperebbero circa 300 MB di spazio su disco in un file CSV compresso. Con il formato di output Parquet puoi aspettarti dimensioni dei file più piccole. Ricorda che si tratta solo di stime e che pertanto le dimensioni reali del tuo file potrebbero essere superiori. Inoltre, trattandosi di dimensioni di dati in formato compresso, avrai bisogno di spazio aggiuntivo per decomprimere e utilizzare i file in questione.
I file Data Transfer più vecchi di 60 giorni vengono eliminati definitivamente da Ad Manager. Se vuoi archiviare i tuoi file per un periodo più lungo dei normali 60 giorni, ti consigliamo di archiviarli a livello locale o di spostarli su una soluzione di spazio di archiviazione sul cloud permanente, ad esempio un account Google Cloud Storage indipendente per il quale disponi di controllo completo.
Informazioni su BigQuery Data Transfer Service
Semplificare l'elaborazione di file Data Transfer di grandi dimensioni
Google Code ha rilasciato CRUSH (Custom Reporting Utilities for Shell), un toolkit open source che consente di elaborare dati testuali delimitati tramite riga di comando o negli script shell. Gli strumenti CRUSH sono stati sviluppati e testati in modo approfondito e funzionano in modo ottimale nei sistemi operativi Linux o Unix. Il supporto per CRUSH è disponibile attraverso la community open source.
Un'alternativa non open source è DMX, un software di integrazione dati sviluppato da Syncsort.