Norme per i contenuti

Filtraggio dei contenuti

Il filtraggio dei contenuti è un sistema automatico realizzato per elaborare grandi volumi di dati ed eseguire azioni su qualunque contenuto che risponda a determinati criteri. Spesso i publisher utilizzano soluzioni di filtraggio di testi e supporti multimediali per gestire la maggior parte dei contenuti generati dagli utenti sul propri siti web. Questi sistemi vengono utilizzati frequentemente per filtrare contenuti relativi alla pubblicazione di file illegali o per adulti o alla vendita di armi da fuoco, sostanze stupefacenti, alcolici e tabacco.

N.B. I contenuti non conformi non devono essere necessariamente ospitati localmente. È considerata una violazione anche il collegamento a sorgenti esterne che li ospitano. Ad esempio, un publisher che offre l'accesso a film ospitati illegalmente su siti di terze parti vìola le norme del programma AdSense.

Sviluppo di una soluzione in proprio

Molti publisher scelgono di sviluppare sistemi di filtraggio propri beneficiando dei seguenti vantaggi:

  • I filtri basati su testo sono relativamente semplici da codificare.
  • Spesso sono soluzioni notevolmente più economiche rispetto alle soluzioni commerciali.
  • Il publisher è il miglior conoscitore del suo sito web e dei suoi utenti, conseguentemente è in grado di prevedere i possibili problemi di conformità alle norme meglio di chiunque altro.
Di seguito abbiamo riportato alcune idee e suggerimenti da tenere presente quando si sviluppa in proprio una soluzione basata sul testo.

Creazione di un elenco di parole chiave
Per filtrare il testo, il sistema deve basarsi su un elenco di parole chiave costituite da singoli termini e combinazioni di termini. Questo elenco può essere creato in vari modi, in funzione del tipo di contenuti, della quantità di testo presente sul sito e delle risorse disponibili del publisher:
  • Crea il tuo elenco di parole chiave e frasi da filtrare. Puoi basarti sulla tua intuizione oppure utilizzare alcune risorse di supporto:
    • Richiedi suggerimenti al personale aziendale
    • Richiedi suggerimenti agli utenti
    • Utilizza lo Strumento per le parole chiave di Google Ads
    • Per farti venire altre idee, consulta i siti web che includono contenuti indesiderati (ad esempio siti per adulti e di condivisione di file) e individua le parole chiave che utilizzano più frequentemente.
  • Codifica il tuo strumento per la rilevazione automatica delle parole chiave:
    • Utilizza i dati del motore di ricerca per analizzare tutte le pagine del sito web
    • Crea un elenco di termini e combinazioni di termini univoci che contiene
    • Conserva le parole chiave più utilizzate e scarta le altre. Non dimenticare di eliminare articoli e parole comuni come "un", "e" o "il".
    • Salva l'elenco in un file di testo
    • Ripeti le suddette operazioni su tutti i siti che ritieni utili finché non sei soddisfatto dell'elenco ottenuto. Questo è tutto.
    • N.B. L'analisi di altri siti e l'uso dei relativi contenuti come se fossero propri sono vietati dalle norme di AdSense e dalle Istruzioni per i webmaster di Google, inoltre possono essere attività illegali e/o considerate amorali.
Definizione di "pesi"

Le parole non sono tutte uguali e alcune parole chiave sono meno efficaci di altre. Pertanto, è utile assegnare a ciascuna di esse il suo "peso".

Ad esempio, i filtri dei contenuti per adulti in italiano assegnerebbero un peso maggiore alla parola "pornografia" rispetto alla parola "sesso". Infatti, il termine "pornografia" è quasi sempre correlato a contenuti non adatti ai minori, mentre il termine "sesso" può anche significare "genere", in base al contesto in cui viene utilizzato.

Inoltre, prendi in considerazione i termini che singolarmente hanno un valore neutro, ma che, associati ad altri termini, potrebbero avere un significato completamente diverso. Ad esempio, il termine "fotografie" di per sé ha un valore neutro, mentre il termine "fotografie di adolescenti" fa spesso riferimento a contenuti pornografici.

Il processo di filtraggio
Il filtraggio dei contenuti viene generalmente eseguito con due metodi che i publisher possono scegliere in base alle caratteristiche del proprio sito web.

Metodo 1 - Analisi dei contenuti generati dagli utenti dopo la pubblicazione su una pagina:

  1. Analizza i contenuti.
  2. Indica se rispettano i criteri di filtraggio.
  3. Disattiva la pubblicazione degli annunci sulla pagina che li include.
  4. Esamina manualmente i contenuti:
    1. Se sono conformi, ripristina la pubblicazione degli annunci e modifica i filtri.
    2. Se non sono conformi, assicurati che non vengano visualizzati sulle pagine che includono il codice degli annunci.

Metodo 2 - Analisi dei contenuti generati dagli utenti prima della pubblicazione:

  1. Analizza i contenuti.
  2. Indica se rispettano i criteri di filtraggio.
  3. Pianificane la verifica oppure rifiutane direttamente la pubblicazione.
  4. Esamina manualmente i contenuti:
    1. Se sono conformi, includili nelle pagine in cui vengono pubblicati gli annunci e modifica i filtri.
    2. Se non sono conformi, disattiva la pubblicazione degli annunci e decidi se pubblicarli o meno.

Descrizione sintetica delle soluzioni commerciali

Sono disponibili numerosi servizi di filtraggio dei contenuti e persino alcuni specializzati nel filtraggio di contenuti specifici, come i contenuti per adulti o coperti da copyright. Esistono anche piattaforme di crowdsourcing che creano un ponte tra publisher e utenti che desiderano ottenere facili guadagni sul Web. In questa situazione è consigliabile eseguire alcune ricerche di mercato sull'argomento in questione e individuare la migliore soluzione per il servizio offerto. Accedi ai siti che recensiscono software e verifica quali tipi di sistemi di filtraggio dei contenuti generati dagli utenti consigliano. Una volta raccolte tutte queste informazioni, potrai scegliere la soluzione migliore per le tue esigenze in base alla valutazione del prodotto, alle sue caratteristiche distintive e al suo modello di determinazione del prezzo.

Hai trovato utile questo articolo?
Come possiamo migliorare l'articolo?