Innholdsfiltrering refererer til et automatisk system som brukes for å behandle store mengder data og iverksette tiltak overfor alt innhold som oppfyller visse kriterier. Publisister bruker ofte tekst- og mediefiltreringsløsninger for å håndtere det meste av brukergenerert innhold på nettstedet sitt. Disse systemene benyttes ofte for å filtrere for eksempel seksuelt innhold og ulovlig fildeling samt salg av skytevåpen, rusmidler, alkohol og tobakk.
Viktig: Innholdet som bryter retningslinjene, trenger ikke å ha en lokal vert. Selv tilknytting til eksterne kilder som er vert for det aktuelle innholdet, regnes som brudd på retningslinjene. Eksempelvis utgjør det brudd på Googles retningslinjer for publisister når publisister integrerer filmer tredjepartsnettsteder er vert for, uten tillatelse til å dele innholdet.
Utvikling av egne løsninger
Mange publisister velger å utvikle egne filtreringssystemer. Denne avgjørelsen kan ha følgende fordeler:
- Tekstbasert filtrering kan være relativt enkelt å kode.
- Det er ofte betydelig billigere enn kommersielle løsninger.
- Publisisten er den som kjenner nettstedet og brukerne best, og kan forutse utfordringer knyttet til retningslinjene bedre enn noen andre.
Lag en søkeordliste
- Lag din egen liste over ord og uttrykk du ønsker å filtrere. Du kan bruke din egen intuisjon eller få litt hjelp:
- Spør ansatte om å bidra.
- Be brukerne dine om hjelp.
- Bruk søkeordverktøyet i Google Ads.
- Hvis du trenger mer inspirasjon, kan du ta en titt på nettsteder som er vert for uønsket innhold (f.eks. nettsteder med seksuelt innhold og ulovlig fildeling), og finne ut hvilke søkeord som ofte dukker opp på disse.
- Utvikle ditt eget verktøy for automatisk uthenting (skraping) av søkeord:
- Bruk søkemotordata for å gå gjennom alle sidene på et nettsted.
- Hent en liste over unike ord og ordkombinasjoner fra nettstedet.
- Ta vare på de mest brukte søkeordene og kvitt deg med resten. Ikke glem å eliminere vanlige bestemmelsesord og ord som «og» eller «det».
- Lagre utdataene som en tekstfil.
- Gjenta fremgangsmåten ovenfor for flere nettsteder, helt til du er fornøyd med listen.
- Viktig: Uthenting av søkeord fra andre nettsteder og bruk av andres innhold som ditt eget, er i strid med Googles retningslinjer for publisister og retningslinjene for nettsøppel for Google Nettsøk. Det kan også være både uetisk og ulovlig.
Alle ord har ikke samme verdi, og noen søkeord er mindre effektive enn andre. Du bør derfor vurdere å tildele forskjellig vekting til ulike termer.
Eksempel: Filtre for seksuelt innhold bør ha høyere vekting for ordet «porno» enn ordet «sex». Mens «porno» nesten utelukkende er knyttet til innhold som ikke er barnesikkert, kan «sex» også være knyttet til seksualopplysning.
Du bør også vurdere ord som er trygge på egenhånd, men som kan bety noe helt annet når de kombineres med andre ord. Ordet «bilder» er for eksempel uskyldig nok i seg selv, men hvis det kombineres til «pornobilder», blir saken en annen.
Metode 1: brukergenerert innhold skannes etter at det vises på en side:
- Skann innholdet.
- Rapporter innholdet hvis det oppfyller filtreringskriteriene.
- Deaktiver annonsevisning på siden som er vert for det aktuelle innholdet.
- Gå gjennom innholdet manuelt.
- Hvis det er trygt, kan du aktivere annonsevisning og justere filtrene.
- Hvis det ikke er det, må du sørge for at innholdet ikke vises på sider som inneholder annonsekode.
Metode 2: brukergenerert innhold skannes før det blir tilgjengelig for brukere:
- Skann innholdet.
- Rapporter innholdet hvis det oppfyller filtreringskriteriene.
- Sett det i kø for gjennomgang eller avslå det umiddelbart.
- Gå gjennom innholdet manuelt.
- Hvis det er trygt, kan du vise innholdet på sider med annonsevisning og justere filtrene.
- Hvis det ikke er det, deaktiverer du annonselevering og viser eller avslår innholdet.
Selve essensen av kommersielle løsninger
Det finnes en rekke tjenester for filtrering av innhold, til og med noen som er spesialutviklet for filtrering av bestemte typer innhold, for eksempel seksuelt eller opphavsrettsbeskyttet innhold. Det finnes også dugnadsplattformer (crowdsourcing) som fungerer som en bro mellom publisister og brukere som ønsker å tjene penger på nettet på en enkel måte. Den beste måten å tilnærme seg dette på er å foreta markedsundersøkelser om temaet og finne ut hva som er den beste løsningen for tjenesten du leverer. Prøv å se etter nettsteder som anmelder programvare, og se hvilke systemer for filtrering av brukergenerert innhold som anbefales. Når du har innhentet all denne informasjonen, bør du avgjøre hva som er den beste løsningen for deg, på bakgrunn av produktets vurdering, unike egenskaper så vel som prismodell.