Indholdsfiltrering henviser til et automatisk system, der er sat op til at behandle store mængder af data og gribe ind overfor indhold, der opfylder visse kriterier. Udgivere bruger ofte tekst- og mediefiltreringsløsninger til at håndtere hovedparten af brugergenereret indhold på deres website. Disse systemer er ofte sat op til at filtrere indhold såsom seksuel og ulovlig fildeling samt salg af skydevåben, narkotika, alkohol og tobak.
Udvikling af en intern løsning
Mange udgivere vælger at udvikle deres eget filtreringssystem. Denne beslutning kan have følgende fordele:
- Tekstbaseret filtrering kan være relativt let at kode
- Det er ofte væsentligt billigere end kommercielle løsninger
- Udgiveren er den, der bedst kender websitet og brugerne, og kan derfor bedre end nogen anden forudse politikproblemer
Oprettelse af en liste med søgeord
- Sammensæt din egen liste med ord og sætninger, du vil filtrere. Du kan bruge din intuition eller få lidt hjælp til det:
- Bed dine medarbejdere om at bidrage
- Bed brugerne om hjælp
- Brug Søgeordsplanlægning i Google Ads
- Få yderligere inspiration ved at se på websites, der hoster uønsket indhold (websites med voksenindhold eller fildeling f.eks.), og find ud af, hvilke søgeord der ofte dukker op der.
- Kod dit eget automatiske værktøj til scraping af søgeord:
- Brug søgemaskinedata til at gennemgå alle sider på et website
- Skaf en liste med unikke ord og kombinationer af ord
- Behold de mest anvendte søgeord, og kassér resten. Husk at eliminere almindelige ord som "en", "og" eller "den"
- Output som en tekstfil
- Gentag ovenstående med så mange websites, du vil, indtil du er tilfreds med listen, og så er du færdig.
- Vigtigt!: Kopiering af andre websites og brug af indholdet som dit eget er imod politikkerne for Google-udgivere og politikkerne for spam i forbindelse med Google Websøgning. Det kan også være ulovligt og/eller uetisk.
Alle ord er ikke ens, og nogle søgeord er værre end andre. Du kan derfor overveje at vægte forskellige udtryk forskelligt.
F.eks. kunne seksuelle filtre for dansk vægte ordet "porno" tungere end "patter". Mens "porno" næsten altid er relateret til indhold, som ikke er familievenligt, kan "patter" forekomme i flere forskellige sammenhænge.
Tænk også på ord, der i sig selv er sikre, men i kombination med et andet ord måske får en helt anden betydning. Ordet "billeder" er f.eks. ganske uskyldigt, men i kombinationen "billeder af teen" henvises der ofte til pornografi.
Metode 1 – Brugergenereret indhold scannes, efter at det vises på en side:
- Scan indholdet
- Anmeld, hvis det opfylder filtreringskriterier
- Deaktiver annoncevisning på den side, der hoster det pågældende indhold
- Gennemgå indholdet manuelt:
- Hvis det er sikkert, kan du aktivere annoncevisning og justere filtre
- Hvis det ikke er tilfældet, skal du sikre dig, at indholdet ikke vises på sider, der indeholder annoncekode.
Metode 2 – Brugergenereret indhold scannes, før det bliver tilgængeligt for brugerne:
- Scan indholdet
- Anmeld, hvis det opfylder filtreringskriterier
- Sæt det i kø til gennemgang, eller afvis det med det samme
- Gennemgå indholdet manuelt:
- Hvis det er sikkert, kan du vise det på sider med annoncevisning og justere filtre
- Hvis det ikke er tilfældet, skal du deaktivere annoncevisning og vise eller afvise indholdet.
Kommercielle løsninger i et nøddeskal
Der er en række tjenester, der tilbyder indholdsfiltrering, og endda nogle få, der specialiserer sig i filtrering af specifikke typer som f.eks. seksuelt eller ophavsretsligt beskyttet indhold. Der er også crowdsourcing-platforme, der bygger bro mellem udgivere og brugere i et forsøg på at tjene nemme penge på internettet. Den bedste måde at håndtere dette på er at foretage markedsundersøgelser om emnet og tage beslutning om den bedste løsning for den tjeneste, du leverer. Prøv at se på websites, der anmelder software, og hold øje med, hvilke typer af indholdsfiltreringssystemer de anbefaler. Når du har indsamlet alle disse oplysninger, kan du beslutte, hvad der er den bedste løsning for dig baseret på vurderingen af produktet, de unikke funktioner og betalingsmodellen.