Indholdsfiltrering

Indholdsfiltrering henviser til et automatisk system, der er sat op til at behandle store mængder af data og gribe ind overfor indhold, der opfylder visse kriterier. Udgivere bruger ofte tekst- og mediefiltreringsløsninger til at håndtere hovedparten af brugergenereret indhold på deres website. Disse systemer er ofte sat op til at filtrere indhold såsom seksuel og ulovlig fildeling samt salg af skydevåben, narkotika, alkohol og tobak.

Vigtigt! Det indhold, der overtræder politikkerne, behøver ikke at være hostet lokalt. Selv linkning til eksterne kilder, der hoster det, betragtes som en overtrædelse. F.eks. overtræder en udgiver, der viser film, som hostes ulovligt på et tredjepartswebsite, politikkerne for Google-udgivere.

Udvikling af en intern løsning

Mange udgivere vælger at udvikle deres eget filtreringssystem. Denne beslutning kan have følgende fordele:

  • Tekstbaseret filtrering kan være relativt let at kode
  • Det er ofte væsentligt billigere end kommercielle løsninger
  • Udgiveren er den, der bedst kender websitet og brugerne, og kan derfor bedre end nogen anden forudse politikproblemer
Her følger et par ideer og forslag til overvejelse ved udvikling af en intern tekstbaseret løsning.

 

Oprettelse af en liste med søgeord
For at filtrere tekst har systemet brug for en liste med søgeord, som består af såvel enkelte ord som kombinationer af ord. Denne liste kan oprettes på en række måder afhængigt af indholdstypen, mængden af indhold på websitet og udgiverens tilgængelige ressourcer:
  • Sammensæt din egen liste med ord og sætninger, du vil filtrere. Du kan bruge din intuition eller få lidt hjælp til det:
    • Bed dine medarbejdere om at bidrage
    • Bed brugerne om hjælp
    • Brug Søgeordsplanlægning i Google Ads
    • Få yderligere inspiration ved at se på websites, der hoster uønsket indhold (websites med seksuelt indhold eller fildeling f.eks.), og find ud af, hvilke søgeord der ofte dukker op der.
  • Kod dit eget automatiske værktøj til skrabning af søgeord:
    • Brug søgemaskinedata til at gennemgå alle sider på et website
    • Skaf en liste med unikke ord og kombinationer af ord
    • Behold de mest anvendte søgeord, og kassér resten. Husk at eliminere almindelige ord som "en", "og" eller "den"
    • Output som en tekstfil
    • Gentag ovenstående med så mange websites, du vil, indtil du er tilfreds med listen, og så er du færdig.
    • Vigtigt! Kopiering af andre websites og brug af indholdet som dit eget er imod politikkerne for Google-udgivere og Googles retningslinjer for webmastere. Det kan også være ulovligt og/eller uetisk.
Tildeling af vægtning

Alle ord er ikke ens, og nogle søgeord er værre end andre. Du kan derfor overveje at vægte forskellige udtryk forskelligt.

F.eks. kunne seksuelle filtre for dansk vægte ordet "porno" tungere end "patter". Mens "porno" næsten altid er relateret til indhold, som ikke er familievenligt, kan "patter" forekomme i flere forskellige sammenhænge.

Tænk også på ord, der i sig selv er sikre, men i kombination med et andet ord måske får en helt anden betydning. Ordet "billeder" er f.eks. ganske uskyldigt, men i kombinationen "billeder af teen" henvises der ofte til pornografi.

Filtreringsprocessen
Der er to almindelige tilgange til indholdsfiltrering, og det er op til hver enkelt udgiver at beslutte, hvad der giver bedst mening på vedkommendes website.

Metode 1 – Brugergenereret indhold scannes, efter at det vises på en side:

  1. Scan indholdet
  2. Anmeld, hvis det opfylder filtreringskriterier
  3. Deaktiver annoncevisning på den side, der hoster det pågældende indhold
  4. Gennemgå indholdet manuelt:
    1. Hvis det er sikkert, kan du aktivere annoncevisning og justere filtre
    2. Hvis det ikke er tilfældet, skal du sikre dig, at indholdet ikke vises på sider, der indeholder annoncekode.

Metode 2 – Brugergenereret indhold scannes, før det bliver tilgængeligt for brugerne:

  1. Scan indholdet
  2. Anmeld, hvis det opfylder filtreringskriterier
  3. Sæt det i kø til gennemgang, eller afvis det med det samme
  4. Gennemgå indholdet manuelt:
    1. Hvis det er sikkert, kan du vise det på sider med annoncevisning justere filtre
    2. Hvis det ikke er tilfældet, skal du deaktivere annoncevisning og vise eller afvise indholdet.

Kommercielle løsninger i et nøddeskal

Der er en række tjenester, der tilbyder indholdsfiltrering, og endda nogle få, der specialiserer sig i filtrering af specifikke typer som f.eks. seksuelt eller ophavsretsligt beskyttet indhold. Der er også crowdsourcing-platforme, der bygger bro mellem udgivere og brugere i et forsøg på at tjene nemme penge på internettet. Den bedste måde at håndtere dette på er at foretage markedsundersøgelser om emnet og tage beslutning om den bedste løsning for den tjeneste, du leverer. Prøv at se på websites, der anmelder software, og hold øje med, hvilke typer af indholdsfiltreringssystemer de anbefaler. Når du har indsamlet alle disse oplysninger, kan du beslutte, hvad der er den bedste løsning for dig baseret på vurderingen af produktet, de unikke funktioner og betalingsmodellen.

Var disse oplysninger nyttige?
Hvordan kan vi forbedre siden?

Har du brug for mere hjælp?

Log ind for at se yderligere supportmuligheder, så du hurtigt kan løse problemet