Filtrování obsahu

Filtrování obsahu je automatický systém, který zpracovává velké objemy dat a zasahuje proti obsahu splňujícímu určitá kritéria. Majitelé stránek často používají řešení pro filtrování textu a médií, aby zvládali velký objem obsahu vytvářeného uživateli na webu. Tyto systémy jsou často zaváděny za účelem filtrování nelegálního stahování souborů, obsahu pouze pro dospělé nebo souvisejícího s prodejem zbraní, drog, alkoholu a tabáku.

Důležité: Obsah porušující zásady nemusí být nutně hostován lokálně. Za porušení je považován i odkaz na externí hostitele. Zásady společnosti Google pro majitele stránek tak například porušuje i majitel stránek, na nichž jsou v rámcích zobrazovány filmy nelegálně hostované na webu třetí strany.

Vývoj vlastního řešení

Mnozí majitelé stránek se rozhodnou vyvíjet vlastní systém filtrování. Toto rozhodnutí může mít následující výhody:

  • Textové filtrování lze relativně snadno naprogramovat.
  • Je často výrazně levnější než komerční řešení.
  • Majitel zná svůj web a uživatele nejlépe a může předvídat problémy s dodržováním zásad lépe než kdokoli jiný.
Níže uvádíme několik návrhů a doporučení pro vývoj vlastního řešení na bázi textu.

 

Vytvoření seznamu klíčových slov
Chcete-li filtrovat text, systém musí být založen na seznamu klíčových slov, který bude obsahovat jednotlivé výrazy a slovní spojení. V závislosti na typu obsahu, jeho objemu na webu a dostupných prostředcích majitele stránek lze tento seznam vytvořit několika způsoby:
  • Sestavte vlastní seznam slov a frází, které chcete filtrovat. Můžete uplatnit vlastní intuici, nebo využít nějakou pomoc:
    • Požádejte zaměstnance, aby přispěli svými návrhy.
    • Požádejte o pomoc také uživatele.
    • Využijte Nástroj pro návrh klíčových slov služby Google Ads.
    • Další inspiraci můžete najít na stránkách, které hostují nežádoucí obsah (například weby pro dospělé nebo stránky pro sdílení souborů), kde zjistíte, jaká klíčová slova se na nich často vyskytují.
  • Naprogramujte si vlastní nástroj na automatické shromažďování klíčových slov:
    • S využitím dat z vyhledávače projděte všechny stránky na webu.
    • Načtěte seznam jedinečných výrazů a slovních spojení, které se na něm vyskytují.
    • Nejčastěji používaná klíčová slova zachovejte, ostatní vyřaďte. Nezapomeňte odstranit běžné spojky, například „a“.
    • Výstup zapište do textového souboru.
    • Postup opakujte pro libovolný počet webů, dokud nebudete se seznamem spokojeni. To je vše.
    • Důležité: Shromažďování obsahu z jiných stránek a jeho následné používání jako vlastního je porušením zásad společnosti Google pro majitele stránek a pokynů Google pro webmastery. Současně to může být nelegální nebo přinejmenším neetické.
Přiřazení váhy

Ne všechny výrazy jsou rovnocenné. Některá klíčová slova jsou horší než jiná. Proto byste měli zvážit ohodnocení výrazů různými vahami.

Například výraz „porno“ by měl mít větší váhu než „sexuální“. Zatímco výraz „porno“ se téměř vždy vztahuje k obsahu nevhodnému pro děti, u výrazu „sexuální“ tomu tak podle kontextu být nemusí.

Uvědomte si také, že některá slova mohou být sama o sobě bezpečná, zatímco ve spojení s jiným výrazem mohou označovat něco zcela jiného. Například výraz „obrázky“ je sám o sobě nevinný, ale spojení „lechtivé obrázky“ může někdy odkazovat na pornografii.

Způsob filtrování
K filtrování obsahu existují dva obvyklé přístupy a je na každém majiteli stránek, aby si zvolil ten vhodnější.

Metoda 1 – obsah vytvářený uživateli je kontrolován až po jeho zobrazení na stránce:

  1. Zkontrolujte obsah.
  2. Pokud splňuje kritéria filtrování, označte jej.
  3. Zakažte zobrazování reklam na stránce s příslušným obsahem.
  4. Obsah ručně přezkoumejte:
    1. Pokud je bezpečný, povolte zobrazování reklam a upravte filtry.
    2. Pokud tomu tak není, zajistěte, aby se tento obsah nezobrazoval na stránkách s kódem reklamy.

Metoda 2 – obsah vytvářený uživateli je kontrolován předtím, než je zpřístupněn uživatelům:

  1. Zkontrolujte obsah.
  2. Pokud splňuje kritéria filtrování, označte jej.
  3. Zařaďte jej do fronty k přezkoumání nebo rovnou vyřaďte.
  4. Obsah ručně přezkoumejte:
    1. Pokud je bezpečný, zobrazte jej na stránkách s reklamami nebo upravte filtry.
    2. Pokud tomu tak není, zakažte zobrazování reklam a obsah zobrazte, nebo jej vyřaďte.

Komerční řešení v kostce

Existuje řada služeb, které poskytují filtrování obsahu, z nichž některé se dokonce specializují na filtrování určitého druhu obsahu, jako je obsah pro dospělé nebo obsah chráněný autorskými právy. Existují také crowdsourcingové platformy, vytvářející spojení mezi majiteli stránek a uživateli, kteří chtějí snadno vydělávat na internetu. Ideální je provést na toto téma nějaký marketingový průzkum a následně vybrat optimální řešení podle poskytované služby. Zkuste se podívat na stránky, které recenzují software, a zjistit, jaké druhy systémů filtrování obsahu vytvářeného uživateli doporučují. Na základě všech těchto informací si můžete vybrat optimální řešení podle hodnocení produktu, jeho jedinečných vlastností a také cenového modelu.

Pomohly vám tyto informace?
Jak bychom článek mohli vylepšit?