Zasady dotyczące treści

Filtrowanie treści

Filtrowanie treści odnosi się do automatycznego systemu skonfigurowanego pod kątem przetwarzania dużych ilości danych i podejmowania działań w stosunku do każdej treści spełniającej określone kryteria. Do obsługi zbioru treści tworzonej przez użytkowników w witrynie wydawcy często stosują rozwiązania filtrowania tekstu i elementów multimedialnych. Te systemy mają często za zadanie filtrowanie takich przypadków jak udostępnianie plików nielegalnych lub przeznaczonych dla dorosłych, a także sprzedaż broni palnej, narkotyków, alkoholu i tytoniu.

Ważne: treść naruszająca zasady nie musi być hostowana lokalnie. Za naruszenie zasad jest uznawane także dodanie linku do źródeł zewnętrznych zawierających taką treść. Na przykład wydawca, który umieszcza w ramkach kopie filmów hostowanych nielegalnie w witrynie innej firmy, narusza Zasady Google dotyczące wydawców.

Opracowywanie własnego rozwiązania

Wielu wydawców decyduje się na opracowanie własnych systemów filtrowania. Taka decyzja może mieć następujące zalety:

  • Napisanie kodu do filtrowania tekstu może być stosunkowo proste
  • Takie systemy są dużo tańsze niż rozwiązania dostępne na rynku
  • Wydawca zna swoją witrynę i użytkowników najlepiej, więc może przewidzieć problemy z zasadami skuteczniej niż ktokolwiek inny
Poniżej znajduje się kilka pomysłów i sugestii, które warto wziąć pod uwagę podczas tworzenia wewnętrznego rozwiązania do filtrowania tekstu.

 

Tworzenie listy słów kluczowych
Aby filtrować tekst, system musi polegać na listach słów kluczowych składających się z poszczególnych słów, a także kombinacji słów. Taką listę można utworzyć na wiele sposobów, w zależności od typu treści, jej ilości w witrynie oraz dostępnych zasobów wydawcy.
  • Utwórz własną listę słów kluczowych i wyrażeń, które chcesz filtrować. Możesz wypisać słowa, które podpowiada Ci intuicja, lub skorzystać z pomocy:
    • Zapytaj pracowników o zdanie
    • Poproś o pomoc użytkowników
    • Użyj narzędzia Google Ads: Planer słów kluczowych
    • Dodatkowych inspiracji poszukaj w witrynach zawierających niechciane treści (np. w witrynach dla dorosłych lub witrynach udostępniających pliki), by zobaczyć, jakie słowa kluczowe często się tam pojawiają.
  • Zaprogramuj własne narzędzie pobierania słów kluczowych:
    • Przejrzyj wszystkie strony witryny, używając danych wyszukiwarki
    • Pobierz listę niepowtarzalnych słów i kombinacji słów występujących w witrynie
    • Zachowaj najczęściej używane słowa kluczowe i odrzuć resztę. Nie zapomnij wyeliminować często występujących części mowy, takich jak „czy”, „oraz”, „lub”.
    • Przedstaw wynik w formie pliku tekstowego
    • Powtórz powyższe czynności dla każdej witryny aż do utworzenia wyczerpującej listy.
    • Ważne: pobieranie treści z innych witryn i używanie ich jako własnych jest niezgodne z Zasadami Google dotyczącymi wydawców i Wskazówkami Google dla webmasterów. Takie działanie może także być nielegalne lub nieetyczne.
Przypisywanie wagi

Nie wszystkie słowa są sobie równe, a niektóre słowa kluczowe są gorsze od innych. Rozważ więc przypisanie różnym terminom różnej wagi.

Na przykład filtry treści dla dorosłych w języku polskim powinny ważyć słowo „porno” wyżej niż „seks”. O ile słowo „porno” odnosi się prawie wyłącznie do treści nie dla całej rodziny, w zależności od kontekstu słowo „seks” może być użyte jako słowo neutralne.

Weź pod uwagę także słowa, które same w sobie są bezpieczne, ale w połączeniu z innym słowem mogą wskazywać na coś zupełnie innego. Samo słowo „zdjęcia” jest całkiem nieszkodliwe, ale wyrażenie „zdjęcia nastolatek” często może odnosić się do pornografii.

Filtrowanie
Filtrowanie treści może odbywać się na dwa proste sposoby i wydawca sam decyduje, który z nich jest najbardziej odpowiedni dla jego witryny.

Metoda 1. Treści użytkowników są skanowane po wyświetleniu na stronie:

  1. Skanowanie treści
  2. Oznaczenie treści, jeśli spełnia kryteria filtrowania
  3. Wyłączenie wyświetlania reklam na stronie zawierającej daną treść
  4. Ręczne sprawdzenie treści:
    1. Jeśli treść jest bezpieczna, możesz włączyć wyświetlanie reklam i dostosować filtry
    2. Jeśli nie jest bezpieczna, dopilnuj, by wyświetlała się na stronach niezawierających kodu reklamy

Metoda 2. Treści użytkowników są skanowane przed publicznym udostępnieniem:

  1. Skanowanie treści
  2. Oznaczenie treści, jeśli spełnia kryteria filtrowania
  3. Umieszczenie w kolejce do sprawdzenia lub odrzucenie od razu
  4. Ręczne sprawdzenie treści:
    1. Jeśli treść jest bezpieczna, możesz ją umieścić na stronach wyświetlających reklamy i dostosować filtry
    2. Jeśli nie jest bezpieczna, odrzuć treść lub wyłącz wyświetlanie reklam i opublikuj ją

Rozwiązania komercyjne w skrócie

Na rynku jest dostępnych kilka usług filtrowania treści, a niektóre z nich specjalizują się w filtrowaniu określonych typów treści, takich jak treści dla dorosłych lub treści chronione prawami autorskimi. Są także platformy crowdsourcingowe będące mostem między wydawcami i użytkownikami, którzy chcą łatwo zarabiać w internecie. Najlepszym sposobem na znalezienie odpowiedniego rozwiązania dla swojej witryny jest zbadanie rynku i wybór najlepszej opcji. Warto znaleźć witryny z recenzjami oprogramowania i sprawdzić, jakie typy systemów filtrowania treści generowanych przez użytkowników są w nich polecane. Weź pod uwagę te wszystkie informacje, by wybrać najlepsze rozwiązanie na podstawie oceny usługi, jej unikalnych funkcji i modelu płatności.

Czy to było pomocne?
Jak możemy ją poprawić?