Zasady dotyczące treści

Filtrowanie treści

Filtrowanie treści odnosi się do automatycznego systemu skonfigurowanego pod kątem przetwarzania dużych ilości danych i podejmowania działań w stosunku do każdej treści spełniającej określone kryteria. Do obsługi zbioru treści tworzonej przez użytkowników w witrynie wydawcy często stosują rozwiązania filtrowania tekstu i elementów multimedialnych. Te systemy mają często za zadanie filtrowanie takich przypadków, jak udostępnianie plików nielegalnych i przeznaczonych dla dorosłych, a także sprzedaż broni palnej, narkotyków, alkoholu i tytoniu.

Ważne: treść naruszająca zasady nie musi być hostowana lokalnie. Za naruszenie zasad jest uznawane także dodanie linku do źródeł zewnętrznych zawierających taką treść. Na przykład wydawca, który umieszcza w ramkach kopie filmów hostowanych nielegalnie w witrynie innej firmy, narusza zasady programu AdSense.

Zaprogramowanie rozwiązania wewnętrznego

Wielu wydawców decyduje się na opracowanie własnych systemów filtrowania. Taka decyzja może mieć następujące zalety:

  • Napisanie kodu do filtrowania tekstu może być stosunkowo proste
  • Takie systemy są dużo tańsze niż rozwiązania dostępne na rynku
  • Wydawca zna swoją witrynę i użytkowników najlepiej, więc może przewidzieć problemy z zasadami skuteczniej niż ktokolwiek inny
Poniżej znajduje się kilka pomysłów i sugestii, które warto wziąć pod uwagę podczas tworzenia wewnętrznego rozwiązania do obsługi tekstu.

Tworzenie list słów kluczowych
Aby filtrować tekst, system musi polegać na listach słów kluczowych składających się z poszczególnych słów, a także kombinacji słów. Taką listę można utworzyć na wiele sposobów, w zależności od typu treści, jej ilości w witrynie oraz dostępnych zasobów wydawcy.
  • Utwórz własną listę słów kluczowych i wyrażeń, które chcesz filtrować. Możesz wypisać słowa, które podpowiada Ci intuicja, lub skorzystać z pomocy:
    • Zapytaj pracowników o zdanie
    • Poproś o pomoc użytkowników
    • Użyj Narzędzia propozycji słów kluczowych Google Ads
    • Dodatkowych inspiracji poszukaj w witrynach zawierających niechciane treści (np. w witrynach dla dorosłych lub witrynach udostępniania plików), by zobaczyć, jakie słowa kluczowe często się tam pojawiają.
  • Zaprogramuj własne narzędzie pobierania słów kluczowych:
    • Przejrzyj wszystkie strony witryny, używając danych wyszukiwarki
    • Pobierz listę niepowtarzalnych słów i kombinacji słów występujących w witrynie
    • Zachowaj najczęściej używane słowa kluczowe i odrzuć resztę. Nie zapomnij wyeliminować często występujących części mowy, takich jak „czy”, „oraz”, „lub”.
    • Przedstaw wynik w formie pliku tekstowego
    • Powtórz powyższe czynności dla każdej witryny aż do utworzenia satysfakcjonującej listy
    • Ważne: pobieranie treści innych firm i używanie jej jako własnej jest niezgodne z zasadami AdSense i Wskazówkami Google dla webmasterów, a także może być nielegalne lub nieetyczne.
Przypisywanie wagi

Nie wszystkie słowa są sobie równe i niektóre słowa kluczowe są gorsze od innych. Rozważ więc przypisanie różnym terminom różnej wagi.

Na przykład filtry treści dla dorosłych w języku polskim powinny ważyć słowo „porno” wyżej niż „seks”. O ile słowo „porno” odnosi się prawie wyłącznie do treści nie dla całej rodziny, w zależności od kontekstu słowo „seks” może być użyte jako słowo neutralne.

Weź pod uwagę także słowa, które same w sobie są bezpieczne, ale w połączeniu z innym słowem mogą wskazywać na coś zupełnie innego. Samo słowo „zdjęcia” jest całkiem nieszkodliwe, ale wyrażenie „zdjęcia nastolatek” często może odnosić się do pornografii.

Przebieg filtrowania
Filtrowanie treści może odbywać się na dwa proste sposoby i wydawca sam decyduje, który z nich jest najbardziej odpowiedni dla jego witryny.

Metoda 1. Treść tworzona przez użytkowników jest skanowana po wyświetleniu na stronie:

  1. Skanowanie treści
  2. Oznaczenie treści, jeśli spełnia kryteria filtrowania
  3. Wyłączenie wyświetlania reklam na stronie zawierającej daną treść
  4. Ręczne sprawdzenie treści:
    1. Jeśli treść jest bezpieczna, możesz włączyć wyświetlanie reklam i dostosować filtry
    2. Jeśli nie jest bezpieczna, upewnij się, czy nie jest wyświetlana na stronach zawierających kod reklamy

Metoda 2. Treść tworzona przez użytkowników jest skanowana przed udostępnieniem użytkownikom:

  1. Skanowanie treści
  2. Oznaczenie treści, jeśli spełnia kryteria filtrowania
  3. Umieszczenie w kolejce do sprawdzenia lub odrzucenie od razu
  4. Ręczne sprawdzenie treści:
    1. Jeśli treść jest bezpieczna, możesz ją umieścić na stronach wyświetlających reklamy i dostosować filtry
    2. Jeśli nie jest bezpieczna, wyłącz wyświetlanie reklam i zamieść treść lub ją odrzuć

Rozwiązania komercyjne w skrócie

Na rynku jest dostępnych kilka usług filtrowania treści, a niektóre z nich specjalizują się w filtrowaniu określonych typów treści, takich jak treści dla dorosłych lub treści chronione prawami autorskimi. Są także platformy crowdsourcingowe będące mostem między wydawcami i użytkownikami, którzy chcą łatwo zarabiać w internecie. Najlepszym sposobem na znalezienie odpowiedniego rozwiązania dla swojej witryny jest zbadanie rynku i wybór najlepszej opcji. Warto znaleźć witryny z recenzjami oprogramowania i sprawdzić, jakie typy systemów filtrowania treści generowanych przez użytkowników są w nich polecane. Mając na względzie wszystkie te informacje, należy wybrać najlepsze rozwiązanie w oparciu o wynik produktu, jego unikalne cechy i model wyceny.

Czy to było pomocne?
Jak możemy ją poprawić?