Фільтрування вмісту

Фільтрування вмісту – це автоматична система, задіяна для обробки великих обсягів даних і вживання заходів щодо вмісту, який відповідає певним критеріям. Видавці часто використовують на сайті фільтрування тексту й медіа для масової обробки вмісту, який створюють користувачі. За допомогою таких систем часто відфільтровують різний вміст: для дорослих, незаконний обмін файлами та продаж вогнепальної зброї, наркотиків, алкоголю й тютюну.

Важливо. Порушувати правила може не лише локально розміщений вміст. Як порушення розцінюється навіть посилання на зовнішні джерела, де його розміщено. Наприклад, видавець, який розміщує фрейми фільмів, незаконно розміщених на сторонніх сайтах, порушує правила Google для видавців.

Розробка власного рішення

Багато видавців розробляють власну систему фільтрування. Це рішення може мати такі переваги:

  • запрограмувати фільтрування на основі тексту порівняно легко;
  • часто це значно дешевше, ніж комерційні рішення;
  • видавець знає свій сайт і користувачів найкраще й може передбачити проблеми з дотриманням політики краще, ніж будь-хто інший.
Нижче подано кілька ідей і пропозицій, які варто врахувати, розробляючи власне рішення на текстовій основі.

 

Створення списку ключових слів
Для фільтрування тексту система має спиратися на список ключових слів, складений і з окремих слів, і з їх комбінацій. Залежно від типу вмісту, його обсягу на сайті та доступних у видавця ресурсів можна застосувати різні способи створення такого списку.
  • Створіть власний список слів і фраз для фільтрування. Тут можна покластися на власну інтуїцію або скористатися допомогою:
    • запросити до участі своїх працівників;
    • звернутися по допомогу до користувачів;
    • використати інструмент добору ключових слів Google Ads;
    • також можна переглянути веб-сайти, де розміщено небажаний вміст (наприклад, сайти для дорослих або для обміну файлами), і з'ясувати, які ключові слова часто там зустрічаються.
  • Запрограмуйте власний автоматичний інструмент виловлювання ключових слів:
    • скористайтеся даними пошукової системи для огляду всіх сторінок на сайті;
    • отримайте список унікальних слів і їх комбінацій;
    • залиште найпоширеніші ключові слова й відкиньте решту (не забудьте вилучити поширені сполучники, як-от "і", "й", "та", "або");
    • відформатуйте результат як текстовий файл;
    • повторюйте описані вище кроки, доки не підготуєте задовільний список.
    • Важливо. Часткове збирання вмісту з інших сайтів і використання його як власного порушує інструкції Google для веб-майстрів і правила Google для видавців, а також може вважатися порушенням законодавчих та/або етичних норм.
Призначення ваги

Не всі слова рівні: деякі ключові слова гірші від інших. Тому варто призначити різним термінам різну вагу.

Наприклад, в україномовних фільтрах вмісту для дорослих слову "секс" слід надати більшу вагу, ніж слову "ескорт". Слово "секс" практично завжди пов’язане з вмістом не для сімейного перегляду, тоді як слово "ескорт" може залежно від контексту позначати військовий, ритуальний, почесний супровід тощо.

Також враховуйте, що певні слова, безпечні окремо, у поєднанні з іншими словами можуть позначати щось зовсім інше. Наприклад, слово "зірки" цілком невинне, проте вираз "голі зірки" часто стосується порнографії.

Процес фільтрування
Є два поширені підходи до фільтрування вмісту. Кожен видавець має сам вирішити, що найкраще підходить для його сайту.

Спосіб 1. Створений користувачами вміст перевіряється після відображення на сторінці

  1. Перевірте вміст автоматичним фільтром.
  2. Позначте вміст, якщо він відповідає критеріям фільтрування.
  3. Вимкніть розміщення оголошень на сторінках, де розміщено такий вміст.
  4. Перевірте вміст вручну:
    1. Якщо він безпечний, увімкніть розміщення оголошень і відкоригуйте фільтри.
    2. В іншому разі подбайте про те, щоб цей вміст не відображався на сторінках із кодом оголошення.

Спосіб 2. Створений користувачами вміст перевіряється перед тим, як стане доступним для користувачів

  1. Перевірте вміст автоматичним фільтром.
  2. Позначте вміст, якщо він відповідає критеріям фільтрування.
  3. Заплануйте перегляд цього вмісту або відразу відхиліть його.
  4. Перевірте вміст вручну:
    1. Якщо він безпечний, відобразіть його на сторінках із розміщенням оголошень і відкоригуйте фільтри.
    2. В іншому разі вимкніть розміщення оголошень і відобразіть або відхиліть вміст.

Стисло про комерційні рішення

Багато сервісів пропонують фільтрування вмісту. Деякі навіть спеціалізуються на фільтруванні таких окремих типів, як вміст для дорослих або вміст, захищений авторським правом. Також є платформи стихійного набору ресурсів: вони створюють міст між видавцями та користувачами, які шукають легкого заробітку в Інтернеті. Найкраще дослідити пропозиції на ринку й підібрати найвідповідніше для своєї служби рішення. Перегляньте сайти відгуків про програмне забезпечення й ознайомтеся з їх рекомендаціями щодо систем фільтрування вмісту, який створюють користувачі. Зібравши всю цю інформацію, ви маєте підібрати найкраще рішення, враховуючи рейтинг продукту, його унікальні функції та модель ціноутворення.

Чи корисна ця інформація?
Як можна її покращити?

Потрібна додаткова допомога?

Увійдіть в обліковий запис, щоб отримати додаткову допомогу та швидко вирішити проблему