Филтрирането на съдържанието представлява автоматична система, създадена за обработване на големи обеми от данни и за предприемане на действия върху всяко съдържание, отговарящо на определени критерии. За обработване на по-голямата част от съдържанието, генерирано от потребителите, на сайта си издателите често използват решения за филтриране на текст и медии. Тези системи често са създадени за филтриране на съдържание, като споделяне на файлове за пълнолетни или незаконно споделяне, както и продажба на огнестрелни оръжия, наркотици, алкохол и тютюневи изделия.
Разработване на вътрешно решение
Много издатели избират да разработят собствена филтрираща система. Това може да има следните предимства:
- филтрирането въз основа на текст може да е относително лесно за кодиране;
- тя често е значително по-евтина от комерсиалните решения;
- издателят най-добре познава сайта и потребителите си и може да предвижда проблемите с правилата по-добре от всеки.
Създаване на списък с ключови думи
- Съставете собствен списък с думите и фразите, които искате да филтрирате. Можете да разчитате на интуицията си или да използвате малко помощ:
- възползвайте се от приноса на служителите си;
- допитайте се за помощ до потребителите си;
- използвайте инструмента на Google Ads за ключови думи;
- за по-голямо вдъхновение разгледайте уебсайтовете, хостващи нежелано съдържание (например сайтове за пълнолетни и/или за споделяне на файлове) и открийте кои ключови думи се показват в тях често.
- Кодирайте свой собствен инструмент за автоматично извличане на данни за ключови думи:
- Използвайте данните от търсачката, за да преминете през всички страници на сайта.
- Определете списък с уникални думи и словосъчетания в него.
- Запазете най-често използваните ключови думи и отхвърлете останалите. Не забравяйте да изключите обичайните думи, като „и“, „е“, „но“.
- Изведете резултата като текстов файл.
- Повторете горните стъпки и с други сайтове, докато получите желания списък, и сте готови.
- Важно: Извличането на данни от други сайтове и използването на съдържанието им като Ваше собствено е против правилата на Google за издатели и правилата относно спама за Google Търсене в мрежата, а може също да е незаконно и/или неетично.
Не всички думи са еднакви, а някои ключови думи са по-лоши от други. Затова трябва да обмислите присвояването на различни тегла на различните думи.
Например във филтрите на съдържание за пълнолетни на български език думата „порнографски“ трябва да е с по-голямо тегло от „полов“. Докато „порнографски“ се свързва почти само със съдържание, неподходящо за всички възрасти, „полов“ може да е признак на пола в зависимост от контекста, в който се използва.
Имайте предвид също така думите, които са безопасни сами по себе си, но придобиват напълно различно значение, когато се използват с друга дума. Думата „снимки“ например е достатъчно обикновена, но „тийн снимки“ често се отнася за порнография.
Метод 1 – Генерираното от потребителите съдържание се преглежда, след като се покаже на страницата:
- Прегледайте съдържанието.
- Маркирайте го, ако отговаря на критериите за филтриране.
- Деактивирайте показването на реклами на страницата, хостваща въпросното съдържание.
- Прегледайте съдържанието ръчно:
- Ако е безопасно, активирайте показването на реклами и коригирайте филтрите.
- Ако не е, се уверете, че то не се показва на страници с рекламен код.
Метод 2 – Генерираното от потребителите съдържание се преглежда, преди да се покаже на потребителите:
- Прегледайте съдържанието.
- Маркирайте го, ако отговаря на критериите за филтриране.
- Планирайте го за преглед или го отхвърлете веднага.
- Прегледайте съдържанието ръчно:
- Ако е безопасно, го покажете на страниците с реклами и коригирайте филтрите.
- Ако не е, деактивирайте показването на реклами и покажете или отхвърлете съдържанието.
Комерсиалните решения накратко
Има много услуги, предоставящи филтриране на съдържание, и дори няколко, специализирани във филтриране на конкретен тип, като съдържание за пълнолетни или защитено с авторски права. Съществуват и платформи за краудсорсинг, които създават връзка между издателите и потребителите, търсещи начин да спечелят лесни приходи в интернет. Най-добрият начин да се запознаете с това, е да направите известно проучване на пазара по въпроса и да изберете най-доброто решение за услугата, която предоставяте. Опитайте да разгледате сайтове, които оценяват софтуер, и вижте какви видове системи за филтриране на съдържание препоръчват. След като съберете цялата тази информация, трябва да изберете най-подходящото за Вас решение въз основа на оценката на продукта, уникалните му функции и неговия модел на ценообразуване.