Regulamentos de conteúdo

Filtragem de conteúdo

A filtragem de conteúdo refere-se a um sistema automático usado para processar grandes volumes de dados e agir sobre qualquer conteúdo que atender a determinados critérios. Frequentemente, os editores de texto usam soluções de filtragem de texto e mídia para gerenciar a maior parte do conteúdo gerado pelo usuário em seus sites. Muitas vezes, esses sistemas são usados para filtrar conteúdos, como conteúdo adulto e compartilhamento ilegal de arquivos, bem como a venda de armas de fogo, drogas, álcool e tabaco.

Importante: não é apenas conteúdo hospedado localmente que precisa estar em conformidade com as políticas. Vincular seu site a fontes externas que hospedam conteúdo infrator também é considerado uma violação. Por exemplo, um editor que enquadra filmes hospedados ilegalmente em um site de terceiros não está obedecendo às políticas de editores do Google.

Desenvolver uma solução interna

Muitos editores optam por desenvolver o próprio sistema de filtragem. Essa decisão pode trazer os seguintes benefícios:

  • A filtragem com base em texto pode ser relativamente fácil de codificar
  • Frequentemente, elas são significativamente mais baratas do que as soluções comerciais
  • O editor conhece melhor seu site e seus usuários e pode antecipar questões de regulamento melhor do que ninguém
Veja a seguir algumas ideias e sugestões que você deve considerar ao desenvolver uma solução interna com base em texto.

 

Como criar uma lista de palavras-chave
Para filtrar textos, o sistema precisa contar com uma lista de palavras-chave formadas por termos individuais e combinações de palavras. Essa lista pode ser criada de diversas maneiras, dependendo do tipo de conteúdo, do volume de conteúdo no site e dos recursos disponíveis do editor:
  • Compile sua própria lista de palavras e frases que deseja filtrar. Você pode usar sua própria intuição ou obter ajuda:
    • Peça a seus funcionários que contribuam
    • Peça a ajuda dos seus usuários.
    • Use Planejador de palavras-chave do Google Ads.
    • Para ver mais ideias, acesse alguns sites que hospedam conteúdos indesejáveis (por exemplo, conteúdo adulto e/ou sites de compartilhamento de arquivos) e descubra quais palavras-chave aparecem com frequência neles.
  • Codifique sua própria ferramenta automática de captura de palavras-chave:
    • Use dados de mecanismos de pesquisa para percorrer todas as páginas de um site
    • Recupere uma lista de palavras individuais e combinações de palavras que aparecem nesse site
    • Mantenha as palavras-chave mais usadas e descarte as demais. Não se esqueça de eliminar artigos comuns e palavras como "um", "uma", "e", "o" ou "a".
    • Obtenha os resultados como um arquivo de texto
    • Repita o procedimento acima para quantos sites você quiser até ter uma lista com termos suficientes.
    • Importante: coletar dados de outros sites e usar o conteúdo deles como se fosse seu é contra as políticas de editores do Google e as Diretrizes para webmasters do Google. Além disso, essa prática é ilegal e/ou antiética.
Como ponderar o peso das palavras

As palavras não são todas iguais, e algumas palavras-chave não são tão eficientes quanto outras. Portanto, avalie a possibilidade de atribuir pesos diferentes a termos diferentes.

Por exemplo, os filtros de conteúdo adulto em inglês devem atribuir à palavra "pornográfico" um peso maior do que à palavra "sexo". Embora o termo "pornográfico" esteja relacionado quase que exclusivamente a conteúdos não indicados para menores, "sexo" também pode significar "gênero", dependendo do contexto no qual é usado.

Considere também as palavras que são seguras individualmente mas, quando combinadas com outras, podem assumir significados completamente diferentes. Por exemplo, a palavra "imagens" é inocente, mas "imagens de adolescentes" frequentemente se refere à pornografia.

O processo de filtragem
Há duas abordagens comuns de filtragem de conteúdo, e cabe a cada editor decidir o que é melhor para o próprio site.

Método 1 - O conteúdo gerado pelo usuário é verificado após ser exibido em uma página:

  1. Verifique o conteúdo.
  2. Sinalize-o se ele atender aos critérios de filtragem
  3. Desative a veiculação de anúncios na página que hospeda tal conteúdo
  4. Analise o conteúdo manualmente:
    1. Se ele for seguro, ative a veiculação de anúncios e ajuste os filtros
    2. Caso contrário, o conteúdo não poderá ser exibido em páginas com códigos de anúncio.

Método 2: o conteúdo gerado pelo usuário é verificado antes de ser disponibilizado para outros usuários:

  1. Verifique o conteúdo.
  2. Sinalize-o se ele atender aos critérios de filtragem
  3. Coloque-o na fila para revisão ou rejeite-o imediatamente
  4. Analise o conteúdo manualmente:
    1. Se ele for seguro, exiba-o em páginas de veiculação de anúncios e ajuste os filtros
    2. Caso contrário, desative a veiculação de anúncios e exiba ou rejeite o conteúdo.

Visão geral das soluções comerciais

Há diversos serviços que oferecem filtragem de conteúdo, até mesmo alguns especializados na filtragem de tipos específicos, como conteúdo adulto ou protegido por direitos autorais. Há também plataformas de redes abertas de conhecimentos que criam uma ponte entre editores e usuários que estão buscando uma forma de ganhar dinheiro fácil na Internet. A melhor maneira de abordar essa questão é fazer pesquisas de mercado sobre o tópico e optar pela melhor solução para o serviço que você oferece. Procure por sites que analisam softwares e veja quais tipos de sistemas de filtragem de conteúdo gerado pelo usuário eles recomendam. Quando tiver todas essas informações, escolha a melhor solução para você com base no preço dela, na pontuação do produto e nos recursos exclusivos que são oferecidos.

Isso foi útil?
Como podemos melhorá-lo?