Tính năng lọc nội dung là hệ thống tự động được dùng để xử lý lượng lớn dữ liệu và thực hiện hành động với bất kỳ nội dung nào đáp ứng các tiêu chí nhất định. Nhà xuất bản thường sử dụng các giải pháp lọc văn bản và phương tiện truyền thông để xử lý số lượng lớn các nội dung do người dùng tạo trên trang web của họ. Các hệ thống này thường được dùng để lọc nội dung, chẳng hạn như nội dung người lớn và hoạt động chia sẻ tệp bất hợp pháp cũng như hoạt động mua bán súng ống, ma tuý, đồ uống có cồn và thuốc lá.
Phát triển giải pháp nội bộ
Nhiều nhà xuất bản chọn phát triển hệ thống lọc của riêng mình. Quyết định này có thể có những lợi ích sau:
- Lọc dựa trên văn bản có thể tương đối dễ để tạo mã
- Giải pháp nội bộ thường rẻ hơn đáng kể so với giải pháp thương mại
- Nhà xuất bản biết rõ nhất trang web và người dùng của mình, và có thể dự đoán các vấn đề về chính sách tốt hơn so với bất cứ ai khác
Tạo danh sách từ khoá
- Biên soạn danh sách các từ và cụm từ của riêng bạn mà bạn muốn lọc. Bạn có thể sử dụng trực giác của chính mình hoặc yêu cầu trợ giúp:
- Yêu cầu nhân viên của bạn đóng góp ý kiến
- Liên hệ với người dùng của bạn để nhận trợ giúp
- Sử dụng Google Ads: Công cụ từ khoá
- Để có thêm ý tưởng, hãy xem xét những trang web lưu trữ nội dung không mong muốn (ví dụ: trang web có nội dung người lớn và/hoặc trang web chia sẻ tệp), đồng thời tìm hiểu những từ khoá thường xuyên xuất hiện trên những trang web này.
- Lập trình cho công cụ tự động trích xuất từ khoá của chính bạn:
- Sử dụng dữ liệu của công cụ tìm kiếm để xem qua tất cả các trang trên một trang web
- Truy xuất danh sách từ và tổ hợp từ duy nhất trên trang web
- Giữ các từ khoá thường dùng nhiều nhất và loại bỏ các từ khoá còn lại. Đừng quên loại bỏ các mạo từ và từ phổ biến như "các", "và" hoặc "những".
- Dữ liệu đầu ra ở dạng tệp văn bản
- Lặp lại quy trình trên với số lượng trang web bất kỳ cho đến khi bạn hài lòng với danh sách của mình. Vậy là bạn đã hoàn tất.
- Quan trọng: Việc trích xuất các trang web khác và sử dụng nội dung của các trang web đó làm nội dung của riêng bạn là lỗi vi phạm Các chính sách dành cho nhà xuất bản của Google và Chính sách về nội dung không phù hợp dành cho Google Tìm kiếm cho web, đồng thời cũng có thể là hành vi bất hợp pháp và/hoặc thiếu đạo đức.
Tất cả các từ mà bạn tạo đều không giống nhau về trọng số và một số từ khoá sẽ kém hơn các từ khoá khác. Do đó, bạn nên xem xét việc chỉ định các trọng số cho từng cụm từ.
Ví dụ: bộ lọc nội dung người lớn bằng tiếng Anh nên tính trọng số cho từ "porno" ("khiêu dâm") cao hơn từ "sex". Mặc dù từ "porno" hầu như chỉ liên quan đến nội dung không an toàn cho gia đình, nhưng từ "sex" cũng có thể có nghĩa là "giới tính" tuỳ thuộc vào ngữ cảnh sử dụng.
Ngoài ra, hãy xem xét những từ an toàn khi đứng riêng nhưng có thể ám chỉ ý nghĩa hoàn toàn khác khi được kết hợp với một từ khác. Ví dụ: từ ‘ảnh’ có thể xem là vô hại, nhưng ‘ảnh thiếu niên’ thường đề cập đến nội dung khiêu dâm.
Phương thức 1 – Nội dung do người dùng tạo sẽ được quét sau khi xuất hiện trên trang:
- Quét nội dung
- Gắn cờ nếu nội dung đáp ứng các tiêu chí lọc
- Tắt tính năng phân phát quảng cáo trên trang lưu trữ nội dung nêu trên
- Xem xét nội dung theo cách thủ công:
- Nếu nội dung an toàn, hãy bật tính năng phân phát quảng cáo và điều chỉnh bộ lọc
- Nếu nội dung không an toàn, hãy đảm bảo nội dung không xuất hiện trên các trang chứa mã quảng cáo
Phương thức 2 – Nội dung do người dùng tạo sẽ được quét rồi mới xuất hiện cho người dùng:
- Quét nội dung
- Gắn cờ nếu nội dung đáp ứng các tiêu chí lọc
- Xếp nội dung vào hàng đợi xem xét hoặc từ chối nội dung ngay lập tức
- Xem xét nội dung theo cách thủ công:
- Nếu nội dung an toàn, hãy hiển thị nội dung trên các trang phân phát quảng cáo và điều chỉnh bộ lọc
- Nếu nội dung không an toàn, hãy vô hiệu hoá tính năng phân phát quảng cáo, đồng thời cho thấy hoặc từ chối nội dung
Tóm tắt về giải pháp thương mại
Có một số dịch vụ cung cấp tính năng lọc nội dung, thậm chí một vài dịch vụ chuyên lọc các loại nội dung cụ thể như nội dung người lớn hoặc nội dung có bản quyền. Ngoài ra còn có các nền tảng sử dụng nguồn lực cộng đồng để tạo cầu nối giữa nhà xuất bản và người dùng đang tìm cách kiếm tiền nhanh gọn trên Internet. Cách tốt nhất để tiếp cận giải pháp này là thực hiện một số nghiên cứu thị trường về chủ đề này và quyết định giải pháp tốt nhất cho dịch vụ bạn đang cung cấp. Hãy thử tìm kiếm các trang web đánh giá phần mềm và xem loại hệ thống lọc nội dung do người dùng tạo nào họ khuyên dùng. Sau khi có tất cả các thông tin này trong tay, bạn nên quyết định giải pháp tốt nhất cho mình dựa vào điểm của sản phẩm, tính năng độc đáo của sản phẩm cũng như các mô hình định giá của nó.