सामग्री फ़िल्टर करने का मतलब है कि अपनी साइट पर बहुत ज़्यादा डेटा को प्रोसेस करने के लिए, अपने आप काम करने वाले किसी सिस्टम का इस्तेमाल करना. इसकी मदद से खास मानदंड को पूरा करने वाली किसी सामग्री के लिए सही कदम उठाया जा सकता है. प्रकाशक अक्सर अपनी साइट पर उपयोगकर्ताओं की जनरेट की गई बहुत ज़्यादा सामग्री को मैनेज करने के लिए, टेक्स्ट और मीडिया को फ़िल्टर करने के सॉफ़्टवेयर इस्तेमाल करते हैं. ये सिस्टम आम तौर पर वयस्क और गैरकानूनी फ़ाइल शेयर करने वाली सामग्री के साथ-साथ बंदूकों, ड्रग, शराब, और तंबाकू की बिक्री जैसी सामग्री को फ़िल्टर करने के लिए भी इस्तेमाल किए जाते हैं.
सामग्री फ़िल्टर करने के लिए निजी सॉफ़्टवेयर बनाना
ज़्यादातर प्रकाशक, सामग्री फ़िल्टर करने के लिए अपना सिस्टम खुद बनाते हैं. इससे ये फ़ायदे हो सकते हैं:
- टेक्स्ट के अनुसार फ़िल्टर करने की प्रोसेस को ज़्यादा आसानी से कोड किया जा सकता है
- आम तौर पर यह कारोबारी तरीकों से काफ़ी सस्ता पड़ता है
- प्रकाशक ही अपनी साइट और उपयोगकर्ताओं को सबसे अच्छी तरह से जानता है और किसी दूसरे की तुलना में नीति से जुड़ी समस्याओं का बेहतर अनुमान लगा सकता है
कीवर्ड की सूची बनाना
- आप जिन शब्दों या वाक्यांशों को फ़िल्टर करना चाहते हैं उनकी सूची बनाएं. आप अपने अनुभव से या किसी की मदद लेकर सूची बना सकते हैं:
- अपने कर्मचारियों की मदद लें
- मदद पाने के लिए अपने उपयोगकर्ताओं से संपर्क करें
- Google Ads का कीवर्ड टूल इस्तेमाल करें
- नीतियों के अनुसार गलत सामग्री (उदाहरण के लिए, वयस्क और/या फ़ाइल शेयर करने वाली साइटें) को होस्ट करने वाली वेबसाइटों की जांच करने से आपको और भी मदद मिल सकती है. इन वेबसाइटों की जांच करके, आप इन पर दिखाई देने वाले कीवर्ड का पता लगा सकते हैं.
- अपने ऑटोमेटिक कीवर्ड स्क्रैपिंग टूल को कोड करने का तरीका:
- किसी साइट के सभी पेजों की जानकारी पाने के लिए सर्च इंजन का डेटा इस्तेमाल करें
- यूनीक शब्दों की सूची डाउनलोड करें. इसमें आपको एक साथ इस्तेमाल किए शब्द भी दिखाई देंगे
- सबसे ज़्यादा इस्तेमाल किए गए कीवर्ड को छोड़कर बाकी सभी शब्द मिटा दें. साथ ही, ‘a’, ‘and’ या ‘the’ जैसे आम शब्दों को निकालना न भूलें.
- इस सूची को टेक्स्ट फ़ाइल के तौर पर डाउनलोड करें
- जब तक आपकी मनपसंद सूची तैयार नहीं हो जाती, तब तक आप ऊपर दी गई प्रोसेस को अनेक साइटों पर दोहरा सकते हैं. मनपसंद सूची तैयार होने पर आपका काम पूरा हो जाता है.
- अहम जानकारी: दूसरी साइटों पर मौजूद कॉन्टेंट की नकल करना और उसे अपने कॉन्टेंट के तौर पर इस्तेमाल करना, Google पब्लिशर से जुड़ी नीतियों और Google वेब खोज के लिए स्पैम से जुड़ी नीतियों के ख़िलाफ़ है. साथ ही, ऐसा करना गैर-कानूनी और/या अनैतिक भी हो सकता है.
सभी शब्द एक जैसे नहीं होते और कुछ कीवर्ड दूसरों के मुकाबले खराब होते हैं. इसलिए आपको हर शब्द को अलग-अलग अहमियत देने के बारे में सोचना चाहिए.
उदाहरण के लिए, इंग्लिश में वयस्क फ़िल्टर के लिए ‘porno’ शब्द को ‘sex’ के मुकाबले ज़्यादा अहमियत देनी चाहिए. वैसे तो ‘porno’ शब्द, खास तौर पर ऐसे कॉन्टेंट से संबंधित है जो परिवार के साथ देखने लायक नहीं है, जबकि ‘sex’ को कॉन्टेंट में इस्तेमाल किए गए संदर्भ के मुताबिक ‘gender’ के तौर पर भी देखा जा सकता है.
इसके अलावा, ऐसे शब्दों के बारे में सोचें जिन्हें अकेला इस्तेमाल करना सुरक्षित है, लेकिन दूसरे शब्द के साथ इस्तेमाल करने से उनका मतलब पूरी तरह बदल जाता है. उदाहरण के लिए, ‘pictures’ एक आम शब्द है, लेकिन ‘teen pictures’ शब्द का इस्तेमाल करने से यह पोर्नोग्राफ़ी में बदल जाता है.
पहला तरीका - किसी पेज पर उपयोगकर्ता की जनरेट की गई सामग्री दिखाए जाने पर, उसे स्कैन किया जाता है:
- सामग्री को स्कैन करना
- अगर यह सामग्री, फ़िल्टर करने के मानदंड पर सही पाई जाती है, तो उसकी ओर ध्यान दिलाना
- अनुरोध की गई सामग्री को होस्ट करने वाले पेज पर विज्ञापन दिखाना प्रस्तुतीकरण रोकना
- कॉन्टेंट की मैन्युअल तरीके से समीक्षा करना:
- अगर यह सामग्री सुरक्षित है, तो विज्ञापन प्रस्तुतीकरण चालू करना और फ़िल्टर में ज़रूरी बदलाव करना
- अगर यह सामग्री सुरक्षित नहीं है, तो पक्का करें कि विज्ञापन कोड वाले पेजों पर वह नहीं दिखाई जाती है
दूसरा तरीका - उपयोगकर्ताओं को दिखाने से पहले ही उनकी जनरेट की गई सामग्री को स्कैन किया जाता है:
- सामग्री को स्कैन करना
- अगर यह सामग्री, फ़िल्टर करने के मानदंड पर सही पाई जाती है, तो उसकी ओर ध्यान दिलाना
- उसे समीक्षा के लिए भेज दिया जाता है या अस्वीकार कर दिया जाता है
- कॉन्टेंट की मैन्युअल तरीके से समीक्षा करना:
- अगर सामग्री सुरक्षित है, तो इसे विज्ञापन दिखाने वाले पेजों पर दिखाना और फ़िल्टर में ज़रूरी बदलाव करना
- अगर ऐसा नहीं है, तो विज्ञापन प्रस्तुतीकरण बंद करना और इसे दिखाना या अस्वीकार करना
कॉमर्शियल सॉफ़्टवेयर के बारे में थोड़ी सी जानकारी
कई कंपनियां सामग्री फ़िल्टर करने की सेवाएं देती है. इनमें से कुछ कंपनियों को वयस्क या कॉपीराइट सामग्री जैसे खास विषयों को फ़िल्टर करने में महारत हासिल है. ऐसे क्राउडसोर्सिंग प्लैटफ़ॉर्म भी हैं जो इंटरनेट पर आसानी से पैसा कमाने की इच्छा रखने वाले प्रकाशकों और उपयोगकर्ताओं को एक साथ जोड़ते हैं. इसका सबसे अच्छा तरीका यह है कि आप मनपसंद विषय पर कुछ मार्केट रिसर्च करें और फिर अपनी सेवा के लिए सबसे बेहतर सॉफ़्टवेयर तय करें. सॉफ़्टवेयर की समीक्षा करने वाली साइटों की तलाश करें और देखें कि उपयोगकर्ता की जनरेट की गई सामग्री को फ़िल्टर करने के लिए किस तरह के सिस्टम का सुझाव दे रहे हैं. सामग्री फ़िल्टर करने वाले सिस्टम की पूरी जानकारी हासिल करने के बाद, आपको अपने लिए सबसे बेहतरीन सॉफ़्टवेयर चुनना चाहिए. साथ ही, अपने चुने गए उत्पाद के स्कोर, इसके यूनीक फ़ीचर, और कीमत का ध्यान भी रखना चाहिए.