प्रतिरूपित सामग्री

प्रतिरूपित सामग्री सामान्यतः डोमेन के अंतर्गत या उसके आर-पार सामग्री के वास्तविक खंडों का संदर्भ देती है, जो या तो अन्य सामग्री से पूर्ण रूप से मेल खाती है या पर्याप्त रूप से उसके समान होती है. अधिकांशतः, यह मूलरूप में भ्रामक नहीं होता. गैर-दुर्भावनापूर्ण प्रतिरूपित सामग्री के उदाहरणों में ये शामिल हो सकते हैं:

  • चर्चा फ़ोरम जो मोबाइल डिवाइस पर लक्षित नियमित और स्ट्रिप-डाउन पृष्ठ, दोनों जेनरेट कर सकते हैं
  • एकाधिक विभिन्न URL के माध्यम से दिखाए गए या लिंक किए गए आइटम संग्रहीत करें
  • वेब पृष्ठों के केवल-प्रिंटर वाले वर्शन

अगर आपकी साइट में काफी हद तक समान सामग्री वाले एकाधिक पृष्ठ शामिल हैं, तो आप Google को कई तरीकों से अपना पसंदीदा URL इंगित कर सकते हैं. (इसे "प्रामाणिकीकरण" कहते हैं.) प्रामाणिकीकरण के बारे में अधिक जानकारी.

हालांकि, कुछ मामलों में, संपूर्ण डोमेन पर खोज इंजन रैंकिंग में हेरफेर करने या अधिक ट्रैफ़िक प्राप्त करने के प्रयास में सामग्री की जानबूझकर प्रतिलिपि बनाई जाती है. इसके जैसी भ्रामक प्रक्रियाओं का परिणाम उस समय खराब उपयोगकर्ता अनुभव हो सकता है, जब किसी विज़िटर को खोज परिणामों के समूह में बार-बार काफी हद तक एक ही सामग्री दिखाई देती है.

Google भिन्न जानकारी वाले पृष्ठों को अनुक्रमित करने और दिखाने के लिए कठिन प्रयास करता है. उदाहरण के लिए, इस फ़िल्टर करने का अर्थ यह है कि अगर आपकी साइट के पास प्रत्येक लेख के एक "नियमित" और "प्रिंटर" वर्शन है और इनमें से किसी को भी noindex मेटा टैग द्वारा अवरोधित नहीं किया गया है, तो हम सूचीबद्ध करने के लिए उनमें से किसी एक को चुनेंगे. उन दुर्लभ स्थितियों में, जिनमें Google मानता है कि प्रतिरूपित सामग्री को हमारी रैंकिंग में हेरफेर करने और हमारे उपयोगकर्ताओं को धोखा देने के उद्देश्य से दिखाया जा सकता है, इसलिए हम इसमें शामिल साइटों के अनुक्रमण और रैंकिंग में उपयुक्त समायोजन भी करते हैं. परिणामस्वरूप, साइट की रैंकिंग को हानि हो सकती है या साइट को Google अनुक्रमणिका से पूरी तरह निकाला जा सकता है, जिस स्थिति में यह अब खोज परिणामों में प्रकट नहीं होगी.

प्रतिरूपित सामग्री की समस्या का अग्रसक्रिय रूप से समाधान करने के लिए कुछ चरण हैं, जिन्हें आप कर सकते हैं और यह सुनिश्चित कर सकते हैं कि विज़िटर वही सामग्री देखें जो आप उन्हें दिखाना चाहते हैं.

  • 301 का उपयोग करें: अगर आपने अपनी साइट की संरचना बदली है, तो उपयोगकर्ताओं, Googlebot और अन्य स्पाइडर को बुद्धिमानी से रीडायरेक्ट करने के लिए अपनी .htacces फ़ाइल में 301 रीडायरेक्ट ("RedirectPermanent") का उपयोग करें. (Apache में, आप .htaccess फ़ाइल से ऐसा कर सकते हैं; IIS में, आप व्यवस्थापक कंसोल से ऐसा कर सकते हैं.)

  • संगत रहें: अपनी आंतरिक लिंकिंग को संगत बनाए रखने का प्रयास करें. उदाहरण के लिए, http://www.example.com/page/ और http://www.example.com/page और http://www.example.com/page/index.htm से लिंक न करें.

  • शीर्ष-स्तरीय डोमेन का उपयोग करें: किसी दस्तावेज़ का सबसे उपयुक्त वर्शन प्रदान करने में हमारी सहायता करने के लिए, जब भी संभव हो तब देश-विशिष्ट सामग्री प्रबंधित करने के लिए शीर्ष-स्तरीय डोमेन का उपयोग करें. http://www.example.com/de या http://de.example.com की बजाय http://www.example.de को देखकर हमारे द्वारा यह जानने की अधिक संभावना होती है कि उसमें जर्मनी-केंद्रित सामग्री है.

  • सावधानी से सिंडिकेट करें: अगर आप अपनी सामग्री को अन्य साइटों पर सिंडिकेट करते हैं, तो Google हमेशा वह वर्शन दिखाएगा जो हमें लगता है कि प्रत्येक दी गई खोज में उपयोगकर्ताओं के लिए सबसे उपयुक्त है, जो आपका पसंदीदा वर्शन हो भी सकता है या नहीं भी हो सकता. हालांकि, यह सुनिश्चित करना सहायक होता है कि वह प्रत्येक साइट जिस पर आपकी सामग्री सिंडिकेट की जाती है, उसमें आपके मूल लेख में वापस जाने के लिए एक लिंक शामिल हो. आप अपनी सिंडिकेट की गई सामग्री का उपयोग करने वालों से यह भी कह सकते हैं कि वे सामग्री के अपने वर्शन को खोज इंजनों द्वारा अनुक्रमित किए जाने से रोकने के लिए noindex मेटा टैग का उपयोग करें.

  • हमें यह बताने के लिए कि आप अपनी साइट को कैसे अनुक्रमित किया जाना पसंद करते हैं Search Console का उपयोग करें: आप Google को अपना पसंदीदा डोमेन बता सकते हैं (उदाहरण के लिए, http://www.example.com या http://example.com).

  • बॉइलरप्लेट दोहराव को न्यूनतम करें: उदाहरण के लिए, प्रत्येक पृष्ठ के नीचे लंबे कॉपीराइट लेख को शामिल करने के बजाय, एक बहुत संक्षिप्त सारांश शामिल करें और फिर उसे अधिक विवरण वाले किसी पृष्ठ से लिंक करें. इसके अलावा, आप यह निर्दिष्ट करने के लिए पैरामीटर प्रबंधन टूल का उपयोग कर सकते हैं कि आप Google से URL पैरामीटर को किस प्रकार प्रबंधित किया जाना पसंद करते हैं.

  • स्टब प्रकाशित करने से बचें: उपयोगकर्ता "रिक्त" पृष्ठ देखना पसंद नहीं करते, इसलिए जहां भी संभव हो, वहां प्लेसहोल्डर से बचें. उदाहरण के लिए, वे पृष्ठ प्रकाशित न करें जिनके लिए आपके पास अभी तक वास्तविक सामग्री नहीं है. अगर आप प्लेसहोल्डर वाले पृष्ठ बनाते ही हैं, तो इन पृष्ठों को अनुक्रमित किए जाने से अवरोधित करने के लिए noindex मेटा टैग का उपयोग करें.

  • अपने सामग्री प्रबंधन सिस्टम को समझें: सुनिश्चित करें कि आप अपनी वेब साइट पर सामग्री प्रदर्शित किए जाने के तरीके से परिचित हैं. ब्लॉग, फ़ोरम और संबंधित सिस्टम अक्सर एकाधिक प्रारूपों में समान सामग्री को दिखाते हैं. उदाहरण के लिए, कोई ब्लॉग प्रविष्टि किसी ब्लॉग के मुखपृष्ठ, किसी संग्रह पृष्ठ और समान लेबल वाली अन्य प्रविष्टियों के किसी पृष्ठ में प्रकट हो सकती है.

  • समान सामग्री न्यूनतम करें: अगर आपके पास एक जैसे अनेक पृष्ठ हैं, तो कृपया प्रत्येक पृष्ठ को विस्तृत करने या पृष्ठों को एक ही पृष्ठ में संकुचित करें. उदाहरण के लिए, अगर आपके पास दो शहरों के लिए अलग-अलग पृष्ठों वाली कोई यात्रा साइट है, लेकिन दोनों पृष्ठों पर समान जानकारी है, तो या तो आप पृष्ठों को एक करके दोनों शहरों के बारे में एक पृष्ठ बना सकते हैं या आप प्रत्येक पृष्ठ में प्रत्येक शहर के बारे में अद्वितीय सामग्री शामिल करके उन्हें विस्तृत कर सकते हैं.

Google आपकी वेबसाइट पर प्रतिरूपित सामग्री के लिए क्रॉलर एक्सेस को robots.txt फ़ाइल के साथ या किसी अन्य विधि से अवरोधित करने का सुझाव नहीं देता. अगर खोज इंजन प्रतिरूपित सामग्री वाले पृष्ठों को क्रॉल नहीं कर सकते, तो वे अपने आप यह पता नहीं लगा सकते कि ये URL एक ही सामग्री को इंगित करते है और इसलिए उन्हें अलग, अद्वितीय पृष्ठों के रूप में माना जाएगा. एक बेहतर समाधान खोज इंजनों को इन URL को क्रॉल करने की अनुमति देना है, लेकिन rel="canonical" लिंक तत्व, URL पैरामीटर प्रबंधन टूल या 301 रीडायरेक्ट का उपयोग करके उन्हें प्रतिलिपि के रूप में चिह्नित करना है. ऐसे मामलों में जहां प्रतिरूपित सामग्री के कारण हम आपकी वेबसाइट को बहुत अधिक क्रॉल करते हैं, आप Search Console में क्रॉल दर सेटिंग एडजस्ट भी कर सकते हैं.

किसी साइट पर प्रतिरूपित सामग्री का होना उस साइट पर कार्रवाई करने का आधार तब तक नहीं होता जब तक यह न लगे कि प्रतिरूपित सामग्री का उद्देश्य भ्रामक और खोज इंजन के परिणामों में हेरफेर करना है. अगर आपकी साइट प्रतिरूपित सामग्री संबंधी समस्याओं से ग्रस्त है और आप ऊपर सूचीबद्ध सलाह का पालन नहीं करते हैं, तो हम अपने खोज परिणामों में दिखाने के लिए सामग्री का वर्शन चुनने का अच्छा कार्य करते हैं.

हालांकि, यदि हमारी समीक्षा यह इंगित करती है कि आप धोखाधड़ी वाले कार्यों में लिप्त हैं और आपकी साइट को हमारे खोज परिणामों से निकाल दिया गया है, तो अपनी साइट की सावधानी से समीक्षा करें. अगर आपकी साइट को हमारे खोज परिणामों से निकाल दिया गया है, तो और जानकारी के लिए हमारे वेबमास्टर दिशानिर्देशों देखें. जब आप अपने परिवर्तन कर लें और आश्वस्त हो जाएं कि आपकी साइट अब हमारे दिशानिर्देशों का उल्लंघन नहीं करती है, तो पुनर्विचार के लिए अपनी साइट सबमिट करें.

बहुत कम स्थितियों में, हमारा एल्गोरिदम आपकी अनुमति के किसी बिना बाहरी साइट से, जो आपकी सामग्री को होस्ट कर रही है, एक URL का चयन कर सकता है. अगर आपको लगता है कि कोई अन्य साइट कॉपीराइट कानून के उल्लंघन में आपकी सामग्री की प्रतिलिपि बना रही है, तो आप अनुरोध निष्कासन के लिए साइट के होस्ट से संपर्क कर सकते हैं. इसके अलावा, आप डिजिटल मिलेनियम कॉपीराइट एक्ट के अंतर्गत एक अनुरोध भरकर Google से हमारे खोज परिणामों से उल्लंघन करने वाले पृष्ठों को निकालने का अनुरोध कर सकते हैं.

क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?