डुप्लिकेट लेखों का समाधान करना

Google समाचार में दिखाई देने वाली खबरें, पूरी तरह से कंप्‍यूटर एल्‍गोरिदम के ज़रिए तय की जाती हैं. अगर Google समाचार को एक ही खबर के कई वर्शन मिलते हैं तो, हमारे एल्‍गोरिदम को यह पहचानने में कठिनाई हो सकती है कि खबर का कौनसा वर्शन मूल है और कौनसा डुप्लिकेट.

किसी खबर का मूल वर्शन पता करने में समाचार साइटों से Google समाचार को 2 तरीकों से मदद मिल सकती है:

  • rel="canonical" मेटा टैग का इस्तेमाल करके
  • Google समाचार और Google सर्च के लिए उपयोगकर्ता-एजेंट को मंज़ूरी न देकर

rel="canonical" टैग का इस्तेमाल करना

अगर आप एक ही लेख को अपनी साइट के कई पेजों पर या साइटों के अपने नेटवर्क पर प्रकाशित करते हैं तो, आप rel="canonical" टैग का इस्तेमाल कर सकते हैं.

हमारे वेबमास्टर सहायता केंद्र में जाकर कैनॉनिकलाइज़ेशन के बारे में ज़्यादा जानें.

Googlebot-समाचार को मंज़ूरी न दें

अगर आप अपने लेख दूसरी समाचार साइटों को बाँटते हैं तो, आप यह पक्का करना चाहेंगे कि आपके लेखों का सिर्फ़ मूल वर्शन Google समाचार में दिखाई दे. ऐसा करने के लिए आप जिन पार्टनर साइटों को लेख बाँटते हैं, उन्हें रोबोट मेटा टैग का इस्तेमाल करना होगा. इससे Google समाचार आपके मूल लेख के पार्टनर वाले वर्शन इंडेक्स नहीं कर पाएगा.

उदाहरण के लिए, अगर The Example Times के संपादक यह पक्का करना चाहते हैं कि The Example Gazette की मंज़ूरी से मिले लेख जिन्हें वे इस्तेमाल कर रहे हैं, Google समाचार में शामिल न किए जाएं तो, वे उस लेख वाले पेज के HTML में नीचे दिया गया कोड जोड़ दें:

<meta name="Googlebot-News" content="noindex">

बाँटे गए लेख में ऊपर दिए गए मेटा टैग का इस्तेमाल करने पर, वह लेख Google समाचार के होम पेज, किसी विषय से जुड़े पेज या खबर से जुड़े पेज पर नहीं दिखाई देगा. बॉट को कुछ खास तरह की सामग्री एक्सेस करने से रोकने के बारे में ज़्यादा जानें.

Googlebot को मंज़ूरी न दें

Google समाचार और Google सर्च में बाँटी गई सामग्री दिखाने से रोकने के लिए, आपको यह साफ़ तौर पर बताना होगा कि Google का मुख्य उपयोगकर्ता-एजेंट, Googlebot आपकी सामग्री को इंडेक्स नहीं करता है.

उदाहरण के लिए, अगर The Example Times के संपादक The Example Gazette की खबर का बाँटा गया वर्शन खोज परिणामों में नहीं दिखाना चाहते हैं तो, वे ऊपर बताए गए कोड का इस्तेमाल करेंगे लेकिन नाम विशेषता में "Googlebot" का इस्तेमाल करेंगे:

<meta name="Googlebot" content="noindex">

बॉट को कुछ खास तरह की सामग्री एक्सेस करने से रोकने के बारे में ज़्यादा जानें.

क्या यह उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?