सरल URL संरचना बनाए रखना

किसी साइट की URL संरचना यथासंभव सरल होनी चाहिए. अपनी सामग्री को इस तरह व्यवस्थित करने पर विचार करें कि URL तार्किक रूप से और इस ढंग से बनाए जाएं कि मनुष्यों के लिए सबसे सुबोध (यदि संभव हो, तो लंबी ID संख्याओं के बजाय पठनीय शब्द) हों. उदाहरण के लिए, अगर आप विमानन के बारे में जानकारी खोज रहे हैं, तो http://en.wikipedia.org/wiki/Aviation जैसा कोई URL आपकी यह निर्णय करने में सहायता करेगा कि उस लिंक पर क्लिक करना है या नहीं. http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1, जैसा कोई URL उपयोगकर्ताओं के लिए बहुत कम आकर्षक होता है.

अपने URL में विराम-चिह्न का उपयोग करने पर विचार करें. URL http://www.example.com/green-dress.html हमारे लिए http://www.example.com/greendress.html की तुलना में बहुत अधिक उपयोगी होगा. हम सुझाव देते हैं कि आप अपने URL में अंडरस्कोर (_) के बजाए हाइफ़न (-) का उपयोग करें.

अत्यधिक जटिल URL, विशेषकर वे जिनमें एकाधिक पैरामीटर होते हैं, वे अनावश्यक रूप से अत्यधिक संख्या में ऐसे URL बनाकर क्रॉलर्स के लिए समस्याएं उत्पन्न कर सकते हैं जो आपकी साइट पर मिलती-जुलती या समान सामग्री की ओर इशारा करते हैं. इसके परिणामस्वरूप, Googlebot आवश्यकता से अधिक बैंडविथ का उपयोग कर सकता है या आपकी साइट की सभी सामग्री को पूर्णतः अनुक्रमित करने में असमर्थ हो सकता है.

इस समस्या के सामान्य कारण

अनावश्यक रूप से अधिक संख्या में URL होने के कई कारण हो सकते हैं. इनमें शामिल हैं:

  • आइटमों के किसी सेट की योगात्मक फ़िल्टरिंग बहुत सी साइटें आइटम या खोज परिणामों के एक ही सेट के अलग-अलग दृश्य उपलब्ध कराती हैं, जहां वह अक्सर उपयोगकर्ताओं को निर्धारित मानदंड का उपयोग करके इस सेट को फ़िल्टर करने की अनुमति देती हैं. (उदाहरण के लिए: मुझे समुद्र-तट पर स्थित होटल दिखाएं). जब फ़िल्टर योगात्मक रूप से संयुक्त किए जा सकते हैं (उदाहरण के लिए: समुद्र-तट पर स्थित होटल और फिटनेस सेंटर के साथ), तो साइट में URL की संख्या (डेटा के दृश्य) अचानक बढ़ जाती है. बड़ी संख्या में होटलों की थोड़ी सी भिन्न सूचियां बनाना अनावश्यक है, क्योंकि Googlebot को केवल एक छोटी संख्या में सूचियां देखने की आवश्यकता होती है जिनसे वह प्रत्येक होटल के पृष्ठ पर पहुंच सकता है. उदाहरण के लिए:
    • "किफ़ायती दरों" पर होटल प्रॉपर्टी:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • समुद्र-तट पर "किफ़ायती दर" पर होटल प्रॉपर्टी:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • समुद्र-तट पर "किफ़ायती दरों" पर और फिटनेस सेंटर के साथ होटल प्रॉपर्टी:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • दस्तावेज़ों की गतिशील जेनरेशन. इसके परिणाम स्वरूप काउंटर, टाइमस्‍टैम्प या विज्ञापन संबंधी छोटे परिवर्तन हो सकते हैं.
  • URL में समस्याजनक पैरामीटर. उदाहरण के लिए सत्र ID बहुत ज़्यादा संख्या में प्रतिलिपिकरण और बड़ी संख्या में URL बना सकते हैं.
  • पैरामीटर क्रमबद्ध करना. कुछ बड़ी शॉपिंग साइटें समान आइटम को क्रमबद्ध करने के एकाधिक तरीके प्रदान करती हैं, जिसके परिणामस्वरूप काफी ज़्यादा संख्या में URL बन जाते हैं. उदाहरण के लिए:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
       &search_category=25
  • URL में अप्रासंगिक पैरामीटर, जैसे रेफ़रल पैरामीटर. उदाहरण के लिए:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
       OPD+Product+Page&cat=79
    http:// www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • कैलेंडर समस्याएं. गति‍शील रूप से बनाया गया कैलेंडर आरंभ या अंतिम दिनांक पर किसी प्रकार के प्रतिबंध के बिना भविष्य के या पिछले दिनांक के लिए लिंक जेनरेट कर सकता है. उदाहरण के लिए:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • टूटे संबंधित लिंक. टूटे संबंधित लिंक के कारण अक्सर अनंत स्थान उत्पन्न हो सकते हैं. यह समस्या बार-बार दोहराए गए पथ तत्वों के कारण उत्पन्न होती है. उदाहरण के लिए:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/
      category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
इस समस्या का समाधान करने के चरण

URL संरचना संबंधी संभावित समस्याओं से बचने के लिए, हम निम्नलिखित का सुझाव देते हैं:

  • समस्याजनक URL पर Googlebot की एक्सेस को अवरोधित करने के लिए robots.txt फ़ाइल का उपयोग करने पर विचार करें. आपको विशिष्ट रूप से गतिशील URL, जैसे खोज परिणाम जेनरेट करने वाले URL या अनंत स्थान बनाने वाले URL जैसे कैलेंडर को अवरोधित करने पर विचार करना चाहिए. अपनी robots.txt फ़ाइल में नियमित अभिव्यक्तियों का उपयोग करके आप आसानी से बड़ी संख्या में URL को अवरोधित कर सकते हैं.
  • जब भी संभव हो URL में सत्र ID का उपयोग करने से बचें. इसके बजाय कुकी के उपयोग पर विचार करें. अतिरिक्त जानकारी के लिए हमारे वेबमास्टर दिशानिर्देश देखें.
  • जब भी संभव हो, अनावश्यक पैरामीटर को हटाकर URL को छोटा करें.
  • यदि आपकी साइट में कोई असीमित कैलेंडर है, तो डायनामिक रूप से बनाए गए भविष्य के कैलेंडर पृष्ठ के लिंक में nofollow विशेषता जोड़ें.
  • टूटे संबंधित लिंक के लिए अपनी साइट देखें.
क्‍या यह लेख उपयोगी था?
हम उसे किस तरह बेहतर बना सकते हैं?