ניהול ה-Sitemap

בנייה ושליחה של Sitemap

דף זה מתאר כיצד לבנות sitemap ולהפוך אותו לזמין ל-Google. מידע נוסף בנושא קובצי sitemap זמין כאן.

בנייה ושליחה של sitemap:

  1. עליכם להחליט אילו דפים באתר ייסרקו על ידי Google, ולקבוע את הגרסה הקנונית של כל דף.
  2. עליכם להחליט באיזה פורמט של Sitemap ברצונכם להשתמש. תוכלו ליצור את ה-sitemap באופן ידני או לבחור מבין מספר כלים של צד שלישי שייצרו את ה-Sitemap עבורכם.
  3. מוודאים שה-sitemap זמין ב-Google באמצעות הוספתו לקובץ ה-robots.txt או באמצעות שליחתו ישירות ל-Search Console.

פורמטים של sitemap

Google תומכת במספר פורמטים של sitemap, כמפורט למטה. Google מצפה לפרוטוקול הסטנדרטי של Sitemap בכל הפורמטים. Google אינה משתמשת בשלב זה במאפיין <priority> בקובצי sitemap.

בכל הפורמטים, קובץ sitemap יחיד מוגבל ל-MB‏ 50‎ (לא דחוס) ול-50,000 כתובות URL. אם הקובץ גדול יותר או מספר כתובות ה-URL גדול יותר, יש לפצל את הרשימה בין כמה קובצי sitemap. לחלופין, ניתן ליצור קובץ אינדקס של sitemaps (קובץ שמפנה לרשימה של sitemaps) ולשלוח את אותו קובץ האינדקס ל-Google. ניתן לשלוח ל-Google מספר Sitemaps ו/או קובצי אינדקס של Sitemaps.

XML

הנה דוגמה ל-sitemap בסיסי מאוד בפורמט XML, שכולל את המיקום של כתובת URL אחת:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

ניתן למצוא דוגמאות מורכבות יותר ותיעוד מלא בכתובת sitemaps.org.

ניתן לעיין בדוגמאות של קובצי sitemap המציינים דפים של שפות חלופיות וקובצי sitemap עבור קובצי חדשות, תמונה וסרטונים.

RSS,‏ mRSS ו-Atom 1.0

אם יש לך בלוג עם עדכון מסוג RSS או Atom, תוכל לשלוח את כתובת אתר העדכון כ-Sitemap. רוב התוכנות ליצירת בלוגים יכולות ליצור עבורכם פיד, אך חשוב לשים לב לכך שהפיד הזה מספק מידע על כתובות האתרים האחרונות בלבד.

  • Google מקבלת פידים מסוג RSS 2.0 ו-Atom 1.0.
  • תוכלו להשתמש בפיד RSS) mRSS של מדיה) כדי לספק ל-Google פרטים על תוכן הסרטונים באתר שלכם.
טקסט

אם ה-Sitemap שלך כולל כתובות אתרים של דפי אינטרנט בלבד, תוכל לספק ל-Google קובץ טקסט פשוט עם כתובת אתר אחת בכל שורה. לדוגמה:

http://www.example.com/file1.html
http://www.example.com/file2.html

הנחיות ל-Sitemaps של קובץ טקסט:

  • קודד את הקובץ באמצעות קידוד UTF-8.
  • קובץ הטקסט אינו אמור להכיל דבר מלבד הרשימה של כתובות האתר.
  • תוכל לתת לקובץ הטקסט כל שם שתרצה, כל עוד הוא בסיומת‎‎ ‎‏‏‎.txt (למשל, sitemap.txt).
Google Sites

אם האתר שלכם נוצר ואומת באמצעות Google Sites,‏ Google Sites ייצור עבורכם sitemap באופן אוטומטי. לא תוכלו לשנות את ה-sitemap, אבל תוכלו לשלוח אותו ל-Google אם תרצו לקרוא את הנתונים של דוח ה-sitemap. שימו לב, אם יש לכם יותר מ-1,000 דפים בספריית משנה אחת, ייתכן שה-sitemap לא יוצג כראוי.

  • אם האתר מתארח ב-Google Sites, כתובת ה-URL של ה-sitemap היאhttp://sites.google.com/site/yoursitename/system/feeds/sitemap
  • אם יצרתם את האתר באמצעות Google Apps, כתובת האתר של ה-sitemap היא http://sites.google.com/yourdomain/yoursitename/system/feeds/sitemap

תוספי sitemap לסוגי מדיה נוספים

Google תומכת בתחביר Sitemap מורחב עבור סוגי המדיה הבאים. השתמשו בהרחבות אלה כדי לתאר קובצי סרטונים, תמונות ותוכן אחר באתר שקשה לנתח, כדי לשפר את יצירת האינדקס.

הנחיות כלליות ל-sitemap

  • חשוב להשתמש בכתובות אתרים עקביות ומלאות. Google תסרוק את כתובות האתרים שלכם בדיוק כפי שהן רשומות. לדוגמה, אם כתובת האתר היא ‏https://www.example.com/‏, אין לציין כתובת אתר כ-‏https://example.com/‏ (ללא www) או כ-‏./mypage.html‏ (כתובת אתר יחסית).
  • ניתן לפרסם sitemap בכל מקום באתר, אבל ה-sitemap משפיע רק על צאצאים של ספריית-אב. לפיכך, קובץ sitemap שמפורסם בשורש האתר יכול להשפיע על כל הקבצים שבאתר, ושם אנחנו ממליצים לפרסם את קובצי ה-sitemap.
  • אין לכלול מזהי ביקור מכתובות URL ב-sitemap, כדי לצמצם סריקות כפולות של כתובות URL אלה.
  • מיידעים את Google בנוגע לגרסאות שפה חלופיות של כתובת URL באמצעות אנוטציות hreflang.
  • קובצי sitemap צריכים להיות בקידוד UTF-8, ולכלול כתובות URL שמסומנות בתו בריחה (escape) כראוי.
  • פיצול של קובצי sitemap גדולים לקובצי sitemap קטנים יותר: הגודל המקסימלי של sitemap הוא 50,000 כתובות URL‏/MB‏ 50 ללא דחיסה. משתמשים בקובץ אינדקס של sitemap‏ כדי לרשום את כל קובצי ה-sitemap הנפרדים ולשלוח את הקובץ היחיד הזה אל Google, במקום לשלוח מספר קובצי sitemap.
  • מפרטים רק כתובות URL קנוניות בקובצי ה-sitemap. אם יש לכם שתי גרסאות של דף, יש לפרט ב-sitemap רק את הגרסאות הקנוניות (שנבחרו על ידי Google). אם ישנן שתי גרסאות לאתר (לדוגמה, כתובת שמתחילה בקידומת www וגם ללא www), עליכם להחליט מהי כתובת האתר המועדפת, לשים בה את ה-sitemap, ולהוסיף rel=canonical או הפניות אוטומטיות באתר השני.
  • אם יש כתובות URL שונות לגרסאות לנייד ולמחשב של דף כלשהו, אנחנו ממליצים להפנות לגרסה אחת בלבד ב-sitemap. עם זאת, אם אתם חשים צורך להפנות לשתי כתובות ה-URL, צריך להוסיף הערה לכתובות ה-URL כדי לציין איזו מהן מיועדת לגרסה לנייד ואיזו למחשב.
  • משתמשים בתוספי sitemap כדי להפנות אל סוגי מדיה נוספים, כגון סרטונים, תמונות וחדשות.
  • אם יש לכם דפים חלופיים לשפות שונות או לאזורים שונים, ניתן להשתמש ב-hreflang ב-sitemap או בתגי HTML כדי לציין את כתובות ה-URL החלופיות.
  • תווים שאינם אלפאנומריים ושאינם לטיניים. אנחנו דורשים שהקידוד של קובץ ה-sitemap יהיה UTF-8 (בדרך כלל, אפשר לעשות זאת בעת שמירת הקובץ). בדומה לכל קובצי ה-XML, כל ערכי הנתונים (כולל כתובות אתרים) חייבים להשתמש בקודי entity escape לתווים המופיעים בטבלה הבאה. קובץ sitemap יכול להכיל תווי ASCII בלבד, ולא תווי ASCII עליונים, קודי בקרה מסוימים או תווים מיוחדים כגון * ו-{}. אם כתובת ה-URL של ה-sitemap כוללת את התווים האלה, תופיע הודעת שגיאה כשתנסו להוסיף אותה.
    תו קוד Escape
    אמפרסנד & &amp;
    גרש ' &apos;
    מירכאות כפולות " &quot;
    גדול מ- > &gt;
    קטן מ- < &lt;
    בנוסף, יש לקודד את כל כתובות ה-URL (לרבות כתובת ה-URL של ה-sitemap) כך ששרת האינטרנט שבו הן ממוקמות יוכל לקרוא אותן, וכתובת ה-URL שלהן צריכה להיות מסומנת בתו בריחה (escape). עם זאת, אם אתם משתמשים בסוג כלשהו של סקריפט, כלי או קובץ יומן כדי ליצור את כתובות האתרים (הכול פרט להקלדתן באופן ידני), בדרך כלל פעולה זו כבר נעשית עבורכם. אם לאחר שליחת ה-sitemap מתקבלת הודעת שגיאה המציינת ש-Google לא מצליחה למצוא חלק מכתובות ה-URL, יש לוודא שכתובות ה-URL שלכם עומדות בתקן RFC-3986 למזהי URI‏, בתקן RFC-3987 למזהי IRI ובתקן XML.

    הנה דוגמה לכתובת URL שבה נעשה שימוש בתו שאינו ASCII‏ (ü), וגם בתו שעבורו נדרש קוד entity escape (&):
    http://www.example.com/ümlat.html&q=name
    הנה אותה כתובת URL בקידוד ISO-8859-1 (לצורך אירוח בשרת שמשתמש בקידוד זה) ועם כתובת URL שמסומנת בתו בריחה (escape):
    http://www.example.com/%FCmlat.html&q=name
    הנה אותה כתובת URL בקידו UTF-8 (לצורך אירוח בשרת שמשתמש בקידוד זה) ועם כתובת URL שמסומנת בתו בריחה (escape):
    http://www.example.com/%C3%BCmlat.html&q=name
    הנה אותה כתובת URL בקידוד entity escape:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • זכרו שקובצי sitemap מהווים המלצה ל-Google שבה אתם מיידעים את Google אילו דפים חשובים לדעתכם. Google לא מתחייבת לסרוק את כל כתובות ה-URL המפורטות ב-sitemap.
  • Google מתעלמת מערכי<priority> ו-<changefreq>, לכן אין טעם להוסיף אותם
  • Google קוראת את הערך <lastmod> , אבל אם הערך הזה לא מוצדק, נפסיק לקרוא אותו.
  • אין חשיבות למיקום של כתובת URL ב-sitemap.‏ Google לא קוראת כתובות URL בסדר שבו הן מופיעות ב-sitemap.

איך להפוך את ה-sitemap לזמין ל-Google (שליחת ה-sitemap אל Google)

Google לא בודקת את קובץ ה-sitemap בכל פעם שאתר נסרק; קובץ ה-sitemap נבדק רק בפעם הראשונה שאנחנו מבחינים בו, ולאחר מכן, רק כשאתם שולחים לנו פינג כדי להודיע לנו שהוא השתנה. עליכם להתריע בפני Google בנוגע ל-sitemap רק כשהוא חדש או מעודכן; אין לשלוח קובצי sitemap או לשלוח פינג לגביהם כמה פעמים.

יש מספר דרכים שונות להפוך את ה-sitemap לזמין ל-Google:

  • לשלוח אותו ל-Google באמצעות הכלי לקובצי sitemap של Search Console
  • להכניס את השורה הבאה במקום כלשהו בקובץ robots.txt, כדי לציין את הנתיב אל קובץ ה-sitemap שלכם:
    Sitemap: http://example.com/sitemap_location.xml
  • להשתמש באפשרות "פינג" כדי לבקש שאנו נסרוק את ה-sitemap שלכם. לשלוח בקשת HTTP GET כמו זו:
      http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    לדוגמה:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

פתרון בעיות בקובצי sitemap

עיינו במדריך לפתרון בעיות בקובצי sitemap.

האם המידע הועיל?
איך נוכל לשפר את המאמר?