ניהול ה-Sitemap

בנייה ושליחה של Sitemap

דף זה מתאר כיצד לבנות sitemap ולהפוך אותו לזמין ל-Google. מידע נוסף בנושא קובצי sitemap זמין כאן.

בנייה ושליחה של sitemap:

  1. עליך להחליט אילו דפים באתר שלך ייסרקו על ידי Google, ולקבוע את הגרסה הקנונית של כל דף. 
  2. עליך להחליט באיזה פורמט של Sitemap ברצונך להשתמש. תוכל ליצור את ה-Sitemap באופן ידני או לבחור מבין מספר כלים של צד שלישי שייצרו את ה-Sitemap עבורך.
  3. מוודאים שה-sitemap זמין ב-Google באמצעות הוספתו לקובץ ה-robots.txt או באמצעות שליחתו ישירות ל-Search Console.

פורמטים של Sitemap

Google תומכת במספר פורמטים של Sitemap, כמפורט למטה. Google מצפה לפרוטוקול הסטנדרטי של Sitemap בכל הפורמטים. Google אינה משתמש בשלב זה במאפיין <priority> ב-Sitemaps.

‏בכל הפורמטים, Sitemap יחיד מוגבל ל-‏‎‏10‎ MB‎‏‎‎‏ (לא דחוס) ול-50,000 כתובות אתרים. אם הקובץ גדול יותר או מספר כתובות האתרים גדול יותר, יש לפצל את הרשימה בין כמה קובצי Sitemap. לחלופין, ניתן ליצור קובץ אינדקס של sitemaps (קובץ שמפנה לרשימה של sitemaps) ולשלוח את אותו קובץ האינדקס ל-Google. ניתן לשלוח ל-Google מספר Sitemaps ו/או קובצי אינדקס של Sitemaps.

XML

הנה דוגמה ל-Sitemap בסיסי מאוד בפורמט XML, שכולל את המיקום של כתובת אתר אחת:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

ניתן למצוא דוגמאות מורכבות יותר ותיעוד מלא בכתובת sitemaps.org.

ניתן לעיין בדוגמאות של קובצי Sitemap המציינים דפים של שפות חלופיות וקובצי Sitemap עבור קובצי חדשות, תמונה וסרטונים.

mRSS ,RSS ו-Atom 1.0

אם יש לך בלוג עם עדכון מסוג RSS או Atom, תוכל לשלוח את כתובת אתר העדכון כ-Sitemap. רוב התוכנות ליצירת בלוגים יכולות ליצור עבורכם פיד, אך חשוב לשים לב לכך שהפיד הזה מספק מידע על כתובות האתרים האחרונות בלבד.

  • Google מקבלת פידים מסוג RSS 2.0 ו-Atom 1.0.
  • תוכלו להשתמש בפיד RSS) mRSS של מדיה) כדי לספק ל-Google פרטים על תוכן הסרטונים באתר שלכם.
טקסט

אם ה-Sitemap שלך כולל כתובות אתרים של דפי אינטרנט בלבד, תוכל לספק ל-Google קובץ טקסט פשוט עם כתובת אתר אחת בכל שורה. לדוגמה:

http://www.example.com/file1.html
http://www.example.com/file2.html

הנחיות ל-Sitemaps של קובץ טקסט:

  • קודד את הקובץ באמצעות קידוד UTF-8.
  • קובץ הטקסט אינו אמור להכיל דבר מלבד הרשימה של כתובות האתר.
  • תוכל לתת לקובץ הטקסט כל שם שתרצה, כל עוד הוא בסיומת‎‎ ‎‏‏‎.txt (למשל, sitemap.txt).
Google sites

אם האתר שלך נוצר ואומת באמצעות Google Sites, Google Sites ייצור עבורך Sitemap באופן אוטומטי. לא תוכל לשנות את ה-Sitemap, אבל תוכל לשלוח אותו ל- Google אם תרצה לקרוא את הנתונים של דוח ה-Sitemap. שים לב, אם יש לך יותר מ-1,000 דפים בספריית משנה אחת, ייתכן שה-Sitemap לא יוצג כראוי.

  • אם האתר מתארח ב-Google Sites, כתובת ה-URL של ה-sitemap היא http://sites.google.com/site/yoursitename/system/feeds/sitemap
  • אם יצרתם את האתר באמצעות Google Apps, כתובת האתר של ה-Sitemap היא http://sites.google.com/yourdomain/yoursitename/system/feeds/sitemap

תוספי Sitemap לסוגי מדיה נוספים

Google תומכת בתחביר Sitemap מורחב עבור סוגי המדיה הבאים. השתמש בהרחבות אלה כדי לתאר קובצי סרטונים, תמונות ותוכן אחר באתר שקשה לנתח, כדי לשפר את יצירת האינדקס.

הנחיות כלליות ל-sitemap

  • חשוב להשתמש בכתובות אתרים עקביות ומלאות. Google תסרוק את כתובות האתרים שלכם בדיוק כפי שהן רשומות. לדוגמה, אם כתובת האתר היא https://www.example.com/, אין לציין כתובת אתר כ-https://example.com/ (ללא www) או כ-./mypage.html (כתובת אתר יחסית).
  • ניתן לפרסם sitemap בכל מקום באתר, אבל ה-sitemap משפיע רק על צאצאים של ספריית-אב. לפיכך, קובץ sitemap שמפורסם בשורש האתר יכול להשפיע על כל הקבצים שבאתר, ושם אנחנו ממליצים לפרסם את קובצי ה-sitemap.
  • אין לכלול מזהי ביקור מכתובות אתרים ב-Sitemap, כדי לצמצם סריקות כפולות של כתובות אתרים אלה.
  • מיידעים את Google בנוגע לגרסאות שפה חלופיות של כתובת URL באמצעות ביאורי hreflang.
  • קובצי Sitemap צריכים להיות בקידוד UTF-8, ולכלול כתובות URL שמסומנות בתו בריחה (escape) כראוי.
  • פיצול של קובצי sitemap גדולים לקובצי sitemap קטנים יותר: הגודל המקסימלי של sitemap הוא 50,000 כתובות URL‏/MB‏ 50 ללא דחיסה. משתמשים בקובץ אינדקס של Sitemap‏ כדי לרשום את כל קובצי ה-sitemap ולשלוח את הקובץ היחיד הזה אל Google, במקום לשלוח מספר קובצי sitemap.
  • מפרטים רק כתובות URL קנוניות בקובצי ה-sitemap. אם יש לכם שתי גרסאות של דף, יש לפרט ב-sitemap רק את הגרסאות הקנוניות (שנבחרו על ידי Google). אם ישנן שתי גרסאות לאתר (לדוגמה, כתובת שמתחילה בקידומת www וגם ללא www), עליכם להחליט מהי כתובת האתר המועדפת, לשים בה את ה-sitemap, ולהוסיף rel=canonical או הפניות אוטומטיות באתר השני.
  • אם יש כתובות URL שונות לגרסאות לנייד ולמחשב של דף כלשהו, אנחנו ממליצים להפנות לגרסה אחת בלבד ב-sitemap. עם זאת, אם אתם חשים צורך להפנות לשתי כתובות ה-URL, צריך להוסיף הערה לכתובות ה-URL כדי לציין איזו מהן מיועדת לגרסה לנייד ואיזו למחשב.
  • משתמשים בתוספי Sitemap כדי להפנות אל סוגי מדיה נוספים, כגון סרטונים, תמונות וחדשות.
  • אם יש לכם דפים חלופיים לשפות שונות או לאזורים שונים, ניתן להשתמש ב-hreflang ב-sitemap או בתגי HTML כדי לציין את כתובות ה-URL החלופיות.
  • תווים שאינם אלפאנומריים ושאינם לטיניים. אנחנו דורשים שהקידוד של קובץ ה-sitemap יהיה UTF-8 (בדרך כלל, אפשר לעשות זאת בעת שמירת הקובץ). בדומה לכל קובצי ה-XML, כל ערכי הנתונים (כולל כתובות אתרים) חייבים להשתמש בקודי entity escape לתווים המופיעים בטבלה הבאה.  sitemap יכול להכיל תווי ASCII בלבד, ולא תווי ASCII עליונים, קודי בקרה מסוימים או תווים מיוחדים כגון * ו-{}. אם כתובת האתר של sitemap כוללת את התווים האלה, תופיע הודעת שגיאה כשתנסו להוסיף אותה.
    תו קוד Escape
    אמפרסנד & &amp;
    גרש ' &apos;
    מירכאות כפולות " &quot;
    גדול מ- > &gt;
    קטן מ- < &lt;
    בנוסף, יש לקודד את כל כתובות האתרים (לרבות כתובת האתר של ה-sitemap) כך ששרת האינטרנט שבו הן ממוקמות יוכל לקרוא אותן, ועליהן להופיע עם קוד Escape בכתובת האתר. עם זאת, אם אתם משתמשים בסוג כלשהו של סקריפט, כלי או קובץ יומן כדי ליצור את כתובות האתרים (הכול פרט להקלדתן באופן ידני), בדרך כלל פעולה זו כבר נעשית עבורכם. אם לאחר שליחת ה-Sitemap מתקבלת הודעת שגיאה המציינת ש-Google לא מצליחה למצוא חלק מכתובות ה-URL, יש לוודא שכתובות ה-URL שלכם עומדות בתקן RFC-3986 למזהי URI‏, בתקן RFC-3987 למזהי IRI ובתקן XML.

    הנה דוגמה לכתובת אתר שמשתמשת בתו שאינו ASCII ‏(ü), ובתו שנדרש לו entity escape (&):
    http://www.example.com/ümlat.html&q=name
    הנה אותה כתובת, בקידוד ISO-8859-1 (לאירוח בשרת שמשתמש בקידוד הזה) וכתובת אתר עם קוד Escape:
    http://www.example.com/%FCmlat.html&q=name
    הנה אותה כתובת אתר, עם קידוד UTF-8 (לאירוח בשרת המשתמש בקידוד הזה) וכתובת אתר עם קוד Escape:
    http://www.example.com/%C3%BCmlat.html&q=name
    הנה אותה כתובת אתר, עם קוד Entity Escape:
    http://www.example.com/%C3%BCmlat.html&amp;q=name

איך להפוך את ה-Sitemap לזמין ל-Google (שליחת ה-Sitemap אל Google)

יש מספר דרכים שונות להפוך את ה-Sitemap לזמין ל-Google:

  • לשלוח אותו ל-Google באמצעות הכלי לקובצי Sitemap של Search Console
  • להכניס את השורה הבאה במקום כלשהו בקובץ robots.txt, כדי לציין את הנתיב אל ה-Sitemap שלכם:
    Sitemap: http://example.com/sitemap_location.xml
  • להשתמש באפשרות 'פינג' כדי לבקש שאנו נסרוק את ה-Sitemap שלכם. לשלוח בקשת GET של HTTP, כמו זו:
      http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    לדוגמה:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

פתרון בעיות בקובצי Sitemap

עיינו במדריך לפתרון בעיות sitemap.

האם המידע הועיל?
איך נוכל לשפר את המאמר?