ניהול ה-Sitemap

דוח קובצי Sitemap

דוח קובצי ה-Sitemap משמש לשליחת Sitemap של הנכס, להצגת ההיסטוריה של קובצי Sitemap שנשלחו ולהצגת שגיאות שאותרו על ידי Google בניתוח קובצי ה-Sitemap שנשלחו.

לפתיחת דוח קובצי Sitemap

 

מהו Sitemap? האם הדוח הזה מיועד לי?

קובץ Sitemap נמצא באתר ומגדיר ל-Google את הדפים שעלינו להכיר. אם יש לכם אתר קטן (פחות מ-100 דפים), ייתכן שיהיה קל ופשוט יותר לשלוח בקשה להוסיף את דף הבית לאינדקס. אם בדף הבית יש קישורים לכל דפי האתר (או קישור לדף עם קישורים לכל הדפים, או קישור לדף עם קישור לדף עם קישורים לכל הדפים, וכן הלאה), כנראה האתר יתווסף לאינדקס. כאן ניתן למצוא מידע נוסף על קובצי Sitemap.

ניהול קובצי Sitemap

שליחת Sitemap

כדי לשלוח קובץ Sitemap חדש לצורך סריקת האתר:

  1. מפרסמים sitemap באתר. דרישות:
  2. חובה להחזיק בהרשאת בעלות באתר כדי לשלוח sitemap באמצעות כלי זה. אם אין לכם הרשאות בעלות, אפשר להוסיף הפניה בקובץ robots.txt במקום זאת.
  3. מזינים את כתובת ה-URL היחסית של ה-Sitemap בדוח קובצי ה-Sitemap ולוחצים על שליחה.
  4. בדרך כלל, ה-sitemap מעובד באופן מיידי. עם זאת, סריקת כתובות ה-URL הרשומות ב-sitemap עשויה להימשך זמן מה וייתכן שלא כולן ייסרקו. היקף הסריקה תלוי בגודל האתר, בפעילות המתבצעת בו, בתנועת המבקרים וכדומה.

שליחה חוזרת של Sitemap

אין צורך לשלוח שוב sitemap שכבר ידוע לנו, גם אם שיניתם אותו. בפעם הבאה שהאתר ייסרק על ידי Google, נבחין בכל השינויים.

מחיקת sitemap

מחיקת sitemap מסירה את הקובץ מדוח זה, אבל ה-sitemap וכל כתובות ה-URL הרשומות בו לא יימחקו מהנתונים של Google. אם זה הכרחי מבחינתכם ש-Google לא תיכנס יותר לכתובות ה-URL הרשומות ב-sitemap כלשהו, עליכם להשתמש בכלל של robots.txt.

כדי למחוק sitemap:

  1. בטבלה שבדוח קובצי ה-Sitemap הראשי, מאתרים את ה-sitemap שרוצים למחוק ולוחצים עליו.
  2. לוחצים על לחצן האפשרויות הנוספות עוד 
  3. לוחצים על הסרה של ה-sitemap.
  4. כדי למנוע מ-Google להמשיך להיכנס ל-sitemap, משתמשים בכלל robots.txt כדי לחסום את הקריאה על ידי Google, או מוחקים את קובץ ה-sitemap מהאתר שלכם.

קריאת הדוח

  • בדוח זה מוצגים רק קובצי sitemap ששלחתם באמצעות דוח זה. לא מוצגים בו קובצי sitemap שזוהו באמצעות הפניה בקובץ robots.txt או שיטות זיהוי אחרות. עם זאת, גם אם כבר זיהינו sitemap באמצעי אחר, עדיין ניתן לשלוח sitemap באמצעות דוח זה כדי לעקוב אחר שיעורי ההצלחה והשגיאות שלנו.
  • בדוח זה מוצגים רק קובצי sitemap שנמצאים בנכס הנוכחי.
  • ניתן לשלוח sitemap עם כתובות URL של תמונות, סרטונים או חדשות. אולם נכון לעכשיו, בדוח לא מוצגים נתונים על כתובות URL כאלה.

 

בכל sitemap מוצגים הפרטים הבאים:

כתובת ה-URL של ה-Sitemap
כתובת ה-URL שבה פורסם ה-sitemap, יחסית לבסיס הנכס.
סוג
סוג ה-sitemap. ערכים אפשריים:
נשלח
תאריך השליחה האחרון של ה-sitemap אל Google באמצעות דוח זה.
נקרא לאחרונה
העיבוד האחרון של ה-sitemap על ידי Google.
סטטוס
הסטטוס של השליחה או הסריקה. ערכים אפשריים:
  • הצלחה: ה-sitemap נטען ועובד בהצלחה ללא שגיאות. כל כתובות ה-URL ייכנסו לתור לסריקה.
  • יש שגיאות: ניתן לנתח את ה-sitemap אבל יש בו שגיאה אחת לפחות. כל כתובות ה-URL שניתן לפענח מה-sitemap ייכנסו לתור לסריקה. יש ללחוץ על ה-sitemap בטבלה כדי להציג את רשימת השגיאות. ניתן לראות תיאורים מלאים של השגיאות בהמשך.
  • לא ניתן לאחזור: מסיבה כלשהי לא ניתן היה לאחזר את ה-sitemap. כדי לראות מה הסיבה, ניתן להריץ ב-sitemap בדיקה של גרסה פעילה באמצעות הכלי לבדיקת כתובות URL:
    1. מציינים נתיב מלא ל-sitemap על ידי העתקת קידומת הנתיב מ"הוספת sitemap חדש", ומוסיפים את הנתיב היחסי של ה-sitemap שנשלח. לדוגמה: https://example.com/sitemaps/mobile/sitemap.txt. יש להשתמש בערכים שהועתקו מהדוח כדי להבטיח שכתובת ה-URL שתיבדק תהיה זו שמשמשת את Google.
    2. לוחצים על בדיקה של גרסה פעילה בכלי לבדיקת כתובות URL. כך תוכלו לדעת אם ה-sitemap קיים וניתן לאחזור על ידי Google.
כתובות ה-URL שזוהו
מספר כתובות ה-URL הרשומות ב-sitemap. אם מדובר באינדקס של sitemap, המספר מציין את המספר הכולל של כתובות ה-URL בכל קובצי הצאצאים של ה-sitemap. כתובות URL כפולות נספרות פעם אחת בלבד.
ייפתח דוח שמציג את סיכום הדפים הנכללים באינדקס של כל כתובות ה-URL ב-sitemap. אם מדובר באינדקס של sitemap, נכללות כל כתובות ה-URL הרשומות בכל קובצי הצאצאים של ה-sitemap.

 

למה ה-Sitemap שלי לא מופיע ברשימה?

אם ה-sitemap שלכם לא מופיע בדוח, יש לכך כמה סיבות אפשריות:

  • הוא פעיל בנכס אחר. קובצי sitemap שמשויכים לנכס מסוים אינם גלויים בנכס אחר. לכן, קובצי sitemap ששלחתם לאתר http://example.com לא יוצגו בדוח קובצי ה-Sitemaps של http://m.example.com או של https://example.com. כדי לפתור בעיה זו, צריך לוודא שהוספתם את כל הגרסאות של האתר.
  • לא שלחתם sitemap באמצעות דוח זה. רשומים רק קובצי sitemap שנשלחו באמצעות דוח זה. קובצי sitemap שנמצאו או נשלחו בשיטות אחרות לא יוצגו, גם אם Google יכולה לאתר אותם ולהשתמש בהם.

שגיאות Sitemap

הדוח של קובצי ה-Sitemap מכיל דיווח על השגיאות הבאות.

רשימת השגיאות המלאה

כתובות URL לא נגישות

Google נתקלה בשגיאה בניסיון לסרוק כתובת URL ב-sitemap. יש לבדוק את כתובת ה-URL ב-Sitemap באמצעות הכלי לבדיקת כתובות URL כדי לראות אם היא זמינה ל-Google.

אין מעקב אחר כתובות URL

Google לא הצליחה לסרוק את כל כתובות ה-URL שרשומות ב-sitemap. הנה כמה סיבות אפשריות לכך:

  • כתובת ה-URL מכילה יותר מדי הפניות לכתובות אחרות וסורקי האינטרנט של Google לא יכולים לסרוק את כולן. אנחנו מציעים להחליף כל הפניה לכתובת אחרת ב-sitemap בכתובת URL שיש לסרוק בפועל.
    • אם יש הפניה קבועה מדף מסוים לדף אחר, יש להשתמש בהפניה קבועה לכתובת אחרת.
    • יש להימנע משימוש בהפניות מסוג JavaScript או meta-refresh לכתובות אחרות.
  • ל-Google יש בעיות עם כתובות URL יחסיות ב-sitemap. כשאפשר, כדאי להשתמש בקישורים מוחלטים או מלאים במקום בקישורים יחסיים. למשל, כדי לקשר לדף אחר באתר, יש לקשר אל https://www.example.com/mypage.html במקום רק אל mypage.html.

כתובת ה-URL אינה מותרת

ה-Sitemap כולל כמה כתובות URL ברמה גבוהה יותר, או בדומיין שונה, מאלו של קובץ ה-Sitemap.

רמה גבוהה יותר: אם ה-Sitemap רשום תחת http://www.example.com/mysite/Sitemap.xml, כתובות האתר הבאות אינן חוקיות עבור אותו Sitemap:

  • http://www.example.com/‎ – רמה גבוהה יותר מה-sitemap
  • http://www.example.com/yoursite/‎ – בספריית אחות של ה-sitemap (עליכם לעלות רמה ולאחר מכן לרדת כדי להגיע לשם).

דומיין שונה: חשוב לבדוק שכל כתובות ה-URL מתחילות בדומיין זהה לזה של מיקום ה-sitemap. לדוגמה, אם ה-Sitemap נמצא ב-http://www.example.com/Sitemap.xml, כתובות ה-URL הבאות אינן חוקיות עבור אותו Sitemap:

  • /http://example.com – חסר "www"
  • /www.example.com – חסר "http"
  • /https://www.example.com – שימוש ב-"https" במקום ב-"http"

שגיאת דחיסה

Google נתקלה בשגיאה בניסיון לבטל את הדחיסה של ה-Sitemap הדחוס. יש לדחוס מחדש את ה-Sitemap (באמצעות כלי כגון gzip), להעלות אותו לאתר ולשלוח מחדש.

Sitemap ריק

ה-sitemap לא מכיל כתובות URL. יש לבדוק את ה-sitemap ולוודא שהוא לא ריק.

שגיאת גודל של קובץ Sitemap: ה-Sitemap חורג מהמגבלה המקסימלית של גודל קובץ

ה-Sitemap שלכם גדול מ-50MB כשאינו דחוס. אם גודלו של ה-Sitemap חורג מהמגבלה, צריך לפצל אותו למספר קובצי Sitemap קטנים יותר, לרשום אותם בקובץ אינדקס של קובצי Sitemap ולשלוח את קובץ האינדקס של קובצי ה-Sitemap.

ערך מאפיין לא חוקי

הקציתם ערך לא חוקי למאפיין תג XML. כדאי לבדוק את קובצי ה-Sitemap כדי לוודא שרק המאפיינים המותרים נמצאים, ושאתם מקצים רק ערכים מותרים על פי המפרט לקובצי Sitemap. כדאי לוודא גם שאין שגיאות הקלדה במאפיינים ובערכים.

תאריך לא חוקי

ה-Sitemap מכיל תאריך אחד או יותר שאינם חוקיים. הסיבה לכך עשויה להיות פורמט שגוי של תאריך, או שהתאריך עצמו אינו חוקי. בכתיבת תאריכים יש להשתמש בקידוד תאריך ושעה של W3C, אולם ניתן להשמיט את מרכיב השעה. יש לוודא שהתאריכים תואמים לאחד מהפורמטים הבאים של תאריך ושעה של W3C:

2005-02-21 
2005-02-21T18:00:15+00:00

ציון השעה אינו חובה (ברירת מחדל לציון השעה היא 00:00:00Z), אך אם מציינים שעה, חובה לציין גם אזור זמן.

ערך תג לא חוקי

ה-Sitemap מכיל תג אחד או יותר עם ערך לא חוקי. יש לבדוק את המפרטים לסוג ה-Sitemap (אינדקס, סטנדרטי, סרטונים וכן הלאה).

כתובת URL לא חוקית

ישנה כתובת URL לא חוקית ב-Sitemap. הסיבה לשגיאה זו יכולה להיות שהכתובת כוללת תווים שאינם נתמכים, רווחים או תווים אחרים כגון מירכאות, או שהפורמט שלה שגוי (לדוגמה, htp://‎ במקום http://‎ ).

יש לוודא שכתובות ה-URL המפורטות ב-Sitemap שלכם מקודדות באופן קריא וכוללות תווי Escape כראוי. יש לוודא גם שאין תווים שגויים כגון רווחים או מירכאות. כמו כן, אפשר לנסות ולהעתיק את כתובת ה-URL לדפדפן, כדי לבדוק אם הדפדפן מזהה את הכתובת וטוען את הדף.

כתובת URL לא חוקית בקובץ אינדקס של קובצי Sitemap: כתובת URL חלקית

קובץ האינדקס של קובצי ה-Sitemap לא כולל את כתובת ה-URL המלאה של כל קובץ Sitemap שהוא מפרט. כשאנחנו רואים קובץ אינדקס של קובצי Sitemap, אנחנו מחפשים באותה ספרייה את הקבצים שהוא מפנה אליהם. למשל, אם קובץ האינדקס של ה-sitemap הוא http://www.example.com/folder1/sitemap_index.xml ורשום בו sitemap בשם sitemap.xml (ללא התו / בהתחלה), נחפש את ה-sitemap בכתובת http://www.example.com/folder1/sitemap.xml. אם לא נמצא אותו שם, תוצג לכם השגיאה הזו.

יש לעדכן את קובץ האינדקס של קובצי ה-Sitemap כך שיכלול את הנתיב המלא לכל Sitemap המפורט בו, ולאחר מכן לשלוח אותו מחדש.

XML לא חוקי: תגים רבים מדי

ה-Sitemap מכיל תגים כפולים. לדוגמה, הרשומה הבאה תגרום לשגיאה זו משום שהתג <loc> מופיע פעמיים:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/page1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

השגיאה מפרטת את התג הבעייתי ואת מספר השורה. יש להסיר את התג הכפול ולשלוח מחדש את ה-Sitemap.

מאפיין XML חסר

באחד מהתגים ב-Sitemap חסר מאפיין נדרש. כדאי לבדוק את קובצי ה-Sitemap כדי לוודא שהמאפיינים הנדרשים לא חסרים בהם. לאחר שמתקנים את ערכי המאפיינים, אפשר לשלוח את ה-Sitemap מחדש.

תג XML חסר

ברשומה אחת או יותר ב-Sitemap חסר תג נדרש. הודעת השגיאה מציינת את מספר השורה. אפשר לעיין בדף היסודות של קובצי Sitemap לקבלת מידע על התגים הדרושים.

חסרה כתובת URL של תמונה ממוזערת

חסרה כתובת URL של תמונה ממוזערת ברשומת סרטון אחת או יותר. כדאי לוודא שהמיקום של כתובות ה-URL של כל התמונות הממוזערות מצוין באמצעות התג <video:thumbnail_loc>.

חסרה כותרת סרטון

חסרה כותרת ברשומת סרטון אחת או יותר. כדאי לוודא שלכל סרטון ב-Sitemap יש כותרת המצוינת בתג <video:title>

פורמט שגוי של קובץ אינדקס של קובצי Sitemap: אינדקסים מקוננים של קובצי Sitemap

אחד או יותר מהערכים בקובץ האינדקס של קובצי ה-Sitemap משתמשים בכתובת URL משלהם, או בכתובת ה-URL של קובץ אינדקס אחר של קובצי Sitemap. קובץ אינדקס של קובצי Sitemap אינו יכול לכלול קובצי אינדקס אחרים של קובצי Sitemap, אלא רק קובצי Sitemap.

יש להסיר את כל הרשומות המפנות לקובצי אינדקס של קובצי Sitemap, ולאחר מכן לשלוח את ה-Sitemap מחדש.

שגיאת ניתוח

Google לא הצליחה לנתח את ה-XML של ה-Sitemap.

לעיתים קרובות, בעיה זו נגרמת על ידי תו ללא תו Escape המופיע בכתובת ה-URL. כמו בכל קובצי ה-XML, כל ערכי הנתונים (כולל כתובות URL) חייבים להשתמש בתווי Escape לפני תווים מסוימים, כגון הסמלים & ' " < >. כדאי לוודא שכתובות ה-URL מקודדות בקודי Escape כראוי.

שגיאה זמנית

המערכת שלנו נתקלה בבעיה זמנית שמנעה את עיבוד ה-Sitemap. בדרך כלל, כאשר שגיאה זו מופיעה, אין צורך לשלוח את ה-Sitemap מחדש. Google יכולה לנסות לאחזר את ה-Sitemap שוב במועד מאוחר יותר. אם השגיאה עדיין קיימת לאחר מספר שעות, כדאי לשלוח שוב את ה-Sitemap.

קובצי Sitemap רבים מדי בקובץ אינדקס של קובצי Sitemap

קובץ האינדקס של קובצי ה-Sitemap מפרט יותר מ-50,000 קובצי Sitemap. יש לפצל את קובץ האינדקס של קובצי ה-Sitemap לכמה קובצי אינדקס של קובצי Sitemap, ולוודא שאף אחד מהם לא מפרט יותר מ-50,000 קובצי Sitemap.

יותר מדי כתובות URL ב-Sitemap

ב-sitemap מפורטות יותר מ-50,000 כתובות URL. יש לפצל את ה-sitemap למספר קובצי sitemap, ולוודא שכל אחד מהם מכיל 50,000 כתובות URL לכל היותר. אפשר להשתמש גם בקובץ אינדקס של קובצי Sitemap כדי לנהל את קובצי ה-sitemap.

פורמט שאינו נתמך

הפורמט של ה-Sitemap אינו נתמך.

הנה כמה שגיאות XML נפוצות:

  • ה-Sitemap חייב להשתמש בכותרת הנכונה. לדוגמה, אם ה-Sitemap מכיל מידע על סרטונים, יש לכתוב את ה-header הבא:
    <?‎xml version="1.0" encoding="UTF-8"?‎>
    <urlset xmlns="http://www.Sitemaps.org/schemas/Sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/Sitemap-video/1.1">
  • מרחב השמות בכותרת חייב להיות "http://www.Sitemaps.org/schemas/Sitemap/0.9" (ולא ‎.9).
  • כל מאפייני ה-XML ​​חייבים להופיע בתוך מירכאות יחידות (') או מירכאות כפולות ("), והמירכאות חייבות להיות ישרות ולא מסולסלות. תוכנות עיבוד תמלילים כמו Microsoft Word עלולות להוסיף מירכאות מסולסלות.

חוסר התאמה של נתיב: ללא www

הנתיב המפנה ל-Sitemap אינו מכיל את התחילית www (לדוגמה: http://example.com/sitemap.xml), אולם כתובות ה-URL שהוא מפרט כוללות אותה (לדוגמה: http://www.example.com/myfile.html.

אפשר לשנות את ה-Sitemap כך שהתחילית www תוסר מכל כתובות ה-URL בהתאם למיקום ה-Sitemap.

חוסר התאמה של נתיב: עם www

הנתיב המפנה ל-Sitemap כולל את התחילית www (לדוגמה: http://www.example.com/sitemap.xml), אולם כתובות ה-URL שהוא מפרט אינן כוללות אותה (לדוגמה: http://example.com/myfile.xml).

אפשר לשנות את ה-Sitemap כך שהתחילית www תתווסף לכל כתובות ה-URL בהתאם למיקום ה-Sitemap.

מרחב שמות שגוי

רכיב הבסיס של ה-Sitemap אינו כולל את מרחב השמות הנכון, או שמרחב השמות מוצהר באופן שגוי, או שיש בו שגיאת הקלדה או כתובת URL שגויה.

חשוב להקפיד להשתמש במרחב השמות הנכון לסוג הקובץ. לדוגמה:

  • קובץ sitemap‏: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • קובץ sitemap‏ של סרטונים: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • קובץ אינדקס של קובצי sitemap‏: ‎<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">‎
  • סוגים אחרים של קובצי sitemap

רווח מוביל

ה-Sitemap מתחיל ברווח, במקום בהצהרת מרחב שמות. קובצי XML חייבים להתחיל בהצהרת XML המציינת את גרסת ה-XML הנמצאת בשימוש.

שגיאה זו לא תמנע מ-Google לעבד את ה-Sitemap, אולם כדאי להסיר את הרווח כדי שהקובץ יתאים לתקן ה-XML ושגיאה זו תפסיק להופיע.

שגיאת HTTP [קוד ספציפי]

Google נתקלה בשגיאת HTTP במהלך הניסיון להוריד את ה-Sitemap. הודעה זו מציגה את קוד הסטטוס שקיבלנו (לדוגמה, 404). כדאי לוודא שכתובת ה-URL של ה-Sitemap שציינתם נכונה ושה-Sitemap קיים במיקום זה. לאחר מכן, אפשר לשלוח את ה-Sitemap מחדש.

התמונה הממוזערת גדולה מדי

התמונה הממוזערת של הסרטון שצוינה ב-Sitemap גדולה מדי. יש לשנות את הגודל של התמונה הממוזערת של הסרטון ל-‎160x120 פיקסלים. יש לעדכן את ה-Sitemap במידע החדש ולאחר מכן לשלוח אותו מחדש. לרשותכם מידע נוסף על הוספת פרטי סרטונים ל-sitemap.

התמונה הממוזערת קטנה מדי

התמונה הממוזערת של הסרטון שצוינה ב-Sitemap קטנה מדי. יש לשנות את הגודל של התמונה הממוזערת של הסרטון ל-‎160x120 פיקסלים. יש לעדכן את ה-Sitemap במידת הצורך. לרשותכם מידע נוסף על הוספת פרטי סרטונים ל-sitemap.

מיקום הסרטון ומיקום דף ההפעלה זהים

ב-sitemap של סרטון, כתובת ה-URL של תוכן הסרטון לא יכולה להיות זהה לכתובת ה-URL של הנגן. אם מוסיפים לשתיהן <video:player_loc> ו-<video:content_loc>, כתובות ה-URL חייבות להיות שונות. לרשותכם מידע נוסף על הוספת פרטי סרטונים ל-sitemap.

נראה שכתובת ה-URL של מיקום הסרטון היא כתובת של דף הפעלה

ב-Sitemap של סרטונים, כתובת ה-URL של <video:content_loc> מפנה לדף המארח את הנגן. לרשותכם מידע נוסף על הוספת פרטי סרטונים ל-sitemap.

ה-Sitemap מכיל כתובות URL שחסומות על ידי robots.txt

ל-Google אין גישה ל-sitemap, או שאין לה גישה לכל התוכן שרשום ב-sitemap, כיוון שהוא חסום על ידי robots.txt. יש להשתמש בכלי לבדיקת כתובות URL כדי לאתר את הקובץ החסום, ולשנות את קובץ ה-robots.txt כך של-Googlebot תהיה גישה לקובץ החסום.

האם המידע הועיל?
איך נוכל לשפר את המאמר?