ניהול קובצי Sitemap באמצעות דוח קובצי Sitemap

דוח קובצי ה-Sitemap משמש לצורך דיווח ל-Google על קובצי Sitemap חדשים שנוספו לנכס, להצגת ההיסטוריה של קובצי Sitemap שנשלחו ולהצגת שגיאות שאותרו על ידי Google בניתוח קובצי ה-Sitemap שנשלחו.

פתיחה של דוח קובצי Sitemap

 

מהו sitemap? האם הדוח הזה נחוץ לי?

Sitemap הוא קובץ שנמצא באתר ומגדיר את הדפים ש-Google צריכה להכיר באתר הזה.

  • אם אתם משתמשים בשירות אירוח באינטרנט, כמו Squarespace או Wix, סביר להניח שה-sitemap מנוהל בשבילכם במסגרת השירות, ובמקרה כזה לא תצטרכו ליצור sitemap משלכם או להשתמש בדוח הזה. ניתן לחפש מידע על קובצי sitemap דרך ספק האירוח.
  • אם יש לכם אתר קטן (פחות מ-100 דפים) וניתן להגיע לכל דף בו על ידי לחיצה על קישור אחד או יותר מדף הבית, אין צורך ב-sitemap או בדוח הזה. במקרה כזה, אפשר פשוט לבקש להוסיף את דף הבית לאינדקס (אלא אם משתמשים בשירות אירוח באינטרנט, כפי שצוין קודם, ובמקרה כזה לא צריך לעשות כלום).

למידע נוסף בנושא קובצי Sitemap

ניהול של קובצי ה-Sitemap

Sitemaps API
תוכלו לנהל את קובצי ה-Sitemap גם באמצעות Search Console Sitemaps API. ה-API מספק את כל הפונקציונליות והמידע שמופיעים בדוח הזה.
שליחת sitemap
"שליחת" sitemap היא בעצם דיווח ל-Google על מיקום הקובץ באתר שלכם. לא ניתן באמת להעלות sitemap ל-Google.

כדי לשלוח Sitemap חדש לצורך סריקת האתר:

  1. כדי שתוכלו לשלוח sitemap באמצעות דוח קובצי Sitemap, דרושות לכם הרשאות בעלים בנכס. אם אין לכם הרשאות בעלים, אתם יכולים לציין את ה-sitemap בקובץ robots.txt במקום לשלוח אותו באמצעות הדוח הזה.
  2. מפרסמים את ה-sitemap באתר.
    • ה-sitemap צריך להיות בנוי לפי אחת מתבניות ה-sitemap המקובלות. יש לפעול בהתאם להנחיות ל-sitemap בנוגע לתחביר, למיקום הקובץ וכן הלאה.
    • מומלץ לשים sitemap ברמה הבסיסית של האתר (root). עם זאת, אם אתם משתמשים בשירות של אירוח אתרים (כמו Blogger,‏ Wix או GoDaddy), עליכם לקרוא את התיעוד של השירות כדי להבין איך ואיפה לפרסם את ה-sitemap (או אם זה נדרש בכלל).
    • אפשר להשתמש במחולל קובצי Sitemap ב-XML כדי ליצור sitemap ולבדוק בו שגיאות תחביר.
  3. מוודאים שה-sitemap זמין ל-Google. ה-sitemap צריך להיות נגיש ל-Googlebot ואין לחסום אותו באמצעות דרישות התחברות. כדי לבדוק אם ה-sitemap נגיש ל-Googlebot, מריצים בדיקה של כתובת ה-URL הפעילה ובודקים שאחזור הדף בוצע בהצלחה.
  4. פותחים את דוח קובצי ה-Sitemap, מעתיקים את כתובת ה-URL שבדקתם בשלב 3 ומדביקים אותה בתיבה הוספת sitemap חדש בדוח קובצי ה-Sitemap. לאחר מכן לוחצים על שליחה.
  5. ה-sitemap בדרך כלל מאוחזר באופן מיידי. עם זאת, סריקת כתובות ה-URL שמופיעות ב-sitemap עשויה להימשך זמן מה ויכול להיות שלא כולן ייסרקו. היקף הסריקה תלוי בגודל האתר, בפעילות המתבצעת בו, בתנועת הגולשים וכן הלאה.
  6. אם סטטוס ה-sitemap הוא לא הצלחה, לוחצים על השורה בדוח כדי לראות פרטים על הכשל וקוראים את המידע שמופיע בהמשך על השגיאות.

כדאי לחזור ולבדוק מדי פעם כדי לוודא ש-Google יכולה לאחזר ולעבד את קובצי ה-Sitemap.

שליחה חוזרת של Sitemap

אם Sitemap נסרק בהצלחה, Google תסרוק את ה-Sitemap מחדש מדי פעם בקצב שלא קשור לסריקת האתר הרגילה.
אם עורכים שינויים גדולים ב-Sitemap, מומלץ לשלוח אותו מחדש באמצעות בקשה חדשה. אם ה-Sitemap לא כולל עדכונים קריטיים שצריכים לעבור עיבוד באופן מיידי, כדאי לאפשר ל-Google לפעול בהתאם לתזמון הסריקה הרגיל.
אם אחזור של Sitemap נכשל בבקשה הראשונה או אחרי סריקה חוזרת מתוזמנת בשלב מאוחר יותר, Google תנסה שוב במשך כמה ימים ותפסיק אם ה-Sitemap עדיין לא יהיה זמין או שיהיו בו שגיאות קריטיות. במקרה כזה, צריך לפתור את הבעיה ולשלוח מחדש את ה-Sitemap באמצעות בקשה חדשה. הסטטוס של הסריקה האחרונה בכל בקשה מוצג בדוח.

מחיקת Sitemap

מחיקת Sitemap תגרום להסרה שלו מהדוח הזה, אבל Google לא תמחק מהמערכת את ה-Sitemap או את כתובות ה-URL הרשומות בו. אם רוצים ש-Google לא תיכנס יותר לכתובות ה-URL הרשומות ב-Sitemap מסוים, צריך להשתמש בכלל robots.txt.

כדי למחוק Sitemap מהדוח:

  1. בטבלה שבדוח קובצי ה-Sitemap הראשי, מאתרים את ה-Sitemap שרוצים למחוק ולוחצים עליו.
  2. בדף הפרטים של ה-sitemap, לוחצים על לחצן האפשרויות הנוספות אפשרויות נוספות.
  3. לוחצים על הסרה של ה-Sitemap.
  4. כדי למנוע מ-Google להמשיך להיכנס ל-Sitemap או לכל כתובת URL שרשומה בו, אפשר להשתמש באחת מהשיטות הבאות לכתובת ה-URL של ה-Sitemap או של הדף:

תזמון סריקה של sitemap

Google תנסה לסרוק Sitemap מיד אחרי השליחה. אם הבקשה תתבצע בהצלחה, Google תמשיך לסרוק מחדש את ה-Sitemap בקצב שלא קשור לתזמון סריקת האתר.

אם ניתוח או אחזור של Sitemap נכשל, Google תמשיך לנסות לאחזר ולעבד את ה-Sitemap במשך מספר ימים. אם הניסיונות עדיין לא יצליחו, Google תפסיק לנסות לסרוק את כתובת ה-URL הזו. בעיות שמשפיעות על כתובות URL מסוימות ב-sitemap לא ימנעו מ-Google להמשיך לקרוא את ה-sitemap, כל עוד ניתן לאחזר ולקרוא אותו באופן כללי.

קריאת הדוח

  1. בדף של דוח קובצי ה-Sitemap ברמה העליונה, ניתן לראות את סטטוס הבקשות של Google לכל קובצי ה-Sitemap שנשלחו באמצעות הדוח הזה או ה-API. בדוח מוצג הסטטוס של הבקשה האחרונה לכל sitemap. לכל sitemap יהיה אחד מהערכים הבאים, וזהו הסטטוס של הבקשה האחרונה:
    1. הצלחה: ה-sitemap אוחזר ונקרא ללא שגיאות.
    2. לא ניתן היה לאחזר: Google לא הצליחה לאחזר את ה-sitemap.
    3. ב-sitemap נמצאו X שגיאות: ניתן היה לאחזר את ה-sitemap ולקרוא אותו באופן חלקי, אבל אירעו כמה שגיאות.
  2. תוכלו ללחוץ על sitemap ספציפי כדי לראות דף פרטים שבו מידע על ה-sitemap ועל הבקשה.
    • אם בדף הפרטים מופיע הכיתוב לא ניתן היה לקרוא את ה-sitemap, האחזור נכשל מאחת הסיבות האלה כפי שרואים בדף הפרטים. כדי לראות פרטים נוספים, מרחיבים את הקטע שמתחת לשגיאה. נסו לפתור את הבעיה ושלחו מחדש את ה-sitemap לדוח. אם אחזור של sitemap נכשל, Google תנסה עוד כמה פעמים אבל בסופו של דבר תפסיק לנסות לקרוא את אותו sitemap.
    • אם בדף הפרטים מופיע הכיתוב ניתן לקרוא את ה-sitemap, אבל יש בו שגיאות, תופיע רשימה של שגיאות בדף הפרטים של ה-sitemap. כדי לראות פרטים נוספים על השגיאה, מרחיבים את הקטע שמתחת לשגיאה. כאן אפשר לקבל מידע נוסף על השגיאות האלה ולגלות איך לפתור אותן.

חשוב:

  • בדוח הזה מוצגים רק קובצי Sitemap שנשלחו באמצעות הדוח או באמצעות ה-API. לא מוצגים בו קובצי Sitemap שזוהו באמצעות הפניה בקובץ robots.txt או שיטות זיהוי אחרות. עם זאת, גם אם Google כבר זיהתה Sitemap באמצעי אחר, עדיין ניתן לשלוח אותו באמצעות הדוח הזה ולעקוב אחר שיעורי ההצלחה והשגיאות שלנו.
  • בדוח הזה מוצגים רק קובצי Sitemap שנמצאים בנכס הנוכחי. אם ה-sitemap שציפיתם לראות לא מוצג, כדאי לוודא שאתם לא מבלבלים בין נכסים של http ו-https, או בין נכסים של www ונכסים שאינם www.
  • אם לא ניתן לאחזר sitemap לאחר מספר ניסיונות, בסופו של דבר Google תפסיק לנסות לקרוא אותו. עליכם לתקן את השגיאות ולשלוח מחדש את ה-sitemap.
  • אם Google הצליחה לקרוא sitemap, היא שומרת את המידע הזה. כשל או הצלחה בקריאת sitemap במועד מאוחר יותר לא יובילו למחיקת המידע מהקריאות הקודמות ב-Google. עם זאת, מידע חדש על כתובת URL מסוימת יחליף מידע ישן יותר לגבי אותה כתובת URL.
  • ניתן לשלוח ב-Sitemap כתובות URL של תמונות, של סרטונים או של חדשות. עם זאת, נתונים על כתובות URL כאלה לא מוצגים בדוח בשלב הזה.
  • בדוח יכולות להופיע עד 1,000 בקשות שנשלחו. אפשר לשלוח יותר בקשות, אבל רק 1,000 יוצגו כאן (והן לא מוצגות לפי סדר השליחה). אין כרגע אפשרות לראות את הבקשות הנוספות ב-Search Console.

 

לכל sitemap מוצגים הפרטים הבאים:

כתובת ה-URL של ה-Sitemap
כתובת ה-URL המדויקת שצוינה בזמן שליחת ה-Sitemap. אין מעקב אחר הפניות אוטומטיות. רק קובצי Sitemap שנשלחו באמצעות הדוח הזה או באמצעות ה-API מוצגים כאן.
סוג
סוג ה-sitemap. ערכים אפשריים:
נשלח
תאריך השליחה האחרון של ה-sitemap אל Google באמצעות הדוח הזה.
נקרא לאחרונה
האחזור האחרון של ה-Sitemap על ידי Google. מוצג רק אם Google הצליחה לאחזר את ה-Sitemap.
סטטוס
הסטטוס של הסריקה האחרונה. ערכים אפשריים:
  • הצלחה: ה-sitemap נטען ועבר עיבוד בהצלחה ללא שגיאות. כל כתובות ה-URL ממתינות לסריקה.
  • יש שגיאות: ניתן היה לאחזר את ה-sitemap, אבל יש בו שגיאה אחת לפחות. כל כתובות ה-URL שניתן היה לנתח מה-sitemap ללא שגיאות ייכנסו לתור לסריקה. אפשר ללחוץ על ה-sitemap שבטבלה כדי להציג את רשימת השגיאות עם פרטים נוספים. תיאורים מלאים של השגיאות בניתוח מופיעים בהמשך
  • לא ניתן לאחזור: מסיבה כלשהי לא ניתן היה לאחזר את ה-sitemap. כך מתקנים שגיאות באחזור
דפים שהתגלו
מספר כתובות ה-URL של דפים שנותחו מה-sitemap. אם מדובר באינדקס של sitemap, המספר מציין את המספר הכולל של כתובות ה-URL בכל קובצי הצאצאים של ה-sitemap. כתובות URL כפולות נספרות רק פעם אחת. אנחנו לא מבטיחים שכתובת URL של דף שהתגלתה ב-sitemap נסרקה או נוספה לאינדקס, או תיסרק או תתווסף לאינדקס, על ידי Google. תוכלו לסנן את דוח ההוספה של דפים לאינדקס לפי sitemap כדי לראות כמה כתובות URL של דפים נוספו לאינדקס ב-sitemap הזה.
סרטונים שהתגלו
מספר כתובות ה-URL של סרטונים שנותחו מה-sitemap. אנחנו לא מבטיחים שכתובות ה-URL האלה נסרקו או נוספו לאינדקס, או שהן ייסרקו או יתווספו לאינדקס, על ידי Google. תוכלו לסנן את דוח ההוספה של דפי סרטונים לאינדקס לפי sitemap כדי לראות כמה כתובות URL של דפים ב-sitemap הזה מכילות סרטון שנוסף לאינדקס. שימו לב: מערכת Search Console מציינת אם כתובת URL אחרת של סרטון נוספה לאינדקס בדף, ולא כתובת ה-URL של הסרטון שצוינה ב-sitemap. sitemap שמופיע כאן יכיל קישור לדוח ההוספה של דפי סרטונים לאינדקס אם הוא מכיל דפים שנוספו לאינדקס שבהם יש סרטונים, על סמך סריקה של Google.
צפייה בפריטים הנכללים באינדקס
בלחיצה ייפתח דוח שבו מוצג סיכום הדפים הנכללים באינדקס של כל כתובות ה-URL ב-sitemap הזה. אם מדובר באינדקס של sitemap, נכללות כל כתובות ה-URL שרשומות בכל קובצי הצאצאים של ה-sitemap שכבר נסרקו.

 

למה ה-sitemap שלי לא מופיע ברשימה?

אם ה-sitemap שלכם לא מופיע בדוח, יש לכך כמה סיבות אפשריות:

  • הוא פעיל בנכס אחר. קובצי Sitemap שמשויכים לנכס מסוים אינם גלויים בנכס אחר. לכן, קובצי Sitemap ששלחתם לאתר http://example.com לא יוצגו בדוח קובצי ה-Sitemap של http://m.example.com או של https://example.com. כדי לפתור את הבעיה הזו, חשוב להוסיף את כל הגרסאות של האתר.
  • לא שלחתם את ה-Sitemap באמצעות הדוח הזה או באמצעות ה-API. מפורטים רק קובצי Sitemap שנשלחו באמצעות הדוח הזה או באמצעות Search Console API. קובצי Sitemap שנמצאו או שנשלחו בשיטות אחרות לא יוצגו, גם אם Google יכולה למצוא אותם ולהשתמש בהם.

שגיאות sitemap

הדוח של קובצי ה-Sitemap מכיל דיווח על השגיאות הבאות. הרשימה הזו לא מלאה, אבל היא ארוכה מספיק וכוללת את רוב השגיאות שעשויות להופיע.

שגיאות באחזור sitemap
אם הסטטוס של ה-sitemap הוא לא ניתן לאחזור בדף ה-sitemap ברמה העליונה, פירוש הדבר הוא ש-Google לא הצליחה לאחזר את קובץ ה-Sitemap עצמו. יכולות להיות לכך כמה סיבות:
  • ה-sitemap חסום על ידי קובץ ה-robots.txt. Google מתייחסת אל robots.txt באחזור קובצי sitemap. עליכם להסיר את הכלל שמונע מ-Google לאחזר את ה-sitemap.
  • ננקטה פעולה ידנית באתר שלכם. אי אפשר לקרוא קובצי Sitemap כשיש באתר פעולה ידנית שלא טופלה. עיינו בדוח הפעולות הידניות. פתרו את הבעיה ושלחו מחדש את ה-sitemap.
  • כתובת ה-URL שצוינה ל-sitemap שגויה (שגיאת HTTP 404: ה-sitemap לא נמצא בכתובת שצוינה). נסו לעבור לכתובת ה-URL בדפדפן כדי לראות אם היא קיימת.
  • שגיאה כללית אחרת: לפעמים שגיאות אחרות יכולות למנוע מ-Google לאחזר sitemap מהאתר, כמו אי-זמינות של שרת. חלק מהשגיאות האלה עשויות להיות זמניות: כדאי לחכות קצת ולבדוק אם Google ממשיכה לקבל את השגיאה הזו בניסיונות סריקה מאוחרים יותר.
  • הביקוש לסריקת ה-sitemap נמוך. ככל שאיכות האתר גבוהה יותר, כך הביקוש לסריקה גבוה יותר. מידע נוסף על יצירת תוכן באיכות גבוהה

איך לנפות באגים בשגיאות אחזור

  1. כדי לראות פרטים על בקשת האחזור האחרונה, לוחצים על ה-sitemap ברשימה.
  2. כדי לראות פרטים נוספים על השגיאה, לוחצים על שם השגיאה בדף הפרטים.
  3. מוודאים שהשגיאה קיימת בכלי לבדיקת כתובות URL:
    1. מעתיקים את כתובת ה-URL של ה-sitemap מדף הפרטים של דוח קובצי ה-Sitemap.
    2. מדביקים את כתובת ה-URL בכלי לבדיקת כתובות URL ומקישים על Enter.
    3. לוחצים על בדיקה של גרסה פעילה בכלי לבדיקת כתובות URL.
    4. מרחיבים את הקטע זמינות הדף כדי לראות למה Google לא יכולה לאחזר את ה-sitemap. כאן מפורט מידע על כל השדות, אבל הפרט שהכי חשוב לדעת הוא מותר לבצע סריקה? = 'כן', אחזור הדף = 'הצלחה'.
שגיאות בניתוח sitemap

השגיאות הבאות עשויות להתרחש במהלך עיבוד sitemap שאוחזר:

אין גישה לכתובות URL

Google נתקלה בשגיאה בניסיון לסרוק כתובת URL ב-sitemap. יש לבדוק את כתובת ה-URL ב-Sitemap באמצעות הכלי לבדיקת כתובות URL כדי לראות אם היא זמינה ל-Google.

אין מעקב אחר כתובות URL

Google לא הצליחה לסרוק את כל כתובות ה-URL שרשומות ב-sitemap. יכולות להיות כמה סיבות אפשריות לכך:

  • כתובת ה-URL מכילה יותר מדי הפניות לכתובות אחרות וסורקי האינטרנט של Google לא יכולים לסרוק את כולן. אנחנו מציעים להחליף כל הפניה לכתובת אחרת ב-sitemap בכתובת URL שיש לסרוק בפועל.
    • אם יש הפניה קבועה מדף מסוים לדף אחר, אתם צריכים להשתמש בהפניה קבועה לכתובת אחרת.
    • יש להימנע משימוש בהפניות מסוג JavaScript או meta-refresh לכתובות אחרות.
  • ל-Google יש בעיות עם כתובות URL יחסיות ב-sitemap. כשאפשר, כדאי להשתמש בקישורים מוחלטים או מלאים במקום בקישורים יחסיים. למשל, כשמקשרים לדף אחר באתר, יש לקשר אל https://www.example.com/mypage.html במקום לקשר רק אל mypage.html.

כתובת ה-URL אינה מותרת

ה-sitemap כולל כמה כתובות URL ברמה גבוהה יותר, או בדומיין שונה, מאלו של קובץ ה-Sitemap.

רמה גבוהה יותר: אם ה-sitemap נמצא בכתובת http://www.example.com/mysite/sitemap.xml, כתובות ה-URL הבאות לא חוקיות לאותו sitemap:

  • http://www.example.com/‎ – רמה גבוהה יותר מה-sitemap
  • http://www.example.com/yoursite/‎ – בספריית אחות של ה-sitemap (עליכם לעלות רמה ולאחר מכן לרדת כדי להגיע לשם).

דומיין שונה: חשוב לבדוק שכל כתובות ה-URL מתחילות בדומיין זהה לזה של מיקום ה-sitemap. לדוגמה, אם ה-sitemap נמצא ב-http://www.example.com/sitemap.xml, כתובות ה-URL הבאות אינן חוקיות עבור אותו sitemap:

  • /http://example.com – חסר "www"
  • /www.example.com – חסר "http"
  • /https://www.example.com – שימוש ב-"https" במקום ב-"http"

שגיאת דחיסה

Google נתקלה בשגיאה במהלך הניסיון לבטל את הדחיסה של קובץ ה-Sitemap הדחוס. דחסו מחדש את ה-Sitemap (באמצעות כלי כמו gzip), העלו אותו לאתר שלכם ושלחו אותו מחדש.

Sitemap ריק

ה-sitemap לא מכיל כתובות URL. יש לבדוק את ה-sitemap ולוודא שהוא לא ריק.

שגיאה בגודל של קובץ Sitemap: ה-Sitemap חורג מהמגבלה המקסימלית של גודל קובץ.

ה-Sitemap גדול מ-50MB כשאינו דחוס. אם גודלו של ה-sitemap חורג מהמגבלה, צריך לפצל אותו למספר קובצי Sitemap קטנים יותר, לרשום אותם בקובץ אינדקס של קובצי Sitemap ולשלוח את קובץ האינדקס של קובצי ה-Sitemap.

ערך מאפיין לא חוקי

הקציתם ערך לא חוקי למאפיין תג XML. כדאי לבדוק את ה-Sitemap כדי לוודא שרק המאפיינים המותרים נמצאים, ושאתם מקצים רק ערכים מותרים בהתאם למפרט לקובצי Sitemap. כדאי גם לוודא שאין שגיאות הקלדה במאפיינים ובערכים.

תאריך לא חוקי

ה-Sitemap מכיל תאריך אחד או יותר שאינם חוקיים. הסיבה לכך עשויה להיות פורמט שגוי של תאריך, או שהתאריך עצמו לא חוקי. עבור תאריכים יש להשתמש בקידוד תאריך ושעה של W3C, אולם ניתן להשמיט את מרכיב השעה. יש לוודא שהתאריכים תואמים לאחד מהפורמטים הבאים של תאריך ושעה של W3C:

2005-02-21 
2005-02-21T18:00:15+00:00

ציון השעה אינו חובה (ברירת מחדל לציון השעה היא 00:00:00Z), אך אם מציינים שעה, חובה לציין גם אזור זמן.

ערך תג לא חוקי

ה-Sitemap מכיל תג אחד או יותר עם ערך לא חוקי. יש לבדוק את המפרטים לסוג ה-Sitemap (אינדקס, סטנדרטי, סרטונים וכן הלאה).

כתובת URL לא חוקית

ישנה כתובת URL לא חוקית ב-sitemap. הסיבה לשגיאה הזו יכולה להיות שהכתובת כוללת תווים שאינם נתמכים, רווחים או תווים אחרים כגון מירכאות, או שהפורמט שלה שגוי (לדוגמה, htp://‎ במקום http://‎).

יש לוודא שכתובות ה-URL המפורטות ב-Sitemap שלכם מקודדות באופן קריא ומסומנות כראוי בתווי בריחה (escape). יש לוודא גם שאין תווים שגויים כגון רווחים או מירכאות. כמו כן, אפשר לנסות ולהעתיק את כתובת ה-URL לדפדפן, כדי לבדוק אם הדפדפן מזהה את הכתובת וטוען את הדף.

כתובת URL לא חוקית בקובץ אינדקס של קובצי Sitemap: כתובת URL חלקית

קובץ האינדקס של קובצי ה-Sitemap לא כולל את כתובת ה-URL המלאה של כל קובץ Sitemap שהוא מפרט. כאשר רואים קובץ אינדקס של קובצי Sitemap, אנחנו מחפשים באותה ספרייה את הקבצים שהוא מפנה אליהם. לדוגמה, אם האינדקס של קובצי ה-Sitemap הוא http://www.example.com/folder1/sitemap_index.xml ורשום בו sitemap מסוים בתור sitemap.xml (ללא / בהתחלה), נבדוק את ה-sitemap הזה בכתובת http://www.example.com/folder1/sitemap.xml. אם הוא לא נמצא שם, תופיע שגיאה זו.

יש לעדכן את קובץ האינדקס של קובצי ה-Sitemap כך שיכלול את הנתיב המלא לכל sitemap המפורט בו, ולאחר מכן לשלוח אותו מחדש.

XML לא חוקי: תגים רבים מדי

ה-sitemap מכיל תגים כפולים. לדוגמה, הרשומה הבאה תגרום לשגיאה הזו בגלל שהתג <loc> מופיע פעמיים:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/page1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

השגיאה מפרטת את התג הבעייתי ואת מספר השורה. יש להסיר את התג הכפול ולשלוח מחדש את ה-sitemap.

מאפיין XML חסר

באחד מהתגים ב-Sitemap חסר מאפיין נדרש. כדאי לבדוק את קובצי ה-Sitemap כדי לוודא שהמאפיינים הנדרשים לא חסרים בהם. לאחר שמתקנים את ערכי המאפיינים, אפשר לשלוח את ה-Sitemap מחדש.

תג XML חסר

ברשומה אחת או יותר ב-Sitemap חסר תג נדרש. הודעת השגיאה מציינת את מספר השורה. אפשר לעיין בדף היסודות של קובצי Sitemap לקבלת מידע על התגים הדרושים.

חסרה כתובת URL של תמונה ממוזערת

חסרה כתובת URL של תמונה ממוזערת ברשומת סרטון אחת או יותר. יש לוודא שהמיקום של כתובות ה-URL של תמונות ממוזערות מצוין באמצעות התג <video:thumbnail_loc>.

חסרה כותרת סרטון

חסרה כותרת ברשומת סרטון אחת לפחות. יש לוודא שלכל סרטון ב-sitemap יש כותרת, המצוינת בתג <video:title>.

פורמט שגוי של קובץ אינדקס של קובצי Sitemap: אינדקסים מקוננים של קובצי Sitemap

אחד או יותר מהערכים בקובץ האינדקס של קובצי ה-Sitemap משתמשים בכתובת URL משלהם, או בכתובת ה-URL של קובץ אינדקס אחר של קובצי Sitemap. קובץ אינדקס של קובצי Sitemap אינו יכול לכלול קובצי אינדקס אחרים של קובצי Sitemap, אלא רק קובצי Sitemap.

יש להסיר את כל הרשומות המפנות לקובצי אינדקס של קובצי Sitemap, ולאחר מכן לשלוח את ה-Sitemap מחדש.

שגיאת ניתוח

Google לא הצליחה לנתח את ה-XML של ה-Sitemap.

לעיתים קרובות, הבעיה הזו נגרמת על ידי תו בכתובת ה-URL שלא סומן בתו בריחה (escape). כמו בכל קובצי XML, כל ערכי הנתונים (כולל כתובות URL) חייבים להשתמש בתווי בריחה לתווים מסוימים, כגון סמלים & ' " > . כדאי לוודא שכתובות ה-URL מקודדות בתווי בריחה כראוי.

שגיאה זמנית

המערכת שלנו נתקלה בבעיה זמנית שמנעה את עיבוד ה-Sitemap. בדרך כלל, כאשר השגיאה הזו מופיעה, אין צורך לשלוח את ה-Sitemap מחדש. Google יכולה לנסות לאחזר את ה-Sitemap שוב במועד מאוחר יותר. אם השגיאה עדיין קיימת לאחר מספר שעות, כדאי לשלוח מחדש את ה-Sitemap.

יותר מדי קובצי Sitemap

בקובץ האינדקס של ה-Sitemap רשומים יותר מ-50,000 קובצי Sitemap. צריך לפצל את האינדקס של ה-Sitemap לכמה קובצי אינדקס של Sitemap, ולוודא שבאף אחד מהם לא רשומים יותר מ-50,000 קובצי Sitemap.

יותר מדי כתובות URL

ב-sitemap רשומות יותר מ-50,000 כתובות URL. צריך לפצל את ה-sitemap לכמה קובצי sitemap, ולוודא שאף אחד מהם לא מכיל יותר מ-50,000 כתובות URL. אפשר להשתמש גם בקובץ אינדקס של sitemap כדי לנהל את קובצי ה-sitemap.

פורמט שאינו נתמך

הפורמט של ה-Sitemap לא נתמך.

הנה כמה שגיאות XML נפוצות:

  • ה-Sitemap חייב להשתמש בכותרת הנכונה. לדוגמה, אם ה-sitemap מכיל מידע על סרטונים, יש לכתוב את ה-header הבא:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • מרחב השמות בכותרת חייב להיות "http://www.sitemaps.org/schemas/sitemap/0.9" (ולא ‎.9).
  • כל מאפייני ה-XML ​​חייבים להופיע בתוך מירכאות יחידות (') או מירכאות כפולות ("), והמירכאות חייבות להיות ישרות ולא מסולסלות. תוכנות עיבוד תמלילים כמו Microsoft Word עלולות להוסיף מירכאות מסולסלות.

חוסר התאמה של נתיב: ללא www

הנתיב המפנה ל-sitemap אינו מכיל את התחילית www (לדוגמה: http://example.com/sitemap.xml), אולם כתובות ה-URL שהוא מפרט כוללות אותה (לדוגמה: http://www.example.com/myfile.html).

אפשר לשנות את ה-sitemap כך שהתחילית "www" תוסר מכל כתובות ה-URL בהתאם למיקום ה-sitemap.

חוסר התאמה של נתיב: עם www

הנתיב המפנה ל-sitemap כולל את התחילית www (לדוגמה: http://www.example.com/sitemap.xml), אולם כתובות ה-URL שהוא מפרט אינן כוללות אותה (לדוגמה: http://example.com/myfile.xml).

אפשר לשנות את ה-sitemap כך שהתחילית "www" תתווסף לכל כתובות ה-URL בהתאם למיקום ה-sitemap.

מרחב שמות שגוי

רכיב הבסיס של ה-Sitemap אינו כולל את מרחב השמות הנכון, או שמרחב השמות מוצהר באופן שגוי, או שיש בו שגיאת הקלדה או כתובת URL שגויה.

חשוב להקפיד להשתמש במרחב השמות הנכון לסוג הקובץ. למשל:

  • קובץ Sitemap:‏ xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • קובץ Sitemap של וידאו: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • קובץ אינדקס של Sitemap:‏ <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • סוגים אחרים של Sitemap

רווח מוביל

ה-sitemap מתחיל ברווח, במקום בהצהרת מרחב שמות. קובצי XML חייבים להתחיל בהצהרת XML המציינת את גרסת ה-XML הנמצאת בשימוש.

השגיאה הזו לא תמנע מ-Google לעבד את ה-sitemap, אבל רצוי שתסירו את הרווח כדי שהקובץ יתאים לתקן ה-XML ושהשגיאה הזו תפסיק להופיע.

שגיאת HTTP [קוד ספציפי]

Google נתקלה בשגיאת HTTP ברמה 400 במהלך הניסיון להוריד את ה-sitemap. בהודעה הזו מוצג קוד הסטטוס שקיבלנו (לדוגמה, 404). כדאי לוודא שכתובת ה-URL של ה-Sitemap שציינתם נכונה ושה-Sitemap קיים במיקום הזה. לאחר מכן, אפשר לשלוח את ה-Sitemap מחדש.

שגיאת HTTP כללית

Google נתקלה בשגיאת HTTP אחרת שלא נכללת בשגיאות הספציפיות יותר שמפורטות כאן. הרחיבו את הפרטים כדי לראות מהו סוג השגיאה שאירעה. מצב כזה עשוי גם לנבוע משגיאה 404 (הדף לא קיים), שהיא שגיאת אחזור.

התמונה הממוזערת גדולה מדי

התמונה הממוזערת של הסרטון שצוינה ב-Sitemap גדולה מדי. יש לשנות את הגודל של התמונה הממוזערת של הסרטון ל-‎160x120 פיקסלים. יש לעדכן את ה-Sitemap במידע החדש ולאחר מכן לשלוח אותו מחדש. לרשותכם מידע נוסף על הוספת פרטי סרטונים ל-sitemap.

התמונה הממוזערת קטנה מדי

התמונה הממוזערת של הסרטון שצוינה ב-Sitemap קטנה מדי. יש לשנות את הגודל של התמונה הממוזערת של הסרטון ל-‎160x120 פיקסלים. יש לעדכן את ה-Sitemap במידת הצורך. לרשותכם מידע נוסף על הוספת פרטי סרטונים ל-sitemap.

מיקום הסרטון ומיקום דף ההפעלה זהים

ב-Sitemap של וידאו, כתובת ה-URL של תוכן הסרטון לא יכולה להיות זהה לכתובת ה-URL של הנגן. אם מספקים גם את <video:player_loc> וגם את <video:content_loc>, כתובות ה-URL חייבות להיות שונות. לרשותכם מידע נוסף על הוספת פרטי סרטונים ל-sitemap.

נראה שכתובת ה-URL של מיקום הסרטון היא כתובת של דף הפעלה

ב-Sitemap של וידאו, כתובת ה-URL‏ <video:content_loc>מפנה לדף המארח את הנגן. מידע נוסף על הוספת פרטי סרטונים ל-Sitemap

יותר מדי כתובות URL של חדשות

מספר כתובות ה-URL הפתוחות גבוה מהמספר המקסימלי המותר (1,000) בקובץ ה-Sitemap. מידע נוסף על הוספת פרטי חדשות ל-Sitemap

תג <publication> חסר

לכל כתובת URL ב-Sitemap של חדשות חייב להיות תג <publication>מידע נוסף על הוספת פרטי חדשות ל-Sitemap

ה-Sitemap מכיל כתובות URL שחסומות על ידי robots.txt

ל-Google אין גישה ל-sitemap, או שאין לה גישה לכל התוכן שרשום ב-sitemap, כיוון שהוא חסום על ידי קובץ robots.txt. יש להשתמש בכלי לבדיקת כתובות URL כדי לאשר איזה קובץ נחסם, ולשנות את קובץ ה-robots.txt כך של-Googlebot תהיה גישה אליו.

האם המידע הועיל?

איך נוכל לשפר את המאמר?

צריכים עזרה נוספת?

תוכלו לנסות את האפשרויות הבאות:

חיפוש
ניקוי החיפוש
סגירת החיפוש
התפריט הראשי
16513814497774778402
true
חיפוש במרכז העזרה
true
true
true
true
true
83844
false
false