יצירת Sitemap של חדשות Google

הנחיות ל-Sitemap של חדשות Google


כשיוצרים Sitemap של חדשות, צריך לפעול לפי הדרישות הבאות:

  • יש לכלול כתובות URL של כתבות שפורסמו ביומיים האחרונים. אפשר להסיר מה-Sitemap של חדשות Google כתבות שפורסמו לפני יותר מיומיים. עם זאת, הן יישארו באינדקס למשך תקופת הזמן הרגילה של 30 יום.
  • יש לעדכן את ה-Sitemap של חדשות Google כשמתפרסמות כתבות חדשות. שירות חדשות Google סורק קובצי Sitemap של חדשות באותה תדירות שבה הוא סורק את שאר האתר.
  • יש להוסיף עד 1,000 כתובות URL מלאות כדי לכלול יותר, לחלק את כתובות ה-URL האלו למספר קובצי Sitemap ולנהל אותן באמצעות קובץ אינדקס של Sitemap. יש להשתמש בפורמט XML המצוין בפרוטוקול ה-Sitemap. אין לכלול יותר מ-50,000 קובצי Sitemap בקובץ ה-Sitemap. המגבלות האלו עוזרות להבטיח ששרת האינטרנט לא משתמש בקבצים גדולים.
  • יש לעדכן את ה-Sitemap הנוכחי בכתובות ה-URL של הכתבות החדשות. אין ליצור Sitemap חדש בכל עדכון. 
  • אין להשתמש במחולל Sitemap של Google כדי ליצור Sitemap של חדשות. המחולל כולל כתובות URL שאינן תואמות לכתבות חדשותיות ספציפיות.

דוגמה לרשומת Sitemap

Sitemap של חדשות Google משתמש בפרוטוקול ‏Sitemap. הנה דוגמה לרשומת Sitemap של חדשות:

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:news="http://www.google.com/schemas/sitemap-news/0.9"> <url> <loc>http://www.example.org/business/article55.html</loc> <news:news> <news:publication> <news:name>ידיעות לדוגמה</news:name> <news:language>iw</news:language> </news:publication> <news:publication_date>2008-12-23</news:publication_date> <news:title>חברה א' וחברה ב' מנהלות משא ומתן למיזוג</news:title> </news:news> </url> </urlset>

אתרים עם Sitemap של חדשות לא מקבלים תוצאות גבוהות יותר בדירוג. שירות חדשות Google משתמש בשיטות סריקה רגילות כדי לחפש ולתייג את דפי הבית והמדורים של כל אתרי החדשות, בלי קשר להימצאות Sitemap של חדשות.

שליחת Sitemap

לאחר יצירת Sitemap של חדשות, שולחים אותו דרך Search Console. אפשר להיכנס למרכז העזרה של Search Console ולקבל מידע נוסף על ניהול קובצי Sitemap. מומלץ גם להעלות את ה-Sitemap לספרייה ברמה הגבוהה ביותר שמכילה את הכתבות החדשותיות.

הגדרות של תגים הספציפיים לחדשות Google

ניתן לעיין למטה בתגים של חדשות Google לקובצי Sitemap:

תג נדרש? תיאור
<publication> כן

הפרסום שבו מופיעה הכתבה. נדרשים לו שני תגי צאצא: <name> וכן <language>
התג <name> מציין את שם הפרסום בחדשות. עליו להתאים במדויק לשם שמופיע בכתבות בכתובת news.google.com, ללא ערכים כלשהם בסוגריים.
התג <language> מציין את שפת הפרסום. צריך להשתמש בקוד שפה ISO 639 ‏(2 או 3 אותיות).

מקרה חריג: לסינית פשוטה, משתמשים בקוד "zh-cn" ולסינית מסורתית - "zh-tw".

<publication_date> כן תאריך הפרסום של הכתבה צריך להיות בפורמט W3C. משתמשים בפורמט "התאריך המלא" (YYYY-MM-DD) או בפורמט "התאריך המלא לצד שעות, דקות ושניות" עם פורמט המציין אזור זמן (YYYY-MM-DDThh:mm:ssTZD). יש לציין את התאריך והשעה המקוריים של פרסום הכתבה באתר. אין לציין את השעה שבה נוסף המאמר ל-Sitemap.

הסורק שלנו מקבל כל אחד מהפורמטים הבאים:
  • תאריך מלא: YYYY-MM-DD‏ (1997-07-16)
  • תאריך מלא בתוספת שעות ודקות: YYYY-MM-DDThh:mmTZD‏ (1997-07-16T19:20+01:00)
  • תאריך מלא בתוספת שעות, דקות ושניות: YYYY-MM-DDThh:mm:ssTZD‏ (1997-07-16T19:20:30+01:00)
  • תאריך מלא בתוספת שעות, דקות, שניות ושבר עשרוני של שנייה: YYYY-MM-DDThh:mm:ss.sTZD‏ (1997-07-16T19:20:30.45+01:00)
<title> כן הכותרת של כתבת החדשות.
טיפ: כשהכותרת מוצגת בחדשות Google, ייתכן שהיא לא תופיע בשלמותה בשל מגבלות שטח. יש לכלול את הכותרת של הכתבה כפי שהיא מופיעה באתר. אין לכלול שם מחבר, שם פרסום או תאריך פרסום בתג הכותרת.
 
האם המידע הועיל?
איך נוכל לשפר את המאמר?