חיפוש
נקה את החיפוש
סגירת החיפוש
Google Apps
תפריט ראשי

איחוד של כתובות אתרים משוכפלות

הגדרת דף קנוני לדפים דומים או משוכפלים

תקציר

אם יש לכם דף אינטרנט אחד שאפשר להיכנס אליו באמצעות כמה כתובות, או דפים שונים עם אותו תוכן (לדוגמה: דף עם גרסה לנייד וגרסה למחשב), אתם צריכים לציין ל-Google מפורשות מהי כתובת האתר הראשית (הקנונית) של הדף. אם לא תעשו זאת, Google תבחר אותה בשבילכם או תתייחס לשתי הגרסאות בצורה שווה. במקרה כזה, עלולה להיות התנהגות בלתי רצויה, כפי שנסביר בחלק הבא.

חשוב לזכור: למרות שמומלץ לציין דף קנוני לכתובות אתרים משוכפלות או לגרסאות זהות של דפים, Google עשויה להשתמש באלגוריתם שלה כדי לבחור דף אחר מסיבות שונות, כמו ביצועים או תוכן.

למה שיהיו לי דפים דומים/משוכפלים?

יש כמה סיבות לגיטימיות לכך שיהיו לכם כתובות שונות שמפנות לאותו הדף, או גרסאות משוכפלות או דומות מאוד של אותו דף בכתובות שונות. אלו הן הסיבות הנפוצות ביותר:

  • כדי לתמוך בסוגים רבים של מכשירים:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • כדי להפעיל כתובות אתרים דינמיות לרכיבים כמו פרמטרים של חיפוש או מזהי הפעלה:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • אם מערכת הבלוגים שומרת אוטומטית כמה כתובות אתרים כשמפרסמים את אותו פוסט בכמה מדורים.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • אם השרת מוגדר להציג את אותו התוכן לגרסאות של הדף עם או בלי www ב-http או https:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • אם התוכן שמפורסם בבלוג במטרה לבצע סינדיקציה לאתרים אחרים משוכפל בחלקו או במלואו בדומיינים האלה:
    https://news.example.com/green-dresses-for-every-day-155672.html (הפוסט בסינדיקציה) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (הפוסט המקורי)
הסבר מעמיק
המידע שבחלק הזה מיועד למי שמתעניין בקנוניזציה. אם הוא לא מעניין אתכם, אפשר לדלג עליו.
כשהבוט Googlebot סורק אתר ומוסיף אותו לאינדקס, הוא מנסה לקבוע באילו נושאים עוסק כל דף. אם Googlebot מוצא באתר כמה דפים שעוסקים באותו נושא, הוא בוחר את הדף שלדעתו הוא המלא והשימושי ביותר, ומסמן אותו כקנוני. כדי לחסוך לכם משאבי סריקה, הדף הקנוני ייסרק לעתים קרובות יותר, ואילו העותקים המשוכפלים ייסרקו לעתים רחוקות יותר. אם לא תציינו ל-Googlebot מהו הדף הקנוני, ותחליטו שזה דף אחר ממה שהבוט קבע, יכול להיות שתתאמצו לשווא בעדכון דף ש-Googlebot לא יסרוק לעתים קרובות או לא יוצג בתוצאות החיפוש.
Google משתמשת בדפים הקנוניים באתר כאמת המידה לאיכות ולתוכן שלו. תוצאת החיפוש ב-Google מפנה בדרך כלל לדף הקנוני, אלא אם אחד מהעותקים המשוכפלים מתאים יותר באופן מובהק לשאילתה של המשתמש. לדוגמה, תוצאת החיפוש תפנה לגרסה של הדף לנייד אם המשתמש חיפש בנייד, גם אם הגרסה למחשב סומנה כדף הקנוני.
Google בוחרת את הדף הקנוני על סמך כמה גורמים (או אותות), למשל: אם הדף הוצג ב-http או https; אם המשתמש בחר דומיין מועדף; איכות הדף; הימצאות של כתובת האתר ב-sitemap; וסימון באמצעות התווית "rel=canonical". אי אפשר לאלץ את Google לבחור בדף מסוים כדף הקנוני, אבל אפשר להשפיע על הבחירה שלה באמצעות השיטות שמוסברות במאמר הזה.

למה זה חשוב?

יש כמה סיבות לכך שמומלץ לבחור מפורשות דף קנוני לדפים דומים/משוכפלים:

  • כדי לבחור את כתובת האתר שתוצג בתוצאות החיפוש. יכול להיות שתעדיפו שאנשים יגיעו לדף שבו אתם מוכרים שמלות ירוקות דרך https://www.example.com/dresses/green/greendress.html‏ ולא דרך https://example.com/dresses/cocktail?gclid=ABCD‏.
  • כדי לאחד בין אותות קישור לדפים דומים או משוכפלים. פעולה זו מסייעת למנועי החיפוש לאחד את המידע שיש להם על כתובות אתרים ספציפיות (כמו הקישורים לכתובות האלה) בכתובת אתר אחת, מועדפת. כך למשל, קישורים מאתרים אחרים אל http://example.com/dresses/cocktail?gclid=ABCD‏ יאוחדו עם קישורים אל https://www.example.com/dresses/green/greendress.html‏.
  • כדי לעקוב בקלות אחרי המדדים של מוצר/נושא ספציפי. כשמשתמשים בכמה כתובות אתרים, קשה יותר לקבל מדדים אחידים לחלק ספציפי בתוכן.
  • כדי לנהל תוכן בסינדיקציה. אם מבצעים סינדיקציה לתוכן כדי לפרסם אותו בדומיינים אחרים, מומלץ לאחד את דירוג הדף של כתובת האתר המועדפת.
  • כדי לחסוך בזמן הסריקה של דפים משוכפלים. בסופו של דבר, אתם רוצים ש-Googlebot יסרוק את האתר שלכם בצורה היעילה ביותר. לכן, עדיף שהוא ישקיע זמן בסריקה של דפים חדשים (או עדכונים) באתר במקום לבזבז זמן ולסרוק את אותו התוכן בשתי גרסאות שונות של הדף, לנייד ולמחשב.

איזו כתובת אתר נחשבת לקנונית (או משוכפלת) מבחינת Google?

אפשר להשתמש בדוח 'סטטוס האינדקס' כדי לבדוק אילו כתובות אתרים נחשבות לקנוניות או למשוכפלות. הדפים המשוכפלים יסומנו כ'לא נסרקו' (לא נוספו לאינדקס) והקנוניים כ'נסרקו'.

חפשו את כתובות האתרים עם הסימון 'הדף נוסף לאינדקס. כדאי לסמן אותו כקנוני', ושקלו לסמן אותן מפורשות כ'קנוניות'.

חפשו את כתובת האתרים שלא נסרקו עם הסימון 'Google בחרה דף קנוני שונה מהמשתמש' כדי להבין מתי Google בחרה דף קנוני שונה מזה שהוגדר.

בחירת דף קנוני ספציפי

יש כמה דרכים לבחור דף קנוני ספציפי מבין הדפים המשוכפלים, בהתאם לצורך:

שיטה תיאור
כללי אצבע כללי האצבע האלה רלוונטיים לכל שיטות הקנוניזציה.
בחירת הדומיין המועדף

השתמשו ב-Search Console כדי לבחור כתובות אתרים ספציפיות בדומיין כקנוניות. לדוגמה, תוכלו לבחור את example.com במקום www.example.com. השתמשו בשיטה הזו רק כשיש לכם שני אתרים דומים שההבדל היחיד ביניהם הוא בתת-דומיין. אל תשתמשו בה כדי להבדיל בין הפרוטוקולים http/https.

היתרונות:

  • קל מאוד לבחור, לנהל ולשנות.
  • מתאימה כשיש אתרים זהים בדומיינים שונים.

החסרונות:

  • מתאימה כשההבדל הוא רק בדומיין. לדפים צריכים להיות נתיבים ושמות זהים כדי שהם ייחשבו משוכפלים.
  • מאפשרת רק מיפוי של הדפים הבודדים הנושאים אותו שם ונמצאים בנתיבים זהים.
התג rel=canonical <link>‎

הוסיפו את התג <link> לקוד של כל הדפים המשוכפלים והפנו באמצעותו לדף הקנוני.

היתרונות:

  • אפשר למפות מספר בלתי מוגבל של דפים משוכפלים.

החסרונות:

  • הדף עשוי לגדול.
  • שינוי המיפוי של אתרים גדולים או אתרים שבהם כתובות האתרים משתנות לעתים קרובות עלול להיות מורכב.
  • מתאימה רק לדפי HTML ולא לקבצים כמו PDF. במקרים כאלה, אפשר להשתמש בכותרת ה-HTTP ‏"rel="canonical.
כותרת ה-HTTP ‏"rel=canonical"

שלחו את הכותרת rel="canonical"‎ בתגובה של הדף.

היתרונות:

  • הדף לא גדל.
  • אפשר למפות מספר בלתי מוגבל של דפים משוכפלים.

החסרונות:

  • שינוי המיפוי של אתרים גדולים או אתרים שבהם כתובות האתרים משתנות לעתים קרובות עלול להיות מורכב.
Sitemap

ציון מפורש של דפים קנוניים ב-sitemap.

היתרונות:

  • קל לבצע ולשנות, במיוחד באתרים גדולים.

החסרונות:

  • הבוט Googlebot עדיין צריך לקבוע אילו דפים משוכפלים קשורים לדפים הקנוניים שצוינו ב-sitemap.
  • האות שנשלח ל-Googlebot חלש יותר מהאות שנשלח באמצעות התג ‎rel="canonical"‎.
הפניות 301 השתמשו בהפניות 301 כדי לומר ל-Googlebot שכתובת האתר שאתם מפנים אליה היא גרסה טובה יותר מכתובת אתר מסוימת. השתמשו בשיטה הזו רק כשאתם רוצים להוציא משימוש דף משוכפל.
גרסת AMP אם אחת מהגרסאות שלכם היא דף AMP, תצטרכו לפעול לפי ההנחיות של AMP כדי לציין מהו הדף הקנוני ומהי גרסת ה-AMP.

 

השיטות האלה הן רק המלצות. אתם לא חייבים להשתמש באף אחת מהן. אם לא תציינו כתובת אתר קנונית, נבחר את זו שלדעתנו היא הגרסה הטובה ביותר.

כללי אצבע

כללי האצבע האלה רלוונטיים לכל שיטות הקנוניזציה.

כללי אצבע
  • אל תשתמשו בקובץ robots.txt‏ לקנוניזציה.
  • אל תשתמשו בכלי להסרת כתובות אתרים לקנוניזציה: הוא מסיר מהחיפוש את כל הגרסאות של כתובת האתר הרלוונטית.
  • אל תציינו כתובות אתרים שונות עבור אותו דף כקנוניות (למשל, כתובת אתר אחת ב-sitemap וכתובת אתר אחרת עבור אותו דף באמצעות rel="canonical"‎‏).
  • אל תשתמשו ב-noindex כדרך למנוע בחירה של דף קנוני. הדף לא ייסרק ולא יתווסף לאינדקס. זו לא הדרך הנכונה להשפיע על הבחירה של הדף הקנוני. 
  • אל תציינו דף קנוני כשאתם משתמשים בתגי hreflang. ציינו דף קנוני באותה שפה. אם אין דף קנוני באותה שפה, בחרו בדף בשפה המתאימה ביותר.

העדפת HTTPS על פני HTTP ביחס לכתובות אתרים קנוניות

Google מעדיפה שדפים קנוניים יהיו בפרוטוקול HTTPS אם גרסת ה-HTTP זהה, למעט אם יש התנגשות בין האותות, כמו בדוגמאות הבאות:

  • לדף ה-HTTPS יש אישור SSL לא חוקי.
  • דף ה-HTTPS מכיל יחסי תלות לא מאובטחים (חוץ מתמונות).
  • דף ה-HTTPS מפנה משתמשים אל דף HTTP או לכתובת אחרת דרכו.
  • דף ה-HTTPS כולל קישור מסוג rel="canonical"‎‏ אל דף ה-HTTP.

כברירת מחדל, המערכות שלנו מעדיפות דפי HTTPS על פני דפי HTTP. עם זאת, אפשר להשתמש בדרכים הבאות כדי לוודא שהן תמיד יעדיפו אותם:

  • הוספה של הפניה לכתובת אחרת מדף ה-HTTP לדף ה-HTTPS.
  • הוספת קישור מסוג rel="canonical"‎‏ מדף ה-HTTP אל דף ה-HTTPS.
  • הטמעת HSTS‏.

כדי למנוע מ-Google להפוך בטעות דווקא את דף ה-HTTP לקנוני, מומלץ להימנע מהפעולות הבאות:

  • אישורי SSL לא תקינים והפניות מחדש מסוג HTTPS-ל-HTTP הם הסיבה לכך שאנחנו מעדיפים HTTP באופן גורף. הטמעת HSTS לא יכולה לבטל העדפה זו.
  • הכללה של דף ה-HTTP, במקום גרסת ה-HTTPS, ב-sitemap או ברשומות ה-hreflang‏ שלכם.
  • הטמעה של אישור ה-SSL/TLS שלכם עבור גרסת המארח הלא נכונה: לדוגמה, example.com מציג את האישור של www.example.com.  על האישור להתאים לכתובת האתר המלאה, או להיות אישור כללי שיכול לשמש עבור תת-דומיינים מרובים באותו דומיין.

איך אפשר להורות ל-Google להתעלם מפרמטרים דינמיים?

אפשר להשתמש בתכונה טיפול בפרמטר כדי להורות ל-Googlebot להתעלם מפרמטרים מסוימים בזמן הסריקה. התעלמות מפרמטרים יכולה להקטין את כמות הכפילויות של התוכן באינדקס של Google, ולהקל על סריקת האתר. לדוגמה, אם מציינים שצריך להתעלם מהפרמטר sessionid, שתי כתובות האתרים הבאות ייחשבו מבחינת Googlebot כמשוכפלות:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

שיטות ספציפיות

אפשר להשתמש באחת מהשיטות הבאות כדי לציין כתובת אתר קנונית לכתובות אתרים משוכפלות או לדפים משוכפלים/דומים.

בכל מקרה, חשוב לשמור גם על כללי האצבע שפירטנו קודם.

הגדרת דומיין מועדף

אפשר להשתמש ב-Search Console כדי לציין ל-Google איזו גרסה של כתובת האתר אתם מעדיפים שתהיה הכתובת הקנונית של הדומיין:

  • https://www.example.com
  • https://example.com

אם תגדירו את הדומיין המועדף בתור https://example.com,‏ Google תתייחס לכתובת אתרים או דפים דומים בדומיין www.example.com כאל עותקים משוכפלים של הדפים בדומיין example.com.

רוצים לדעת איך להגדיר דומיין מועדף?

שימוש בתג הקישור rel="canonical"‎

אפשר להשתמש בתג <link> בכותרת של הדף כדי לציין שהדף הוא עותק משוכפל של דף אחר.

נניח שאנחנו רוצים שהכתובת https://example.com/dresses/green-dresses תהיה כתובת האתר הקנונית, גם אם יש כמה וכמה כתובות אתרים שמובילות לתוכן הזה. נוכל לציין את כתובת האתר הזו כקנונית באופן הבא:

  1. סימון כל הדפים כמשוכפלים באמצעות אלמנט הקישור rel="canonical"‎. מוסיפים את האלמנט <link> עם המאפיין rel="canonical"‎ בקטע <head> של הדפים המשוכפלים, ומפנים לדף הקנוני:
    ‎<link rel="canonical" href="https://example.com/dresses/green-dresses" />‎

  2. אם לדף הקנוני יש גרסה לנייד, מוסיפים אליה את הקישור rel="alternate"‎ כדי להפנות לגרסה לנייד של הדף:
    ‎<link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">‎

  3. מוסיפים תגי hreflang או הפניות אחרות הרלוונטיות לדף.

חשוב להשתמש בנתיבים אבסולוטיים ולא בנתיבים יחסיים עם אלמנט הקישור rel="canonical"‎.

השתמשו במבנה הזה: https://www.example.com/dresses/green/greendresss.html‏
ולא במבנה הזה: ‎/dresses/green/greendress.html
שימוש בכותרת HTTP‏ rel="canonical"‎

אם אפשר להגדיר את השרת, כדאי להשתמש בכותרות HTTP מסוג rel="canonical"‎ (במקום בתגי HTML) כדי לציין את כתובת האתר הקנונית של מסמכים שאינם ב-HTML, כמו קובצי PDF.

לדוגמה, אם יש כמה כתובות אתרים שמובילות לקובץ ה-PDF, אפשר להשתמש בכותרת HTTP‏ rel="canonical"‎ בכתובת האתרים המשוכפלות, כמו בדוגמה הבאה. כך אפשר לומר ל-Googlebot מהי כתובת האתר הקנונית של קובץ ה-PDF:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"‎

כרגע, אפשר להשתמש בשיטה הזו רק לתוצאות החיפוש באינטרנט ב-Google.

חשוב להשתמש בנתיבים אבסולוטיים ולא בנתיבים יחסיים עם אלמנט הקישור rel="canonical"‎. כלומר:
השתמשו במבנה הזה http://www.example.com/downloads/white-paper.pdf
ולא במבנה הזה: ‎/downloads/white-paper.pdf
שימוש ב-sitemap

אפשר לבחור כתובת אתר קנונית לכל אחד מהדפים ולשלוח אותן באמצעות sitemap. כל הדפים שרשומים ב-sitemap יוצעו כקנוניים. הבוט Googlebot יחליט אילו דפים הם משוכפלים (אם בכלל יהיו עותקים משוכפלים), בהתאם למידת הדמיון בתוכן.

אנחנו לא מבטיחים שנתייחס לכתובות האתרים ב-sitemap כאל קנוניות, אבל זוהי דרך פשוטה להגדיר כתובות אתרים קנוניות לאתר גדול. בנוסף, זוהי דרך נוחה לציין ל-Google אילו דפים נחשבים בעיניכם כחשובים ביותר באתר.

אל תכללו דפים לא-קנוניים ב-sitemap. אם אתם משתמשים ב-sitemap, ציינו רק כתובות אתרים קנוניות.

שימוש בהפניות מחדש מסוג 301 לכתובות אתרים שאינן בשימוש

אפשר להשתמש בשיטה הזו כשרוצים להיפטר מדפים משוכפלים ולהבטיח מעבר חלק לפני שמוציאים משימוש כתובות אתרים ישנות.

נניח שניתן להגיע אל הדף בכמה דרכים:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

אפשר לבחור אחת מהן ככתובת האתר הקנונית ולהשתמש בהפניות מחדש מסוג 301 בשרת כדי להעביר את התנועה מכתובות האתרים האחרות אל כתובת האתר המועדפת. זוהי הדרך הטובה ביותר להבטיח שהמשתמשים ומנועי החיפוש יופנו לדף הנכון. המשמעות של קוד סטטוס 301 היא שהדף הועבר לתמיד למיקום חדש.

האם המאמר היה מועיל?
איך נוכל לשפר את המאמר?
false