משתמשים מתחילים

כיצד פועל חיפוש Google

איך Google מגלה, סורקת, ומציגה דפי אינטרנט

איך Google עובדת? הנה גרסה קצרה וגרסה ארוכה.

המידע ש-Google מקבלת מגיע מכל מיני מקורות, ביניהם:

  • דפי אינטרנט
  • תוכן שמשתמשים שולחים, למשל דרך Google לעסק שלי ומפות Google
  • סריקות ספרים
  • מסדי נתונים ציבוריים המפורסמים באינטרנט
  • מקורות רבים נוספים

עם זאת, הדף הזה מתמקד בדפי אינטרנט.

הגרסה הקצרה

Google מבצעת שלושה צעדים בסיסיים כדי להפיק תוצאות מדפי אינטרנט:

סריקה

הצעד הראשון הוא לגלות אילו דפים קיימים באינטרנט. אין מרשם מרכזי לכל דפי האינטרנט, ולכן Google צריכה לחפש בקביעות דפים חדשים ולהוסיף אותם לרשימת הדפים המוכרים שברשותה. חלק מהדפים מוכרים מפני ש-Google כבר נכנסה אליהם. דפים אחרים מתגלים כש-Google עוקבת אחר קישור מדף מוכר לדף חדש. למרות זאת, חלק מהדפים מתגלים כשבעל אתר מגיש ל-Google רשימת דפים (sitemap) לסריקה. אם אתם משתמשים במארח אתרי אינטרנט מנוהל, כדוגמת Wix או Blogger, ייתכן שהוא ישלח הוראה ל-Google לסריקת דפים שעדכנתם או דפים חדשים שהוספתם.

לאחר ש-Google מגלה כתובת דף, היא נכנסת לדף, או סורקת אותו, כדי לגלות איזה תוכן נכלל בו. Google מעבדת את הדף ומנתחת את הטקסט, את התוכן שאינו טקסטואלי, ואת הפריסה הוויזואלית הכללית, כדי לקבוע את המיקום שבו הוא יופיע בתוצאות החיפוש. ככל ש-Google תבין את האתר שלך טוב יותר, נוכל להתאים אותו בצורה טובה יותר לאנשים שמחפשים את התוכן שלכם.

כדי לשפר את סריקת האתר שלכם:

  • מוודאים ש-Google יכולה להגיע לדפים באתר שלכם ושהם נראים נכונים. Google ניגשת לאינטרנט כמשתמש אנונימי (משתמש ללא סיסמאות וללא פרטים). כמו כן, Google צריכה להצליח לראות את כל התמונות והרכיבים האחרים של הדף כדי להבין אותו כראוי. תוכלו לבצע בדיקה מהירה על ידי הקלדת כתבות הדף שלכם בכלים לבדיקת התאמה לניידים.
  • אם יצרתם או עדכנתם דף אחד, תוכלו לשלוח אל Google כתובת דף יחידה. כדי להודיע ל-Google על מספר דפים חדשים או מעודכנים בו-זמנית, השתמשו ב-sitemap.
  • אם מבקשים מ-Google לסרוק דף אחד בלבד, יש לבחור בדף הבית. מבחינת Google, דף הבית הוא הדף החשוב ביותר באתר שלכם. כדי לעודד סריקה מלאה של האתר, יש לוודא שלדף הבית (ולכל שאר הדפים) יש מערכת טובה לניווט באתר המקשרת לכל הקטעים והדפים החשובים. כך המשתמשים (וגם Google) יתמצאו באתר שלכם בקלות. עבור אתרים קטנים יותר (פחות מ-1,000 דפים), כל מה שצריך הוא ש-Google תכיר את דף הבית שלכם. וחשוב ש-Google תוכל להגיע לכל יתר הדפים באמצעות נתיב קישורים שמתחיל מדף הבית הזה. 
  • כדאי להוסיף קישור לדף שלכם בדף אחר ש-Google כבר מכירה. עם זאת, שימו לב שלא יבוצע מעקב אחר קישורים בפרסומות, קישורים שאתם משלמים עבורם באתרים אחרים, קישורים בתגובות או קישורים אחרים שלא פועלים בהתאם להנחיות Google למנהלי אתרים.

 

Google לא מקבלת תשלום עבור סריקת אתר בתדירות גבוהה יותר או לדירוגו במיקום גבוה יותר. אם מישהו יגיד לכם אחרת, הוא טועה.

הוספה לאינדקס

לאחר גילוי הדף, Google מנסה להבין מה נושא הדף. תהליך זה נקרא הוספה לאינדקס. Google מנתחת את תוכן הדף, מקטלגת תמונות וסרטונים שמוטמעים בו ומנסה להבין את הדף. מידע זה שמור באינדקס Google‏, מסד נתונים ענק שמאוחסן בהמון, המון (המון!) מחשבים.

כך ניתן לשפר את התהליך של הוספת הדף שלכם לאינדקס:

  • כדאי ליצור כותרות דפים קצרות ובעלות משמעות.
  • כדאי להשתמש בכותרות דף שמעבירות את נושא הדף.
  • כדאי להשתמש בטקסט במקום בתמונות כדי להעביר תוכן (Google יכולה להבין היטב חלק מהתמונות והסרטונים, אבל לא באותה מידה שהיא יכולה להבין טקסט. לכל הפחות, כדאי להוסיף הערות וביאורים לסרטונים ולתמונות בעזרת טקסט חלופי ומאפיינים נוספים, לפי הצורך).

הצגה (ודירוג)

כשמשתמש מקליד שאילתה, Google מנסה למצוא את התשובה הרלוונטית ביותר מהאינדקס שלה על סמך גורמים רבים. Google מנסה לקבוע מהן התשובות האיכותיות ביותר, בשקלול שיקולים אחרים שיספקו את חוויית המשתמש הטובה ביותר ואת התשובה המתאימה ביותר. לשם כך גורמים רבים מובאים בחשבון, למשל, מיקום המשתמש, השפה שלו והמכשיר שבו הוא משתמש (מחשב או טלפון). לדוגמה, חיפוש של "תיקון אופניים" יציג תשובות שונות למשתמש בפריז מאלה שיוצגו למשתמש בהונג קונג. Google אינה מקבלת תשלום עבור דירוג אתר במיקום גבוה יותר. הדירוג נעשה באופן פרוגרמטי.

כך ניתן לשפר את אופן ההצגה והדירוג:

הגרסה הארוכה

מעוניינים במידע נוסף? בבקשה:

הגרסה הארוכה

סריקה

סריקה היא התהליך שבאמצעותו Googlebot נכנס לדפים חדשים ומעודכנים שיש להוסיף לאינדקס Google.

אנחנו משתמשים במערך עצום של מחשבים כדי לאחזר (או "לסרוק") מיליארדים של דפי אינטרנט. התוכנה המבצעת את האחזור נקראת Googlebot (היא מכונה גם 'רובוט', 'בוט' או 'סורק'). Googlebot משתמש בתהליך אלגוריתמי כדי לקבוע אילו אתרים לסרוק, באיזו תדירות לסרוק אותם וכמה דפים לאחזר מכל אתר.

תהליך הסריקה של Google מתחיל ברשימת כתובות URL של דפי אינטרנט שהופקה בתהליכי הסריקה הקודמים, ואשר אליה נוספו נתוני sitemap שסיפקו מנהלי אתרים. כאשר Googlebot נכנס לדף, הוא מאתר בו קישורים ומוסיף אותם לרשימת הדפים לסריקה. במסגרת התהליך נרשמים אתרים חדשים, שינויים באתרים קיימים וקישורים מנותקים, ואלה משמשים לעדכון של אינדקס Google.

במהלך הסריקה, Google מבצעת רינדור לדף באמצעות גרסה עדכנית של Chrome. במסגרת תהליך הרינדור, היא מריצה את הסקריפטים שנמצאים בדף. אם האתר משתמש בתוכן שנוצר באופן דינמי, עליכם לפעול לפי העקרונות הבסיסיים של אופטימיזציה למנועי חיפוש ב-JavaScript.

סריקה ראשית / סריקה משנית

Google משתמשת בשני סורקים שונים לסריקת אתרים: סורק לניידים וסורק למחשבים. כל סוג סורק מדמה משתמש שנכנס לדף מסוג מכשיר זה.

Google משתמשת בסוג אחד של סורק (לנייד או למחשב) בתור הסורק הראשי לאתר שלכם. Google סורקת את כל הדפים באתר באמצעות הסורק הראשי הזה. הסורק הראשי לכל האתרים החדשים הוא הסורק לניידים.

נוסף לכך, Google סורקת מחדש כמה דפים באתר שלכם בעזרת סוג הסורק השני (לניידים או למחשבים). פעולה זו נקראת סריקה משנית, והיא נועדה לבדוק מה מידת ההצלחה של פעולת האתר שלכם בסוג המכשיר הנוסף.

איך Google יודעת אילו דפים לא לסרוק?

  • דפים שחסומים באמצעות קובץ robots.txt לא ייסרקו, אבל ייתכן שבכל זאת יתווספו לאינדקס אם הם דף אחר מקשר אליהם. (Google יכולה להסיק את תוכן הדף על ידי קישור שמוביל אליו ולהוסיף את הדף לאינדקס בלי לנתח את תוכנו).
  • Google לא יכולה לסרוק דפים שאינם נגישים למשתמש אנונימי. לכן, דף התחברות מסוג כלשהו או כל הרשאת הגנה שהיא ימנעו את סריקת הדף.
  • דפים שכבר נסרקו ונחשבים עותקים משוכפלים של דפים אחרים, נסרקים בתדירות נמוכה יותר.

דרכים לשיפור הסריקה

אפשר להשתמש בטכניקות הבאות כדי לעזור ל-Google לגלות את הדפים הנכונים באתר שלכם:

הוספה לאינדקס

Googlebot מעבד כל דף שהוא סורק כדי להבין את תוכן הדף. פעולה זו כוללת עיבוד של התוכן הטקסטואלי ושל תגי תוכן ומאפיינים חשובים, כגון תגי <title> ומאפייני alt, תמונות, סרטונים ועוד. Googlebot מסוגל לעבד סוגי תוכן רבים, אך לא את כולם. לדוגמה, אנחנו לא יכולים לעבד את התוכן בחלק מקובצי המדיה העשירה.

בשלב כלשהו בין סריקה להוספה לאינדקס, Google קובעת אם הדף הוא עותק משוכפל או גרסה קנונית של דף אחר. אם הדף נחשב עותק משוכפל, הוא ייסרק בתדירות הרבה יותר נמוכה. דפים דומים מקובצים יחד למסמך – קבוצה של דף אחד או יותר, הכוללת את הדף הקנוני (הדף המייצג את הקבוצה) וכן דפים משוכפלים שנמצאו (ייתכן שאלה כתובות URL חלופיות שמגיעות לאותו דף, או גרסאות חלופיות לניידים או למחשבים של אותו דף).

שימו לב ש-Google לא מוסיפה לאינדקס דפים עם הוראת noindex (כותרת או תג). יחד עם זאת, חובה שההוראה תוצג ל-Google. אם הדף חסום על ידי קובץ robots.txt, דף התחברות או מכשיר אחר, ייתכן שהדף יתווסף לאינדקס גם בלי ש-Google נכנסה אליו!

דרכים לשיפור ההוספה לאינדקס

קיימות דרכים רבות לשיפור היכולת של Google להבין את תוכן הדף שלכם:

מהו "מסמך"?

Google מייצגת את האינטרנט באופן פנימי כקבוצה (ענקית) של מסמכים. כל מסמך מייצג דף אינטרנט אחד או יותר. דפים אלה זהים או דומים מאוד, אבל למעשה התוכן שבהם זהה, וניתן להיכנס אליהם באמצעות כתובות URL שונות. כתובות ה-URL השונות במסמך יכולות להוביל בדיוק לאותו דף (לדוגמה, example.com/dresses/summer/1234 ו-example.com?product=1234 עשויות להציג אותו דף), או שהן יובילו לאותו דף עם שינויים קלים שנועדו למשתמשים במכשירים שונים (לדוגמה, example.com/mypage למשתמשים במחשבים ו-m.example.com/mypage למשתמשים בניידים).

Google בוחרת באחת מכתובות ה-URL במסמך ומגדירה אותה ככתובת ה-URL הקנונית של המסמך. כתובת ה-URL הקנונית של המסמך היא זו ש-Google סורקת ומוסיפה לאינדקס בתדירות הגבוהה ביותר. כתובות ה-URL האחרות נחשבות עותקים משוכפלים או כתובות חלופיות, וייתכן שמדי פעם הן ייסרקו או יוצגו בהתאם לבקשת המשתמש: לדוגמה, אם כתובת ה-URL הקנונית של מסמך היא כתובת ה-URL לניידים, סביר להניח ש-Google עדיין תציג את כתובת ה-URL (החלופית) למחשבים עבור משתמשים המבצעים חיפוש במחשבים.

רוב הדוחות ב-Search Console מתייחסים לנתונים מכתובת ה-URL הקנונית של המסמך. חלק מהכלים (כמו הכלי לבדיקת כתובות URL) תומכים בבדיקת כתובות חלופיות, אבל בדיקה של כתובת ה-URL הקנונית אמורה לספק מידע גם על כתובות ה-URL החלופיות.

תוכלו ליידע את Google איזו כתובת URL היא הקנונית לדעתכם, אך ייתכן שהדף ש-Google תבחר כקנוני יהיה שונה, מכל מיני סיבות.

זהו סיכום של מונחים, והאופן שבו נעשה בהם שימוש ב-Search Console:

  • מסמך: אוסף של דפים דומים. כולל כתובת URL קנונית, וייתכן שגם כתובות URL חלופיות, אם באתר שלכם יש דפים משוכפלים. כתובות ה-URL במסמך יכולות להיות שייכות לאותו ארגון או לארגון שונה (הדומיין הבסיסי (root), לדוגמה "google" ב-www.google.com). Google תבחר את כתובת ה-URL הטובה ביותר להצגה בתוצאות חיפוש בהתאם לפלטפורמה (נייד/מחשב), לשפת המשתמש או למיקום, ובהתאם למשתנים רבים אחרים. Google מגלה דפים קשורים באתר שלכם באמצעות סריקה אורגנית או תכונות המוטמעות באתר, כמו הפניות אוטומטיות או התגים <link rel=alternate/canonical>. דפים קשורים בארגונים אחרים ניתנים לסימון כחלופיים רק אם הם קודדו במפורש באתר שלכם (באמצעות הפניות אוטומטיות או תגי קישורים).
  • כתובת URL: כתובת ה-URL המובילה אל קטע תוכן נתון באתר. האתר עשוי להתאים כתובות URL שונות לאותו הדף.
  • דף: דף אינטרנט נתון, שניתן להגיע אליו באמצעות כתובת URL אחת או יותר. יכולות להיות גרסאות שונות של דף כלשהו, בהתאם לפלטפורמה של המשתמש (נייד, מחשב, טאבלט וכן הלאה).
  • גרסה: וריאציה אחת של הדף, בדרך כלל מסווגת כ"נייד", "מחשב" ו-"AMP" (אף שגרסת ה-AMP יכולה לכלול גרסאות לניידים ולמחשבים). לכל גרסה יכולה להיות כתובת URL שונה (example.com לעומת m.example.com) או אותה כתובת URL (אם האתר משתמש בהצגה דינמית או בעיצוב אתר רספונסיבי, אותה כתובת URL יכולה להציג גרסאות שונות של אותו דף), בהתאם להגדרת התצורה של האתר. וריאציות של שפות אינן נחשבות לגרסאות שונות, אלא למסמכים שונים.
  • דף קנוני או כתובת URL קנונית: כתובת ה-URL שנחשבת, לפי Google, הכתובת המייצגת בצורה הכי טובה את המסמך. Google תמיד סורקת כתובת URL זו. גם כתובות URL כפולות במסמך נסרקות מדי פעם.
  • דף חלופי/כפול או כתובת URL חלופית: כתובת ה-URL של המסמך ש-Google עשויה לסרוק מעת לעת. Google תציג גם את כתובות ה-URL האלה אם הן מתאימות למשתמש ולבקשה (למשל, כתובת URL חלופית למשתמשים במחשבים תוצג לבקשות ממחשבים במקום כתובת URL קנונית לניידים).
  • אתר: בדרך כלל זו מילה נרדפת לאתר אינטרנט (קבוצת דפי אינטרנט הקשורים זה לזה מבחינה רעיונית), אבל לפעמים זו מילה נרדפת לנכס Search Console. אולם, נכס בפועל יכול להיות מוגדר רק כחלק מאתר. אתר יכול לכלול תת-דומיינים (וגם מספר ארגונים, אם יש בו דפי AMP שמקושרים כהלכה).

דפים עם תוכן זהה בשפות שונות מאוחסנים במסמכים שונים, הכוללים הפניות ביניהם באמצעות תגי hreflang. לכן חשוב להשתמש בתגי hreflang עבור תוכן מתורגם.

הצגת התוצאות

כאשר משתמש מזין שאילתה, המחשבים שלנו מחפשים באינדקס דפים תואמים ומחזירים את התוצאות שהן להערכתנו הרלוונטיות ביותר למשתמש. הרלוונטיות נקבעת על ידי מאות גורמים, ואנחנו תמיד פועלים לשיפור האלגוריתם שלנו. Google מביאה בחשבון את חוויית המשתמש בעת בחירת תוצאות ודירוגן, ולכן כדאי להקפיד שהדף שלכם נטען במהירות ושהוא מתאים לניידים.

איך לשפר את הצגת התוצאות

  • אם התוצאות שלכם מכוונות למשתמשים במיקומים ספציפיים או בשפות ספציפיות, תוכלו לספר ל-Google על העדפותיכם.
  • חשוב להקפיד שהדף שלכם נטען במהירות ושהוא מתאים לניידים.
  • מומלץ לפעול לפי ההנחיות למנהלי אתרים כדי להימנע משגיאות שכיחות וכדי לשפר את דירוג האתר שלכם.
  • כדאי לשקול הטמעת תכונות של תוצאות חיפוש באתר שלכם, כמו כרטיסי מתכונים או כרטיסי מאמרים.
  • כדאי להטמיע AMP לטעינה מהירה יותר של דפים בניידים. חלק מדפי ה-AMP כשירים גם לתכונות נוספות של תוצאות חיפוש, כמו הקרוסלה 'בראש החדשות'.
  • אנחנו משפרים באופן קבוע את האלגוריתם של Google. לכן, במקום לנסות לנחש את האלגוריתם ולעצב את הדף שלכם בהתאם לכך, כדאי להשקיע את המאמצים ביצירת תוכן טוב ועדכני שיעניין את המשתמשים, וכן לפעול לפי ההנחיות שלנו.

גרסה עוד יותר ארוכה

כאן תמצאו גרסה עוד יותר ארוכה על האופן שבו חיפוש Google פועל (עם תמונות וסרטון!)

האם המידע הועיל?
איך נוכל לשפר את המאמר?