כיצד פועל חיפוש Google

איך Google מגלה, סורקת, ומציגה דפי אינטרנט

כיצד פועלת Google? הנה גרסה קצרה וגרסה ארוכה.

Google מקבלת מידע ממיקומים שונים ורבים, כולל: 

  • דפי אינטרנט
  • תוכן ששולחים משתמשים, למשל דרך Google לעסק שלי ומפות Google
  • סריקות ספרים
  • מסדי נתונים ציבוריים המפורסמים באינטרנט
  • ומקורות רבים נוספים.

בכל מקרה, הדף הזה מתמקד בדפי אינטרנט.

הגרסה הקצרה

Google מבצעת שלושה צעדים בסיסיים כדי להפיק תוצאות מדפי אינטרנט:

סריקה

הצעד הראשון הוא לגלות אילו דפים קיימים באינטרנט. אין מרשם מרכזי לכל דפי האינטרנט, ולכן Google צריכה לחפש בקביעות דפים חדשים ולהוסיף אותם לרשימת הדפים המוכרים שברשותה. תהליך גילוי זה נקרא סריקה.

חלק מהדפים מוכרים מפני ש-Google כבר סרקה אותם בעבר. דפים אחרים מתגלים כש-Google עוקבת אחר קישור מדף מוכר לדף חדש. למרות זאת, חלק מהדפים מתגלים כשבעל אתר מגיש ל-Google רשימת דפים (sitemap) לסריקה. אם אתם משתמשים במארח אתרי אינטרנט מנוהל, כדוגמת Wix או Blogger, הוא עשוי להגיד ל-Google לסרוק דפים שעדכנתם או דפים חדשים שהוספתם.

איך לשפר את סריקת האתר שלכם:

  • לשינויים בדף בודד, אפשר להגיש כתובת אתר יחידה ל-Google
  • אפשר להוסיף קישור לדף בדף אחר ש-Google כבר מכירה. יחד עם זאת, שימו לב שלא ייעשה מעקב לקישורים בפרסומות, לקישורים שאתם משלמים עבורם באתרים אחרים, לקישורים בתגובות או לקישורים אחרים שלא פועלים בהתאם להנחיות Google לבעלי אתרים.

 

Google אינה מקבלת תשלום עבור סריקת אתר בתדירות גבוהה יותר או לדירוגו במיקום גבוה יותר. אם מישהו יגיד לכם אחרת, הוא טועה.

יצירת אינדקס

לאחר גילוי הדף, Google מנסה להבין מה נושא הדף. תהליך זה נקרא יצירת אינדקס. Google מנתחת את תוכן הדף, מקטלגת תמונות וסרטונים שמוטמעים בו, ומנסה להבין את הדף. מידע זה שמור ב-אינדקס Google‏, מסד נתונים ענק ששמור בהמון, המון (המון!) מחשבים.

כך ניתן לשפר את תהליך יצירת האינדקס לדף שלכם:

  • כדאי ליצור כותרות דפים קצרות ובעלות משמעות
  • כדאי להשתמש בכותרות דף שמעבירות את נושא הדף
  • כדאי להשתמש בטקסט במקום בתמונות כדי להעביר תוכן (Google יכולה להבין היטב חלק מהתמונות והסרטונים, אבל לא באותה מידה שהיא יכולה להבין טקסט. לכל הפחות, כדאי להוסיף הערות וביאורים לסרטון ולתמונות בעזרת טקסט חלופי ומאפיינים נוספים, לפי הצורך).

הצגה (ודירוג)

כשמשתמש מקליד שאילתה, Google מנסה למצוא את התשובה הרלוונטית ביותר מהאינדקס שלה על סמך כמה גורמים. Google מנסה לקבוע מהן התשובות האיכותיות ביותר, בשקלול שיקולים אחרים, שיספקו את חוויית המשתמש הטובה ביותר ואת התשובה המתאימה ביותר. לשם כך נלקחים גורמים רבים בחשבון, למשל, מיקום המשתמש, השפה שלו והמכשיר שבו הוא משתמש (מחשב שולחני או טלפון). לדוגמה, חיפוש של "תיקון אופניים" יציג תשובות שונות למשתמש בפריז מאלה שיוצגו למשתמש בהונג קונג. Google אינה מקבלת תשלום עבור דירוג אתר במיקום גבוה יותר. הדירוג נעשה באופן פרוגרמטי.

כך ניתן לשפר את אופן ההצגה והדירוג:

הגרסה הארוכה

מעוניינים במידע נוסף? בבקשה:

הגרסה הארוכה

 

סריקה

סריקה היא התהליך שבו Googlebot מגלה דפים חדשים ועדכניים שיש להוסיף לאינדקס של Google.

אנחנו משתמשים במערך עצום של מחשבים כדי לאחזר (או "לסרוק") מיליארדים של דפי אינטרנט. התוכנית המבצעת את האחזור נקראת Googlebot (מכונה גם 'רובוט', 'בוט' או 'סורק'). Googlebot משתמש בתהליך אלגוריתמי: תוכניות מחשב קובעות אילו אתרים יש לסרוק, באיזו תדירות וכמה דפים לאחזר מכל אתר.

תהליך הסריקה של Google מתחיל ברשימת כתובות אתרים של דפי אינטרנט שהופקה בתהליכי הסריקה הקודמים ואשר אליה נוספו נתוני Sitemap שסיפקו מנהלי אתרים. כש-Googlebot מבקר בכל אחד מהאתרים האלה, הוא מאתר קישורים בכל דף ומוסיף אותם לרשימת הדפים לסריקה. במסגרת התהליך מצוינים אתרים חדשים, שינויים באתרים קיימים וקישורים מנותקים, ומשמשים לעדכון האינדקס של Google.

איך Google מוצאת דף?

Google משתמשת בטכניקות רבות למציאת דף, כולל:

  • מעקב אחר קישורים מאתרים או מדפים אחרים
  • קריאת קובצי sitemap

איך Google יודעת אילו דפים לא לסרוק?

  • דפים שחסומים באמצעות קובץ robots.txt לא ייסרקו, אבל ייתכן שבכל זאת יתווספו לאינדקס אם הם מקושרים לדף אחר (Google יכולה להסיק את תוכן הדף על ידי קישור שמוביל אליו ולהוסיף את הדף לאינדקס בלי לנתח את תוכנו).
  • Google לא יכולה לסרוק דפים שאינם נגישים למשתמש אנונימי. לכן, דף התחברות מסוג כלשהו או כל הרשאת הגנה שהיא ימנעו את סריקת הדף.

דרכים לשיפור הסריקה

אפשר להשתמש בטכניקות הבאות כדי לעזור ל-Google לגלות את הדפים הנכונים באתר שלכם:

יצירת אינדקס

Googlebot מעבד כל דף שהוא סורק על מנת ליצור אינדקס עצום של כל המילים שהוא רואה ואת מיקומן בכל דף. בנוסף לכך, אנחנו מעבדים את המידע הנכלל בתגי תוכן ובמאפיינים חשובים, כגון תגי Title ומאפייני Alt. Googlebot מסוגל לעבד סוגי תוכן רבים, אך לא את כולם. לדוגמה, אנחנו לא יכולים לעבד את התוכן בחלק מקובצי המדיה העשירה.

שימו לב ש-Googlebot לא סורק דפים עם הוראת noindex (כותרת או תג). יחד עם זאת, הוא חייב להיות מסוגל לראות את ההוראה. אם הדף חסום על ידי קובץ robots.txt, דף התחברות או מכשיר אחר, ייתכן שהדף יתווסף לאינדקס גם אם Google לא תיכנס אליו!

דרכים לשיפור יצירת האינדקס

קיימות דרכים רבות לשיפור היכולת של Google להבין את תוכן הדף שלכם:

הצגת התוצאות

כאשר משתמש מזין שאילתה, המחשבים שלנו מחפשים באינדקס דפים תואמים ומחזירים את התוצאות שהן להערכתנו הרלוונטיות ביותר למשתמש. הרלוונטיות נקבעת על ידי יותר מ-200 גורמים, ואנחנו תמיד פועלים לשיפור האלגוריתם. Google מביאה בחשבון את חוויית המשתמש בעת בחירת תוצאות ודירוגן, לכן כדאי להקפיד שהדף שלכם נטען במהירות ושהוא מתאים לניידים.

איך לשפר את הצגת התוצאות

  • אם התוצאות שלכם מכוונות למשתמשים במיקומים ספציפיים או בשפות ספציפיות, אפשר לספר ל-Google על העדפותיכם.
  • להקפיד שהדף שלכם נטען במהירות ושהוא מתאים לניידים.
  • מומלץ לפעול לפי ההנחיות למנהלי אתרים כדי להימנע משגיאות שכיחות וכדי לשפר את דירוג האתר שלכם.
  • כדאי לשקול הטמעה של תכונות של תוצאות חיפוש באתר שלכם, כמו כרטיסי מתכונים או כרטיסי מאמרים.
  • כדאי להטמיע AMP לטעינה מהירה יותר של דפים בניידים. חלק מדפי ה-AMP כשירים גם לתכונות נוספות של תוצאות חיפוש, כמו הקרוסלה 'בראש החדשות'.
  • אנחנו משפרים באופן קבוע את האלגוריתם של Google. לכן, במקום לנסות לנחש את האלגוריתם ולעצב את הדף שלכם בהתאם לכך, כדאי להשקיע את המאמצים ביצירת תוכן טוב ועדכני שיעניין את המשתמשים, וכן לפעול לפי ההנחיות שלנו.

גרסה עוד יותר ארוכה

אפשר למצוא כאן גרסה עוד יותר ארוכה על האופן שבו חיפוש Google פועל (עם תמונות וסרטון!)

האם המאמר היה מועיל?
איך נוכל לשפר את המאמר?