זה לוקח רק חצי שנייה עבורגוגלכדי להחזיר חיפוש על סמך מילות מפתח שאתה מקליד, אבל יש הרבה יותר מתרחש מאחורי הקלעים כדי לתת לך את התוצאות שאתה צריך. גוגל השיקה ביום שני סרטון שמסביר את המדע מאחורי איך מנוע החיפוש המאסיבי עובד בפועל.
מאט קאטס, מהנדס תוכנה ראש צוות ספאם האינטרנט של גוגל, פרטים ב-aיוטיובסרטון כיצד ענקית מנועי החיפוש סורקת ביסודיות את האינטרנט על בסיס יומי כדי לספק למשתמשים את התוצאות המעודכנות ביותר.
"יש שלושה דברים שאתה צריך לעשות כדי להיות מנוע החיפוש הטוב ביותר בעולם. ראשית, אתה צריך לסרוק את האינטרנט באופן מקיף ועמוק, ואז אתה רוצה לדרג או לשרת את הדפים האלה ולהחזיר קודם את הרלוונטיים ביותר", קאטס. אמר.
למרות שגוגל סורקת את האינטרנט על בסיס יומי, זה לא תמיד היה המקרה.
"נהגנו לזחול במשך 30 יום... ולאחר מכן לבצע אינדקס במשך כשבוע ולדחוף את הנתונים האלה החוצה - וזה ייקח בערך שבוע," אמר קאטס. "לפעמים היית פוגע במרכז נתונים עם נתונים חדשים ולפעמים היית פוגע במרכז נתונים עם נתונים ישנים."
אבל שיטה זו לא עברה אופטימיזציה מכיוון שהרבה מהמידע יהיה לא מעודכן. בשנת 2003, גוגל עברה לסרוק כמות משמעותית מהאינטרנט בכל יום. על ידי סריקה באינטרנט בכל יום אחר תוכן חדש, הוא עדכן בהדרגה את האינדקס שלו.
ראה גם:
"השתפרנו אפילו יותר עם הזמן, ובשלב זה, אנחנו יכולים לשמור את זה טרי מאוד", אמר קאטס.
לשם כך, דירוג הדף הוא הגורם המרכזי שקובע את הסיכוי שתראה קישור: "אנחנו בעצם לוקחים את דירוג הדף כגורם הקובע העיקרי וככל שיש לך יותר דירוג דף -- כלומר, יותר אנשים מקשרים אל אתה וככל שהאנשים האלה בעלי מוניטין רב יותר - כך גדל הסיכוי שנגלה את הדף שלך בשלב מוקדם יחסית בסריקה", אמר קאטס.
גוגל גם שמה דגש רב על סדר המילים. לדוגמה, חיפוש אחר זמרת הפופ "קייטי פרי" יחפש תוצאות עם שתי המילים הללו אחת ליד השנייה, במקום ש"קאטי" והמילה "פרי" יופיעו בחלקים שונים של התוכן.
מציאת האיזון הנכון בין קרבת מילים, מוניטין של עמוד וקישורים המפנים אליה היא המפתח.
"זה סוג של הרוטב הסודי," הוסיף קאט.
לאחר מכן, גוגל שולחת את השאילתה הזו למאות מכונות שונות בבת אחת, אשר מסתכלות דרך חלקי האינטרנט שלהם שנוספו לאינדקס כדי למצוא את ההתאמה הטובה ביותר.
"אנחנו אומרים, 'מה העמוד הטוב ביותר שמתאים לשאילתה הזו בכל האינדקס שלנו?'' אמר קאטס. "אנחנו לוקחים את הדף הזה ומנסים להציג אותו עם קטע שימושי, אז אנחנו מציגים את מילות המפתח בהקשר של המסמך. ולהחזיר את הכל תוך פחות מחצי שנייה."
כיצד לדעתך חברות יכולות להשתמש במידע הזה כדי להופיע טוב יותר בתוצאות החיפוש של Google? תן לנו לדעת את המחשבות שלך בתגובות.
תמונה ממוזערת דרךiStockphoto,פרנקרפורטר.
בונוס: 10 הצצות נהדרות מאחורי הקלעים של גוגל