לגוגל יש וידוי: היא לא מבינה אותך. אם תשאלו את זה "10 האגמים העמוקים ביותר בארה"ב", זה ייתן לכם תוצאה טובה מאוד בהתבסס על מילות המפתח בביטוי ואתרים עם סמכות משמעותית על המילים הללו ואפילו קבוצות מילים, אבל עמית גוגל וסמנכ"ל סמנכ"ל עמית סינגאל אומר גוגל לא מבין את השאלה. "אנחנו מחזיקות אצבעות ומקווים שמישהו באינטרנט כתב על הדברים או הנושאים האלה."
העתיד שלגוגלחיפוש, עם זאת, יכול להיות סיפור אחר לגמרי. בשיחה נרחבת,סינגהל, העוסק בתחום החיפוש כבר 20 שנה, התווה חזון מתפתח לחיפוש שלוקח אותו מעבר למילים גרידא ואל עולם הישויות, התכונות והיחסים בין הישויות הללו. במילים אחרות, מנוע החיפוש העתידי של גוגל לא רק יבין את שאלת האגם שלך אלא יידע שאגם הוא גוף מים ויגיד לך את העומק, שטחי הפנים, הטמפרטורות ואפילו המליחות של כל אגם.
כדי להבין לאן גוגל הולכת, עם זאת, אתה צריך לדעת היכן היא הייתה.
אַשׁרַאי:
בסופו של דבר גוגל עברה מבדיקת מילות מפתח למשמעות. "הבנו שהמילים 'ניו' ו'יורק' המופיעות זו לצד זו שינו לפתע את המשמעות של שתי המילים הללו." גוגל פיתחה יוריסטיקה סטטיסטית שזיהתה ששתי המילים האלה שמופיעות יחד הן סוג חדש של מילה. עם זאת, גוגל באמת עדיין לא הבינה שניו יורק היא עיר, עם אוכלוסייה ומיקום מסוים.
ובכל זאת, רצפי מילים והמשמעות שיש להם זה משהו, אבל לא מספיק עבור גוגל או סינגהל, שנבחר לאחרונה לאקדמיה הלאומית להנדסה.
שינויים גדולים בפתח
גוגל רוצה כעת להפוך מילים המופיעות בדף לישויות שמשמעותן משהו ויש להן תכונות קשורות. זה מה שהמוח האנושי עושה באופן טבעי, אבל עבור מחשבים, זה מכונה בינה מלאכותית.
זו משימה מאתגרת, אבל העבודה כבר החלה. גוגל "בונה הבנה עצומה פנימית של מהי ישות ומאגר של ישויות בעולם ומה צריך לדעת על הישויות האלה", אמר סינגהל.
אַשׁרַאי:
בשנת 2010, גוגל רכשה את Freebase, בסיס ידע שנבנה על ידי קהילה עמוס בכ-12 מיליון ישויות קנוניות. 12 מיליון הם התחלה טובה, אבל גוגל, לפי סינגהל, השקיעה באופן דרמטי כדי "לבנות גרף ידע עצום של ישויות הקשורות ביניהן והתכונות שלהן".
המעבר מאינדקס המבוסס על מילים לגרף ידע זה הוא שינוי מהותי שיגדיל באופן קיצוני את העוצמה והמורכבות. סינגהל הסביר שהמילה אינדקס היא בעצם כמו האינדקס שאתה מוצא בגב ספר: "בסיס ידע הוא עצום בהשוואה לאינדקס המילים והרבה יותר מעודן או מתקדם."
כרגע גוגל, אמר לי סינגהל, בונה את התשתית לחיפוש המורכב יותר מבחינה אלגוריתמית של המחר, והמשימה הזו, כמובן, כוללת יותר מחשבים. כל המחשבים האלה עוזרים לענקית החיפוש לבנות את גרף הידע, שכעת יש לו "מצפון ל-200 מיליון ישויות". מה אתה יכול לעשות עם סוג כזה של גרף ידע (או בסיס)?
בהתחלה, אתה פשוט עושה צעדים קטנים. למרות שראיות לאינטליגנציה דמוית AI זו מתחילות להופיע בתוצאות החיפוש של גוגל, רוב האנשים כנראה אפילו לא שמו לב לזה.
גרף ידע בעבודה היום
אַשׁרַאי:
כשאני מציין שזה לא נראה שונה בטירוף או חריג יותר מהתוצאות המסורתיות לעיל, סינגהל הזהיר אותי כי לשפוט את כוחו של גרף הידע בנושא זה יהיה כמו לשפוט אמן על עבודה שעשה כילד בן 12 או 24 חודשים .
אפשר לראות שזה קצת אירוני שגוגל מתייחסת למה שהיתה ביקורת מרכזית שהוטחה בה על ידי מתחרת החיפוש הראשית שלה, מיקרוסופטבינג. ענקית התוכנה הריצה סדרה של פרסומות חריפות, שאמנם מעולם לא הזכירה את גוגל בשמה, אך תיארו את תוצאות החיפוש שרוב האנשים מקבלים כחסרות הקשר באופן קומי. רוב האנשים הבינו שהביקורת והבדיחה כוונו לגוגל, ועכשיו גוגל עושה משהו לגבי איכות התוצאות שלה.
כששאלתי את סינגהאל אם הוא חשב על הביקורת של בינג והבין שבינג כבר מזמן מפרסם שהתוצאות שלו מתמקדות יותר בתשובות שימושיות במקום בקישורים, סינגהל סטה ואמר שהוא לא יכול להגיב על מה שבינג עשוי לעשות או לא.
ראוי גם לציין שמיליוני אנשים מאמינים כעת שכבר יש להם חיפוש בינה מלאכותית הודות לחיפוש של אפלאייפון 4Sוסירי, העוזר האינטליגנטי. הוא משתמש במידע שהוא יכול לגשת אליו בטלפון שלך ובאמצעות האינטרנט כדי לענות על שאלות בשפה טבעית. מה שגרף הידע של גוגל יכול לעשות, ברור שהוא צריך לחרוג ממותג הבינה המלאכותית של סירי.
להצביע בדיוק כמה רחוק אתה יכול לקחת את "חיפוש העתיד", עם זאת, קצת קשה עבור סינגהל. "אנחנו בונים את 'מתנגש ההדרון'. אילו חלקיקים ייצאו מזה, אני לא יכול לחזות כרגע", אמר.
מצד שני, סינגהל כן מודה שזה החלום שלו לבנות את מחשב מסע בין כוכבים. כמו סירי, אתה יכול לשאול את המחשב הזה, שהופיע בתוכנית המדע הבדיוני של שנות ה-60, כמעט כל שאלה ולקבל תשובה אינטליגנטית. "כל ההיבטים של מחשוב או בינה מלאכותית משתפרים כאשר יש לך תשתית כזו בבית", אמר סינגהל בהתייחסו לגרף הידע המאסיבי שגוגל בונה. "אתה יכול לעבד שאילתה או שאלה הרבה יותר טוב, ואתה מתקרב צעד נוסף לבנייה. המחשב של מסע בין כוכבים", אמר.
מעבר לחיפוש
אם כבר מדברים על מסע בין כוכבים, יש גבול נוסף שעשוי להפיק תועלת מהכוח של גרף הידע של גוגל: רובוטיקה. סינגהל הוא אמנם לא מומחה, אבל ציין שרובוטיקה, שקיימת בצומת של מהנדסי מכונות ומחשוב, נאבקת בכל הנוגע ליכולות השפה. "אני מאמין שאנחנו מניחים את הבסיס לאופן שבו רובוטיקה תשלב שפה בעתיד של אינטראקציה בין רובוט לאדם", אמר.
זו מחשבה מרגשת. בהיותי חנון רובוט, המשכתי לצייר תמונת עתיד שסינגהאל לא חלק עליו: רובוטים עתידיים עם גישה למנוע החיפוש מבוסס הישויות של גוגל אולי יוכלו להבין ש"התינוק הזעיר" שהם מטפלים בו (מה ? לא היית משאירה את התינוק שלך עם רובוט?) הוא קטן, שביר ותמיד רעב. הרובוט יכול אפילו לדעת איך להאכיל את התינוק כי הוא יידע שיש להצליב את הישות "תמיד רעב" עם העובדה שזהו "תינוק", שהוא גם ישות בגרף הידע, וכולל תכונות כמו "ללא מוצקים."
כשדיברנו, עלה בדעתי שבעוד 200 מיליון ישויות זה הרבה, עולם הידע הוא עצום. כמה ישויות יידרש כדי שגרף הידע של גוגל ידע את התשובה לכל דבר? סינגהל צחק ובמקום להצביע על מספר סובב את השאלה:
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.