לי סדול סוקר את המשחק השלישי מול AlphaGo, בסיאול ב-12 במרץ 2016. קרדיט: Lee Jin-man/AP
הבלתי מתקבל על הדעת קרה: תוכנית המחשב AlphaGo של גוגל שלחה בקלות את אלוף העולם מרובים לי סדול במשחק תערוכת Go, וניצחה 3:0 (מתוך חמישה משחקים אפשריים).
במסיבת עיתונאים שאחרי המשחק, סדול התנצל על כך שלא הראה תוצאה טובה יותר. "די הרגשתי חסר אונים", אמר.
הוא אמר שבמשחק הראשון הוא לא העריך נכון את היכולות של AlphaGo. המשחק השני היה הפוך או שבירה, אבל הוא החמיץ הזדמנויות. לגבי המשחק השלישי, הוא אמר שמעולם לא הרגיש כל כך לחץ. בסופו של דבר לי התפטר לאחר 176 מהלכים.
"לא הייתי מסוגל להתגבר על כמות הלחץ הזו", אמר.
"אנחנו קצת המומים וחסרי מילים", אמר מנכ"ל DeepMind, דמיס חסאביס.
#AlphaGoניצח את המשחק השלישי ואת המשחק! רגע היסטורי. ביראת כבוד מוחלטת מהגאונות המדהימה של לי סדול, וגאה בצוות AlphaGo המדהים!
- דמיס חסאביס (@demishassabis)12 במרץ 2016
הניצחון המוחץ הוא אבן דרך חשובה - ובעיקר לא צפויה - עבור בינה מלאכותית. לפני כמה שנים חשבו שבינה מלאכותית לעולם לא תוכל לשלוט ב-Go כפי שעשתה שחמט, בגלל המספר העצום של החישובים המעורבים (יותר ממה שיש אטומים ביקום, לפי גוגל).
ואז, בינואר, AlphaGo, פרויקט של חברת הבינה המלאכותית של גוגל DeepMind,ווֹןנגד אלוף אירופה Fan Hui, מה שמוכיח בפעם הראשונה של-AI יש את מה שצריך כדי לצאת נגד שחקנים מקצועיים.
מהירות אור ניתנת לריסוק
מנצח מול הטובים ביותר
הניצחון מול Sedol, לעומת זאת, הוא משהו שונה. אלוף העולם המרובה, אחד השחקנים הדומיננטיים ביותר בעשור האחרון, וכרגע מדורג רביעי בעולם, חשב שהוא ינצח בקלות, רק נותן אפשרות קלה לאלפאגו לנצח באחד מחמשת המשחקים.
לפי Yoo Changhyuk, מאסטר של 9 דן גו שהגיב על המשחק, Sedol ניסה מספר אסטרטגיות נגד AlphaGo. "במהלך המשחק הראשון, לי סדול ביצע מהלכים קשים כדי להסעיר את AlphaGo, אך לא הצליח לעשות זאת. היום הוא ניסה את ההיפך - הוא שיחק בטוח ונכנס למשחק הסיום", אמר לאחר המשחק השני.
בסופו של דבר, שום דבר לא עבד נגד ה-AI העוצמתי, שהזכייה שלו עדיין לא הופכת אותה לאלופת העולם, אבל היא בהחלט מדרגת אותה שם עם הטובים שבטובים.
למרות שהוא הפסיד שלושה ברציפות, לסדול עדיין יש סיכוי להציל פנים, מכיוון שכל חמשת המשחקים ישוחקו כדי לקבוע את התוצאה הסופית.
למה הניצחון הזה כל כך חשוב?
מאז שמחשב השחמט Deep Blue של IBM התחיל לנצח באופן קבוע את השחקנים המובילים בסוף שנות ה-90, התרגלנו לכך שבינה מלאכותית פשוט טובה יותר בסוגים מסוימים של אתגרים מאשר בני אדם. הדבר נובע בחלקו משיפורים בכוח המחשוב, כאשר מחשבים מסוגלים לחשב מיליוני מהלכים מראש תוך שניות, ובחלקו בשל השימוש בשיטות היוריסטיות לפתרון בעיות בשחמט.
Go זה שונה; הכללים שלו, שבהם השחקנים של הצד השחור והלבן מתחרים על לכידת היתדות זה של זה, פשוטים יותר, אבל הלוח גדול יותר (רשת של 19x19), ומספר השילובים גדול מדי עבור כל מחשב נוכחי לחשב איתו כוח גס.
AlphaGo -- הוסבר בפירוט בינוארנְיָרבכתב עת מדעיטֶבַע- משתמש ברשתות עצביות כדי לחקות שחקני Go מומחים, ומסוגל ללמוד ממשחקים שהוא משחק נגד עצמו. הוא גם משתמש באלגוריתמים של חיפוש עצים כדי לדמות אלפי משחקים אקראיים של משחק עצמי.
במונחים קלים להבנה, השחמט יעיל יותר. זה מתחיל מאותה תצורה בדיוק בכל פעם; המהלכים מוגבלים יחסית, במיוחד עבור חלקים מסוימים, כמו הפיון, ואיבוד דמות, ברוב המקרים, הוא דבר רע. ב-Go אתה כל הזמן צריך להעריך את כל האפשרויות. ניתן למקם יתדות על כל החללים הריקים על הלוח, ולעתים קרובות קשה לומר אם המהלך היה טוב או רע, מכיוון שיש יותר מדי אפשרויות בהמשך הדרך כדי להיחשב.
"ב-AlphaGo יש שתי רשתות עצביות שונות", מסביר מתכנת DeepMind הראשי דיוויד סילבר בסרטון יוטיוב, שפורסם על ידיטֶבַעבינואר. "רשת המדיניות" משמשת כדי להציע מהלכים מבטיחים לכל משחק, מה שמפחית מאוד את מספר האפשרויות ש-AlphaGo צריך לשקול. לאחר מכן משתמשים ב"רשת הערך" להקטנת עומק החיפוש. "במקום לעשות את החיפוש העמוק העצום הזה שצריך לרדת עד אולי ל-300 מהלכים, עד לסוף המשחק, מה שאנחנו עושים זה אנחנו מחפשים לאיזה עומק צנוע, של אולי 20 מהלכים, ואז אנחנו מעריכים את העמדה הזו מבלי לשחק עד סוף המשחק", מסביר סילבר.
"תהליך החיפוש עצמו אינו מבוסס על כוח גס; הוא מבוסס על משהו שדומה יותר לדמיון", הוא אומר.
היישומים האמיתיים של ההצלחה של AlphaGo הם רבים. האסביס של DeepMind מכנה זאת "קפיצת מדרגה לקראת בניית בינה מלאכותית כללית". וסילבר מספק דוגמה לרפואה, שבה AI יכול יום אחד להשתמש בטכניקות דומות כדי למצוא "אילו רצפים של טיפולים מובילים לתוצאות הטובות ביותר".
יש לך מה להוסיף לסיפור הזה? שתפו אותו בתגובות.
סטן הוא עורך בכיר ב-Mashable, שם הוא עובד מאז 2007. יש לו יותר גאדג'טים וחולצות טריקו מונעי סוללה ממך. הוא כותב על הדבר פורץ הדרך הבא. בדרך כלל, זהו טלפון, מטבע או מכונית. המטרה הסופית שלו היא לדעת משהו על הכל.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.