ה-AlphaGo Zero של גוגל לימד את עצמו להפוך לשחקן ה-Go הגדול בהיסטוריה

קרדיט: מרקוס ייגלי

מעבדת DeepMind של גוגל בנתה תוכנית חכמה באופן מלאכותילימד את עצמולהפוך לאחד משחקני ה-Go הדומיננטיים בעולם. גוגל אומרת שהתוכנית, AlphaGo Zero, העניקה לעצמה "יכולות על אנושיות", אסטרטגיות למידה שלא היו ידועות בעבר לבני אדם.

AlphaGo Zero התחיל את דרכו ללא שמץ של מושג איך לנצח את המשחק Go -- משחק סיני בן 2,500 שנה שבו שני שחקנים משתמשים באריחים שחורים ולבנים כדי לכבוש שטח רב יותר מיריביהם.

ראה גם:

לקח ל-AlphaGo Zero רק שלושה ימים לנצח תוכנית AI קודמת (AlphaGo Lee), שניצחה בצורה מהדהדת את אלוף העולם לי Sedol בשנת 2016. לאחר 21 ימי משחק, AlphaGo Zero ניצחהאלפאגו מאסטר, תוכנית אינטליגנטית הידועה בכך שגברה על 60 מקצוענים מובילים ברשת ועוד שחקן אלוף עולם בשנת 2017. עד היום ה-40, AlphaGo Zero ניצחה את כל גרסאות הבינה המלאכותית הקודמות של AlphaGo.

וזה השיג את כל הניצחונות האלה בלי שום אסטרטגיות שסופקו על ידי אדם או ידע במשחק. גוגלפורסםהתוצאות שלהם השבוע בכתב העתטֶבַע.

"הרעיון החשוב ביותר ב-AlphaGo Zero הוא שהוא לומד לחלוטיןבלוטות טעם- זה אומר שהוא מתחיל מלוח ריק ומבין בעצמו, רק מתוך משחק עצמי, בלי שום ידע אנושי, שום מידע אנושי, בלי שום דוגמאות אנושיות או תכונות או התערבות של בני אדם", אמר חוקר אלפאגו הראשי דיוויד סילברב טֶבַערֵאָיוֹן.

לאחר שצפו במכונה שלהם לומדת אסטרטגיות אנושיות, סילבר וצוותו צפו ב-AlphaGo Zero משיגים באופן אוטונומי יכולות על אנושיות.

מהירות אור ניתנת לריסוק

"אז מה שהתחלנו לראות הוא ש-AlphaGo Zero לא רק גילה את הדפוס והפתחים הנפוצים שבני אדם נוטים לשחק... היא גם למדה אותם, גילתה אותם, ובסופו של דבר זרקה אותם בהעדפה לשונות משלו שבני אדם לא נוהגים לשחק בהם. אפילו לדעת או לשחק כרגע," הסביר סילבר.

במאי 2017, שחקן הגו הסיני המקצועי Ke Jie (משמאל) משחק נגד תוכנית הבינה המלאכותית של גוגל AlphaGo. קרדיט: VCG דרך Getty Images

החוקרים של גוגל השתמשו בתכנית "למידה חיזוקית" כדי להפוך את AlphaGo Zero לאינטליגנטי מספיק כדי ללמוד בעצמו. באמצעות רשת עצבית עמוקה - שהיא מודל מלאכותי של האופן שבו מוחות אנושיים מקשרים רעיונות ומבצעים את תחזיות התוצאות הטובות ביותר - AlphaGo Zero עשתה תחזיות מומחים משלה ולאחר מכן למדה מהטעויות שלה.

במהלך כ-30 מיליון משחקים, AlphaGo Zero ביצע מספר עצום של מהלכים. זה דרש כ-25 מיליון דולר בחומרת מחשב,לפילמנכ"ל Google DeepMind, Demis Hassabis.

כעת, כאשר AlphaGo Zero שלטה בתחרות העולמית שלה, גוגל חושבת שניתן ליישם את יכולת הלמידה העצמית חסרת התקדים הזו לבעיות אחרות, מבלי להקדיש זמן ומשאבים ללימוד המכונה.

"אם אתה יכול להשיגבלוטות טעםלמידה, באמת יש לך סוכן שניתן להשתיל ממשחק Go לכל תחום אחר. אתה מתיר את עצמך מהפרטים של התחום שאתה נמצא בו ואתה מגיע עם אלגוריתם שהוא כל כך כללי שאפשר ליישם אותו בכל מקום", אמר סילבר.

אם ניסויי AlphaGo הם רמז כלשהו, סוג זה של חדשנות בינה מלאכותית עשויה להוביל ליישום מחשבה "על אנושית" בתחומי קיום אחרים - אולי רפואה או מכוניות נוהגות בעצמן.

אבל לפי DeepMind's Silver, המטרה היא לא לעלות על בני אדם; זה עבור המכונות החכמות הללו לתרום לסכום הידע האנושי.

"מבחינתנו, הרעיון של AlphaGo הוא לא לצאת ולהביס בני אדם, אלא... שתוכנית תוכל ללמוד בעצמה מה זה ידע", אמר.

מארק הוא עיתונאי עטור פרסים ועורך המדע ב-Mashable. לאחר שעבד כשומר בשירות הפארקים הלאומיים, הוא החל בקריירת דיווח לאחר שראה את הערך יוצא הדופן בחינוך אנשים על ההתרחשויות על פני כדור הארץ, ומעבר לכך.

הואירד 2,500 רגללתוך מעמקי האוקיינוס בחיפוש אחר כריש שישה זימים, העז אל תוךאולמות של מעבדות מו"פ מובילות, וראיין חלק מההמדענים המרתקים ביותרבעולם.

אתה יכול להגיע למרק בכתובת[מוגן באימייל].

ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.