קרדיט: בוב אל-גרין/מאשבל
מדבר עםאלכסההוא לעתים קרובות מדי עניין חד צדדי. ללא ספק, המטרה העיקרית של עוזר דיגיטלי היאלְהַקְשִׁיב, אבל התגובות שלו נוטות להעדיף יעילות קרה -- היכנס וצא. אם בן אדם דיבר אליך באותה צורה, היית חושב שהוא פסיבי אגרסיבי כדי לגרום לך לשתוק ולהשאיר אותם בשקט.
בעוד שהדינמיקה הזו הגיונית מנקודת מבט תועלתנית, היא מנוגדת למטרות המוצהרות של כל העוזרים הדיגיטליים (Siri, Google Assistant והשאר) - היותה שפת שיחה.
כדי באמת לקחת את התועלת שלהם לשלב הבא, עוזרים דיגיטליים צריכים להבין יותר מסתם מילים. עליהם לקחת בחשבון את ההקשר ואפילו את מצב הרוח או האישיות של הדובר.
רוב העוזרים הדיגיטליים משתמשים בבינה מלאכותית כדי להבין את ההקשר במידה מסוימת, כך שהם יכולים להגיב לשאילתות המשך. החיפוש הקולי של Google הצליח להגיב לשאלות המשךמאז 2013 לפחות. אתה יכול לשאול, "מי הוא ראש ממשלת בריטניה?" וכשגוגל אומרת לך שזו תרזה מיי, אתה יכול לעקוב אחריו עם "מתי היא נולדה?" לראות שמיי נולדה ב-1 באוקטובר 1956.
עם זאת, סוג זה של מודעות הקשרית לא נמשכת בדרך כלל מעבר לכמה שאילתות נוספות. כמו כן, שיחות אנושיות אמיתיות מערבות את שני הצדדים, לעתים קרובות, מקשיבים ומדברים בו-זמנית. אם אתה מגיב למישהו IRL, אתה כל הזמן קורא את ההבעות שלו ומתכוונן. אתה יכול אפילו להתערב מדי פעם, ולכן חיוני שגם הצד השני יתבונן, מוכן להגיב לרגעים כאלה.
הגבול הבא
עוזרים דיגיטליים הם ממש גרועים בכל הדברים העדינים האלה שקורים בשיחות רגילות היום. אֲבָלמיקרוסופטחמק החוצה אהודעה אחרונהשנותן לנו תקווה לעתיד. החברה טוענת שעשתה קפיצת מדרגה גדולה בתחום הבינה המלאכותית בשיחות על ידי הצגת "דופלקס מלא" - כלומר, היכולת לנהל שיחה מילולית עם עוזר מונע בינה מלאכותית שבה היא יכולה לדבר ולהקשיב בו זמנית.
"זו העסקה הגדולה ביותר", אמר שיין מאק, מנכ"ל Assist, פלטפורמת עוזר אוטומטית, ל-Mashable. "זהו הפתרון לבעיית 'אני לא מבין'. כך הופכת פעולת ההקשבה להבנה. כש[עוזרים דיגיטליים] יתחילו לעשות את הדברים האלה, אנשים יגידו, 'לכל הרוחות, זה מה שאני רוצה'".
אין צורך לומר "אלכסה" או "קורטנה" מילות ערות שוב ושוב יהיה בהחלט נוחות, אם כי זה גם אומר שנצטרך לכוון מחדש את הציפיות שלנו לגבי מתי עוזר באמת מקשיב לתוכן של מה שקורה. אמר ולא רק חציצה של אודיו כדי לסרוק מילה ערה. זה משנה את משוואת הפרטיות, ומשתמשים יצטרכו להצטרף בבירור להאזנה - וכך להקליט בצורה כלשהי - לעתים קרובות יותר.
מהירות אור ניתנת לריסוק
"אתה צריך לתת ללקוח את הפקדים כדי להיות בשליטה על הפרטיות שלו", אומר מאק. "בסופו של יום, אתה צריך לאזן בין פרטיות ונוחות. כולם ירצו את זה".
קרדיט: מיקרוסופט
אבל לטכנולוגיה של דופלקס מלא יש פוטנציאל להפוך את האינטראקציות שלנו עם עוזרים דיגיטליים להרבה יותר טבעיים. תוכל לומר הוראות נוספות כאשר הבינה המלאכותית נמצאת באמצע תגובה למשהו אחר - נגיד, תגיד לו לעמעם את האורות כשהיא באמצע קריאת אימייל.
זה לא אומר בהכרח שהשיחות גסות יותר, רק יותר אנושיות. כמה פעמים נזכרת במשהו בדיוק כשהאדם שאתה מדבר איתו רק התחיל דיבור ארוך? "חכה רגע" בדרך כלל עושה את העבודה מבלי לפגוע, ובאופן תיאורטי יעבוד עם עוזר המסוגל לבצע דופלקס מלא.
"אנחנו יודעים שזהו כיוון שאליו פונה כל המרחב [העוזר הדיגיטלי]", אומרת קישה קלייטון, מנהלת תקשורת בכירה ב-Microsoft AI. "במקום לנהל שיחת סיבוב של טריגר אחד, זוהי שיחה דופלקסת מלאה, מרובה פניות שבה אתה יכול להמשיך לשוחח, אתה לא צריך את מילת ההתעוררות."
סין מובילה את הדרך
דופלקס מלא אינו זמין באף אחד מהעוזרים הגדולים בארה"ב, אפילו לא הקול של מיקרוסופט בחלל, Cortana. (גוגל, אפל ואמזון סירבו להגיב למאמר זה, אם כי ברור שאף אחד מהעוזרים שלהם לא מציע דופלקס מלא כרגע). צ'אטבוט מיקרוסופט הציגה בשנת 2014 והוא פופולרי מאוד ... באסיה.
"שיאויצ'ה מספקת את מזג האוויר בתחנות חדשות, היא קוראת שירה, היא שרה שירים", מסביר קלייטון. "בסין, הם באמת מובילים את הדרך עם מה שיכולנו לראות כעתיד עם הבוטים האלה."
בזכותהשותפות של מיקרוסופט עם שיאומי, XiaoIce נמצא כעת בכמה מכשירי בית חכם, ונאמר כי לצ'אטבוט יש יותר מ-200 מיליון משתמשים. לפחות אחד מהם בסופו של דבר דיבר עם XiaoIce יותר מ-4 שעות, טוענת מיקרוסופט, עם יותר מ-1,600 חילופים מילוליים בודדים.
זו צ'אטי קאתי אחת -- סשן ראפ כזה הוא כמעט בלתי נתפס כשהוא מוערם על רקע עדכוני מזג האוויר השוטפים והגדרת הטיימר שתופסים את הרוב המכריע של רוחב הפס המילולי של אלקסה וסירי.
"כרגע צ'אטבוטים טובים יותר בהיותם משיבונים מאשר מאפשרים שיחה", אומר מייקל Facemire, אנליסט ראשי ב-Forrester Research. "רוב הצ'אטבוטים מאפשרים לך לשאול שאלה אחת ולקבל תשובה אחת בחזרה. זה מאוד מאוד חשוב שיהיה לנו [דופלקס מלא] לטווח ארוך."
ובכל זאת, קשה לאמוד עד כמה התגובות של XiaoIce הן אישיות או שימושיות ללא תמליל. ובואו נהיה אמיתיים - השיא של מיקרוסופט עם צ'אטבוטים מעורב, בלשון המעטה. זה איפשר בשוגג לאינטרנט לאמן את בוט הטוויטר שלו, Tayזבל גזעני חוזרוהמאמץ החדש יותר שלו,כָּזֶה, לא בדיוק מדליק את העולם עם התגובות המתחשבות שלו. פשוט בדוק את הקטע הזה מהשיחה שלי איתו:
במילים אחרות, דופלקס מלא הוא כלי נהדר ליצירת שיחות, אבל ברור שה-AI שמניע אותם זקוק לעבודה. ובכל זאת, אם אי פעם באמת נגיע למחשב מסע בין כוכבים למחצה שכולנו חולמים עליו, היכולת להקשיב תוך כדי דיבור היא משהו שכל העוזרים הדיגיטליים יצטרכו ללמוד. ולפעם אחת, מיקרוסופט זוכה להוביל את השיחה.
פיט פצ'ל היה העורך הטכנולוגי של Mashable והיה בחברה מ-2011 עד 2019. הוא סיקר את תעשיית הטכנולוגיה, ממכוניות בנהיגה עצמית ועד לסמארטפונים שהרסו את עצמם. פיט סיקר את הטכנולוגיה הצרכנית בדפוס ובאינטרנט במשך יותר מעשור. במקור מאדמונטון, קנדה, פיט העלה את עצמו לראשונה לעיתונות טכנולוגית במגזין Sound & Vision בשנת 1999. פיט שימש גם כעורך טכנולוגי ב-Syfy, ויצר את האתר הטכנולוגי של הערוץ, DVICE (כיום Blastr), מתוך קוד HTML חלוד ו- קולב מעילים מפורק. לאחר מכן הוא עבר ל-PCMag, שם שימש כמנהל החדשות של האתר. פיט הוצג ב-Fox News, The Today Show, בלומברג, CNN, CNBC ו-CBC. פיט הוא בעל תארים בעיתונאות מאוניברסיטת קינגס קולג' בהליפקס. הנדסה מאוניברסיטת אלברטה באדמונטון. מפלצות הדוקטור הו האהובות עליו הן אנשי הסייבר.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.