סירי שאתה מבין באותה מידה שהוא מבין אותך. קרדיט: Shutterstock / nenetus
סירי הבאה לא תשים את ההדגשה על ההברה הלא נכונה.
זו פחות או יותר ההבטחהתַפּוּחַנעשה במהלךהמפתח של כנס המפתחים העולמי בשבוע שעבר. בהפגנה על הבמה, סגן הנשיא הבכיר של אפל להנדסת תוכנה, קרייג פדריגי, שאל את סירי על מזג האוויר.
"הנה התחזית לשלושת הימים הבאים: שמש, שמש ושטוף שמש," השיבה סירי.
כל "שמש" נשמע בגוון שונה. למרות שפדריגי הכריז על זה "חזק מאוד", קהל המפתחים לא פרץ למחיאות כפיים פרועות.
אולי זה ניצחון בפני עצמו. עם הקרובiOS 11, סירי בת ה-6 תישמע כל כך טבעית שאף אחד לא ישים לב, ובהודעה אני מתכוון לרגעים הראויים האלה כשסירי (או בעצם כל עוזרת קולית) מנסה לבטא שם, מיקום או להציע עוד תשובה טבעית וזה נשמע כאילו הם בלעו זבוב באמצע המשפט. (האהוב עליי האישי הוא כשסירי משבשת את השם של עיר הולדתי.)
חלק מזה הוא תוצאה של האופן שבו הקול של סירי נבנה במקור. בתור סוזן בנט, האישה הנחשבת לקול הראשון של סירי,סיפר להגרדיאןבסוף השנה שעברה, ל-Nuance, שבנתה את זיהוי הקול והתגובה המקוריים של סירי, הרשומה שלה "מאות ומאות משפטים וביטויים נוצרו כדי לקבל את כל שילובי הצלילים בביטויים".
ולא, היא לא הקליטה, "מזג האוויר באל פאסו הוא 100 מעלות ושטוף שמש."
במקום זאת, בנט ואחרים שהיו הקולות המקוריים של סירי הקליטו משפט אחר משפט שלא היה הגיוני. דברים כמו "פאסה, שאל את פאסה תשאל את סאטי" ו"תגיד את הגריסה שוב, אמור את הגריסה שוב."
עם כל חלקי הדיבור האלה, סירי יכלה לבנות פקסימיליות סבירות של תגובות קוליות למגוון מסחרר של שאלות, גם אם לא כולן נשמעות בדיוק אנושיות.
עם זאת, סירי נמצאת בכל דבר, מהאייפון ל-Apple TV ועד למק ועד ל-Apple Watch (ובקרוב ה-HomePod של אפל). היא גם מטפלת, על פי אפל, ב-2 מיליארד בקשות קוליות מדי שבוע ומשיבה לפחות בכמה משפטים. לכן, ההגיות השגויות של סירי והתגובות המפסיקות מדי פעם הן כמעט בלתי נמנעות.
מהירות אור ניתנת לריסוק
הגיע הזמן לשינוי, אם כי, למען האמת, סירי תמיד משתנה.
בשנה שעברה, אפל אמרה לי שהם נתנו לסירי מה שהסתכםהשתלת מוח, בלי הרבה תרועה. הם התחילו ליישם למידת מכונה על עיבוד השפה הטבעית וראו שיפורים בזיהוי דיבור והבנת שאילתות על רעשי רקע.
כעת, אפל נוקטת באותה גישה מונעת למידה של מכונה לנאום של סירי עצמה.
הקול של סירי ב-iOS 11, אמרה לי אפל, הוא חדש לגמרי.
בניית הקול של סירי עדיין מתחילה בקטעי אודיו מוקלטים שזורים יחד לתגובות האודיו של סירי. אמנם לא ברור אם אפל עדיין משתמשת במשפטי שטות, אבל החברה אומרת שסירי יכולה להגיד הכל.
הסיבה לכך היא שהטכנולוגיה המשמשת ליצירת משפטים קוגנטיים היא אותה הטכנולוגיה שעזרה לסירי להבין אותך טוב יותר.
אפל משתמשת בלמידת מכונה או, ליתר דיוק, למידה עמוקה ורשתות עצביות, תת-דיסציפלינה של למידת מכונה המבקשת לשכפל את הדרך שבה מוחות מתפקדים ולומדים, כדי לחבר את החלקים לתגובות.
כדי לגרום לתגובות להישמע טבעיות יותר, אפל הזינה דוגמאות של אנשים אמיתיים המדברים לתוך מערכת ה- Machine Learning שלה. הוא ניתח ניואנסים בדיבור אנושי כמו כשאנשים לוקחים נשימה, ואיך קולות עולים ויורדים במשפט אחד, וכמובן, הדגשה ואינטונציה.
האלגוריתם משתמש גם בכוח של בינה מלאכותית ולמידת מכונה כדי להסתכל על בניית משפטים ומדוע אותה מילה הממוקמת בשלוש עמדות שונות במשפט אחד צריכה להיות מבוטא בשלוש דרכים שונות באופן מובהק.
אלו דברים שאנחנו לא ממש שמים לב אליהם או שמים לב אליהם כי זו הדרך שבה כולנו מדברים - אלא אם כן אנחנו מחשבים.
אפל מתכוננת לטשטש את הקו הזה, לא כל כך כדי להטעות אנשים לחשוב שסירי היא אנושית, אלא להעביר את הפוקוס מהאופן שבו סירי מדברת למידע שהעוזרת הדיגיטלית מספקת. זה יהפוך חשוב במיוחד ככל שסירי תהפוך לשיחתי יותר. ב-iOS 11, תוכל לצלול עמוק יותר לתוך תגובות Siri על ידי הקשה על המסך ולאחר מכן שאלת שאלת המשך. תן וקח זה יפעיל יותר לחץ על אפל לגרום לסירי להישמע נורמלי (או אמיתי) ככל האפשר.
יהיה מעניין לראות איך זה מתורגם ברחבי העולם. Siri נמצאת כעת ב-36 מדינות, מכסה 21 שפות שונות, ואפל משיקה בקרוב תכונת תרגום חדשה של Siri עם חמש שפות ועוד.
אולי לא נצטרך להגיד לסירידבר בטבעיות, כי היא כבר תעשה את זה.
לאנס אולנוף היה הכתב הראשי והעורך ב-Large של Mashable. לאנס שימש כחבר בכיר בצוות העריכה, תוך התמקדות בהגדרת תוכן דעה פנימי ואצור. הוא גם עזר לפתח כישורי סיפור אלטרנטיביים בכל הצוות ויישום של כלי מדיה חברתית במהלך אירועים חיים. לפני שהצטרף ל-Mashable בספטמבר 2011, לאנס אולנוף שימש כעורך ראשי של PCMag.com וסגן נשיא בכיר לתוכן עבור Ziff Davis, Inc. בזמן שהוא שם, הוא הדריך את המותג לקיום דיגיטלי של 100% ופיקח על אסטרטגיית תוכן לכולם מאתרי האינטרנט של זיף דייויס. הטור הארוך שלו ב-PCMag.com זיכה אותו בפרס ארד מה-ASBPE. Winmag.com, HomePC.com ו-PCMag.com זכו כולם לכבוד בהדרכתו של לאנס. הוא מופיע תכופות בתוכניות חדשות לאומיות, בינלאומיות ומקומיות כולל Fox News, The Today Show, Good Morning America, Kelly and Michael, CNBC, CNN וה-BBC. הוא גם הציע פרשנות ברדיו הציבורי הלאומי והתראיין לעיתונים ותחנות רדיו ברחבי הארץ. לאנס היה דובר אורח מוזמן במספר רב של כנסים טכנולוגיים, כולל SXSW, Think Mobile, CEA Line Shows, Digital Life, RoboBusiness, RoboNexus, Business Foresight ו-Digital Media Wire's Games and Mobile Forum.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.