האם סירי סוף סוף, באמת יכולה להיות טובה? קרדיט: SOPA Images / Getty Images
אפל נראתה איטית לקפוץ על עגלת הבינה המלאכותית הגנרטיבית, אבל חדשהמֶחקָרהקשור להבנה הקשרית עשוי להפוך את Siri לטוב יותר מאשר ChatGPT.
ענקית הטכנולוגיה הייתה שקטה באופן בולט במהלך המטאורעליית ChatGPTוהמטח שלאחר מכן של כלים ותכונות AI גנרטיביות מחברות כמוגוגל,מיקרוסופט, ומטא. אבל לחוקרים של אפל יש דגם חדש שיכול לתת לסירי את שדרוג הבינה המלאכותית הגנרטיבית לו קיוו מעריצי אפל.
"דיבור אנושי מכיל בדרך כלל התייחסויות מעורפלות כמו 'הם' או 'זה', שמשמעותם ברורה (לבני אדם אחרים) בהתחשב בהקשר", אמרו החוקרים. המאמר מציע מודל בשם ReALM (Reference Resolution As Language Modeling) המתמודד עם הבעיה של מודלים של שפה גדולה (LLMs) שלא תמיד מסוגלים להבין את ההקשר בכל הנוגע להפניות על המסך, לשיחה ורקע (למשל, אפליקציות או תכונות הפועלות ברקע) במטרה להשיג "חוויה אמיתית של דיבורית בעוזרות קוליות."
בעוד ש-ChatGPT הוא די טוב וסוגים מסוימים של הבנת הקשר, חוקרים אמרו ש-ReALM מתעלה על GPT-3.5 ו-GPT-4 (המספקים גרסאות חינמיות ותשלום של ChatGPT) בכל מבחני ההקשר שלה. הנה מה שזה יכול להיות אומר עבור סירי.
מהירות אור ניתנת לריסוק
1. רמזים להקשר על המסך
חוקרי אפל הכשירו את ReALM באמצעות נתונים "על המסך" מדפי אינטרנט, כולל מידע ליצירת קשר, מה שאפשר למודל להבין טקסט בתוך צילומי מסך (למשל, כתובות ופרטי חשבון בנק). בעוד ש-GPT-4 יכול גם להבין תמונות, הוא לא הוכשר על צילומי מסך, מה שלטענת העיתון הופך את ReALM לטוב יותר בהבנת מידע על המסך שמשתמשי אפל יבקשו מסירי עזרה.
2. הבנת שיחה ורקע
הפניות לשיחה אומרות משהו שרלוונטי לשיחה, אבל אולי לא מוזכר במפורש בהנחיה. מהדרכה של ReALM על נתונים כמו רשימות של עסקים, המודל יכול להבין הנחיות כמו "התקשר לחלק התחתון" בהתייחס לרשימה של בתי מרקחת קרובים המוצגים על המסך, ללא צורך במתן הוראות ספציפיות יותר.
ReALM מסוגלת להבין "ישויות רקע", כלומר משהו שרץ ברקע של מכשיר "שאולי לא בהכרח הוא חלק ישיר ממה שהמשתמש רואה על המסך שלו או מהאינטראקציה שלו עם הסוכן הווירטואלי", כמו מוזיקה שמתנגנת או אזעקה שנדלקת.
3. לגמרי במכשיר
אחרון חביב, ReALM נועד להיות במכשיר, וזה יהיה עניין גדול מכיוון ש-LLM דורשים הרבה כוח מחשוב ולכן הם בעיקר מבוססי ענן. במקום זאת, ReALM הוא LLM קטן יותר, "אך מותאם באופן ספציפי ומפורש למשימה של רזולוציית התייחסות." אפל הציגה היסטורית את המחויבות שלה לפרטיות כנקודת מכירה עבור המכשירים שלה, כך שגרסת AI גנרטיבית של Siri שפועלת לחלוטין על המכשיר תהיה גם מותגית מאוד וגם הישג גדול עבור מכשירים עם יכולות AI.
אפל הייתה כצפוי קצרת שפתיים לגבי תוכניות הבינה המלאכותית שלה, אבל המנכ"ל טים קוק אמר אצפויה הכרזת AI גדולהמאוחר יותר השנה, כך שכל העיניים נשואות לוועידת המפתחים העולמית של אפל (WWDC).10 ביוני.
ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.