קרדיט: מיקרוסופט
מיקרוסופט מנסה להוכיח שהבינה המלאכותית שלה יכולה לעשות יותר מאשר לנחש את גילך או לנצח בפאק-מן.
ביום רביעי פרסמה החברהרואה AI, אפליקציית "מצלמה מדברת" עבורiOSנועד לעזור ללקויי ראייה לנווט את סביבתם.
רשימת התכונות שלו נשמעת כמעט טובה מכדי להיות אמיתית: היא יסרוק מסמכים ויקרא לך את תוכנם, יגיד לך איזה ערך של שטרות יש לך בידיים, יסרוק ברקודים כדי שתדע בדיוק מה אתה מחזיק, תלמד את הפרצופים של אנשים שאתה מכיר, קרא את הביטויים שלהם, ואפילו נסה לתאר את כל מה שעומד מולך בכל רגע נתון.
אולם בפועל, ברור שלמיקרוסופט יש עוד הרבה עבודה לעשות לפני ש-Seing AI יהיה למעשה כלי שימושי עבור לקויי ראייה. (גם החברה מודעת לכך היטב: הדבר הראשון שמופיע כשאתה מפעיל את האפליקציה הוא אזהרה ש"לראות בינה מלאכותית זה לא תמיד מדויק"). הנה איך זה הסתדר בבדיקות שלנו.
טקסט וברקודים
יש כבר הרבה אפליקציות בחוץ שיכולות לנתח בצורה מוכשרת טקסט וברקודים כך שלא מפתיע שזה מה שהאפליקציה עשתה הכי טוב. הוא היה מסוגל לקרוא כמעט כל קטע טקסט שזרקנו עליו וזיהה את רוב הברקודים בקלות.
בעוד שהיכולות הללו נפוצות למדי באפליקציות אחרות, היישום של AI בולט בכך שהוא מסייע לך ליישר את המצלמה בתוך האפליקציה עם כל מה שאתה מנסה לסרוק. במקרה של ברקודים, הוא יצפצף ככל שתתקרב לברקוד וינחה אותך עם טקסט כדי ליישר את המצלמה עם קצוות המסמך.
הקריאות של הטקסט המודפס היו קצת מביכות - אבל מדויקות - אבל הוא סרק כמעט כל ברקוד בקלות (צנצנת של אבקת חמאת בוטנים הכשילה אותו מסיבה כלשהי).
מהירות אור ניתנת לריסוק
אנשים ו"סצנות"
כאן הדברים נעשים מעניינים יותר. מלבד טקסט וברקודים, Seeing AI משתמש בהמון אלגוריתמי AI של מיקרוסופט כדי לזהות אובייקטים ואנשים בסביבתך. אלו היו החלקים המרשימים ביותר בהדגמות המוקדמות של האפליקציה של מיקרוסופט, אבל הדברים לא התנהלו בצורה חלקה בבדיקות שלי.
התחלתי בקלות: השולחן והספה שלי. האפליקציה זיהתה בקלות את שניהם, מה שאולי הציב את הציפיות שלי גבוהות מדי כי זה רק החמיר משם.
קרדיט: לראות את Ai
קרדיט: לראות בינה מלאכותית
לאחר מכן, ניסיתי ערימה של ספרים, שהאפליקציה זיהתה בטעות כ"ערימה של פליירים [sic]" ומיני מקרר עם כמה משחקים למעלה. לראות בינה מלאכותית חזרה עם "נראה שזה רצפה, מקורה, שולחן עבודה", שלמרות שזה לא שגוי מבחינה טכנית מכיוון שכל הפריטים הללו היו נוכחים טכנית, לא נראה מועיל לו באמת ניסיתי להבין מה עומד לפניי .
בשלב הבא, ניסיתי את התכונה "אנשים". זה מתיימר לספר לך לא רק כמה אנשים נמצאים סביבך אלא גם להעריך את גילם ומצבם הרגשי (בהתבסס על הבעת הפנים שלהם).
נראה שמיקרוסופט שיפרה את זהטכנולוגיה לניחוש גיללא מעט מאז שיצא לראשונה, אבל יש לו עוד עבודה לעשות. בעוד שהגילאים התקרבו באופן סביר (עמיתי שגילו הוערך יתר על המידה בחמש שנים עשוי לא להסכים), זיהוי הביטוי נראה פחות אמין.
התכונה גם לא מסוגלת לזהות אנשים שלא מסתכלים ישר לתוך המצלמה, מה שנראה כמו מגבלה די רצינית.
היו גם כשלים אחרים: גזרת קרטון של Chewbacca זוהתה כ"אדם שעומד מול מראה מצטלם למצלמה", וזה גם שגוי בצורה מצחיקה וגם ספציפית בצורה מוזרה, בעוד שאחד מקיילו רן חזר כ"נראה להיות קיר, מקורה [sic]."
כמובן, כל זה לא לגמרי צפוי. אפליקציות כמו זו דורשות כמות עצומה של נתוני אימון ותפקוד אלגוריתמים לפני שהם יכולים להיות קרובים לאמינים.
ובעוד שקל לצחוק על יותר#AIכשל, המציאות היא שסוג זה של טכנולוגיה באמת יכולה לשנות חיים עבור אדם עם לקויות ראייה אם היא אכן נותנת לו את היכולת לנווט בסביבתו ביתר ביטחון.
אבל אחרי שבילה זמן מה בניסיון לראות בינה מלאכותית, ברור שלמיקרוסופט יש עוד עבודה לעשות.
קאריסה הייתה כתבת הטכנולוגיה הבכירה של Mashable, והיא מבוססת בסן פרנסיסקו. היא מכסה פלטפורמות מדיה חברתית, עמק הסיליקון, והדרכים הרבות שבהן הטכנולוגיה משנה את חיינו. עבודתה הופיעה גם ב-Wired, Macworld, Popular Mechanics ו-The Wirecutter. בזמנה הפנוי היא נהנית לסנובורד ולצפות ביותר מדי סרטוני חתולים באינסטגרם. עקבו אחריה בטוויטר @karissabe.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.