קרדיט: iStock Editorial / Getty Images Plus
לאחרונה, משתמשים שמו לב לזרימה של סיכומים שנוצרו על ידי AI של ביקורות מוצרים באמזון. האם ניתן לסמוך עליהם?
אֲמָזוֹנָהלמוצרים יש לעתים קרובות מאות ואלפיביקורות, וזה יכול להיות מייגע ולאורך זמן לנפות את כל המשוב הזה. אבל קנייה באמזון של מעמד למחשב נייד, למשל, מצריכה לעתים קרובות סינון של אפשרויות רבות באתר המשתנות באופן דרסטי באיכותן, עומס עבודה מתאים יותר להשקעה ברכב מאשר לקניית פריט ביתי. באוגוסט האחרון, אמזוןהכריזפתרון לבדיקת עייפות: סיכום שנוצר בינה מלאכותית שמדגיש בתמציתיות את היתרונות והחסרונות של הלקוחות.
תיאורטית, התכונה היא כלי שימושי שעוזר לצרכנים להחליט במהירות אילו מוצרים לקנות. אבל הופעתם של הסיכומים האלה מדגישה את המלכודות שבהסתמכות על בינה מלאכותית גנרטיבית:חוֹסֶר דִיוּקומידע מטעה.
חיפוש מהיר באמזון העלה מספר בעיות. סיכום שנוצר על ידי AI של ביקורות עבורManduka GRP Adapt Hot Yoga Mat, התייחס למזרן יוגה אחר על ידי מותג מתחרה, וקרא לו "מזרן יוגה של אלו לוחם". מאז אמזון פתרה את הבעיה הספציפית הזו לאחר ש-Mashable הביאה אותה לידיעתם. אבל תיקון אי דיוקים בודדים בתפוקות של מודל שפה גדול זה קצת כמו whac-a-mole, כי אפילו המהנדסים לא מבינים לגמרי את התנהגויות המודלים.
הסיכום שנוצר בינה מלאכותית מכנה בטעות את מזרן היוגה של Manduka "מזרן היוגה של אלו הלוחם", שהוא מוצר ומותג אחר. קרדיט: אמזון
ובזה טמונה הבעיה בהסתמכות רבה מדי על AI גנרטיבי. אימון בינה מלאכותית להתנהג באופן אוטונומי גם אומר שמודלים יכולים "לפעול" בדרכים לא מכוונות או מביכות.
בכמה דוגמאות קטנות אחרות, סיכום סקירת הבינה המלאכותית של משהו שנקרא סודו של Musher התייחס למוצר במעורפל כ"ציוד לחיות מחמד" ואמר שהוא שומר על "רפידות ה-PSA חמות". בהיותנו משחה המגנה על כפות הכלב מפני מדרכות קפואות, זה כנראה אמור להיות "רפידות כפות", אלא אם כן "רפידות psa" הן משהו שאנחנו לא יודעים עליו. במונחים של שכל ישר בינה מלאכותית, נראה שהמודל "לומד" לכתוב דברים כמו "רפידות psa" במקום "רפידות כפות" מהאידיוסינקרטיות של משתמשים אמיתיים, מה שלכאורה יעניק לפלטים של ה-AI אותנטיות מסוימת. אבל האם זה מה שמשתמשים צריכים לרצות?
תקציר הביקורת של Musher's Secret מכנה את המוצר "הציוד לחיות מחמד" וכותב "psa" במקום ככל הנראה "כפה". קרדיט: אמזון
עבור אקדח עיסוי מיני של TheraGun, סיכום הביקורת מכניס את המילה "אפליקציה" במלוא המילים, כך שכתוב "הם מזכירים שה-APP מספק מידע שימושי על הסוללה וכמה זמן היא מחזיקה". סביר להניח שהתקציר מדבר על האפליקציה הנלווית, אבל מה אם במקום זה היה מתייחס לתכונה טכנית בשם "APP?"
מהירות אור ניתנת לריסוק
כתיבת "אפליקציה" במלואה היא בעיה קטנה אך עלולה לבלבל את הלקוחות. קרדיט: אמזון
נכון, מדובר בשגיאות קלות שאינן משפיעות על מהות הסיכום. בנוסף, ביקורות אנושיות מכילות שגיאות הקלדה כל הזמן וזה לא בהכרח הורס את האמינות שלהן. אבל אולי הרף צריך להיות גבוה יותר עבור אינטליגנציה לא אנושית שלאזכה באמון שלנואוּלָם. אז כל אי דיוק או קשקוש מופרך מרגישים כמו דגל אדום מיידי.
גרוע מכך: אם אי דיוקים והזיות ייעלמו מעיניהם, הסיכומים הללו - המוצגים כסמכותיים יותר או פחות - עלולים לפגוע במוניטין של מוצרים. אבלומברג דִוּוּחַגילה כי סיכומי ביקורות המוצרים מגזימים בהיבטים השליליים של ביקורות, אשר מטעים את הצרכנים. הסיכום שנוצר על ידי AI של כדורי טניס של Penn עם דירוג של 4.7 כוכבים הדגיש את הריח כשלי. אבל מתוך 4,300 הרייטינג, "רק שבע ביקורות מזכירות ריח". זה לא רק מטעה לקוחות, זה עלול ליצור בעיות עבור סוחרים.
בנוסף, הביקורות לא ציינו את סוג הריח, אבל האם לא לכל כדורי הטניס הטריים יש את הריח הגומי החריף הזהחלק מהאנשים אפילו נהנים? התייחסויות לדברים כמו ריח של כדורי טניס נראים פחות כמו הכללת תלונות לגיטימיות, ויותר כמו הקולות הפולשניים של מבקרים בסגנון קארן שנותנים באופן לא פרופורציונלי ביקורות שליליות למוצרים בגלל משהו לא הגיוני כמו אריזה שקשה לפתוח.
השימוש הזה בטכנולוגיה מעלה גם שאלות לגבי מה צריך ומה לא צריך להיות מדגיש סקירה שנוצרה בינה מלאכותית. לצורך בקרת איכות וכדי להבטיח שלמוצרים אין סיכומים שנוצרו על ידי בינה מלאכותית של ביקורות מרמה, אמזון משתמשת רק בביקורות של Verified Purchase ומתמקדת במוצרים שיש להם "מספר מינימלי של ביקורות", ורק במצבים שבהם "לקוחות חולקים את אותה דעה", אמרה הדוברת מריה בושטי.
נכון לעכשיו, לאמזון אין דגשים לביקורות על ספרים, מה שנראה כמו דבר טוב. אבל יש לו דגשים לרפואה כמו אדוויל איבופרופן, שאולי לא תעלה לרמה של סכנה פוטנציאלית, אבל כן מעידה על חוסר זהירות מסוים בהפצת תכונה זו. אמזון אומרת שהיא מתכננת להתרחב לקטגוריות נוספות, כך שלא נראה שזהירות בתפריט כרגע.
למרות שלא היה קשה למצוא דוגמאות פגומות, הלקוחות כבר מוצאים את התכונה שימושית. עובד של Mashable שחיפש חצובה זולה הצליח להחליט על ידי השוואת סיכומים של ביקורות מוצרים שונות, ובחר אחד שלא היה לו משוב שלילי, בהשוואה לאחרים עם סנטימנטים קצת יותר מעורבים.
"הניתוח שלנו מצא כי דגשים בביקורת עוזרים ללקוחות למצוא את המוצרים שהם רוצים ומובילים להגדלת המכירות למוכרים", אמר Boschetti. "אכפת לנו מאוד מהדיוק, ונשפר ללא הרף את חווית הדגשים בביקורת לאורך זמן."
ובואו נהיה כנים, רוב האנשים לא יכולים או לא רוצים לבזבז את הזמן בניתוח ביקורות כאשר סיכום פשוט יספיק - כל עוד הוא מדויק.
אז האם אתה צריך לסמוך על סיכומי הביקורת האלה? שאלה טובה יותר יכולה להיות,האם הסיכומים הללו נוחים יותר למשתמשים מהמערכת הקודמת?אפשר - בזהירות רבה - לטעון שהתשובה לשאלה הזו היא "אמון, אבל בדוק, על ידי הבנת הפגמים והחולשות של הטכנולוגיה".
ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.