עבור כתוביות, בני אדם הם עדיין המפתח לטכנולוגיה נגישה, מונעת בינה מלאכותית

כלי בינה מלאכותית נוכחיים פועלים כאבן דרך יעילה, לא כקו סיום, לנגישות. קרדיט: Getty Images

התיק לפיקוח אנושי עלבינה מלאכותית (AI)השירותים נמשכים, עם העולם השזור שלתמלול אודיו, כתוביות וזיהוי דיבור אוטומטי (ASR)מצטרפים לקריאה לבקשות המשלימות, לא מחליפות, קלט אנושי.

כיתובים וכתוביות ממלאים תפקיד חיוני במתן גישה למדיה ומידע לצופים חירשים או כבדי שמיעה, והםעלה בשימוש פופולריבמהלך השנים האחרונות. תומכי נכים דחפו לאפשרויות כתוביות טובות יותר עבורעשרות שנים, המדגיש צורך שהולך יותר ויותר רלוונטי עם התפשטותשירותי סטרימינג לפי דרישה. פלטפורמות מבוססות וידאו התחברו במהירות גם לבינה מלאכותית, כש-YouTube הכריזה על בדיקות מוקדמות שלתכונת AI חדשה המסכמת סרטונים שלמיםו-TikTokבוחן צ'אט בוט משלו.

אז עם הטירוף ההולך וגובר על AI כמצוף למגבלות הטכנולוגיה, שילוב הכלים והשירותים העדכניים ביותר של AI בכתוביות אוטומטיות עשוי להיראות כמו שלב הבא הגיוני.

ראה גם:

3Play Media, חברה לשירותי נגישות וכתוביות וידאו, התמקדה בהשפעה של כלי בינה מלאכותית גנרטיבית על כתוביות המשמשות בעיקר צופים חירשים וכבדי שמיעה בתוכנית שפורסם לאחרונהדוח מצב של זיהוי דיבור אוטומטי לשנת 2023. על פי הממצאים, המשתמשים צריכים להיות מודעים להרבה יותר מאשר דיוק פשוט כששירותי AI חדשים ומתקדמים במהירות נזרקים לתמהיל.

הדיוק של זיהוי דיבור אוטומטי

הדו"ח של 3Play Media ניתח את שיעור שגיאות המילים (מספר המילים המתועתקות במדויק) ואת שיעור השגיאות המעוצב (הדיוק של המילים והפורמט בקובץ מתומלל) של מנועי ASR שונים, או מחוללי כיתובים המופעלים על ידי AI. מנועי ה-ASR השונים משולבים במגוון תעשיות, כולל חדשות, השכלה גבוהה וספורט.

"ASR באיכות גבוהה לא בהכרח מוביל לכיתובים באיכות גבוהה", מצא הדו"ח. "עבור שיעור שגיאות מילים, אפילו המנועים הטובים ביותר ביצעו רק כ-90% מדויק, ועבור שיעור שגיאות בפורמט, רק בסביבות 80% במדויק, אף אחד מהם לא מספיק לציות לחוק ולדיוק של 99%, תקן התעשייה לנגישות."

החוק אמריקאים עם מוגבלויות (ADA)מחייב ממשלות מדינה ומקומיות, עסקים וארגונים ללא מטרות רווח המשרתים את הציבור "לתקשר בצורה יעילה עם אנשים הסובלים מלקויות תקשורת", כוללכתוביות סגורות או בזמן אמתשירותים לחירשים וכבדי שמיעה. על פי נציבות התקשורת הפדרלית (FCC)כללי ציות לטלוויזיה, כתוביות חייבות להיות מדויקות, מסונכרנות, רציפות וממוקמות כראוי "במידה המרבית האפשרית".

דיוק הכתוביות על פני מערך הנתונים השתנה מאוד גם בשווקים ובמקרי שימוש שונים. "חדשות ורשתות, קולנוע וספורט הם הקשים ביותר עבור ASR לתמלל בצורה מדויקת", כותבת 3Play Media, "כיוון שלעתים קרובות יש בשווקים האלה תוכן עם מוזיקת רקע, דיבור חופף ואודיו קשה. לשווקים אלה יש את שיעורי השגיאות הממוצעים הגבוהים ביותר עבור שיעור שגיאות מילים ושיעור שגיאות בפורמט, כאשר חדשות ורשתות הן הכי פחות מדויקות."

למרות שבאופן כללי, הביצועים השתפרו מאז הדו"ח של 3Play Media לשנת 2022, החברה גילתה ששיעורי השגיאות עדיין גבוהים מספיק כדי להצדיק שיתוף פעולה עם עורך אנושי בכל השווקים שנבדקו.

שמירה על בני אדם בעניינים

דגמי תמלול בכל רמה, מהצרכן ועד לשימוש בתעשייה, שילבו כיתוב אודיו שנוצר בינה מלאכותית במשך שנים. רבים כבר משתמשים במה שמכונה מערכות "אנושיות בלולאה", שבהן תהליך רב-שלבי משלב גם כלי ASR (או AI) וגם עורכים אנושיים. חברות כמו Rev, שירות נוסף של כתוביות ותמלול, ציינו את זהחשיבותם של עורכים אנושייםבסנכרון אודיו-ויזואלי, עיצוב מסך, ושלבים נחוצים אחרים בהפיכת מדיה חזותית נגישה לחלוטין.

מהירות אור ניתנת לריסוק

ייתכן שהציוץ נמחק

מודלים של Human-in-the-loop (הידועים גם בשם HITL) קודמו בפיתוח AI גנרטיבי כדי לנטר טוב יותרהטיה מרומזת במודלים של AI, ולהנחות בינה מלאכותית גנרטיבית עם קבלת החלטות בהנחיית אדם.

קונסורציום האינטרנט העולמי (W3C).יוזמת נגישות לאינטרנטמחזיקה זמן רב בעמדתה גם לגבי פיקוח אנושי, שצוין בההנחיה לכתוביות ולכתוביות. "כתוביות שנוצרות באופן אוטומטי אינן עונות על צורכי המשתמש או דרישות הנגישות, אלא אם כן יאושרו כמדויקות לחלוטין. בדרך כלל הן זקוקות לעריכה משמעותית", נכתב בהנחיות הארגון. "כתוביות אוטומטיות יכולות לשמש כנקודת התחלה לפיתוח כיתובים ותמלילים מדויקים".

ובדוח משנת 2021 על החשיבות שלתעתיקים חיים שנוצרו על ידי אדם, 3Play Media ציין היסוסים דומים.

"ל-AI אין את אותה יכולת להקשרכאדם, כלומר כאשר ASR לא מבין מילה לא נכון, ישנה אפשרות שהיא תוחלף במשהו לא רלוונטי, או יושמט לגמרי", כותבים בחברה. "למרות שכרגע אין דרישה חוקית מוחלטת לשיעורי דיוק כתוביות בשידור חי,תקנות כיתוב פדרליות ומדינתיות קיימותעבור תוכן מוקלט ציין כי מקומות לינה נגישים חייבים לספקניסיון שווהלזה של צופה שומע... תוך כדילא AI ולא כתוביות אנושיות יכולים לספק דיוק של 100%., השיטות היעילות ביותר של כתוביות חי משלבות את שתיהן כדי להתקרב ככל האפשר."

סימון הזיות

בנוסף למספרי דיוק נמוכים יותר באמצעות ASR בלבד, הדו"ח של 3Play Media ציין חשש מפורש מהאפשרות שלAI "הזיות",גם בצורה של אי דיוקים עובדתיים וגם הכללת משפטים שלמים מפוברקים לחלוטין.

בְּהַרְחָבָה,הזיות מבוססות בינה מלאכותיתהפכו להיבט מרכזי בארסנל של תלונות נגד טקסט שנוצר בינה מלאכותית.

ראה גם:

בינואר, כלב שמירה על מידע מוטעהNewsGuardפרסם אלִלמוֹדעל הקלות של ChatGPT לייצר ולמסור טענות מטעות למשתמשים המתחזות ל"שחקנים רעים". הוא ציין כי בוט הבינה המלאכותית שיתף מידע מוטעה על אירועי חדשות 80 מתוך 100 פעמים בתגובה להנחיות מובילות הקשורות לדגימה של נרטיבים כוזבים. ביוני, מנחה רדיו אמריקאיהגיש תביעת לשון הרע נגד OpenAIלאחר שהצ'אטבוט שלו, ChatGPT, הציע לכאורה "עובדות" שגויות על המארח למשתמש המחפש פרטים על תיק בית משפט פדרלי.

רק בחודש שעבר, מובילי בינה מלאכותית (כולל אמזון, אנתרופיק, גוגל, Inflection, Meta, Microsoft ו-OpenAI)נפגש עם ממשל ביידן-האריס"לעזור לנוע לקראת פיתוח בטוח, מאובטח ושקוף של טכנולוגיית AI" לקראת צו ביצוע אפשרי על שימוש אחראי ב-AI. כל החברות שהשתתפו חתמו על סדרה של שמונה התחייבויות להבטחת ביטחון הציבור, הבטיחות והאמון.

עבור שילובה של AI בטכנולוגיה היומיומית - ובמיוחד עבור מפתחים המחפשים צורות אחרות של AI לייצור טקסט כדרך סלולה לנגישות - אי דיוקים כמו הזיות מהווים סיכון גדול באותה מידה למשתמשים, מסבירה 3Play Media.

"מנקודת מבט של נגישות, הזיות מציגות בעיה חמורה עוד יותר: הצגה כוזבת של דיוק עבור צופים חרשים וכבדי שמיעה", מסביר הדו"ח. 3Play כותב שלמרות ביצועים מרשימים הקשורים להפקת משפטים דקדוקיים מנוקד היטב, בעיות כמו הזיות מהווים כיום סיכונים גבוהים למשתמשים.

מנהיגי התעשייה מנסים לעשות זאתלטפל בהזיות עם המשך אימון, וכמה מהמנהיגים הגדולים ביותר של הטכנולוגיה, כמוביל גייטס, אופטימיים ביותר. אבל למי שזקוק לשירותים נגישים אין זמן לחכות למפתחים שישכללו את מערכות ה-AI שלהם.

"אמנם ייתכן שההזיות הללו יופחתו באמצעות כוונון עדין, אך ההשלכות השליליות על הנגישות עשויות להיות עמוקות", מסכם הדו"ח של 3Play Media. "עורכים אנושיים נותרים הכרחיים בהפקת כתוביות באיכות גבוהה הנגישות למשתמשי הקצה העיקריים שלנו: אנשים חירשים וכבדי שמיעה."

רוצה עודסטוב סוציאליונְגִישׁוּתסיפורים בתיבת הדואר הנכנס שלך? הירשם לניוזלטר הסיפורים המובילים של Mashableהַיוֹם.

צ'ייס הצטרף לצוות Social Good של Mashable בשנת 2020, וכיסה סיפורים מקוונים על אקטיביזם דיגיטלי, צדק אקלימי, נגישות וייצוג תקשורתי. עבודתה נוגעת גם לאופן שבו שיחות אלו באות לידי ביטוי בפוליטיקה, בתרבות פופולרית ובפאנדום. לפעמים היא מאוד מצחיקה.

ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.