תמלול חי מבוסס בינה מלאכותית מכשיל קהילות ילידים. וההשלכות חורגות מעבר לנגישות. קרדיט: בוב אל-גרין / Mashable
הזירה העולמית שלAIהעיצוב והיישום ממשיכים לגוון, עם עניין פורח בבינה מלאכותית יצירתית ידידותית למשתמש המובילה את צמיחתה. עדיין דגירה: תפקידה של AI בקידום חללים נגישים, גם באינטרנט וגם מחוץ.
מייגן ואן הארטןהוא מנהיג אסטרטגי ושותפה בעיצוב נוצות, סוכנות קריאייטיב בהובלת נשים בבעלות ילידים שבסיסה בקנדה. האתוס העסקי והעיצובי של Design de Plume משלבים את מה של ואן הארטן מכנה "קליידוסקופ" של עדשות עולמיות שונות: מקוריות, הכללה, גיוון, שוויון, קיימות ועוד.נְגִישׁוּת. החברה הוקמה בעקבות הקריירה המוקדמת של ואן הארטן כמעצבת גרפית, לאחר שהיא ומייסדיה ביקשו להוסיף נקודת מבט על עיצוב דיגיטלי שחסרה במיינסטרים.
Design de Plume משלב את העקרונות הללו ישירות במסגרת של שירותים ופתרונות כמו עיצוב אתרים, כמו עבודתו האחרונה עםסל הידע של אזורים מוגנים ושמורים של ילידים (IPCAs)., פלטפורמה לשיתוף מידע דיגיטלי עבור מסלולי שימור בהובלת ילידים בקנדה. החברה זכתה בפרספרס העיצוב של DNA פריז לשנת 2023עבור הפרויקט.
בעבודתה כאסטרטגית וכדוברת פומבית, ואן הארטן שומרת עין מאומנת על נגישות הילידים, במיוחד. המעצב מאונטריו אומר כי אי הכללת מודלים תרבותיים ושפה של עמים ילידים בתקני נגישות ובעמידההותיר פערים עצומים בהנגשת התקשורתעבור קהילות ילידים.
ואפילו עם תנופת הבינה המלאכותית שמבשרת על גל חדש של חדשנות טכנולוגית ואוטומציה כביכול, הפער לא הולך וקטן - למעשה, נראה שהוא הולך ומתרחב.
כמשתפי פעולה בעיצוב טכנולוגיות וחללים דיגיטליים, ואן הארטן ועמיתיה קוראים ליותר אנשים להעריך את כלמַעֲרֶכֶתשל נגישות כדי לשאול כיצד טכנולוגיות מסייעות, שירותי אינטרנט ואפילו כלים המופעלים על ידי בינה מלאכותית (כמו תמלול חי ויצירת תמונות) יכולים להיות משמעותיים יותר עבור קבוצות ילידים, ולכלול את הצרכים שלהן.
בשיחה על העבודה והמשימה הזו, דיבר ואן הארטן עם Mashable'sצ'ייס דיבנדטועל הכשלים ביצירת בינה מלאכותית, הצורך בתקני נגישות מתפתחים, וכיצד שילוב נקודות מבט של הילידים צריך להיות בין הצעדים הראשונים בחדשנות טכנולוגית.
Mashable: איך נראה "שילוב הילידים" בעבודה שלך?
ואן הארטן: יש את הרעיון הזה של "ראייה דו-עינית", תוך שימוש במיטב העקרונות המערביים והידע הילידים בו-זמנית. אתה משתמש בשתי העיניים שלך כדי לבצע את המשימה הזו. זה מאוד חלק מהתרבות של Design de Plume, אבל גם מהתרבות של עיצוב טוב: לקחת את הטוב ביותר משני העולמות. אני אוהב את המונח "כוס פתוחה" או "כוס ריקה" - לתת לאנשים אחרים למלא אותך בידע כדי שתוכל לתת פתרון טוב בסופו של יום. זה לא מושג חדש. זה מרגיש חדש באמריקה התאגידית, אבל זה ממש לא. זה באמת בסיסי לדרך הילידים לדעת.
למשל, האופן שבו אנו מנהלים את מפגשי ההתקשרות שלנו עם הלקוחות שלנו. אנחנו תמיד מדברים על זה שהוא יותר מעגל - אף אחד לא אחראי או מעל זה, כל קול צריך להיות מיוצג באופן שווה - כך, נוכל ליצור סביבה מכילה יותר ולהתמקד ברעיון הזה שאנחנו פרויקטים -פְּתִירָהיַחַד. כסוכנות, אנחנו לא באים עם טרנדים עיצוביים או כלים עיצוביים שעבדו בעבר. זה אולי לא נכון עבור כל קבוצת האומה הראשונה או כל קבוצה ילידית שאתה נתקל בה. אתה צריך להיות פתוח באמת כדי להפוך למרחב בטוח ופתוח עבור אנשים לשתף פעולהעִםאַתָה.
גילית שלעתים קרובות קבוצות ילידים אינן נכללות בעיצוב נגיש, במיוחד בפיתוח של כלי AI חדשים.
במונחים של AI, זה למעשה היה קשה מאוד. יש כל כך הרבה הטיה בטכנולוגיה, בדרך שבה היא מפותחת. לא מתייעצים עם הילידים כשזה מגיע לפתרון. מה שאני מתכוון בכך הוא שאם מביאים אותם, מביאים אותם בסוף הפרויקט ושואלים אותם, "זה עובר?" זה לא מעורבות טובה. אתה צריך לערב את האנשים האלה מההתחלה, להסביר להם את הבעיה, לערב אותם בפתרון בעיות ולפצות אותם על המאמצים האלה. חלק מהקשיים בכתוביות, למשל, כמו זיהוי דיבור אוטומטי, היו קשים ביותר.
האם אתה יכול לפרט כיצד כתוביות חי, או זיהוי דיבור אוטומטי באופן רחב יותר, מכשילים את הקהילות הללו?
לדוגמה, הרגע הורדתי תמליל של מצגת חיה שעשיתי, והיא שינתה מילה מ"אנישינאבה", שהיאקבוצה גדולה של ילידים, ל"נאבי הישר". אז זה עיוות את השפה לחלוטין. הזכרתי קבוצה של אנשים, והיא אפילו לא הצליחה להבין את זה. גם אם יש תרגום ישיר לאנגלית... הדרך שבה שפות ילידים עובדות היא שהן מכוונות ביותר, לכל אות ושילוב של אותיות יש משמעויות משנה. יש כל כך הרבה ניואנסים מכוונים למילה הספציפית הזו שמתגעגעים, במיוחד במקרה של כיתוב חי.
מהירות אור ניתנת לריסוק
[באחרונהניתן למעוךסָעִיףעל דוח מצב זיהוי דיבור אוטומטי של 3PlayMedia לשנת 2023, חברת שירותי הנגישות]אמר שזיהוי דיבור אוטומטי מדויק בכ-90 אחוז אבל צריך להיות יותר כמו 99 אחוז. אבל כשזה מגיע לשפות ילידיות, זה ממש 0 אחוז מדויק. זו המציאות הקשה שבה אנו חיים. הדרך שבה אנו בונים טכנולוגיה, מערכות עיצוב, כל הדברים האלה, תורמת לתרבות של רצח עם [תרבותי] נוסף ומחיקת שפות.
האם הרעיון של עיצוב אוניברסלי, או הרעיון שצריך ליצור מוצרים וחללים מתוך מחשבה על נגישות מלאה מההתחלה, הוא פתרון?
יש כל כך הרבה במונחים של פיתוח תקנים, חוקי ציות וכו'. אבל הבסיס לא קיים עבור הילידים. בתחום הנגישות, אנשים מזכירים לעתים קרובות שתאימות ADA (או, מאיפה אני, הAODA) היא קומת הקרקע, לא התקרה. עבור הילידים, זה רק פער פתוח לרווחה. הם פשוט נופלים לתוך המערבולת הזו. אין מערכות לשפה נגישה בשפות שלהם, ואין דרך לפתח כלים שמבוססים על שתי שפות בו זמנית.
מה שכל כך מתסכל זה שיש לנו את הרעיונות שם. הכלים טובים, במובן מסוים. טוב שיש לנו כיתובים. זה נורא שזה לא יכול להבין, בזמן שאני מבהיר את זה למערכת, מה אני בעצם מנסה להגיד.
אני מרגיש שעם עליית הבינה המלאכותית הגנרטיבית וההשקעות שבוצעו למען החדשנות המתמדת שלה, בעיה זו הייתה צריכה להיחשב עד עכשיו.
בְּהֶחלֵט. למה אני לא יכול לדבר עם הבינה המלאכותית מראש? אם אני מתכוון להציג בשפה הזו, הרשו לי ללמד אתכם איך לומר זאת. אבל אני לא יכול לעשות את זה. כרגע הפתרון הטוב ביותר הוא תמלול חי וכיתוב חי [אנושי]. זה נהדר, אבל לארגונים רבים אין את המימון כדי להציע כתוביות חיות. אז האזהרה שאני צריך לתת להם היא שהכתוביות [האוטומטיות] לא יהיו הגיוניות.
האם יש סיבה מבנית לניתוק המוחלט הזה?
יש התמקדות גדולה מאוד בתמיכה בנגישות חד לשונית, אז יש לך מסמך באנגלית, או מסמך בצרפתית, והוא יקרא לך אותו באנגלית או בצרפתית. אבל מה קורה בתוך מעגלים של שפות ילידים שבהם, באמצעות רצח עם ואפליה, חלק מהשפה אבד? גם אם תפתח מערכת ואומר, "עכשיו אנחנו יכולים לקרוא את הדף הזה במלואו באנגלית, ואת הדף הזה בשפה הילידית האחרת הזו", אתה עדיין עלול לפספס את הרעיון לחלוטין, כי אין דרך טובה להטמיע את שתי השפות באותה שפה מִסְמָך. אין שום דרך לעשות את זה בשום טכנולוגיית נגישות כרגע, כי ההתמקדות היא בדרך חשיבה מערבית, שהיא שהכל נפרד.
האם מצאת בעיה זו עם מיקוד יחיד במקרים אחרים של שימוש בבינה מלאכותית, כמו יצירת תמונות או צ'אטבוטים?
תוכנת יצירת תמונות הייתה כל כך מעניינת בתחום העיצוב. אתה שומע הרבה על הדבר הזה שיכול "פוטושופ זה כל כך טוב. זה נראה כל כך טוב." אבל זו שטות טהורה, במיוחד כשמדובר בייצוג תרבות ועקרונות ילידים.
יש לך דוגמה?
בכמה תרבויות של האומות הראשונות בקנדה, יש לנו משהו שנקראגלגל רפואה. יש הרבה משמעות בסמל הזה, והוא נועד להיות כלי ריפוי. השתמשתי בתוכנה ליצירת תמונות, והצעתי את "גלגל הרפואה הילידים". זהו. זו ההנחיה שלי. זה לא מסובך. אם תכניס את זה לגוגל, תקבל גלגל רפואה לגיטימי.
אבל מה שחוזר מתוכנת יצירת התמונות הוא ממש זבל. ראיתי כאלה שבהם זו צלחת, עם חלקים רבים ושונים על הצלחת. חשבתי שאולי זה מפרש את זה כאוכל. אוכל יכול להיות תרופה, נכון? אוכל יכול להיות מרפא. אבל כשהגדלתי את התמונה, הייתי כמו, "אלה קונכיות של חלזונות. וזו סיגריה." רק פיסות מרקם אקראיות שנמשכו כדי להפוך אותה לתמונה "נראית מגניבה", אבל איבדו מהיסוד את הכוונה ואת העקרונות התרבותיים של הילידים.
גם אני ראיתי את זהכל הטקסטכלי דור... אני חושב שזה באמת יהיה נגיש עבור אנשים אם הם יכולים להשתמש בדברים כמו מחוללי טקסט חלופי, לפחות שיהיה להם בסיס התחלה טוב. אבל אתה לא יכול לקבל את הבסיס ההתחלתי הזה אם אין בסיס של כוונה והכלה.
אז האם אני מודאג ש-AI מגיע לעבודה שלי? לא, בכלל לא.
נראה שלצד הלהט הזה לחדשנות בינה מלאכותית, ישנה תרבות סימולטנית של פחד שנוצרה סביב היכולות של בינה מלאכותית.
אם אנחנו אומרים שבינה מלאכותית יוצרת תרבות פחד, היא יוצרת את תרבות הפחד הזו כי היא לא מייצגת אנשים.
אתה מדבר על הגעה למקום שבו עוזר בינה מלאכותית "מבין" באופן מלא שפות או תרבות ילידים תוך מתן שירות. מה זה כרוך?
אני חושב שהבנה היא מיומנות שיתופית. אחד הדברים שבאמת מגניבים ב-AI עכשיו הוא היכולת לשוחח איתו, לעזור לו ולגדל אותו. כך שהכלי הזה יהיה זמין במערכות נוספות יעזור להבנה. אתה יכול להגיד את זה, "היי, מה שאתה אומר בעצם מזיק ומנציח סטריאוטיפ. אנחנו צריכים להפסיק להגיד את זה." אשמח לראות את זה מיושם בצורה רחבה יותר על מערכות אלו.
אבל גם, לפני שאתה משחרר מוצר ופשוט מצפה שהעולם יתקן אותו עבורך על ידי אינטראקציה איתו, שלב אנשים בשלבים ההתחלתיים שלו כדי לעזור להשפיע עליו. עירבו קבוצה מגוונת של אנשים שיעזרו לדבר עם ה-AI הזה, כך שהוא יוכל להבין שיש הרבה זבל באינטרנט שהוא הולך לאסוף, או שאנשים יתדלקו בו.
האם בפועל, האם כלי כולל ומקיף כזה יכול להתקיים אי פעם? או שזה משהו שאסור לוותר לטכנולוגיה או לשירותים מבוססי בינה מלאכותית? האם מספיק פתרונות אנושיים?
אני חושב שאם אתה בונה טכנולוגיה בצורה יותר מכילה, ואתה מוכן לקחת גם דרך הרסנית קדימה ולחשוב מחדש על הדרך שבה ניגשת אליה בעבר, זה אפשרי.
אחד התחומים העיקריים שעליהם הם צריכים לדבר - כממשלה, או כתאגידים, או בתור החיות הגדולות האלה בטכנולוגיה - הוא את מי הם מוכנים להדיר? הילידים הם [אחד] מההאוכלוסיות הצומחות ביותרבצפון אמריקה. אז בכך שלא נפתח עם הכלים האלה בחשבון, למען הילידים וההכלה, אנו משאירים את קבוצת האנשים הענקית הזו. זה לא על הילידים לפתור כל בעיה. זה בידי האנשים שיש להם את הכספים לגרום לזה לקרות, ולהיות מוכנים לחשוב מחדש על התהליכים שלהם כדי להתקדם בצורה טובה.
מחשב לא יכול לזייף אמפתיה. זה לא יכול להבין אמפתיה. ואותו דבר למעשה חל על אנשים. אם הם לא אמפתיים, אז הם לא יבינו למה זה משמעותי, למה אנחנו מדברים על הנושא הספציפי הזה. אבל רמת האמפתיה האנושית היא איך אנחנו באמת הולכים לטפל בזה, ואיך אנחנו הולכים לפתור את זה.
צ'ייס הצטרף לצוות Social Good של Mashable בשנת 2020, וכיסה סיפורים מקוונים על אקטיביזם דיגיטלי, צדק אקלימי, נגישות וייצוג תקשורתי. עבודתה נוגעת גם לאופן שבו שיחות אלו באות לידי ביטוי בפוליטיקה, בתרבות פופולרית ובפאנדום. לפעמים היא מאוד מצחיקה.