זבל להיכנס, זבל החוצה זה לא דבר טוב לאינטרנט. קרדיט: Getty Images
זה לא אתיאוריית קונספירציהאוֹנבואת עתיד. הרעיון של אינטרנט שנשלט על ידי תוכן שנוצר בינה מלאכותית כבר מתרחש והוא לא נראה טוב.
מאז ChatGPTיצא לשוק, תוכן שנוצר על ידי בינה מלאכותית חלחל בהתמדה לאינטרנט. בינה מלאכותית קיימת כבר עשרות שנים. אבל ChatGPT הפונה לצרכנים דחף את הבינה המלאכותית למיינסטרים, ויצרה נגישות חסרת תקדים למודלים מתקדמים של בינה מלאכותית ודורשת שעסקים להוטים לנצל.
כתוצאה מכך, חברות ומשתמשים כאחד ממנפים בינה מלאכותית יצירתית כדי להפיק נפחים גבוהים של תוכן. בעוד שהחשש הראשוני הוא שפע התוכן המכיל אי דיוקים, ג'יבריש ומידע מוטעה, ההשפעה ארוכת הטווח היא השפלה מוחלטת של תוכן אינטרנט לאשפה חסרת תועלת.
זבל פנימה, זבל החוצה
אם אתה חושב,האינטרנט כבר מכיל חבורה של זבל חסר תועלת, זה נכון, אבל זה שונה. "יש הרבה זבל בחוץ... אבל יש בו כמות מטורפת של מגוון וגיוון", אמר נאדר הניין, אנליסט סמנכ"ל בחברת הייעוץ הניהולי גרטנר. ככל ש-LLM ניזונים אחד מהתוכן של זה, האיכות נעשית גרועה יותר ומעורפלת יותר, כמו צילום של צילום של תמונה.
תחשוב על זה כך: הגרסה הראשונה של ChatGPT הייתה הדגם האחרון שעבר הכשרה על תוכן שנוצר לחלוטין על ידי אדם. כל מודל מאז מכיל נתוני אימון שיש להם תוכן שנוצר בינה מלאכותית שקשה לאמת, או אפילו לעקוב. זה הופך לבלתי אמין, או במילים פשוטות, זבל, נתונים. כשזה קורה, "אנחנו מאבדים את האיכות והדיוק של התוכן,ואנחנו מאבדים את הגיוון", אמר הניין שחוקר הגנה על נתונים ובינה מלאכותית. "הכל מתחיל להיראות אותו דבר".
"למידה עריות" כך מכנה הניין. "למ"רים הם רק משפחה אחת גדולה, הם פשוט צורכים אחד את התוכן של זה ומאביקים צולבים, ועם כל דור שיש לך... יותר ויותר אשפה עד לנקודה שבה האשפה עוקפת את התוכן הטוב ומשם הדברים מתחילים להידרדר."
ככל שיותר תוכן שנוצר על ידי בינה מלאכותית נדחק החוצה לאינטרנט, וכןזֶההתוכן נוצר על ידי אנשי LLM המאומנים על תוכן שנוצר בינה מלאכותית, אנו מסתכלים על רשת עתידית שהיא הומוגנית לחלוטין ולא אמינה לחלוטין. כמו כן, פשוט ממש משעמם.
קריסת דוגמניות, קריסת אינטרנט
רוב האנשיםכבר חושיםמשהו כבוי.
ייתכן שהציוץ נמחק
בחלק מהדוגמאות היותר גבוהות, אמנות משוכפלת על ידי רובוטים. ספרים נבלעים בשלמותם ומשוכפלים על ידי לימודי תואר שניללא רשות המחברים. תמונות וסרטונים המשתמשים בקולות ובדמיון של ידוענים נוצרים ללא הסכמתם ופיצוים.
אבל חוקי זכויות היוצרים והקניין הרוחני הקיימים כבר קיימים כדי להגן על הפרות כאלה. בנוסף, חלקם מאמצים שיתוף פעולה בינה מלאכותית כמו גריימס שמציעה עסקאות לחלוקת הכנסות עם יוצרי מוזיקה בינה מלאכותית וחברות תקליטים שחוקרותעסקאות רישויעם חברות טכנולוגיות בינה מלאכותית. בצד המדיניות, המחוקקים הציגו אאין חוק זיופיםכדי להגן על אישי ציבור מפני העתקים של בינה מלאכותית. התקנות לתיקון כל הבעיות הללו לא קיימות, אבל תיקון שלהן הוא לפחות מתקבל על הדעת.
הצניחת האיכות הכוללת של כל דבר באינטרנט, לעומת זאת, היא תופעה ערמומית יותר, וחוקרים הוכיחו מדוע היא עומדת להחמיר.
ב אלִלמוֹדמאוניברסיטת יוהנס גוטנברג בגרמניה, חוקרים מצאו ש"לולאת האימון הצורכת את עצמה משפרת בתחילה גם את האיכות וגם את הגיוון", מה שעומד בקנה אחד עם מה שסביר שיקרה בהמשך. "עם זאת, לאחר כמה דורות התפוקה בהכרח מתנוונת בגיוון. אנו מגלים שקצב הניוון תלוי בשיעור הנתונים האמיתיים והמופקים".
שניים אחריםאֲקָדֵמִי ניירותשפורסם ב-2023 הגיעו לאותה מסקנה לגבי השפלה של מודלים של בינה מלאכותית כשהם מאומנים על נתונים סינתטיים, הלא הם נתונים שנוצרו בינה מלאכותית. על פי מחקר של חוקרים מאוקספורד, קיימברידג', אימפריאל קולג' בלונדון, אוניברסיטת טורונטו ואוניברסיטת אדינבורו, "שימוש בתוכן שנוצר על ידי מודלים באימון גורם לפגמים בלתי הפיכים במודלים המתקבלים, שבהם זנבות של הפצת התוכן המקורי נעלמים, "מתייחס לזה כ"קריסת מודל."
מהירות אור ניתנת לריסוק
באופן דומה, אמרו חוקרים מאוניברסיטת סטנפורד ו-Rice, "ללא מספיק נתונים אמיתיים טריים בכל דור של לולאה אוטופאגית [צורכת עצמית], מודלים יצירתיים עתידיים נידונים שהאיכות (הדיוק) או הגיוון (היזכרות) שלהם יורדים בהדרגה".
חוסר גיוון, מסביר הניין, הוא הבעיה הבסיסית, כי אם מודלים של בינה מלאכותית מנסים להחליף את היצירתיות האנושית, זה הולך ומתרחק מזה.
האינטרנט שנוצר בינה מלאכותית במבט חטוף
כאשר קריסת הדגמים מתנשאת, האינטרנט שנוצר בינה מלאכותית כבר הגיע.
לאמזון יש תכונה חדשה שמספקת סיכומים שנוצרו על ידי AI של סקירות מוצרים. כלים מגוגל ומיקרוסופט משתמשים בבינה מלאכותית כדי לעזור בניסוח מיילים ומסמכים ואינדוד השיקה א כְּלִיבספטמבר המאפשר למגייסים ליצור תיאורי תפקיד שנוצרו בינה מלאכותית. פלטפורמות כמו DALL-E 3 ו-Midjourney מאפשרות למשתמשים ליצור תמונות שנוצרו בינה מלאכותית ולשתף אותן באינטרנט.
בין אם הם מוציאים ישירות תוכן שנוצר בינה מלאכותית כמו אמזון או מספקים שירות למשתמשים להוציא תוכן שנוצר בינה מלאכותית בעצמם כמו גוגל, מיקרוסופט, Indeed, OpenAI ו-Midjourney, זה כבר שם בחוץ.
ואלה רק הכלים והתכונות של חברות ביג טק שמתיימרות שיש להן איזשהו פיקוח. המבצעים האמיתיים הם אתרי קליק-פיתיון שמוציאים תוכן באיכות נמוכה, בנפח גבוה, מוחזר לדירוג והכנסה גבוהים של SEO.
לאחרונהדִוּוּחַמ-404 Media, מצאו אתרים רבים "שקורעים שקעים אחרים על ידי שימוש בבינה מלאכותית כדי להוציא תוכן במהירות". לדוגמא של תוכן מסוג זה, המונע גניבת עין על חשבון קוהרנטיות, עיין באתר החדשות המפוקפקWorldtimetodays.com, שם השורה הראשונה של סיפור משנת 2023 שנוגעת בירי של ג'ינה קארנוקריאת מלחמת הכוכבים, "עבר זמן מאז שג'ינה קאראנו החלה בטירידה נגד לוקאספילם לאחר שפוטרמלחמת כוכביםאז לטוב ולרע היינו בשלים".
ברור שהמשפט הזה נוצר בינה מלאכותית. קרדיט: Worldtimetodays.com
בגוגל סקולר,משתמשיםגילה אמטמוןשל מאמרים אקדמיים המכילים את הביטוי "כמודל שפת בינה מלאכותית", כלומר חלקים של עבודות - או מאמרים שלמים לכל מי שיודע - נכתבו על ידי צ'טבוטים כמו ChatGPT. מאמרי מחקר שנוצרו על ידי בינה מלאכותית - שאמורים להיות בעלי אמינות אקדמית כלשהי - יכולים לפלס את דרכם לאתרי חדשות ובלוגים כהפניות מוסמכות.
ייתכן שהציוץ נמחק
אפילו חיפושים בגוגל מצפים כעת לפעמים דמויות שנוצרו על ידי AI של ידוענים במקום דברים כמו תמונות עיתונות או תמונות סטילס של סרטים. כשאתה מחפש בגוגל את ישראל קמקאוויואול, המוזיקאי שנפטר הידוע בקאבר היוקלילי שלו ל"Somewhere Over the Rainbow", התוצאה העליונההוא תחזית שנוצרה על ידי בינה מלאכותית של איך Kamakawiwo'ole היה נראה אילו היה חי היום.
חיפושי תמונות בגוגל של קירה נייטלי מביאים לעיבודים מעוותים שהועלו על ידי משתמשים ב-OpenArt, Playground AI ו-Dopamine Girl לצד תמונות אמיתיות של השחקנית
זה לא מגיע לקירה. קרדיט: Mashable
זה שלא לדבר על התקופה האחרונהזיופים עמוקים פורנוגרפייםשל טיילור סוויפט, מודעת אינסטגרם המשתמשת בדמותו של טום הנקס כדי למכור אתוכנית שיניים, אפליקציית עריכת תמונות המשתמשת בפניה ובקולה של סקרלט ג'והנסוןללא הסכמתה, ושיר האש הזה של דרייק ו-The Weeknd שלמעשה היה לא מורשהאודיו עמוק זיוףזה נשמע בדיוק כמוהם.
אם כבר אי אפשר לסמוך על תוצאות מנוע החיפוש שלנו, וכמעט בוודאות שהדגמים מתענגים על הזבל הזה, עברנו את הסף לעידן האשפה של ה-AI של האינטרנט. כרגע, הרשת כפי שהכרנו אותה פעם עדיין מוכרת במידה מסוימת, אבל האזהרות כבר אינן מופשטות.
האינטרנט לא לגמרי נידון
בהנחה שמוצרים כמו ChatGPT לא יביאו ברד-מרי ויתחילו לייצר באופן אמין תוכן תוסס ומרגש שבני אדם באמת מוצאים נעים או שימושי לצרוך, מה יקרה אחר כך?
צפו מקהילות וארגונים להילחם בחזרה על ידי הגנה על התוכן שלהם מפני מודלים של AI המנסים להעלים אותו. ייתכן שהרשת הפתוחה, הנתמכת בפרסומות, מבוססת החיפוש, תיעלם, אבל האינטרנט יתפתח. צפו שאתרי מדיה מכובדים יותר ישימו את התוכן שלהם מאחורי חומות תשלום, ומידע מהימן המגיע מניוזלטר מנויים.
צפו לראות יותר מאבקי זכויות יוצרים ורישוי, כמוהניו יורק טיימס'תביעה נגד מיקרוסופט ו-OpenAI. צפו לראות עוד כלים כמוסוֹלָנוּם, כלי בלתי נראה המגן על תמונות המוגנות בזכויות יוצרים על ידי ניסיון להשחית דוגמניות שהוכשרו עליהן. צפו לפיתוח של כלי סימון ואימות חדשים ומתוחכמים המונעים גירוד בינה מלאכותית.
בצד השני, אתה יכול לצפות גם לפרסומי חדשות אחרים כמוAssociated Press- ויִתָכֵןCNN, פוקס וזמן -לאמץ את הבינה המלאכותית הגנרטיבית ולגבש הסכמי רישוי עם חברות כמו OpenAI.
ככלים כמו ChatGPT ו-GoogleSGEהופכים תחליפים לחיפוש מסורתי, צפו שמודלים של הכנסה שנבנו על קידום אתרים ישתנו.
הבטנה הכסוף של קריסת הדגם, לעומת זאת, היא אובדן הביקוש. התפשטות הבינה המלאכותית הגנרטיבית מוכתבת כיום על ידי הייפ, ואם מודלים שהוכשרו על תוכן באיכות נמוכה אינם מועילים יותר, הביקוש מתייבש. מה שנשאר (בתקווה) זה אנחנו, בני האדם חלשי המוח, עם הדחף הבלתי ניתן לכיבוי להתפרץ, לשתף יתר על המידה, להודיע ולהביע את עצמנו בצורה אחרת באינטרנט.
ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.