על מה הוכשרה סורה? קריאייטיבים דורשים תשובות.

קרדיט: מרוכב של Mashable: איאן מור / Boarding1Now / iStock / Getty Images

ביום חמישי, OpenAI שוב הרעיד את עולם הבינה המלאכותית עם דגם לדור וידאו בשם Sora.

ההדגמות הראו סרטונים פוטוריאליסטיים עם פירוט ומורכבות חדים, המבוססים על הנחיות טקסט פשוטות. אוִידֵאוֹבהתבסס על ההנחיה "השתקפויות בחלון של רכבת שנוסעת בפרברי טוקיו" נראה כאילו צולם בטלפון, כולל עבודת מצלמה רועדת והשתקפויות של נוסעי הרכבת. אין ידיים מעוותות מוזרות באופק.

ייתכן שהציוץ נמחק

סרטון מתוך ההנחיה, "טריילר לסרט המציג את הרפתקאותיו של איש החלל בן ה-30 חובש קסדת אופנוע סרוגה מצמר אדום, שמיים כחולים, מדבר מלח, סגנון קולנועי, צולם בסרט 35 מ"מ, צבעים חיים" נראה כמו כריסטופר נולאן -ווס אנדרסון היברידי.

ייתכן שהציוץ נמחק

עוד אחד מגורי גולדן רטריבר ששיחקו בשלג הפך פרווה רכה ושלג רכות כל כך מציאותי שאפשר להושיט יד ולגעת בו.

שאלת 7 טריליון הדולר היא איך OpenAI השיגה זאת? אנחנו למעשה לא יודעים כי OpenAI בקושי שיתפה שום דבר על נתוני ההדרכה שלה. אבל כדי ליצור מודל כל כך מתקדם, סורה נזקקה להרבה נתוני וידאו, אז אנחנו יכולים להניח שהוא הוכשר על נתוני וידאו שנגרדו מכל פינות האינטרנט. ויש המשערים שנתוני ההדרכה כללו יצירות המוגנות בזכויות יוצרים. OpenAI לא הגיבה מיד לבקשת תגובה על נתוני האימונים של סורה.

ראה גם:

ב-OpenAI'sנייר טכניהוא מתמקד במידה רבה בשיטה להשגת תוצאות אלה: Sora הוא מודל דיפוזיה שהופך נתונים חזותיים ל"טלאים" או פיסות נתונים שהמודל יכול להבין. אבל יש אזכור מועט מהיכן הגיעו הנתונים החזותיים.

OpenAI אומרת שהיא "לוקחת השראה ממודלים של שפות גדולות שרוכשות יכולות כלליות על ידי אימון על נתונים בקנה מידה אינטרנט". החלק המעורפל להפליא של "לקחת השראה" הוא ההתייחסות המתחמקת היחידה למקור נתוני האימונים של סורה. בהמשך העיתון, אומר OpenAI, "אימון מערכות יצירת טקסט לווידאו דורש כמות גדולה של סרטונים עם כתוביות טקסט מתאימות." המקור היחיד לכמות עצומה של נתונים ויזואליים ניתן למצוא באינטרנט, רמז נוסף לאיפה מגיעה סורה.

מהירות אור ניתנת לריסוק

הסוגיה המשפטית והאתית של אופן רכישת נתוני הדרכה עבור מודלים של AI קיימת מאז ש-OpenAI השיקה את ChatGPT. שְׁנֵיהֶםOpenAIוגוגלהואשמו ב"גניבת" נתונים כדי לאמן את מודל השפה שלהם, במילים אחרות באמצעות נתונים שנגרדו ממדיה חברתית, פורומים מקוונים כמו Reddit ו-Quora, ויקיפדיה, מאגרי מידע של ספרים פרטיים ואתרי חדשות.

עד עכשיו הרציונל לגרד את כל האינטרנט לנתוני אימון הוא שהוא זמין לציבור. אבל זמין לציבורלא תמיד מתרגםלרשות הרבים. מקרה לגופו, הניו יורק טיימסהואלתבועOpenAI ומיקרוסופט בגין הפרת זכויות יוצרים, בטענה שהמודלים של OpenAI השתמשו ב-פִּיעובד מילה במילה או ציטט בצורה שגויה את הסיפורים.

כעת נראה ש-OpenAI עושה את אותו הדבר, אבל עם וידאו. אם זה המקרה, אתה יכול לצפות שללהיטים כבדים בתעשיית הבידור יהיו מה לומר על זה.

אבל הבעיה נותרה בעינה: אנחנו עדיין לא יודעים מה מקור נתוני האימונים של סורה. "החברה (למרות שמה) הייתה אופיינית לקרובת שפתיים לגבי מה היא הכשירה את הדוגמניות",כתבגארי מרקוס, מומחה AI שהעיד בדיון בוועדת הפיקוח על AI של הסנאט האמריקאי. "אנשים רבים [השערו] שכנראה יש שם הרבה דברים שנוצרו ממנועי משחקים כמו Unreal. אני בכלל לא אתפלא אם היו גם הרבה הדרכה ביוטיוב שביקרו בהם, וחומרים שונים המוגנים בזכויות יוצרים." אמר מרקוס, לפני שהוסיף, "כנראה שאמנים ממש מתבאסים כאן."

למרות סירובה של OpenAI לחשוף את סודותיה, אמנים ויוצרים מניחים את הגרוע ביותר. ג'סטין בייטמן, יוצרת סרטים ויועצת בינה מלאכותית מחוללת של SAG-AFTRA לא כרכה במילים. "כל ננו-שנייה מזה#AIאשפה מאומנת על עבודה גנובה על ידי אמנים אמיתיים",פורסםבייטמן ב-X. "דוחה", הוסיפה.

ייתכן שהציוץ נמחק

אחרים בתעשיות יצירתיות מודאגות מהאופן שבו עלייתם של סורה ומודלים לייצור וידאו ישפיעו על עבודתם. "אני עובד בסרט vfx, כמעט כל מי שאני מכיר הוא אבדון ואפלה, בפאניקה לגבי מה לעשות עכשיו,"פורסם@jimmylanceworth.

OpenAI לא התעלם לחלוטין מההשפעה הנפיצה שעלולה להיות לסורה. אבל זה מתמקד בעיקר בנזקים פוטנציאליים הכרוכים בזיופים עמוקים ומידע מוטעה. זה כרגע בשלב האדום של צוות, מה שאומר שהוא עובר בדיקת לחץ לאיתור תוכן לא הולם ומזיק. לקראת סוף ההכרזה שלה, OpenAI אמרה כי היא "תעסיק את קובעי המדיניות, מחנכים ואמנים ברחבי העולם כדי להבין את דאגותיהם ולזהות מקרי שימוש חיוביים עבור הטכנולוגיה החדשה הזו".

אבל זה לא נותן מענה לנזקים שאולי כבר התרחשו מהכנת סורה מלכתחילה.

ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.

ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.

Related articles

ספריית הקונגרס מדווחת כי 75% מהסרטים האילמים אבדו לנצח

אישה מתחרטת מיד על ההחלטה להזמין את ד"ר מרטנס מאיביי

הוטרינר שולח לבעלים את התמונה המקסימה ביותר של כלב טוב מאוד לאחר הניתוח שלו

בנקים עומדים לאבד את המעמד האחרון שלהם מול Apple Pay

הנה עוד 6 מהצילומים הטובים ביותר בהיסטוריה של הוליווד

ריאן גוסלינג הוא אבא מאוד לא נוח ב