אחד המוצרים הצפויים ביותר הקשורים לבינה מלאכותית הגיע זה עתה: מחולל וידאו AI של OpenAI Soraהושקביום שני במסגרת החברה12 ימים של OpenAIמִקרֶה.
OpenAI סיפקה הצצות על הפלט של סורה בעבר. אבל, עד כמה זה שונה בהשקה? OpenAI בהחלט עבדה קשה כדי לעדכן ולשפר את מחולל וידאו ה-AI שלה לקראת השקתו הפומבית.
ליוטיובר מרקס בראונלי היה אמבט ראשון על סורה, מפרסם את סקירת הווידאו שלו על המוצר האחרון של OpenAI שעות לפני ש-OpenAI אפילו הכריזה רשמית על ההשקה. מה בראונלי חשבה?
במה סורה טובה
לדברי Brownlee, בדיקת Sora שלו מצאה שמחולל וידאו AI מצטיין ביצירת נופים. בינה מלאכותית שנוצרה מעל הראש, צילומים דמויי מזל"ט של טבע או נופים מפורסמים נראים בדיוק כמו צילומי מלאי מהחיים האמיתיים. כמובן, כפי שמציינת בראונלי, אם אתה בקיא באופן ספציפי כיצד נראית הסביבה של ציון דרך, אולי תוכל לזהות את ההבדלים. עם זאת, אין יותר מדי מה שנראה באופן מובהק שנוצר בינה מלאכותית בסוגים אלה של קליפים שנוצרו על ידי סורה.
אולי סוג הסרטון שסורה מסוגלת ליצור בצורה הטובה ביותר, לפי בראונלי, הם סרטונים מופשטים. אמנות מופשטת מסוג רקע או שומר מסך יכולה להיעשות די טוב על ידי סורה אפילו עם הוראות ספציפיות.
מהירות אור ניתנת לריסוק
בראונלי גם גילתה שסורה יצרה סוגים מסוימים של תוכן מונפש, כמו אנימציה מסוג סטופ-מושן או חימר, נראים סבירים לפעמים, שכן התנועות המקומטות שלפעמים עדיין פוגעות בוידאו בינה מלאכותית נראות כמו בחירות סגנוניות.
באופן מפתיע ביותר, בראונלי גילתה שסורה הצליחה להתמודד עם טקסטים מונפשים מאוד ספציפיים. מילים מופיעות לעתים קרובות כטקסט משובש בדגמים אחרים של יצירת תמונות ווידאו בינה מלאכותית. עם סורה, בראונלי גילתה שכל עוד הטקסט היה ספציפי, נניח כמה מילים בכרטיס הכותרת, סורה הצליחה ליצור את החזותי באיות נכון.
איפה סורה משתבשת
עם זאת, סורה עדיין מציגה הרבה מאותן בעיות שכל מחוללי וידאו בינה מלאכותית שהגיעו לפניה נאבקו בהן.
הדבר הראשון שבראונלי מזכיר הוא קביעות אובייקט. לסורה יש בעיות עם הצגת, למשל, אובייקט מסוים ביד של אדם לאורך כל זמן הריצה של הסרטון. לפעמים החפץ יזוז או פשוט ייעלם פתאום. בדיוק כמו עם טקסט AI, סרטון ה-AI של סורה סובל מהזיות.
מה שמביא את בראונלי לבעיה הכי גדולה של סורה: פיזיקה בכלל. נראה שסרטון פוטוריאליסטי הוא די מאתגר עבור סורה, כי הוא לא יכול רק להפחית את התנועה כמו שצריך. אדם פשוט הולך יתחיל להאט או להאיץ בדרכים לא טבעיות. חלקי גוף או חפצים יתעוותו לפתע למשהו אחר לגמרי לפעמים גם כן.
ובעוד שבראונלי הזכירה את השיפורים האלה בטקסט, אלא אם כן אתה הופך ספציפי מאוד, סורה עדיין משבשת את האיות של כל סוג של טקסט רקע כמו שאתה עשוי לראות על בניינים או שלטי רחוב.
Sora היא עבודה מתמשכת מאוד, כפי ששיתפה OpenAI במהלך ההשקה. למרות שהוא עשוי להציע עלייה ממחוללי וידאו אחרים של AI, ברור שיש רק כמה תחומים שבהם כל דגמי הווידאו AI ימצאו מאתגרים.