גוגלהודיעה זה עתה (אך לא פרסמה) את Gemini 1.5, עדכון למודל שפת הדגל שלה - הדגם ששימש בצ'אטבוט שפעם היה ידוע בשם Bard, אך מבחינה סינרגטיתשונה שם תאומיםלפני שבוע.
הטענה הגדולה עם המהדורה הזו היא "פריצת דרך בהבנת הקשר ארוך על פני אופנים". זה גם אמור להיות עליית מדרגה מבחינת יעילות, לאחר שנבנה על סוג ארכיטקטורה המכונה "תערובת מומחים (MoE)," כלומר ביצועים הדומים כביכול ל-Gemini 1.0, אך מסתמכים על פחות מעבדי GPU זוללי חשמל להתרחק כדי להשיג את זה.
הטענה הגדולה הראשונה לגבי הבנה רב-מודאלית של "הקשר ארוך" היא ז'רגון כמו שזה נשמע, אבל מייסד שותף של Google Deepmind פרסם הדגמה ב-X שנועדה להראות מה זה אומר בפועל.
ייתכן שהציוץ נמחק
ניצול חכם של פיסת טקסט גדולה ברשות הרבים שלא תדרג אף דבק בזכויות יוצרים - במקרה זה תמליל של 402 עמודים של משימת נאס"א שנחתה על הירח -LLMמסוגל לצמצם את המיקוד שלו למה שהמשתמש צריך ("הקשר") למרות שההנחיה היא ענקית לחלוטין ("ארוכה"), אז כנראה שזו המשמעות של "הקשר ארוך".
מהירות אור ניתנת לריסוק
בהדגמה, Gemini 1.5 מסוגלת לבחור שלושה רגעים משעשעים מקטע הטקסט באורך הרומן. הוא גם מסוגל לזהות את האירוע בתמליל התואם לתמונה של הדפס מגף ירח - החלק שבו, אתם יודעים, ניל ארמסטרונג הולך על הירח - מה שמבהיר מה המשמעות של "מולטימודאלי" בהקשר זה: מודל זיהוי תמונה עובד יד ביד עם ה-LLM.
שדרוג זה הוא חלק ממאמץ מתמשך להשאיר את גוגל בשיחת AI לאחר מכןOpenAIאכל את ארוחת הצהריים של כולם ב-AI בשנת 2022 על ידי שחרורChatGPT. בסוף השנה שעברה, גוגל החלה לשאוף ברצינות את השינויים שיגיעו עם בארד והדגם המניע אותו, שנותר גם מודל שפה גדול, הידוע יותר בזכות היותונעליים בגוגל ואנדרואיד הפופולריותמוצרים מאשר לשימוש כמו ChatGPT כדי לפתור בעיות יומיומיות ולפוצץ מוחות במסיבות קוקטייל. בפרט, מאמר מחקר מדצמבר 2023 הציג גרסה של מזל תאומים שכןעלה על הביצועים של ה-GPT-4 של OpenAIמודל במקרים מסוימים, ולהיות ה-LLM הראשון שקיבל ציון עובר במבחן AI ספציפי של "הבנת שפה מרובה משימות " או MLU.
בין שאר ההצהרות לגבי Gemini 1.5, גוגל טוענת שהמודל החדש יכול לחתוך מערכי נתונים גדולים עם דיוק מרשים, ו - בטענה קצת יותר מרימה גבות - ביצועים טוביםהַנמָקָהבכל מיני סוגי נתונים. הנמקה היא החולשה המפורסמת ביותר בקרב רוב ה-LLMs.
לדברי המנכ"ל סונדאר פיצ'אי, גוגל משחררת את Gemini 1.5 לקבוצה מוגבלת. "אנו נרגשים להציע תצוגה מקדימה מוגבלת של תכונה ניסיונית זו למפתחים וללקוחות ארגוניים", כתב פיצ'אי בפוסט בבלוג של גוגל.
הבסיס הרחב יותר של משתמשי Gemini יהיה השופטים האולטימטיביים של טענות הביצועים של גוגל כאשר הם יורשו למעשה לנסות את Gemini 1.5 כחלק ממוצר ששוחרר באופן רשמי. הדגם החזק ביותר של גוגל, Gemini Ultra שוחררלפני שבוע, אז זה עשוי לחלוף זמן מה, וכנראה בטוח להניח ש-Gemini 1.5, יהיה יום אחד חלק מחבילת הפרימיום החדשה של גוגל - במילים אחרות "בתשלום" - של מוצרי Workspace בשםGoogle One AI Premium.