היכן עומדת לאמה 2 במירוץ החימוש בינה מלאכותית? קרדיט: Getty Images
ביום שלישי הודיעה מטהלאמה 2, גרסה חדשה של מודל השפה הגדול שלה.
תשומת לב רבה ניתנה ללימודי תואר שני כמו OpenAI'sGPT-4אילו סמכויותChatGPTושל גוגלפאלם 2מה שמניע את בארד, אבל אל תישן על המאמצים של Meta להתחרות בזירת הבינה המלאכותית. בניגוד ל-GPT-4 ו-PaLM 2, שהם דגמים סגורים, Llama 2 הוא קוד פתוח (עוד על כך בהמשך). הוא כבר מקבל ציון דומה במדדים מסוימים, וככל הנראה ישתפר רק עם תגובות מהציבור.
הנה מה שצריך לדעת על להיט ה-LLM sleeper של Meta:
Lama 2 הוא קוד פתוח, בניגוד למתחרים הגדולים שלו
Meta הפכה את Llama 2 לקוד פתוח וחינמי לשימוש מחקר ומסחרי, מכיוון שהיא נותנת לציבור יותר הזדמנות לעצב ולהפיק תועלת מהטכנולוגיה הטרנספורמטיבית.
"מתן גישה לעסקים, סטארט-אפים, יזמים וחוקרים לכלים שפותחו בקנה מידה שיהיה מאתגר לבנות בעצמם, מגובה בכוח מחשוב שאליו לא יגשו אחרת, יפתח בפניהם עולם של הזדמנויות להתנסות, לחדש במסעות מרגש. דרכים, ובסופו של דבר להפיק תועלת כלכלית וחברתית", אמר הפוסט בבלוגמכריזים על השחרור.
מהירות אור ניתנת לריסוק
גוגל ו-OpenAI לא שיתפו פרטים על האופן שבו מפתחים את ה-LLMs הקנייניים שלהם, כגון פרטים על מספר הפרמטרים או באילו נתונים שימשו להכשרת המודלים. לעומת זאת, Llama 2 נגיש באופן חופשי דרךפנים מחבקות, Amazon Web Services ו-Microsoft Azure, כלומר למפתחים יש גישה לקוד ולנתונים שלה, מה שיאפשר להם לבנות ולשפר את המודל. ל-Llama 2 יש שלושה גדלים שונים של דגמים מאומנים מראש: 7 מיליארד, 13 מיליארד ו-70 מיליארד פרמטרים, שלכולם ניתן לגשת.
Microsoft Azure היא "השותף המועדף" של Llama 2
לצד שחרורו של Meta של Llama 2, היא גם הכריזה על אשׁוּתָפוּתעם פלטפורמת מחשוב הענן של מיקרוסופט Azure. החל מהשבוע, לקוחות Azure יכולים להשתמש ב-Llama 2 כאופציה לבניית אפליקציות. כן, אתה יכול להוריד את Llama 2 ישירות, אבל דרך פלטפורמת ה-AI של Azure, אתה מקבל את תכונות הכוונון, הבטיחות וההסקה שתוכננו במיוחד לעבודה עם LLMs.
שותפות זו עולה בקנה אחד עם העמדה הציבורית של שתי ענקיות הטכנולוגיה לדמוקרטיזציה של AI. Azure הוא מנוי בתשלום, אבל מיקרוסופט הפכה את כלי Bing ו-Edge המופעלים על ידי AI בחינם לשימוש. וכלים אלה מופעלים על ידי GPT-4 של OpenAI, שקיבלהשקעה כבדהממיקרוסופט. כל זה אומר, מיקרוסופט פועלת קשה על AI גנרטיבי וממנפת שותפויות חזקות כדי לגרום לזה לקרות. עבור Meta, השותפות של מיקרוסופט היא ערוץ בעל ערך עבור מפתחי Azure לשימוש ב-Llama 2.
איך Llama 2 מסתדר מול ChatGPT
מספיק עם הרקע, האם Llama 2 באמת יכול להדיח את ChatGPT כ-LLM הטוב ביותר? התשובה הקצרה עדיין לא, אבל אולי בסופו של דבר.
ב-Meta'sעבודת מחקר, הוא השווה את הביצועים של Llama 2 באמות מידה אקדמיות שונות למודלים אחרים, כולל GPT-3.5 ו-GPT-4 של OpenAI ו-PaLM ו-PaLM 2 של Google. Llama 2 לא קיבל ציון גבוה כל כך במערך נתונים שמודדים ידע כללי, מתמטיקה בבית ספר תיכון, או יכולות קידוד, אבל Meta ערכה מחקר נוסף באמצעות הערכות אנושיות שהיו לו תוצאות מעניינות. בני אדם השיגו 4,000 הנחיות לגבי "עזרות" בהשוואה בין מודלים שונים. בכך, Llama 2 ניצחה את ChatGPT, והרוויחה 35.9 אחוז "ניצחונות" מול 32.5 אחוזים של ChatGPT.
הציונים הללו נמדדים מול מודלים סגורים, אבל בכל מה שקשור להשוואות בנצ'מרק של מודלים אחרים של קוד פתוח, Llama 2 הצליח לנצח אותם. ה-LLM של Meta עלה על דגמי קוד פתוח אחרים (MPT ו-Falcon) בכל התחומים.
באופן גס, האינטליגנציה של Llama 2 מדורגת כדומה ל-GPT-3.5, והיא מדורגת מעט יותר מועילה מ-ChatGPT בצורת צ'טבוט. תיאורטית, עם מאמצים של קהילת המפתחים, Llama 2 רק ישתפר מכאן.
ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.