StableLM: מה לדעת על מודל השפה של Stability AI

קרדיט: SOPA Images / Getty

עברו על GPT-4, יש מודל שפה חדש בעיר! אבל אל תזיז רחוק מדי, כי הצ'טבוט המופעל על ידי הדגם הזה הוא... גרוע להחריד.

ביום רביעי, Stability AI השיקה שפה משלה בשם StableLM. לחברה, הידועה במחולל התמונות של AI בשם Stable Diffusion, יש כעת מודל שפת קוד פתוח שיוצר טקסט וקוד. על פי הפוסט בבלוג Stability AI, StableLM הוכשרה על מערך נתונים של קוד פתוח בשם The Pile, הכולל נתונים מויקיפדיה, YouTube ו-PubMed. עם זאת, Stability AI אומר כי מערך הנתונים שלו גדול פי שלושה מזה של The Pile עם "1.5 טריליון אסימונים של תוכן".

אז איך זה מסתדר מול ChatGPT? כל כך גרוע שאנחנו מקווים שזה לא אמור להיות בר השוואה. ערך האמת של התפוקות שלו כמעט ולא קיים. למטה, למשל, תשים לב לטענות שב-6 בינואר 2021, תומכי טראמפ השתלטו על בית המחוקקים. זה מידע שגוי מבלבל בצורה מסוכנת לגבי אירוע אחרון.

קרדיט: Hugging Face / Stability AI

אמבחן נפוץ למודלים של שפהבשימוש על ידי Mashable הוא אחד שבו אנו בודקים עד כמה הוא מסוגל ומוכן לספק הנחיה מפוקפקת מבחינה אתית המבקשת כתבה חדשותית על טופאק שאקור. התוצאות עבור StableLM כאשר ניתן מבחן זה הן מאירות. הדוגמנית לא מצליחה לכתוב כתבה חדשותית משכנעת, שזה לא בהכרח דבר רע, אבל היא גם לא מצליחה לזהות את קווי המתאר הבסיסיים של מה שהיא מתבקשת לעשות, ואינה "יודעת" מי זה טופאק שאקור.

מהירות אור ניתנת לריסוק

קרדיט: Hugging Face / Stability AI

כדי להיות נדיב, נראה שסוג זה של יצירת טקסט אינו השימוש המיועד ל-StableLM, אבל כששואלים אותו "מה עושה StableLM?" תגובתו הייתה שני משפטים קצרים מרתקים המכילים קצת ז'רגון טכני: "היא משמשת בעיקר כמערכת תומכת החלטות בהנדסת מערכות וארכיטקטורה, ויכולה לשמש גם בלמידה סטטיסטית, למידת חיזוק ובתחומים אחרים."

ל-StableLM חסרים מעקות בטיחות לתוכן רגיש

מדאיג גם היעדר לכאורה של מעקות בטיחות עבור תוכן רגיש מסוים. במיוחד, הוא נופל על פניו כאשר נותנים לומְפוּרסָםמבחן "אל תשבח את היטלר". הדבר החביב ביותר שאפשר לומר על התגובה של StableLM למבחן הזה הוא שהיא שטות.

קרדיט: Hugging Face / Stability AI

אבל הנה כמה דברים שכדאי לזכור לפני שמישהו קורא לזה "מודל השפה הגרוע ביותר אי פעם": זה קוד פתוח, כך שה-AI הספציפי הזה של "הקופסה השחורה" מאפשרת לכל אחד להציץ לתוך הקופסה ולראות מה הגורמים הפוטנציאליים לבעיות שלה . כמו כן, הגרסה של StableLM שפורסמה היום נמצאת במצב אלפא, השלב המוקדם ביותר של הבדיקה. הוא מכיל בין 3 ל-7 מיליארד פרמטרים, שהם משתנים שקובעים כיצד המודל חוזה תוכן, ו-Stability AI מתכננת לשחרר דגמים נוספים עם פרמטרים גדולים יותר של עד 65 מיליארד. אם זה נשמע הרבה, מדובר בכמות קטנה יחסית. להקשר, ל-GPT-3 של OpenAI יש 175 מיליארד פרמטרים, כך של-StableLM יש הרבה להתעדכן - אם זו אכן התוכנית.

כיצד לנסות את StableLM עכשיו

הקוד של StableLM זמין כעת ב-GitHub, וחיבק פנים מארח גרסה בעלת חזית קצה ידידותית למשתמש עם השם הקליט ביותר "StableLM-Tuned-Alpha-7b צ'אט." הגרסה המתארחת ב-Huging-Face פועלת כמו צ'טבוט, אם כי היא איטית במקצת.

אז עכשיו שאתה יודע את המגבלות שלו, אתה מוזמן לנסות את זה בעצמך.

ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.

ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.