כיצד OpenAI מפחית את סיכוני האבטחה הגדולים של GPT-4o. קרדיט: Ismail Aslandag / Anadolu / Getty Images
למצב הקול של ChatGPT יש כמה ליקויי אבטחה, אבל OpenAI אומר שהוא מעליו.
ביום חמישי פרסמה OpenAI אדִוּוּחַעל תכונות הבטיחות של GPT-4o, תוך התייחסות לבעיות ידועות המתרחשות בעת השימוש בדגם. GPT-4o הוא הדגם הבסיסי שמפעיל את הגרסה האחרונה של ChatGPT, ומגיע עם מצב קול שהיהשוחרר לאחרונהלקבוצה נבחרת של משתמשים עם מנוי ChatGPT Plus.
"אתגרי הבטיחות" שזוהו כוללים סיכונים סטנדרטיים כמו הנחיית המודל לתגובות אירוטיות ואלימות, תוכן אסור אחר, ו"מסק לא מבוסס" ו"ייחוס תכונה רגישה" - הנחות שעלולות להיות מפלות או מוטות, במילים אחרות. OpenAI אומרת שהיא אימנה את המודל לחסום כל פלט המסומן בקטגוריות אלה. עם זאת, הדו"ח גם אומר שההקלות אינן כוללות "קולות לא מילוליות או אפקט קול אחר" כגון גניחות אירוטיות, צרחות אלימות ויריות. ניתן להסיק, אם כן, שהנחיות הכוללות צלילים לא מילוליים רגישים מסוימים עלולות לקבל תגובה שגויה.
OpenAI גם הזכירה אתגרים ייחודיים שמגיעים עם תקשורת קולית עם המודל. אנשי Red Team גילו שניתן לבקש מ-GPT-4o להתחזות למישהו או לחקות בטעות את קולו של המשתמש. כדי להילחם בזה, OpenAI מאפשר רק קולות מורשים מראש (מִינוּסהקול הידוע לשמצה שנשמע סקרלט ג'והנסון). GPT-4o יכול גם לזהות קולות נוספים מלבד קולו של הדובר, מה שמציג בעיית פרטיות ומעקב רצינית. אבל הוא הוכשר לדחות את הבקשות האלה - אלא אם הדוגמנית מתבקשת על פי ציטוט מפורסם.
מהירות אור ניתנת לריסוק
Red-teamers ציינו גם שניתן לבקש מ-GPT-4o לדבר באופן משכנע או מודגש, תכונה שעלולה להזיק יותר מפלטי טקסט בכל הנוגע למידע מוטעה ותיאוריות קונספירציה.
יש לציין, OpenAI התייחס גם לבעיות פוטנציאליות של זכויות יוצריםהטרידה את החברהוהפיתוח הכולל של בינה מלאכותית גנרטיבית, המתאמנת על נתונים שנגרדו מהרשת. GPT-4o הוכשר לסרב לבקשות לתוכן המוגן בזכויות יוצרים ויש לו מסננים נוספים לחסימת פלטים המכילים מוזיקה. בנימה זו, מצב הקול של ChatGPT הופנה לא לשיר בשום פנים ואופן.
הפחתות הסיכונים הרבות של OpenAI המכוסות במסמך הארוך בוצעו לפני פרסום מצב קול. אז המסר הגלוי של הדו"ח אומר שבעוד ש-GPT-4o מסוגל להתנהגות מסוכנת מסוימת, הוא לא יעשה זאת.
עם זאת, אומר OpenAI, "הערכות אלו מודדות רק את הידע הקליני של המודלים הללו, ואינן מודדות את התועלת שלהם בזרימות עבודה בעולם האמיתי." אז זה נבדק בסביבה מבוקרת, אבל כשהציבור הרחב שם את ידיו על GPT-4o, זה יכול להיות חיה אחרת כשהיא בטבע.
Mashable פנה ל-OpenAI כדי לקבל בהירות נוספת לגבי ההקלות הללו, ותעדכן אם נשמע.
ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.