מערך הנתונים, המורכב ממיליוני פוסטים של Bluesky, הוסר מאז. קרדיט: Jaap Arriens / NurPhoto דרך Getty Images
Bluesky כבר מתמודדת עם גירוד הבינה המלאכותית הראשונה שלה, למרות עמדת בעליה שהיא תעשה זאתלעולם אל תאמן AI גנרטיביעל נתוני המשתמש.
דווח על ידי404מדיהב- 26 בנובמבר, מיליון פוסטים בבלוזקי ציבוריים - שלמים עם זיהוי מידע על משתמשים - זחלו ואז הועלו לחברת AI Huging Face. מערך הנתונים נוצר על ידי ספרן למידת מכונות דניאל ואן סטריאן, שנועד לשמש בפיתוח מודלים לשפה ועיבוד שפות טבעיות, כמו גם ניתוח כללי של מגמות מדיה חברתית, מתינות תוכן ודפוסי פרסום. הוא מכיל מזהים מבוזרים (DID) של משתמשים ואפילו יש לו פונקציית חיפוש לאיתור תוכן ממשתמשים ספציפיים.
על פי התיאור של מערך הנתונים, הסט "מכיל מיליון פוסטים ציבוריים שנאספו מממשק ה- API של Bluesky Social Social (ממשק תכנות יישומים), המיועדים למחקר וניסויים ללימוד מכונות עם נתוני מדיה חברתית. כל פוסט מכיל תוכן טקסט, מטא נתונים ומידע אודות מדיה קשרי קבצים מצורפים ותשובות."
מהירות אור ניתנת לריסוק
משתמשי Bluesky לא הצטרפו לשימושים כאלה בתוכן שלהם, אבל זה גם לא אסור במפורש על ידי Bluesky. ממשק ה- API של Firehose של הפלטפורמה הוא "זרם כרונולוגי מצטבר של כל עדכוני הנתונים הציבוריים כפי שהם מתרחשים ברשת, כולל פוסטים, לייקים, עוקבים, טפל בשינויים ועוד." ה- API של בלוזקי - יחד עם הפרוטוקול ההעברה המאומתת הציבורית ומבוזרת (AT) האתר נבנה - פירושו שתוכן בלוזקי פתוח וזמין למפתחי צד ג 'שהפלטפורמה מנסה לבית המשפט, מסבירה 404 מדיה.
זה יכול להיות תמרור אזהרה מרכזי לרבים ממיליוני המשתמשים החדשים של האתר, שרבים מהם עזבו את המתחרה X בעקבותמדיניות אימון בינה מלאכותית חדשה ומדאיגה. נציג בלוזקי הגיב לבקשותיה של 404 Media לתגובה: "בלוזקי היא רשת חברתית פתוחה וציבורית, בדומה לאתרים באינטרנט עצמה. כמו שקבצי Robots.Txt לא תמיד מונעים מחברות חיצוניות לזחול את האתרים האלה, הדבר תקף כאן . דנים כיצד להשיג זאת".
זמן קצר לאחר פרסום המאמר, מערך הנתונים הוסר מ-Huging Face. "הסרתי את נתוני Bluesky מה- Repo. בזמן שרציתי לתמוך בפיתוח כלים לפלטפורמה, אני מכיר בגישה זו הפרה עקרונות של שקיפות והסכמה באיסוף נתונים. אני מתנצל על הטעות הזו," כתב ואן סטריאן בעקבותיה -לְמַעלָהפוסט בלוסקי.
צ'ייס הצטרף לצוות Social Good של Mashable בשנת 2020, וכיסה סיפורים מקוונים על אקטיביזם דיגיטלי, צדק אקלימי, נגישות וייצוג תקשורתי. עבודתה נוגעת גם לאופן שבו שיחות אלו באות לידי ביטוי בפוליטיקה, בתרבות פופולרית ובפאנדום. לפעמים היא מאוד מצחיקה.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.