OpenAI נתבע על אימון ChatGPT עם נתונים אישיים 'גנובים'

משרד עורכי דין בקליפורניה אומר ש-ChatGPT נבנה עם נתונים 'גנובים'. קרדיט: Getty Images

משרד עורכי דין בקליפורניה הגיש אתביעה ייצוגיתנגד OpenAI על "גניבת" נתונים אישיים כדי להתאמןChatGPT.

משרד עורכי הדין קלארקסון, בתלונה שהוגשה לבית המשפט הצפוני של קליפורניה ביום רביעי, טוענת ש-ChatGPT ו-Dall-E "משתמשים במידע פרטי גנוב, כולל מידע אישי מזהה, ממאות מיליוני משתמשי אינטרנט, כולל ילדים בכל הגילאים, ללא הסכמתם או ידיעתם מדעת." כדי להכשיר את מודל השפה הגדול שלה, OpenAI גירדה 300 מיליארד מילים מהאינטרנט, כולל מידע אישי ופוסטים מאתרי מדיה חברתית כמו טוויטר ו-Reddit. משרד עורכי הדין טוען ש-OpenAI "עשתה זאת בסתר, ומבלי להירשם כמתווכת נתונים כפי שהיא נדרשה לעשות על פי החוק החל".

ראה גם:

OpenAI היה נושא למחלוקת לגבי האופן שבו ואיזה נתונים היא אוספת כדי להכשיר ולפתח את ChatGPT. עד לאחרונה, היהאין דרך מפורשת למשתמשים לבטל את הסכמתםלתת ל-OpenAI להשתמש בשיחות ובמידע האישי שלהם כדי להאכיל את המודל. ChatGPT היהתחילה נאסר באיטליה, באמצעות תקנת הגנת המידע הכללית של אירופה (GDPR), להגנה לא מספקת על נתוני משתמשים, במיוחד כשמדובר בקטינים. תביעה זו כוללתמדיניות הפרטיות האטומה של OpenAI עבור משתמשים קיימים, אך מתמקד בעיקר בנתונים שנגרדו מהאינטרנט שמעולם לא נועדו במפורש לשיתוף עם ChatGPT. באמצעות השקעות של מיליארדי דולרים ממיקרוסופט והכנסות מנויים עבור ChatGPT Plus, OpenAI הרוויחה מהנתונים האלה מבלי לפצות את המקור שלהם.

מהירות אור ניתנת לריסוק

15 הסעיפים בתלונה כוללים הפרת פרטיות, רשלנות בגין אי הגנה על נתונים אישיים וגניבה על ידי השגת כמויות אדירות של מידע אישי כדי להכשיר את המודלים שלה באופן בלתי חוקי. מערכי נתונים כמו Common Crawl, ויקיפדיה ו-Reddit, הכוללים מידע אישי, זמינים לציבור כל עוד חברות עוקבות אחר הפרוטוקולים לרכישה ושימוש בנתונים אלו. אבל OpenAI השתמשה לכאורה בנתונים האלה ללא רשות או הסכמה של משתמשים בהקשר של ChatGPT. למרות שהמידע האישי של אנשים ציבורי באתרי מדיה חברתית, בלוגים ומאמרים, אם נעשה שימוש בנתונים מחוץ לפלטפורמה המיועדת, זה יכול להיחשב כהפרה של הפרטיות.

באירופה, יש הבחנה משפטית בין נחלת הכלל ונתונים לשימוש חופשי הודות לחוק ה-GDPR, אבל בארה"ב, זה עדיין נתון לוויכוח. נאדר הניין, סמנכ"ל מחקר פרטיות בגרטנר, שחושב שהסנטימנט של התביעה תקף, אמר, "לאנשים צריכה להיות שליטה על אופן השימוש בנתונים שלהם, גם כאשר הם זמינים ברשות הרבים". אבל הניין לא בטוח אם מערכת המשפט האמריקאית תסכים.

ראיין קלארקסון, שותף מנהל אמר במשרדפוסט בבלוג, זה קריטי לפעול כעת עם החוקים הקיימים במקום לחכות לסניפי ההנהלה והמשפט שיגיבו ברגולציה פדרלית. "אנחנו לא יכולים להרשות לעצמנו לשלם את העלות של תוצאות שליליות עם AI כפי שעשינו עם מדיה חברתית, או כמו שעשינו עם גרעיני. כחברה, המחיר שכולנו נשלם הוא הרבה יותר מדי תלול".

ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.

ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.