תביעה נוספת הכוללת AI וגניבת נתונים. קרדיט: Getty Images
למשרד עורכי דין בקליפורניה ישמְתוּיָקתביעה ייצוגית נגד גוגל על "גניבה בסתר" כמויות אדירות של נתונים מהאינטרנט כדי להכשיר את טכנולוגיות הבינה המלאכותית שלה.
משרד עורכי הדין קלארקסון תובע את ענקית הטכנולוגיה בגין רשלנות, פגיעה בפרטיות, גניבה, הפרת זכויות יוצרים ורווח מנתונים אישיים שהושגו באופן בלתי חוקי. "גוגל לקחה את כל המידע האישי והמקצועי שלנו, העבודות היצירתיות והקופירייטר שלנו, התמונות שלנו ואפילו הודעות הדוא"ל שלנו - כמעט את כל טביעת הרגל הדיגיטלית שלנו - ומשתמשת בו כדי לבנות מוצרים מסחריים של בינה מלאכותית ('AI') כמו ' בארד", נכתב בתלונה, שהוגשה ב-11 ביולי במחוז הצפוני של קליפורניה.
התביעה מגיעה בעקבות גוגלמעדכן בשקט את מדיניות הפרטיות שלובשבוע שעבר, בטענה שכל מידע ציבורי יכול לשמש לאימון מוצרי הבינה המלאכותית שלה כמו בארד. גוגל בעצם אומרת שכל מה שמתפרסם באינטרנט הוא משחק הוגן, אבל משרד עורכי הדין סבור שזוהי חדירה מסיבית לפרטיות, על ידי גירוד נתונים ללא פיצוי או הסכמה מהסיבה המפורשת של הכשרת מודלים של AI. התביעה טוענת שגוגל, חברה בהיקף של מיליארדי דולרים עם יותר ממיליארד משתמשים ברחבי העולם, מעמידה את המשתמשים במצב "בלתי נסבל": "או תשתמשו באינטרנט ותעבירו את כל המידע האישי שלכם ומוגן בזכויות יוצרים לדגמי הבינה המלאכותית של גוגל - או הימנעו האינטרנט כולו."
מהירות אור ניתנת לריסוק
בהצהרה לרויטרס, היועצת הכללית של גוגל, חלימה דליין פראדו, כינתה את הטענות "חסרות בסיס", ואמרה, "אנו משתמשים בנתונים ממקורות ציבוריים - כמו מידע המתפרסם ברשת הפתוחה ומערכי נתונים ציבוריים - כדי להכשיר את המודלים של AI מאחורי שירותים כמו Google Translate, באחריות ובקו עם עקרונות הבינה המלאכותית שלנו".
לאחרונה הגיש קלארקסון אתביעה ייצוגית דומהנגד OpenAI, החברה שיצרה את ChatGPT, בגין "גניבה והפקה פסולה של נתונים אישיים", תוך שימוש באותו סוג של פעולת גירוד נתונים. מודלים של שפה גדולים זקוקים לכמויות אדירות של נתונים כדי לאמן צ'טבוטים של AI ולהפוך אותם לשיחיים וחכמים. גם בארד וגם ChatGPT מסתמכים על מודלים של שפות גדולות כדי לעבוד, מה שהעלה חששות לגבי שימוש בנתונים פרטיים כמו גם הפרת זכויות יוצרים.
התביעה האחרונה טוענת שגוגל ניצלה לא נכון מערכי נתונים כמו Common Crawl, ארגון ללא מטרות רווח, מה שהופך את הנתונים שלה ללא תשלום למטרות מחקר וחינוך, כמו גם נתונים מאתרים כמו Medium וקיקסטארטר. גוגל גם משתמשת בנתונים משלה מג'ימייל ומחיפוש Google כדי להאכיל את הדגמים שלה. נתונים אחרים שנגרדו כוללים יצירות המוגנות בזכויות יוצרים כמו ספרים אלקטרוניים בספריות דיגיטליות, ואפילו מאתרים פיראטיים, שהחברה משתמשת בהן מבלי לפצות אמנים ומחברים.
המפתח לתביעה של קלארקסון הוא נושא הנחלת הכלל. אבל, "'זמין לציבור' מעולם לא התכוון לשימוש חופשי לכל מטרה", נכתב בתלונה. כן, נתונים מסוימים או זמינים לרכישה, אבל זה תלוי בהקשר של השימוש בהם ובהסכמת המשתמש. כן, משתמשים מסכימים למדיניות הפרטיות כשהם מפרסמים תוכן באינטרנט, אך יש להם זכות לדעת אם נעשה בו שימוש במקום אחר. במילים אחרות, קלרקסון אומר, "גוגל חייבת להבין, אחת ולתמיד: אין לה הבעלים של האינטרנט."
ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.