מערכי נתונים אנונימיים הם בדיחה. וכפי שמראה מחקר שפורסם לאחרונה, הבדיחה במקרה היא עליך.
מרכישות כרטיס האשראי שלך לתיעוד הרפואי שלך ועד להיסטוריית הגלישה המקוונת שלך, חברות משתפות ומוכרות מה שנקרא ערכות נתונים לא מזוהות המכילות תיעוד של כל מהלך שלך. המידע כביכול מופשט מכל פרט ספציפי - כמו שמך - שיקשר אותו ישירות אליך. עם זאת, במקרה זה אנונימיזציה אמיתית של הנתונים האישיים שלך היא הרבה יותר קשה ממה שאתה עשוי לחשוב.
אז מוצא אמחקר שפורסם היוםביומןתקשורת טבע. חוקרים קבעו שבאמצעות המודל שלהם, "99.98% מהאמריקאים יזוהו מחדש בצורה נכונה בכל מערך נתונים באמצעות 15 מאפיינים דמוגרפיים".
בעוד ש-15 מאפיינים דמוגרפיים עשויים להישמע כמו הרבה נתונים שיש על אדם אחד, המחקר שם את המספר הזה בפרספקטיבה.
"מערכי נתונים מודרניים מכילים מספר רב של נקודות לכל אדם", כותבים המחברים. "לדוגמה, מתווך הנתונים Experian מכר [חברת מדע וניתוח נתונים] Alteryx גישה למערך נתונים לא מזוהה המכיל 248 תכונות לכל משק בית עבור 120 מיליון אמריקאים."
מהירות אור ניתנת לריסוק
זה כשלעצמו חדשות כי ניתן להסיר מערכי נתונים אנונימיים. בשנת 2018, חוקרים ב-ועידת הפריצה של DEF CONהדגימו כיצד הם הצליחו לרכוש באופן חוקי וחופשי את היסטוריית הגלישה האנונימית לכאורה של 3 מיליון גרמנים ולאחר מכןביטול אנונימיות במהירותחלקים ממנו. החוקרים הצליחו לחשוף, למשל, את הרגלי הפורנו של שופט גרמני ספציפי.
איזה, אוש.
מחקר חדש זה מדגים עד כמה מעט נתונים נדרשים למעשה כדי לאתר אנשים ספציפיים ממערכות נתונים דלילות אחרת. "[מעט] תכונות מספיקות לעתים קרובות כדי להזדהות מחדש בביטחון גבוה של אנשים במערכים לא שלמים מאוד", מציינים המחברים.
כדי להסיע את הנקודה הזו הביתה,דוחות פסק הדיןשהחוקרים פרסמוכלי מקווןשמאפשר לך לראות עד כמה קל יהיה לזהות אותך במערך נתונים אנונימי כביכול.
ספוילר: התוצאות מטרידות כמו שהיית מצפה - משהו שכדאי לזכור בפעם הבאה שהאותיות הקטנות של חברה מזהירות שהיא "עשויה לשתף את הנתונים האנונימיים שלך עם צדדים שלישיים".