אַשׁרַאי:
רעיון גדול: Kaggle מארח תחרויות עבור מדעני נתונים.
למה זה עובד: שימוש בתחרות כדי לשכלל מודלים חזויים.
בשנת 2006,נטפליקספרסמה קבוצה של נתוני משתמש אנונימיים ואתגר: כל מי שיוכל לשפר את אלגוריתמי ההמלצות שלו לסרטים ב-10% לפחות יקבלפרס של מיליון דולר.
זה לקח שלוש שנים, אבלצוות(שתי קבוצות, למעשה) בסופו של דבר אכן עמדו במטרה - משהו שמדעני הנתונים של נטפליקס עצמם לא הצליחו לעשות בעצמם.
"כשאתה עובד בהקשר של תחרות, אתה מנסה כמה דברים ומגיע לראש טבלת ההישגים ואתה די מרוצה מעצמך", מסביר מייסד ומנכ"ל Kaggle, אנתוני גולדבלום. "ואז מישהו אחר בא ועוקר אותך, אז אתה צריך לנסות משהו אחר. הזינוק הזה בדרך כלל נמשך עד שאף אחד לא יכול להשתפר - זה כמו לסחוט לימון עד שהוא יבש."
לא רק נטפליקס מסתמכת על מודלים חיזויים - גם בנקים, חברות ביטוח, ספקי בדיקות ותעשיות רבות אחרות. גולדבלום לקחה את מודל פרס נטפליקס והפכה אותו לקיים עבור כל סוגי החברות.
Kaggle מארח תחרויות עבור מדעני נתונים. חברות שרוצות לפתור בעיות מפרסמות אותן, יחד עם מערכי נתונים רלוונטיים, באתר. כל אחד יכול להגיש פתרון, וכל מתחרה מדורג בלוח המוביל לאורך כל התחרות. עד כה כ-30,000 אנשים הגישו לפחות דגם אחד לתחרות.
הפרסים פועלים מכל מקום ביניהם$1,000, עבור אלגוריתם שיכול להתאים מסמכים למחבריהם, ל3 מיליון דולר, עבור אלגוריתם שחוזה כמה ימים יבלה מטופל בבית חולים בשנה הבאה. לרוב התחרויות יש מועד אחרון בין חודשיים לשלושה חודשים.
גם הנושאים משתנים מאוד. הפעלה מקוונת להכנה למבחןגרוקיט, למשל, השתמש בפלטפורמה כדי לחזות אילו שאלות משתמשים ספציפיים נוטים לטעות. חברה אחרת משתמשת בו כדי לפתח דירוג מאמרים במכונה. רב סרן אנגלי קיבל המחאה על זכייה באתגר Kaggle הקשור לחקר HIV (אמו הייתה מבולבלת כשהופיע במגזין המדע).
הרעיון הוא שבסופו של דבר מדעני הנתונים הטובים בעולם יוכלו להרוויח כמו שחקני הגולף הטובים ביותר או כוכבי הרוק הטובים ביותר.