ניתוח של טראמפ בטוויטר מצביע על כך שהוא כותב רק את הציוצים הזועמים

וילמינגטון, צפון קרוליינה - 9 באוגוסט: המועמד הרפובליקני לנשיאות דונלד טראמפ נואם לקהל במהלך אירוע קמפיין בקולוסיאום טראסק ב-9 באוגוסט 2016 בווילמינגטון, צפון קרוליינה. זה היה ביקורו הראשון של טראמפ בדרום מזרח קרוליינה הצפונית מאז שנכנס למירוץ לנשיאות. קרדיט: שרה דיוויס/Getty Images

(הערת העורך: פוסט זה פורסם מחדש מהבלוג Variance Explained. בקרהפוסט המקוריכדי לראות את הקוד שבו השתמש המחבר בניתוח זה.)

אני בדרך כלל לא מפרסם פוסטים על פוליטיקה (אני לא מתמצא במיוחד בסקרים, וזה המקום שבו מדע הנתוניםהייתה ההשפעה הגדולה ביותר על הפוליטיקה). אבל בסוף השבוע הזה ראיתי השערה על חשבון הטוויטר של דונלד טראמפ שפשוט התחננה לחקור עם נתונים:

ייתכן שהציוץ נמחק

כשטראמפ מאחל בהצלחה לנבחרת האולימפית, הוא מצייץ מהאייפון שלו. כשהוא מעליב יריב, הוא בדרך כלל מצייץ מאנדרואיד. האם זה חפץ שמראה אילו ציוצים הם של טראמפ ואילו של מטפל כלשהו?

לאחרים ישחקר את ציר הזמן של טראמפושם לב שזה נוטה להחזיק מעמד - וטראמפ עצמואכן מצייץ מסמסונג גלקסי. אבל איך נוכל לבחון אותו כמותית? כתבתי על כריית טקסט וניתוח סנטימנטיםלאחרונה, במיוחד במהלך הפיתוח שלי שלחבילת tidytext Rעם ג'וליה סילג', וזו הזדמנות מצוינת ליישם אותו שוב.

הניתוח שלי, המוצג להלן, מסיק זאתהציוצים של אנדרואיד ואייפון הם בבירור מאנשים שונים, פרסום בשעות שונות של היום ושימוש בהאשטאגים, קישורים וציוצים מחדש בדרכים שונות. מה שכן, אנחנו יכולים לראות את זההציוצים של אנדרואיד כועסים ושליליים יותר, בעוד שהציוצים באייפון נוטים להיות הכרזות ותמונות שפירות. בסך הכל הייתי מסכים עם@tvaziriניתוח של: זה מאפשר לנו להבחין בין הציוצים של הקמפיין (אייפון) לבין זה של טראמפ (אנדרואיד).

מערך הנתונים

ראשית, נאחזר את תוכן ציר הזמן של דונלד טראמפ.

אנו מנתחים מערך נתונים שחולץ מציר הזמן של דונלד טראמפ. (אנחנו מסתכלים רק על הציוצים של אייפון ואנדרואיד - מספר קטן בהרבה הוא מלקוח האינטרנט או האייפד).

בסך הכל, זה כולל 628 ציוצים מאייפון ו-762 ציוצים מאנדרואיד. נתחיל בלשקול באיזו שעה ביום מתרחשים הציוצים, שהיינו מצפים להיות "חתימה" של המשתמש שלהם. כאן נוכל לזהות הבדל גם כן:

טראמפ על האנדרואיד עושה הרבה יותר ציוץ בבוקר, בעוד שהקמפיין מפרסם יותר מהאייפון בשעות אחר הצהריים והערב המוקדמות. מקום נוסף שאנחנו יכולים לזהות הבדל הוא בהתנהגות האנכרוניסטית של טראמפ של "ציוץ ידני מחדש" של אנשים על ידי העתקה והדבקה של הציוצים שלהם, ואז מקיפים אותם במרכאות:

ייתכן שהציוץ נמחק

כמעט כל הציוצים המצוטטים הללו מתפרסמים מאנדרואיד:

בניתוחי מילות הלוואי הנותרים בטקסט הזה, אסנן את הציוצים המצוטטים הללו החוצה (מכיוון שהם מכילים טקסט של עוקבים שאולי אינו מייצג את הציוצים של טראמפ עצמו). במקום אחר אנו יכולים לראות הבדל כרוך בשיתוף קישורים או תמונות בציוצים.

מסתבר שציוצים מהאייפון היוסבירות גבוהה פי 38 שיכיל תמונה או קישור.זה הגיוני גם עם הנרטיב שלנו: האייפון (ככל הנראה מנוהל על ידי הקמפיין) נוטה לכתוב ציוצים "הכרזה" על אירועים, כמו זה:

Mashable Top Stories

ייתכן שהציוץ נמחק

בעוד אנדרואיד (טראמפ עצמו) נוטה לכתוב ציוצים ללא תמונה כמו:

ייתכן שהציוץ נמחק

השוואה בין מילים

עכשיו כשאנחנו בטוחים שיש הבדל בין שני החשבונות האלה, מה אנחנו יכולים לומר על ההבדל ב-תוֹכֶן?

מה היו המילים הנפוצות ביותר בציוצים של טראמפ בסך הכל?

אלה צריכים להיראות מוכרים לכל מי שראה את הפיד. כעת נבחן אילו מילים נפוצות ביותר מאנדרואיד ביחס לאייפון, ולהיפך.

אילו מילים סביר להניח שיגיעו מאנדרואיד וככל הנראה מאייפון?

כמה תצפיות:

  • רוב ההאשטאגים מגיעים מהאייפון. ואכן, כמעט אף ציוץ מאנדרואיד של טראמפ לא הכיל האשטאגים, למעט כמה חריגים נדירים כמוזֶה. (זה נכון רק בגלל שסיננו את ה"ציוצים מחדש" שצוטטו, כפי שטראמפ מצטט לפעמים ציוציםכָּזֶההמכילים hashtags).

  • גם מילים כמו "להצטרף" ו"מחר", וזמנים כמו "19:00", הגיעו רק מהאייפון. האייפון אחראי בבירור להודעות על אירועים כמוזֶה("הצטרפו אליי ליוסטון, טקסס מחר בערב ב-19:00!").

  • הרבה מילים "טעונות רגשית", כמו "רע", "משוגע", "חלש" ו"טיפש", היו נפוצות יותר באנדרואיד.זה תומך בהשערה המקורית שזהו החשבון ה"כועס" או ההיפרבולי יותר.

ניתוח סנטימנטים: הציוצים של טראמפ הרבה יותר שליליים משל הקמפיין שלו

מכיוון שראינו הבדל בסנטימנט בין הציוצים של אנדרואיד לאייפון, בואו ננסה לכמת אותו. נעבוד עםאגודת המילים-רגש של NRCלקסיקון, זמין מחבילת tidytext, שמשייכת מילים ל-10 סנטימנטים:חִיוּבִי,שְׁלִילִי,כַּעַס,הֶקדֵם,סְלִידָה,פַּחַד,שִׂמְחָה,עֶצֶב,הַפתָעָה, ואֵמוּן.

לאחר מכן אנו רוצים למדוד כמה יותר סביר שחשבון אנדרואיד ישתמש במונח טעון רגשית ביחס לחשבון האייפון. מכיוון שמדובר בנתוני ספירה, אנו יכולים להשתמש ב-aמבחן פויסוןכדי למדוד את ההבדל, ולדמיין אותו עם רווח סמך של 95%:

כך, חשבון האנדרואיד של טראמפ משתמש בכ-40-80 אחוז יותר מילים הקשורותסְלִידָה,עֶצֶב,פַּחַד,כַּעַס, וסנטימנטים "שליליים" אחרים ממה שעושה חשבון האייפון. (הרגשות החיוביים לא היו שונים במידה משמעותית סטטיסטית).

אנחנו מתעניינים במיוחד אילו מילים הניעו את ההבדל הזה בסנטימנט. הבה נבחן את המילים עם השינויים הגדולים ביותר בכל קטגוריה:

זה מאשר שהרבה מילים המוערות כסנטימנטים שליליים (עם כמה יוצאי דופן כמו "פשע" ו"טרוריסט") נפוצות יותר בציוצים של טראמפ באנדרואיד מאשר בציוצי האייפון של הקמפיין.

מסקנה: רוח הרפאים במכונה הפוליטית

הייתי מוקסם מהתקופה האחרונהמאמר בניו יורקרעל טוני שוורץ, כותב הרפאים של טראמפ עבוראמנות העסקה. מעניין במיוחד היה כיצד שוורץ חיקה את קולו ופילוסופיה של טראמפ:

בכתב העת שלו, שוורץ מתאר את תהליך הניסיון להפוך את קולו של טראמפ לטעים בספר. זה היה סוג של "טריק", הוא כותב, לחקות את ההגשה הבוטה, הסטקאטו, ללא התנצלות של טראמפ, תוך שהוא גורם לו להיראות מושך כמעט נערי... במבט לאחור על הטקסט כעת, אומר שוורץ, "יצרתי דמות הרבה יותר. מנצח ממה שטראמפ הוא בעצם".

כמו כל עיתונות, עיתונות נתונים עוסקת בסופו של דבר בעניין אנושי, ויש אדם אחד שאני מתעניין בו: מי כותב את הציוצים האלה באייפון? רוב הציוצים מהאייפון הם הצהרות שפילות למדי. אבל שקול מקרים כמו אלה, שניהם פורסמו מאייפון:

ייתכן שהציוץ נמחק
ייתכן שהציוץ נמחק

הציוצים האלה בהחלט נשמעים כמו טראמפ שכולנו מכירים. אולי הניתוח שלנו לעיל אינו שלם: אולי טראמפ צייץ לפעמים, אך לעתים רחוקות, מאייפון (אולי מכתיב, או סתם משתמש בו כשהסוללה שלו נגמרה). אבל מה אם ההשערה שלנו נכונה, ואלה לא נכתבו על ידי המועמד - רק מישהו מנסה כמיטב יכולתו להישמע כמוהו? או מה לגבי ציוצים כאלה (גם אייפון), שמגנים על הסלוגן של טראמפ, אבל לא באמת נשמע כמו משהו שהוא היה כותב?

ייתכן שהציוץ נמחק

הרבה נכתב על מצבו הנפשי של טראמפ. אבל אני באמת מעדיף להיכנס לראשו של איש הצוות האנונימי הזה, שתפקידו לחקות את הקצב הייחודי של טראמפ ("עצוב מאוד!"), או לתת לו ספין חיובי, למיליוני עוקבים.

האם הוא מאמין אמיתי, או סתם גלגל שיניים במכונה פוליטית, שמשלב כל משיכה מיינסטרים שהוא יכול לתוך המרקחת @realDonaldTrump? האם בדומה לטוני שוורץ, הוא יתחרט יום אחד על מעורבותו?

דיוויד רובינסון הוא מדען נתונים ב-Stack Overflow. במאי 2015 הוא קיבל את הדוקטורט שלו בביולוגיה כמותית וחישובית מאוניברסיטת פרינסטון. תחומי העניין שלו כוללים סטטיסטיקה, ניתוח נתונים, גנומיקה, חינוך ותכנות ב-R וב-Python. אתה יכול לקרוא עוד מעבודותיו בבלוג שלו, שונות מוסברת.

Jason Abbruzzese הוא כתב עסקי ב- Mashable. הוא מכסה את תעשיות המדיה והטלקום תוך התמקדות מיוחדת כיצד האינטרנט משנה את השווקים הללו ומשפיע על הצרכנים. לפני שעבד ב-Mashable, ג'ייסון שימש ככתב שווקים ומפיק אתרים ב-Financial Times. לג'ייסון תואר ראשון בעיתונאות מאוניברסיטת בוסטון ותואר שני בעניינים בינלאומיים מהאוניברסיטה הלאומית של אוסטרליה.

ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.