מה עושים ByteDance וסורק האינטרנט האגרסיבי שלו? קרדיט: Jakub Porzycki / NurPhoto / Getty Images
TikTokחברת האם ByteDance צוברת כמויות עצומות של נתוני אינטרנט הרבה יותר מהר מאשר סורקי האינטרנט הגדולים האחרים
ייתכן ש-ByteDance מתכננת לשחרר LLM משלה, ומשתמשת באגרסיביות בסורק האינטרנט שלה, "Bytespider", כדי לגרד נתונים כדי לאמן את המודלים שלה,מַזָלדיווח.
Bytespider הופיע בזירה באפריל, ומאז, קצב הצריכה שלו מבייש את מגרדי האינטרנט מ-OpenAI, Google, Meta ו-Anthropic.
מהירות אור ניתנת לריסוק
סם קראוטר, מנכ"ל Kasada, חברה המתמחה בניהול בוטים, אמר לשקע שקצב הגרידה של Bytespider הוא פי 25 מה-GPTbot של OpenAI ופי 3,000 מהשיעור של ClaudeBot, שהוא סורק האינטרנט של Anthropic עבור קלוד LLM שלה. קראוטר אמר גם כי הנתונים של קסדה ראו "עליות ענק בפעילות הגרידה" מבית Bytespider בששת השבועות האחרונים.
בעוד Bytespider צורכת בלהט את האינטרנט, ממשלת ארה"ב מנסה למנוע גישה פוטנציאלית לנתוני משתמשים אמריקאים לממשלת סין. באפריל, הנשיא ביידןחתם על שטרלאלץ את האיסור של TikTok אלא אם כן הוא נמכר על ידי ByteDance בתוך השנה. בהתחשב בשעון המתקתק של ByteDance למכירת TikTok, תחושת הדחיפות מתאימה לקצב האדיר של פעילות סריקת האינטרנט שלה - אם עבור LLM, אלגוריתם טוב יותר או משהו אחר, אנחנו לא יודעים.
מה ByteDance מתכננת לעשות עם כל הנתונים החדשים שנמכרו נותר לראות. אבל TikTok השיקה כמה תכונות המונעות בינה מלאכותית עבור הפלטפורמה. במאי, היא הכריזה על חבילת כלים ליצירת מפרסמיםמודעות שנוצרו על ידי AI, ואווטרים שנוצרו על ידי AIעבור מותגים ויוצרים. לפי השמועות גם TikTok עובד על אמנוע חיפוש פנימי, עם תוצאות המופעלות על ידי AI - אולי באמצעות ChatGPT.
ססילי היא כתבת טכנולוגיה ב-Mashable שמסקרת בינה מלאכותית, אפל ומגמות טכנולוגיות מתפתחות. לפני שקיבלה את התואר השני שלה בבית הספר לעיתונאות קולומביה, היא בילתה מספר שנים בעבודה עם סטארטאפים ועסקים בעלי השפעה חברתית עבור Unreasonable Group ו-B Lab. לפני כן, היא הקימה עסק לייעוץ סטארט-אפים למרכזי יזמות מתפתחים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר בכתובת@cecily_mauran.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.