מה מומחי AI אומרים על DeepSeek R1

מומחים חולקים את השקפותיהם ב- DeepSeek. קרדיט: CFOTO / פרסום עתידי / Getty Images

פִּתְאוֹם,DeepSeekנמצא בכל מקום.

שֶׁלָהדגם R1הוא קוד פתוח, שהוכשר לכאורה לשבריר מהעלות של דגמי AI אחרים, והוא טוב באותה מידה, אם לא טוב יותר מ- Chatgpt.

השילוב הקטלני הזהפגע בוול סטריט קשה, גורם למניות טק להתנפנף, ולגרום למשקיעים לשאול כמה כסף יש צורך כדי לפתח מודלים טובים של AI.מהנדסי DeepSeek טועניםR1 הוכשר על 2,788 GPUs שעלו כ -6 מיליון דולר, לעומת ה- GPT-4 של Openaiעל פי הדיווחיםעלה 100 מיליון דולר להתאמן.

יעילות העלות של DeepSeek מאתגרת גם את הרעיון שמודלים גדולים יותר ויותר נתונים מובילים לביצועים טובים יותר. בין השיחה המטורפת על יכולותיו של דיפסק, האיום שלה על חברות AI כמו Openai, ומשקיעים מבולבלים, זה יכול להיות קשה להבין מה קורה. אולם מומחי AI עם ניסיון ותיק שקלו עם נקודות מבט יקרות ערך.

Deepseek מוכיח את מה שמומחי AI אומרים כבר שנים: גדול יותר לא טוב יותר

Deepseek מבוסס סין, שנאלץ להיות יצירתי בפיתוח והדרכה של R1. שהם הצליחו להשיג את ההישג הזה תמורת 6 מיליון דולר בלבד (וזה לא הרבה כסף במונחי AI) היה גילוי למשקיעים.

אבל מומחי AI לא הופתעו. "בגוגל שאלתי מדוע הם מקובעים בבניית הדגם הגדול ביותר. למה אתה הולך לגודל? איזו פונקציה אתה מנסה להשיג? מדוע הדבר שהיית מוטרד מכך שלא היה לך הדגם הגדול ביותר? הגיב בירי בי, "פורסםטמניק גברו, שהופסק מפורסם מגוגל בגלל שקרא AI Bias, ב- X.

מהירות אור מחית

ייתכן שציוץ נמחק

מחבק פניםהאקלים וה- AI Lead Sasha Luccioni ציינו כיצד השקעה של AI בנויה באופן מדויק על שיווק והייפ. "זה פראי שרמז כי LLM יחיד (בעל ביצועים גבוהים) מסוגל להשיג את הביצועים האלה מבלי להכניס את החרא מאלפי GPUs כדי לגרום לזה,"אמרלוסוני.

ייתכן שציוץ נמחק

הבהרה מדוע DeepSeek R1 הוא עניין כה גדול

DeepSeek R1 ביצע באופן דומה לדגם Openai O1 על מדדי המפתח. זה עלה בשולי, השווה או נפל ממש מתחת ל- O1 במבחני מתמטיקה, קידוד ומבחני ידע כללי. זה אומר, ישנם דגמים אחרים שם בחוץ, כמו קלוד אנתרופי, גוגל תאומים ומדגם הקוד הפתוח של Meta, המסוגלים לא פחות למשתמש הממוצע.

אבל R1 גורם לטירוף כזה בגלל כמה מעט עולה לעשות. "זה לא חכם יותר מדגמים קודמים, פשוט התאמן בזול יותר,"אמרמדען המחקר AI גארי מרקוס.

ייתכן שציוץ נמחק

העובדה ש- Deepseek הצליחה לבנות דגם שמתמודד עם הדגמים של Openai היא די מדהימה. אנדרג 'קראפטי שהקים יחד את Openai,פורסםב- X, "האם זה אומר שאתה לא צריך אשכולות GPU גדולים עבור LLMS Frontier? לא, אבל אתה צריך להבטיח שאתה לא בזבזני עם מה שיש לך, וזה נראה כמו הפגנה נחמדה שיש עדיין הרבה מה הסתובב עם נתונים וגם עם אלגוריתמים. "

ייתכן שציוץ נמחק

Wharton AI פרופסור איתן מוליקאמרזה לא קשור ליכולותיו, אלא לדגמים שאנשים כרגע יש להם גישה. "DeepSeek הוא מודל ממש טוב, אבל זה בדרך כלל לא מודל טוב יותר מ- O1 או קלוד", אמר. "אבל מכיוון שזה גם חופשי וגם קבלת המון תשומת לב, אני חושב שהרבה אנשים שהשתמשו בדגמי 'מיני' חופשיים נחשפים למה ש- AI Sporter AI המוקדם של 2025 יכול לעשות ומופתעים."

ייתכן שציוץ נמחק

ציון אחד לדגמי AI בקוד פתוח

פריצת Deepseek R1 היא ניצחון עצום עבור תומכי קוד פתוח הטוענים כי דמוקרטיזציה של הגישה למודלי AI חזקים, מבטיחה שקיפות, חדשנות ותחרות בריאה. "לאנשים שחושבים ש'סין עולה על ארה"ב ב- AI ', המחשבה הנכונה היא' דגמי קוד פתוח עולים על סגורים ',"אמריאן לקון, מדען AI הראשי ב- META, שתמך במקור פתוח במודלים של LLAMA משלו.

ייתכן שציוץ נמחק

מדען מחשבים ומומחה AI אנדרו נג לא ציין במפורש את המשמעות של R1 להיות מודל קוד פתוח, אך הדגיש כיצד ההפרעה של DeepSeek היא יתרון עבור מפתחים, מכיוון שהיא מאפשרת גישה שאחרת שער על ידי ביג טק.

"'מכירת Deepseek' של ימינו בשוק המניות - המיוחסת ל- Deepseek V3/R1 המשבשת את המערכת האקולוגית הטכנולוגית - היא סימן נוסף לכך ששכבת היישום היא מקום נהדר להיות בו,"אמרNg. "שכבת מודל היסוד הינה היפר-תחרותית נהדרת לאנשים הבונים יישומים."

ייתכן שציוץ נמחק

ססילי הוא כתב טק ב- Mashable שמכסה מגמות טכניות של AI, אפל ומתהווה. לפני שקיבלה את התואר השני בבית הספר לעיתונאות בקולומביה, היא בילתה כמה שנים בעבודה עם סטארט -אפים ועסקי השפעה חברתית עבור קבוצות ומעבדת B בלתי סבירה. לפני כן, היא הקימה יחד עסק ייעוץ סטארט-אפ עבור מרכזי יזמים מתעוררים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר ב@cecily_mauranו

עלוני מידע אלה עשויים להכיל קישורי פרסום, עסקאות או סניפים. על ידי לחיצה על מנוי, אתה מאשר שאתה בן 16 ומעלה ומסכים לשלנותנאי שימושוכןמדיניות פרטיותו