מדוע פתאום מדברים על DeepSeek? קרדיט: ג'סטין סאליבן / Getty Images
בשבוע בלבד,DeepSeekלמודל השפה הגדול של R1 ישchatgpt מבוטלבחנות האפליקציות,טלטל את שוק המניותוהיוו איום רציני על Openai, ובהרחבה, הדומיננטיות של ארה"ב של ענף ה- AI.
ביום שני האחרון פרסמה חברת AI הסינית דיפסיק LLM עם קוד פתוח בשם Deepseek R1, והפכה ל- AI Chatbot הכי מזויפת מאז Chatgpt. זה לכאורה טוב באותה מידה - אם לא טוב יותר - מאשר הדגמים של Openai, זולים יותר לשימוש, ולכאורה התפתח עם פחות שבבים מהמתחרים שלה. הנה מה שאתה צריך לדעת על Deepseek R1 ולמה כולם מדברים על זה פתאום.
Deepseek R1 טוען לעלות על דגמי Openai במדדי מפתח
עם שחרורו של Deepseek R1 פרסמה החברה דו"ח על יכולותיה, כולל ביצועים על מדדים סטנדרטיים בתעשייה. Deepseek טוענת כי LLM שלה Beat Beet Model של Openai O1 על מבחני מתמטיקה וקידוד מתקדמים (Aime 2024, Math-500, SWE-Bench מאומת) והרוויח ממש מתחת ל- O1 על מדד תכנות אחר (Codeforces), מדע בגובה בוגר (GPQA Diamond), וידע כללי (MMLU).
ראה גם:
סטן שרדר של Mashableשים את DeepSeek R1 למבחןעל ידי בקשת ממנה "לקוד אפליקציית אינטרנט מורכבת למדי שצריכה לנתח נתונים זמינים לציבור, וליצור אתר דינמי עם מידע על נסיעות ומזג אוויר לתיירים", והתרחקו מיכולותיו.
בשלב זה קיימים מספר LLMs המופיעים באופן דומה לדגמים של Openai, כמו קלוד אנתרופי, דגמי LLAMA של קוד פתוח של מטא, וגוגל תאומים. אבל הביצועים של DeepSeek R1, בשילוב עם גורמים אחרים, הופכים את זה למתמודד כה חזק.
מהירות אור מחית
שלא כמו דגמי Openai, Deepseek R1 הוא קוד פתוח
מכיוון ש- DeepSeek R1 הוא קוד פתוח, כל אחד יכול לגשת אליו ולציץ אותו למטרותיו. זה גם מאפשר למתכנתים להסתכל מתחת למכסה המנוע ולראות איך זה עובד. מודלים של קוד פתוח נחשבים קריטיים לקנה מידה של שימוש ב- AI ולדמוקרטיזציה של יכולות AI מכיוון שמתכנתים יכולים לבנות אותם במקום לדרוש כוח מחשוב בשווי מיליוני דולרים לבניית משלהם.
מטא נקט בגישה זו על ידי שחרור LLAMA כקור פתוח, בהשוואה לגוגל ופתוח, אשר נמתחים ביקורת על ידי תומכי קוד פתוח כשמירת סף. דגם Gemini של גוגל הוא מקור סגור, אך יש בו משפחה של מודל קוד פתוחג'מהו
זה זול לשימוש והיה זול לבנות
ל- Deepseek R1 גרסת אפליקציות אינטרנט בחינם, הנגישה באמצעות chat.deepseek.com, וממשק API שעולה משמעותית פחות מגישה של API של Openai לדגם המתקדם ביותר שלו. מודל ההנמקה שלה עולה 0.14 דולר עבור מיליון אסימוני קלט במטמון, לעומת 7.50 דולר למיליון אסימוני קלט במטמון עבור דגם O1 של Openai. זה גניבה מוחלטת שלפירותה מתכנתים נוהרים אליו.
עבור מבפני תעשיית AI ומשקיעי טק, ההישג המשמעותי ביותר של DeepSeek R1 הוא כמה מעט כוח מחשוב נדרש (לכאורה) כדי לבנות אותו. על פי מהנדסי DeepSeek דרךהניו יורק טיימס, מודל ה- R1 נדרש רק 2,000 שבבי NVIDIA. זה לעומת אדיווח10,000 GPUs NVIDIA הנדרשים לדגמי OpenAI החל משנת 2023, כך שזה ללא ספק עכשיו יותר.
זו טענה די נועזת, אבל אם נכון, היא מטילה ספק בכמה יש צורך בהשקעה כדי לפתח מרכזי נתונים כמופרויקט סטארגייט של 500 מיליארד דולרכרגע יוצא לדרך. שוק המניות בהחלט הבחין ביעילות העלות לכאורה של Deepseek R1, כאשר NVIDIA טבילה 13 אחוזים במחיר המניות ביום שני.
Deepseek R1 הוא המלך החדש בחנות האפליקציות של אפל
ברור שמשתמשים הבחינו בכישוריו של DeepSeek R1. עד יום שני, הילד החדש ב- Block הציג את חנות האפליקציות של Apple כאפליקציה מספר אחת בחינם, והחליף את CHATGPT כאפליקציה החיננית הממלכתית.
מי יודע אם המומנטום של DeepSeek R1 ימשיך, אבל הוא בהחלט הציג מחדש את מירוץ ה- AI ולקח את התחרות לגבהים גלובליים.
ססילי הוא כתב טק ב- Mashable שמכסה מגמות טכניות של AI, אפל ומתהווה. לפני שקיבלה את התואר השני בבית הספר לעיתונאות בקולומביה, היא בילתה כמה שנים בעבודה עם סטארט -אפים ועסקי השפעה חברתית עבור קבוצות ומעבדה בלתי סבירות. לפני כן, היא הקימה יחד עסק ייעוץ סטארט-אפ עבור מרכזי יזמים מתעוררים בדרום אמריקה, אירופה ואסיה. אתה יכול למצוא אותה בטוויטר ב@cecily_mauranו
עלוני מידע אלה עשויים להכיל קישורי פרסום, עסקאות או סניפים. על ידי לחיצה על מנוי, אתה מאשר שאתה בן 16 ומעלה ומסכים לשלנותנאי שימושוכןמדיניות פרטיותו