הדבר הזה חכם - וזול. קרדיט: DeepSeek
יש חדשAIשחקן בעיר, ואולי כדאי לשים לב לזה.
ביום שני, חברת בינה מלאכותית סיניתDeepSeekהשיקה מודל שפה גדול חדש בקוד פתוח בשם DeepSeek R1.
לפי DeepSeek, R1 מנצח על LLMs פופולריים אחרים (דגמי שפה גדולים) כגוןOpenAIבכמהאמות מידה חשובות, וזהוטוב במיוחדעם משימות מתמטיות, קידוד והיגיון.
ייתכן שהציוץ נמחק
DeepSeek R1 הוא למעשה חידוד של DeepSeek R1 Zero, שהוא LLM שהוכשר ללא שיטה בשימוש קונבנציונלי הנקראת כוונון עדין מפוקח. זה הפך אותו למסוגל מאוד במשימות מסוימות, אבל כפי שהגדיר זאת DeepSeek עצמו, לאפס היו "קריאות גרועה וערבוב שפה". הזן R1, אשר מתקן את הבעיות הללו על ידי שילוב של "אימון רב-שלבי ונתוני התחלה קרה" לפני שהוא הוכשר עם למידת חיזוק.
מהירות אור ניתנת לריסוק
מלבד שפה טכנית ערמומית (הפרטים הםבאינטרנטאם אתה מעוניין), ישנם מספר דברים עיקריים שאתה צריך לדעת על DeepSeek R1. ראשית, זהו קוד פתוח, כלומר הוא עומד לבדיקה של מומחים, מה שאמור להקל על החששות לגבי פרטיות ואבטחה. שנית, זה בחינם לשימוש כאפליקציה אינטרנט, בעוד שגישה ל-API היאזול מאוד($0.14 עבור מיליון אסימוני קלט, בהשוואה לשל OpenAI$7.5 עבור מודל ההיגיון החזק ביותר שלו, o1).
ראה גם:
והכי חשוב, הדבר הזה הוא מאוד מאוד מסוגל. כדי לבדוק את זה, זרקתי אותו מיד למים עמוקים, וביקשתי ממנו לקוד אפליקציית אינטרנט מורכבת למדי שצריכה לנתח נתונים זמינים לציבור, וליצור אתר אינטרנט דינמי עם מידע על נסיעות ומזג אוויר לתיירים. למרבה הפלא, DeepSeek ייצר קוד HTML מקובל לחלוטין מיד, והצליח לשכלל את האתר עוד יותר על סמך הקלט שלי תוך שיפור ואופטימיזציה של הקוד בכוחות עצמו לאורך הדרך.
אני אעשה את כל זה...מחר. קרדיט: סטן שרדר / Mashable / DeepSeek
ביקשתי ממנו גם לשפר את כישורי השחמט שלי תוך חמש דקות, ועל כך הוא השיב עם מספר טיפים מסודרים ומאוד שימושיים (כישורי השחמט שלי לא השתפרו, אלא רק בגלל שהתעצלתי ממש לעבור עם ההצעות של DeepSeek) .
לאחר מכן ביקשתי מ-DeepSeek להוכיח כמה זה חכם בדיוק בשלושה משפטים. מהלך רע מצדי, מכיוון שאני, האדם, לא מספיק חכם כדי לאמת או אפילו להבין כל אחד משלושת המשפטים. שימו לב, בצילום המסך למטה, שאתם יכולים לראות את "תהליך המחשבה" של DeepSeek בזמן שהוא מגלה את התשובה, שהיא אולי אפילו מרתקת יותר מהתשובה עצמה.
אנחנו מבינים, אתה חכם. קרדיט: סטן שרדר / Mashable / DeepSeek
זה מרשים לשימוש. אבל כמוZDnet ציינה, ברקע לכל אלה יש עלויות הכשרה הנמוכות בסדרי גודל מאשר בדגמים מתחרים מסוימים, וכן שבבים שאינם חזקים כמו השבבים העומדים לרשות חברות בינה מלאכותית בארה"ב. לכן DeepSeek מראה שבינה מלאכותית חכמה במיוחד עם יכולת חשיבה לא חייבת להיות יקרה במיוחד לאימון - או לשימוש.
סטן הוא עורך בכיר ב-Mashable, שם הוא עובד מאז 2007. יש לו יותר גאדג'טים וחולצות טריקו מונעי סוללה ממך. הוא כותב על הדבר פורץ הדרך הבא. בדרך כלל, זהו טלפון, מטבע או מכונית. המטרה הסופית שלו היא לדעת משהו על הכל.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.