ה- XAI של אלון מאסק שוחרר סוף סוף, מודל ה- AI החדש שלה, ובו נכתב שהוא עולה על התחרות בצורה של Openai, Deepseek ועוד. אבל האם זה מספק?
עם תכונות נימוק חדשות וכוח מחשוב רב יותר, גרוק 3 עבר דרך ארוכה, אך מומחי AI עדיין נמצאים על הגדר לגבי סיכוייה. בואו נגלה כיצד הוא מתמודד עם דגמי ה- AI המובילים הזמינים.
האם גרוק 3 הוא פריצת דרך בהנמקה של AI?
מאסק חשף את משפחת גרוק 3 בזרם חי על x, הצגת נימוקים גרוק 3 (בטא) וגרוק 3 נימוקים מיני. בניגוד למודלים של AI גנביים קונבנציונליים, AI מבוסס סיבה מסוגל "לחשוב" בעיות, למזער את הפוטנציאל למידע שגוי או הזיות. זוהי אבן דרך חשובה בשיפור אמינות AI ודיוק.
XAI טוען כי Grok 3 עולה על ביצועים טובים יותר מ- O1 ו- Deepseek-R1 של Openai במדדי מפתח. בבדיקה העיוורת של צ'אט בוט ארנה, גרוק 3 - תחת שם הקוד "שוקולד" - הוענק מאוד, והוכיח שהוא הדביק את מנהיגי התעשייה למרות כניסתו המאוחרת לשוק.
האם ניתן לנתק את צ'טגט?
לחלוץאנדריי קראפטיה,חבר מייסד Openai ומנהל טסלה AI לשעבר, בדק את גרוק 3 ושיתף את תובנותיו.
- Andrej Karpathy (@karpathy)18 בפברואר 2025ניתנה לי גישה מוקדמת לגרוק 3 מוקדם יותר היום, מה שגרם לי לדעתי אחד מהראשונים שיכולים להריץ בדיקת vibe מהירה.
חֲשִׁיבָה
✅ ראשית, לגרוק 3 יש בבירור מודל חשיבה חשיבה של אמנות (כפתור "לחשוב") ועשה נהדר מחוץ לקופסה על המתנחל שלי של קטאן ...pic.twitter.com/qiruan1ifd
לדבריו, Grok 3 עם תכונת ההנמקה העמוקה של החיפוש שלה הוא תחרותי עם הדגמים העליונים של Openai כמו O1-Pro (200 $ לחודש) ומעט מוציאים את DeepSeek-R1.
למרות ההתקדמות הזו, קרפטיה לא מאמינה שגרוק 3 יספיק בכדי לגרום למשתמשים לבטל את המנויים שלהם ל- ChatGPT.
פרופסור AI איתן מוליק הדהד את הסנטימנט הזה, וקבע כי "גרוק 3 נכנס ממש בציפיות", והוסיף כי הכוח והמהירות מחושבים נשארים מבדיקי המפתח בפיתוח AI.
המחלוקת של קסאי של קסאי: האם הם מתעופפים יותר מדי בגרוק 3?
תרשימי הביצועים של גרוק 3 הפכו במהירות לוויראלית, והראו כי הם מתפקדים מתחרים מפתח. עם זאת, רקס אסאבור של Openai אתגר את הטענות הללו, ושיתף תרשים "מעודכן" שהראהמכה את גרוק 3 במדדי מתמטיקה ומדע.
אמנם ה- O3 של Openai עדיין אינו זמין לציבור, אך השוואה זו מוסיפה שכבה של ספקנות לטענותיו של קסאי.
למען ההגינות, ייתכן ש- XAI לא היה תלוי בציוני Benchmark האחרון של Openai כאשר הם ביצעו את המבחנים שלהם. עם זאת, זוהי תזכורת לכך שמרוץ ה- AI רחוק מלהסתיים.
הצמיחה האקספוננציאלית של גרוק 3: קצה הקרחון?
למרות ספק מסוים, ההתפתחות המהירה של גרוק 3 אינה ניתנת להכחשה,Mashable כותב.גוגל ופתוח נהנו שנים של התחלות ראש בפיתוח - 13 ו -8 שנים, בהתאמה - בעוד ש- XAI יצאה בשנת 2023. עם זאת, גרוק 3 כבר הצטרף לדיון כמודל AI מוביל.
מאסק גם ציין כי Grok 3 הוכשר עם פי 10 מכושר המחשוב של Grok 2, תוך שימוש ב 200,000 GPUs. זה מאשר מחדש את הכלל הכללי כי הגדלת כמויות המחשוב גורמות לביצועי AI משופרים.
עם זאת, חוקרים כמו גארי מרקוס אכן נשאלו האם הגדרת המחשוב או לא תגביר עוד יותר את אינטליגנציה של AI מעבר לסף מסוים.
המגבלות של גרוק 3: עדיין עבודה בעיצומה
למרות שגרוק 3 עבר דרך ארוכה, הוא עדיין חווה רבים מאותם סוגיות כמו דגמי AI אחרים:
- יכולות הומור חלשות: בדומה לדגמי AI רבים, לגרוק 3 יש כישורים ירודים לייצור הומור טוב, ולעתים קרובות נוקט לבדיחות אבא תפלות.
- אתגרים של ייצור תמונות SVG: מודלים של AI נאבקים לעתים קרובות למצב אלמנטים חזותיים מורכבים. גרוק 3 ביצעו ביצועים טובים יותר של אלטרנטיבות כמו פלאש תאומים 1.5 אך עדיין סבלו מבעיות מערכת יחסים מרחבית.
- סוגיות הטיה פוליטיות: מאסק מסגר את גרוק כנקודת נגד "אנטי-ווק" למודלים של AI שביקרו ביקורת על תקינות פוליטית. אולם קרפטיה גילתה שגרוק 3 לא ידון בכמה אתגרים אתיים, ואולי יהפוך אותו ל"רגיש מדי "יותר ממה שהקהל של מאסק עשוי לרצות.
מאסק ציין בעבר כי דגמי גרוק קודם לכן מוטים משמאל מכיוון שחומר אימונים זמין לציבור נוטה להטיה שנשארו. עדכונים עתידיים, הוא נשבע, יהפוך את גרוק לניטרלי פוליטית יותר.
מהי האפשרות הטובה ביותר?
Grok 3 זמין ראשון למנויי X Premium+, תוכנית שעלתה לאחרונה ל 50 $ לחודש. בעוד שהדגם התקדם משמעותית, יתכן שהוא עדיין לא יספיק כדי לרסק את הצ'אט וה- Deepseek של Openai, כלומר
לחובבי AI ומושק, גרוק 3 הוא תוספת מבורכת לסצנת AI. אבל עבור כל מי שמחפש את הטוב ביותר בדגמי AI, Grok 3 אולי לא מספיק חזק כדי לגרום למשתמשים לעבור משחקני התעשייה המובילים בנקודת זמן זו.
בסקירה אחרת מאתלפענח, Grok-3 מאפשר יותר "דיבור חופשי" מאשר צ'אט בוטים אחרים של AI. כשמדובר בקידוד, זה "פשוט עובד" טוב יותר מאחרים. עם זאת, בהנמקה במתמטיקה, Openai ו- Deepseek הם עדיין הצ'אט בוטים הטובים יותר.
Ⓒ 2024 TechTimes.com כל הזכויות שמורות. אל תשחזר ללא אישור.