פֿאַר במס, ויטאָבוס, ינדאַסטריאַל, ינסטראַמענטיישאַן קאַבלע.

Elon פּיזעם און די XAI מאַנשאַפֿט אַפישאַלי לאָנטשט די לעצטע ווערסיע פון גראָק, גרוק 3, בעשאַס אַ ליוועסטרעאַם. איידער דעם פּאַסירונג, אַ באַטייטיק סומע פון פֿאַרבונדענע אינפֿאָרמאַציע, קאַפּאַלד מיט Musk ס 24/7 פּערמאָושאַנאַל כייפּ (אויפשטיין גלאבאלע עקספּעקטיישאַנז פֿאַר גראָבן 3 צו אַנפּרעסידענטיד לעוועלס. נאָר אַ וואָך צוריק, פּיזאָק קאַנפאַדאַנטלי סטייטיד בעשאַס אַ ליוועסטרעאַם בשעת קאַמענטינג אויף דיפּעטעק ר 1, "קסאַי איז וועגן צו קאַטער אַ בעסער יי מאָדעל." פון די דאַטן דערלאנגט לעבן, Grok3 איז ריפּאָרטאַדלי סערפּאַסט אַלע קראַנט מיינסטרים מאָדעלס אין בענטשמאַרקס פֿאַר מאטתימאטיק טאַסקס שייַכות אז גלאָווסישער טאַסקס, פאָרויסזאָגן "ברייקטרווז ביי די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז אין די נאָבעל פרייז." אָבער, דאָס זענען דערווייַל בלויז פּעפּק ס אַספּערשאַנז. נאָך דעם קאַטער, איך טעסטעד די לעצטע ביתא ווערסיע פון גראָק 3 און געשטעלט די קלאַסיש טריק קשיא פֿאַר גרויס מאָדעלס: "וואָס איז גרעסערע, 9.11 אָדער 9.9?" ריגרעטאַבלי, אָן קיין קוואַלאַפייערז אָדער מאַרקינגז, די אַזוי גערופענע סמאַרטאַסט גראָק 3 נאָך קען נישט ענטפֿערן דעם קשיא ריכטיק. Grok3 ניט אַנדערש צו אַקיעראַטלי ידענטיפיצירן די טייַטש פון די קשיא.
דעם פּראָבע געשווינד געצויגן היפּש ופמערקזאַמקייט פון פילע פרענדז, און צונויפפאַלן, פאַרשידן ענלעך טעסץ מעייווער - לייאַם מיט די יקערדיק פון די פיסיקאַלז פון די פיסיק / מאטעמאטיק / מאטעמאטיק. אזוי, עס איז געווען שפּאַסיק - לייבאַלד ווי "אַ זשעני אַנווילינג צו ענטפֿערן פּשוט פֿראגן."

Grok3 איז גוט, אָבער עס איז נישט בעסער ווי R1 אָדער O1-Pro.
גרוק 3 יקספּיריאַנסט "פייליערז" אויף פילע פּראָסט וויסן טעסץ אין פיר. בעשאַס די XAI קאַטער געשעעניש, מוסק דעמאַנסטרייטיד ניצן Grok3 צו אַנאַלייז די כאַראַקטער קלאסן און יפעקץ פון די שפּיל דרך פון גלות 2, וואָס ער קליימד צו שפּילן אָפט, אָבער רובֿ פון די ענטפֿערס צוגעשטעלט דורך Grok3 זענען פאַלש. פּיזעם בעשאַס די ליוועסטרעאַם האט נישט באַמערקן דעם קלאָר ווי דער טאָג אַרויסגעבן.
דעם גרייַז ניט בלויז צוגעשטעלט ווייַטער זאָגן פֿאַר מעייווער - לייאַם נעץ-פּאַדאַסענס צו רייצנ מאַסקע פֿאַר "דערגייונג אַ פאַרטרעטער" אין גיימינג, אָבער אויך אויפשטיין באַטייַטיק קאַנסערנז וועגן די רילייאַבילאַטי פון די גראָק 3 אין פּראַקטיש אַפּלאַקיישאַנז. פֿאַר אַזאַ אַ "געניוס," ראַגאַרדלאַס פון זיין פאַקטיש קייפּאַבילאַטיז, זיין רילייאַבילאַטי אין גאָר קאָמפּלעקס אַפּלאַקיישאַן סינעריאָוז, אַזאַ ווי מאַרס עקספּלאָריישאַן טאַסקס, בלייבט אין צווייפל.
דערווייַל, פילע טעסטערס וואָס באקומען אַקסעס צו גראָק 3 וואָכן צוריק, און יענע וואָס פּונקט טעסטעד די מאָדעל קייפּאַבילאַטיז פֿאַר אַ ביסל שעה נעכטן, אַלע פונט צו אַ פּראָסט מסקנא: "גראָק 3 איז גוט, אָבער עס איז נישט בעסער ווי R1 אָדער O1-Pro."

אַ קריטיש פּערספּעקטיוו אויף "דיסראַפּטינג NVIDIA"
אין די אַפישאַלי דערלאנגט פּפּט בעשאַס די מעלדונג, Grok3 איז געוויזן צו זיין "ווייַט פאָרויס" אין די טשאַטבאָט אַרענאַ, אָבער דעם קלעווערלי געוויינט גראַפיק טעקניקס אין די אָריגינעל 1% דיפפערענסע אין פּרובירן רעזולטאַטן דערשייַנען יקסעפּטאָרלי באַטייטיק אין דעם פּרעזענטירונג.

אין פאַקטיש מאָדעל סקאָרינג רעזולטאַטן, Grok3 איז בלויז 1-2% פאָרויס פון Direseek R1 און GPT-4.0, וואָס קאָראַספּאַנדז צו פילע יוזערז יקספּיריאַנסיז אין פּראַקטיש טעסץ וואָס געפֿונען "קיין באמערקט." גרוק 3 נאָר יקסידז זייַן סאַקסערז דורך 1% -2%.

כאָטש Grok3 האט סקיילד העכער ווי אַלע דערווייַל עפנטלעך טעסטעד מאָדעלס, פילע טאָן ניט נעמען דעם עמעס: נאָך אַלע, קסאַי ביז אַהער געווען קריטיקירט פֿאַר "כעזשבן מאַניפּיאַליישאַן" אין די גרוק 2 טקופע. ווי די אויפֿפּאַסן פּענאַלייזד ענטפֿערן לענג סטיל, די סקאָרז זייער דיקריסט, לידינג אינדוסטריע ינסידערז צו אָפט קריטיקירן די דערשיילונג די דערשיינונג פון "הויך סקאָרינג אָבער נידעריק פיייקייט."
צי דורך לעאַדערבאָאַרד "מאַניפּיאַליישאַן" אָדער פּלאַן טריקס אין אילוסטראציעס, זיי אַנטדעקן די באַבע און די באַנעמעניש פון די באַנעמעניש פון דעם געדאַנק פון "לידינג די פּאַק" אין מאָדעל קייפּאַבילאַטיז. פּיזעם באַצאָלט אַ אַראָפאַנג פּרייַז פֿאַר די מאַרדזשאַנז: בעשאַס די קאַטער, ער באָוסטיד דורך 200.000 ה 100 גפּוס (קליימינג "איבער 100.000" בעשאַס די ליוועסטרעאַם) און דערגרייכן אַ גאַנץ טריינינג צייט פון 200,000,000. דאָס האָט געפֿירט עטלעכע צו גלויבן אַז עס רעפּראַזענץ אן אנדער באַטייטיק בון פֿאַר די גפּו אינדוסטריע און צו באַטראַכטן די אַוטפּאָרץ פון דיפּעקיש אויף דעם סעקטאָר ווי "נאריש." נאָוטאַבלי, עטלעכע גלויבן אַז לויטער קאַמפּישאַנאַל מאַכט וועט זיין די צוקונפֿט פון מאָדעל טריינינג.
אָבער, עטלעכע נעטיזענס קאַמפּערד די קאַנסאַמשאַן פון 2000 ה 800 גפּוס איבער צוויי חדשים צו פּראָדוצירן דיפּשעק וו 3, קאַלקיאַלייטינג אַז די פאַקטיש טריינינג מאַכט קאַנסאַמשאַן מאַכט קאַנסאַמשאַן פון Grok3 איז 263 מאל. דער ריס צווישן דיפּעקשאַן וו 3, וואָס סקאָרד 1402 פונקטן, און Grok3 איז נאָר אונטער 100 פונקטן. Following the release of this data, many quickly realized that behind Grok3's title as the "world's strongest" lies a clear marginal utility effect—the logic of larger models generating stronger performance has begun to show diminishing returns.

אפילו מיט "הויך סקאָרינג אָבער נידעריק פיייקייט," גראָק 2 האט וואַסט אַמאַונץ פון הויך-קוואַליטעט ערשטער-פּאַרטיי דאַטן פון די X (טוויטטער) פּלאַטפאָרמע צו שטיצן באַניץ. אָבער, אין די טריינינג פון Grok3, Xai געוויינטלעך געפּלאָנטערט די "סופיט" וואָס אָפּענאַאַי דערווייַל פנימער-די פעלן פון פּרעמיע טריינינג דאַטן סוויפטלי יקספּאָוזיז די קייפּאַלייז פון די מאָדעל.
די דעוועלאָפּערס פון Grok3 און Musk זענען מסתּמא דער ערשטער צו פֿאַרשטיין און ידענטיפיצירן די פאקטן דיפּלי, וואָס איז וואָס פּיזק האט קעסיידער דערמאנט אויף געזעלשאַפטלעך מידיאַ אַז די ווערסיע ניצערס איצט איז "נאָך די ביתא" און אַז "די פול ווערסיע וועט זיין פריי אין די קומענדיק חדשים." פּיזעם האט גענומען אויף דער ראָלע פון Grok3 ס פּראָדוקט פאַרוואַלטער, סאַגדזשעסטינג ניצערס צושטעלן באַמערקונגען אויף פאַרשידן ישוז געפּלאָנטערט אין די באַמערקונגען אָפּטיילונג. ער קען זיין די מערסט נאכגעגאנגען פּראָדוקט פאַרוואַלטער אויף דער ערד.
אין אַ טאָג, Grok3 ס אויפֿפֿירונג בלי אויפגעהויבן אַלאַרמס פֿאַר יענע כאָופּינג צו פאַרלאָזנ אויף "מאַסיוו קאַמפּיוטיישאַנאַל מוסקל" צו באַן פעטער - תגובה 5. רומאָרס פֿאָרשלאָגן אַז די פּאַראַמעטער גרייס פון גפּט-4.5 קען זיין אפילו גרעסערע.
ווי דער מאָדעל פּאַראַמעטער סיזיז שוועבן, די טריינינג קאָס זענען אויך סקייראַקאַטינג. מיט גראָאָק 3 ס בייַזייַן, קאַנטענדערז ווי גפּט -4.5 און אנדערע וואָס ווילן צו פאָרזעצן "ברענען געלט" צו דערגרייכן בעסער מאָדעל אויפֿפֿעלער פאָרשטעלונג דורך פּאַראַמעטער גרייס מוזן באַטראַכטן די סופיט אַז איז איצט קלאר אין דערזען און באַטראַכטן ווי צו באַטראַכטן ווי צו באַטראַכטן ווי צו באַטראַכטן ווי צו באַקומען עס. אין דעם מאָמענט, יליאַ סוטסקווער, געוועזענער הויפּט געלערנטער אין אָפּענאַי, האט ביז אַהער סטייטיד לעצטע דעצעמבער, "די פאַר-טריינינג מיר זענען באַקאַנט מיט וועט קומען צו אַ סוף," וואָס האט ריסערפאַסעד אין דיסקוסיאָנס, פּראַמפּטינג השתדלות צו געפֿינען דעם אמת דרך פֿאַר טריינינג גרויס מאָדעלס.

יליאַ ס מיינונג האט געבלאזן די שרעק אין די אינדוסטריע. ער אַקיעראַטלי פאָרסאַוו די אָט - אָט יגזאָסטשאַן פון צוטריטלעך נייַ דאַטע, לידינג צו אַ סיטואַציע ווען פאָרשטעלונג קענען ניט פאָרזעצן צו זיין ענכאַנסט דורך דאַטן אַקוואַזישאַן, די יגזאָסטשאַן פון פאַסאַל פיואַלז. ער האָט אנגעוויזן אַז "ווי בוימל, מענטשלעך-דזשענערייטאַד אינהאַלט אויף דער אינטערנעץ איז אַ לימיטעד מיטל." אין סוטאָסטיווער ס פֿאָרויסזאָגן, דער ווייַטער דור פון מאָדעלס, פּאָסטן-פאַר-טריינינג, וועט פאַרמאָגן "אמת זעלבסט - פאַרוואַלטונג" און ריזאַנינג קייפּאַבילאַטיז "ענלעך צו דער מענטשלעך מאַרך."
ניט ענלעך הייַנט ס פאַר-טריינד מאָדעלס וואָס בפֿרט פאַרלאָזנ זיך אינהאַלט וואָס ריכטן זיך (באזירט אויף די ביז אַהער געלערנט מאָדעל אינהאַלט), צוקונפֿט יי סיסטעמען קענען לערנען און פאַרלייגן מעטאָדאָלאָגיעס צו סאָלווע פּראָבלעמס צו סאָלווע פּראָבלעמס צו סאָלווע פּראָבלעמס צו סאָלווע פּראָבלעמס אין אַ שטייגער פון די מענטשלעך מאַרקס. א מענטש קענען דערגרייכן פונדאַמענטאַל באַהאַוונטקייַט אין אַ ונטערטעניק מיט יקערדיק פאַכמאַן ליטעראַטור, בשעת אַן אַי גרויס מאָדעל ריקאַנערז מיליאַנז פון דאַטן פונקטן צו דערגרייכן פּונקט די מערסט יקערדיק פּאָזיציע פון די אַבניקאַסי. אפילו ווען די ווערדינג איז פארענדערט אַ ביסל, די פונדאַמענטאַל פֿראגן קען נישט זיין ריכטיק פארשטאנען אַז די מאָדעל האט ניט טאַקע ימפּרוווד אין סייכל: די גרונט פון דעם אַרטיקל רעפּראַזענץ אַ קלאָר בייַשפּיל פון דעם דערשיינונג.

ויסלאָז
אָבער, ווייַטער פון ברוט קראַפט, אויב גראָק 3 טאַקע סאַקסידז צו אַנטדעקן צו די אינדוסטריע וואָס "פאַר-טריינד מאָדעלס זענען אַפּראָוטשינג זייער סוף," עס וואָלט פירן באַטייַטיק ימפּלאַקיישאַנז פֿאַר די פעלד.
טאָמער נאָך די פרענזי אַרומיק גראָק 3 ביסלעכווייַז סאַבסיידז, מיר וועלן עדות מער קאַסעס ווי פעי-פעי לי ס בייַשפּיל פון "טונינג הויך-פאָרשטעלונג מאָדעלס אויף בלויז $ 50," לעסאָף אַנטדעקן דעם אמת.
קאָנטראָל קייבאַלז
סטראַקטשערד קאַבלינג סיסטעם
נעץ און דאַטן, פיברע-אַפּטיק קאַבלע, לאַטע שנור, מאַדזשולז, פאַסע
אפריל .166 -8, 2024 מיטל-מזרח-ענערגיע אין דובאַי
Apr.116 -18, 2024 סעקוריקאַ אין מאָסקווע
May.9, 2024 ניו פּראָדוקץ & טעטשנאָלאָגיעס קאַטער געשעעניש אין שאַנגהאַי
אקטאבער 22, 2024 זיכערהייט טשיינאַ אין בעידזשינג
נאוועמבער 2010, 2024 פארבונדן וועלט קסאַ
פּאָסטן צייט: פעברואר 19-2025