הקדמה

אנגייענדיקע דאגות צווישן קאנקורירנדיקע גרויסע מאדעלן, קלאָוד פּראַוויידערז וואָס קאָנקורירן פֿאַר מאַרק טיילן, און שווער-אַרבעטנדיקע טשיפּ פאַבריקאַנטן - דער דיפּסיק ווירקונג בלייבט.

אזוי ווי דער פרילינג פעסטיוואל קומט צו אן ענדע, בלייבט די אויפרעגונג ארום DeepSeek שטארק. דער לעצטער יום טוב האט ארויסגעוויזן א באדייטנדיק געפיל פון קאנקורענץ אין דער טעק אינדוסטריע, מיט פילע וואס דיסקוטירן און אנאליזירן דעם "קאטפיש". סיליקאן וועלי דערלעבט אן אומגעזעענעם געפיל פון קריזיס: פארטיידיקער פון אפען-קוואל זאגן נאכאמאל זייערע מיינונגען, און אפילו OpenAI באטראכט איבער צי איר פארמאכט-קוואל סטראטעגיע איז געווען די בעסטע ברירה. די נייע פאראדיגמע פון נידעריגערע קאמפיוטאציאנעלע קאסטן האט ארויסגערופן א קייטן רעאקציע צווישן טשיפ ריזן ווי Nvidia, וואס האט געפירט צו רעקארד איינציג-טאגיקע מארקעט ווערט פארלוסטן אין אמעריקאנער בערזע געשיכטע, בשעת רעגירונג אגענטורן אויספארשן די קאמפלייענס פון די טשיפס גענוצט דורך DeepSeek. צווישן געמישטע באריכטן פון DeepSeek אין אויסלאנד, דערלעבט עס אן אויסערגעווענליכן וואוקס אין לאקאל. נאך דער לאנטשירונג פון דעם R1 מאדעל, האט די פארבונדענע אפליקאציע געזען א שטארקן אויפשטייג אין טראפיק, וואס ווייזט אז וואוקס אין אפליקאציע סעקטארן וועט שטופן דעם אלגעמיינעם AI עקא-סיסטעם פאראויס. דער פאזיטיווער אספעקט איז אז DeepSeek וועט פארברייטערן אפליקאציע מעגלעכקייטן, וואס ווייזט אז זיך פארלאזן אויף ChatGPT וועט נישט זיין אזוי טייער אין דער צוקונפט. די ענדערונג איז אפגעשפיגלט געווארן אין OpenAI'ס לעצטע אקטיוויטעטן, אריינגערעכנט די צושטעל פון א לאזונג מאדעל גערופן o3-mini פאר פרייע באנוצער אלס רעאקציע צו DeepSeek R1, ווי אויך נאכפאלגנדע אפגרעידס וואס האבן געמאכט די געדאנקען-קייט פון o3-mini פובליק. אסאך אויסלענדישע באנוצער האבן אויסגעדריקט דאנקבארקייט צו DeepSeek פאר די אנטוויקלונגען, כאטש די געדאנקען-קייט דינט אלס א צוזאמענפאסירונג.

אָפּטימיסטיש, איז עס קלאָר אַז DeepSeek פֿאַראייניקט די היגע שפּילער. מיט זײַן פֿאָקוס אויף רעדוצירן טראַינינג קאָסטן, פֿאַרשידענע אַפּסטרים טשיפּ פאַבריקאַנטן, ינטערמידייט וואָלקן פּראַוויידערז, און צאָלרײַכע סטאַרטאַפּס אַקטיוו זיך אָנשליסן אין דער עקאָסיסטעם, פֿאַרבעסערן קאָסטן עפֿעקטיווקייט פֿאַר נוצן דעם DeepSeek מאָדעל. לויט DeepSeek'ס פּאַפּירן, דאַרף די גאַנצע טראַינינג פֿון דעם V3 מאָדעל בלויז 2.788 מיליאָן H800 GPU שעה, און דער טראַינינג פּראָצעס איז העכסט סטאַביל. די MoE (Mixture of Experts) אַרכיטעקטור איז קריטיש פֿאַר רעדוצירן פאַר-טראַינינג קאָסטן מיט אַ פֿאַקטאָר פֿון צען קאַמפּערד צו Llama 3 מיט 405 ביליאָן פּאַראַמעטערס. איצט, איז V3 דער ערשטער עפֿנטלעך דערקענט מאָדעל וואָס דעמאָנסטרירט אַזאַ הויכע שפּאַרסיטי אין MoE. דערצו, אַרבעט די MLA (Multi Layer Attention) סינערגיסטיש, ספּעציעל אין ריזאַנינג אַספּעקטן. "ווי שפּאַרער דער MoE, אַלץ גרעסער די באַטש גרייס וואָס איז נויטיק בעת ריזאַנינג צו פֿולשטענדיק נוצן קאַמפּיוטיישאַנאַל מאַכט, מיט די גרייס פֿון די KVCache זײַענדיק דער שליסל לימיטייטינג פֿאַקטאָר; די MLA ראַדוסירט באַדײַטנדיק די KVCache גרייס," האָט באַמערקט אַ פֿאָרשער פֿון Chuanjing Technology אין אַן אַנאַליז פֿאַר AI Technology Review. אינגאנצן, ליגט DeepSeek'ס ערפאלג אין דער קאמבינאציע פון פארשידענע טעכנאלאגיעס, נישט נאר איין איינציקע. אינדוסטרי אינסיידערס לויבן די DeepSeek מאַנשאַפֿט'ס אינזשעניריע מעגלעכקייטן, באַמערקנדיק זייער עקסאַלאַנס אין פּאַראַלעל טריינינג און אָפּעראַטאָר אָפּטימיזאַציע, דערגרייכנדיק גרונט-ברעכנדיקע רעזולטאַטן דורך ראַפינירן יעדן דעטאַל. DeepSeek'ס אָפֿן-קוואַל צוגאַנג שטופּט ווייטער די אַלגעמיינע אַנטוויקלונג פון גרויסע מאָדעלן, און מען אַנטיסיפּירט אַז אויב ענלעכע מאָדעלן וועלן זיך אויסברייטערן אין בילדער, ווידעאָס און מער, וועט דאָס באַדייטנד סטימולירן די פאָדערונג איבער דער אינדוסטריע.

געלעגנהייטן פֿאַר דריט-פּאַרטיי ריזאַנינג באַדינונגען

דאטן ווייזן אז זינט זיין ארויסגעבן, האט DeepSeek צוזאמענגעקליבן 22.15 מיליאן טעגליכע אקטיווע באנוצער (DAU) אין בלויז 21 טעג, דערגרייכנדיג 41.6% פון ChatGPT'ס באנוצער באזע און איבערשטייגנדיג 16.95 מיליאן טעגליכע אקטיווע באנוצער פון Doubao, אזוי ווערנדיג די שנעלסט-וואקסנדיקע אפליקאציע גלאבאל, אנפירנדיג דעם עפל אפ סטאר אין 157 לענדער/ראיאנען. אבער, בשעת באנוצער האבן זיך געזאמלט אין גרויסע צאלן, האבן סייבער העקערס אומאויפהערליך אטאקירט די DeepSeek אפליקאציע, וואס האט געפירט צו א באדייטנדיקן דרוק אויף אירע סערווערס. אינדוסטריע אנאליסטן גלייבן אז דאס איז טיילווייז צוליב דעם וואס DeepSeek האט ארויסגעשטעלט קארטלעך פאר טרענירונג אבער האט נישט גענוג קאמפיוטאציאנעלע מאכט פארן טראכטן. אן אינדוסטריע אינסיידער האט געזאגט פאר AI Technology Review, "די אפטע סערווער פראבלעמען קענען לייכט ווערן אויסגעלייזט דורך בארעכענען אפצאלן אדער פינאנצירן צו קויפן מער מאשינען; לעצטנס, ווענדט זיך עס אין DeepSeek'ס באשלוסן." דאס שטעלט פאר א קאמפראמיס אין פאקוסירן אויף טעכנאלאגיע קעגן פראדוקטיזאציע. DeepSeek האט זיך מערסטנס פארלאזט אויף קוואנטום קוואנטיזאציע פאר זעלבסט-פארזארגונג, האבנדיג באקומען ווייניג עקסטערנע פינאנצן, רעזולטירנדיג אין א רעלאטיוו נידריגן געלט-פלוס דרוק און א ריינערע טעכנאלאגישע סביבה. איצט, אין ליכט פון די אויבן דערמאנטע פראבלעמען, בעטן עטלעכע באַניצער DeepSeek אויף סאציאלע מעדיע צו העכערן די באַניץ-שוועלן אדער איינפירן באצאלטע פֿונקציעס צו פֿאַרבעסערן די באַניצער-קאָמפֿאָרט. דערצו, האָבן דעוועלאָפּערס אָנגעהויבן נוצן די אָפֿיציעלע API אדער דריט-פּאַרטיי APIs פֿאַר אָפּטימיזאַציע. אָבער, DeepSeek'ס אָפֿענע פּלאַטפאָרמע האָט לעצטנס געמאָלדן, "די איצטיקע סערווער-רעסורסן זענען זעלטן, און API סערוויס-אויפֿלאָדן זענען סוספּענדירט געוואָרן."

דאָס עפֿנט אָן ספק מער געלעגנהייטן פֿאַר דריט-פּאַרטיי פֿאַרקויפֿער אין דעם קינסטלעכער אינפֿראַסטרוקטור סעקטאָר. לעצטנס, האָבן צאָלרײַכע לאָקאַלע און אינטערנאַציאָנאַלע וואָלקן ריזן לאָנטשט DeepSeek'ס מאָדעל APIs - אויסלענדישע ריזן Microsoft און Amazon זענען געווען צווישן די ערשטע צו זיך אָנשליסן אין סוף יאַנואַר. דער לאָקאַלער פֿירער, Huawei Cloud, האָט געמאַכט דעם ערשטן שריט, און האָט אַרויסגעגעבן DeepSeek R1 און V3 ריזאַנינג סערוויסעס אין מיטאַרבעט מיט Silicon-based Flow דעם 1טן פֿעברואַר. באַריכטן פֿון AI Technology Review ווײַזן אָן אַז Silicon-based Flow'ס סערוויסעס האָבן געזען אַ שטראָם פֿון באַניצער, וואָס האָט עפֿעקטיוו "קראַשט" די פּלאַטפֿאָרמע. די גרויסע דרײַ טעק קאָמפּאַניעס - BAT (Baidu, Alibaba, Tencent) און ByteDance - האָבן אויך אַרויסגעגעבן ביליקע, באַגרענעצטע-צײַט אָפֿערס אָנהייבנדיק פֿעברואַר 3, וואָס דערמאָנט די לעצטע יאָר'ס וואָלקן פֿאַרקויפֿער פּרײַז מלחמות וואָס זענען אָנגעצונדן געוואָרן דורך DeepSeek'ס V2 מאָדעל לאָנטש, וווּ DeepSeek האָט אָנגעהויבן ווערן גערופֿן דער "פּרײַז מעסטער". די פֿרענעטע אַקציעס פֿון וואָלקן פֿאַרקויפֿער שפּיגלען אָפּ די פֿריִערדיקע שטאַרקע פֿאַרבינדונגען צווישן Microsoft Azure און OpenAI, וואו אין 2019 האָט Microsoft געמאַכט אַ באַדײַטנדיקע $1 ביליאָן ינוועסטירונג אין OpenAI און גענאָסן די פֿאָרטיילן נאָך ChatGPT'ס לאָנטשירונג אין 2023. אָבער, די נאָענטע פֿאַרבינדונג האָט זיך אָנגעהויבן צו פֿאַרשוואַכן נאָך וואָס Meta האָט געמאַכט Llama אָפֿן-קוואַל, און דאָס האָט דערמעגלעכט אַנדערע פֿאַרקויפֿער אַרויס פֿון Microsoft Azure עקאָסיסטעם צו קאָנקורירן מיט זייערע גרויסע מאָדעלן. אין דעם פֿאַל האָט DeepSeek נישט נאָר איבערגעשטיגן ChatGPT אין טערמינען פֿון פּראָדוקט היץ, נאָר האָט אויך פֿאָרגעשטעלט אָפֿן-קוואַל מאָדעלן נאָך דער o1 מעלדונג, ענלעך צו דער אויפֿרעגונג אַרום Llama'ס ווידער-באַנייען פֿון GPT-3.

אין פאַקט, וואָלקן פּראַוויידערז שטעלן זיך אויך אַרויף ווי טראַפיק גייטווייז פֿאַר AI אַפּלאַקיישאַנז, וואָס מיינט אַז טיפֿערע פֿאַרבינדונגען מיט דעוועלאָפּערס איבערזעצט זיך צו פאַרהיטנדיקע מעלות. באַריכטן ווײַזן אַז Baidu Smart Cloud האָט געהאַט איבער 15,000 קאַסטאַמערז וואָס האָבן געניצט דעם DeepSeek מאָדעל דורך די Qianfan פּלאַטפאָרמע אויף דעם מאָדעל'ס לאָנטשירונג טאָג. דערצו, עטלעכע קלענערע פירמעס פאָרשלאָגן לייזונגען, אַרייַנגערעכנט סיליקאָן-באַזירט Flow, Luchen טעכנאָלאָגיע, Chuanjing טעכנאָלאָגיע, און פֿאַרשידענע AI אינפֿראַראַ פּראַוויידערז וואָס האָבן לאָנטשט שטיצע פֿאַר DeepSeek מאָדעלן. AI טעכנאָלאָגיע איבערבליק האָט געלערנט אַז איצטיקע אָפּטימיזאַציע געלעגנהייטן פֿאַר לאָקאַליזירטע דיפּלוימאַנץ פון DeepSeek עקסיסטירן בפֿרט אין צוויי געביטן: איינער איז אָפּטימיזירן פֿאַר די ספּאַרסיטי קעראַקטעריסטיקס פון דעם MoE מאָדעל ניצן אַ געמישט ריזאַנינג צוגאַנג צו דיפּלויען דעם 671 ביליאָן פּאַראַמעטער MoE מאָדעל לאָקאַל בשעת ניצן כייבריד GPU/CPU אינפֿערענץ. דערצו, די אָפּטימיזאַציע פון MLA איז וויכטיק. אָבער, DeepSeek'ס צוויי מאָדעלן שטייען נאָך פֿאַר עטלעכע טשאַלאַנדזשיז אין דיפּלוימאַנט אָפּטימיזאַציע. "צוליב דער גרייס פונעם מאָדעל און די פילע פּאַראַמעטערס, איז אָפּטימיזאַציע טאַקע קאָמפּליצירט, ספּעציעל פֿאַר לאָקאַלע דיפּלוימאַנץ וואו דערגרייכן אַן אָפּטימאַלן באַלאַנס צווישן פאָרשטעלונג און קאָסטן וועט זיין אַ שווערע אַרבעט," האָט געזאָגט אַ פאָרשער פֿון טשואַנדזשינג טעכנאָלאָגיע. די מערסט באַדייטנדיקע שטערונג ליגט אין איבערקומען די לימיטן פֿון זכּרון קאַפּאַציטעט. "מיר נעמען אָן אַ העטעראָגענעם קאָלאַבאָראַציע צוגאַנג צו פֿולשטענדיק נוצן CPUs און אַנדערע קאָמפּיוטיישאַנאַל רעסורסן, און שטעלן בלויז די נישט-געטיילטע טיילן פֿון דער דין MoE מאַטריץ אויף CPU/DRAM פֿאַר פּראַסעסינג מיט הויך-פאָרשטעלונג CPU אָפּעראַטאָרן, בשעת די געדיכטע טיילן בלייבן אויף דער GPU," האָט ער ווייטער דערקלערט. באַריכטן ווײַזן אַז טשואַנדזשינג'ס אָפֿן-מקור פריימווערק KTransformers לייגט הויפּטזעכלעך אַרײַן פֿאַרשידענע סטראַטעגיעס און אָפּעראַטאָרן אין דער אָריגינעלער טראַנספאָרמערס אימפּלעמענטאַציע דורך אַ טעמפּלאַט, וואָס פֿאַרבעסערט באַדייטנדיק די אינפֿערענץ גיכקייט מיט מעטאָדן ווי CUDAGraph. DeepSeek האָט באַשאַפֿן געלעגנהייטן פֿאַר די סטאַרטאַפּס, ווי די וווּקס בענעפֿיטן ווערן קלאָר; פילע פֿירמעס האָבן געמאָלדן באַמערקבאַרן קונה וווּקס נאָך לאָנטשינג די DeepSeek API, באַקומען פֿראַגעס פֿון פֿריִערדיקע קליענטן וואָס זוכן אָפּטימיזאַציעס. אינדוסטרי אינסיידערס האבן באמערקט, "אין דער פארגאנגענהייט, זענען עטוואס איינגעשטעלטע קליענט גרופעס אפט געווען פארשפארט אין די סטאנדארדיזירטע סערוויסעס פון גרעסערע פירמעס, שטארק געבונדן דורך זייערע קאסטן מעלות צוליב גרייס. אבער, נאכדעם וואס מיר האבן פארענדיגט די דיפלוימענט פון DeepSeek-R1/V3 פארן פרילינג פעסטיוואל, האבן מיר פלוצלינג באקומען קאאפעראציע פארלאנגען פון עטליכע באקאנטע קליענטן, און אפילו פריער שלאפנדיקע קליענטן האבן אנגעהויבן קאנטאקט צו פארשטעלן אונזערע DeepSeek סערוויסעס." יעצט, עס שיינט אז DeepSeek מאכט מאדעל אינפערענס פערפארמענס אלץ מער קריטיש, און מיט א ברייטערע אדאפטאציע פון גרויסע מאדעלן, וועט דאס ווייטער שטארק איינפלוסן די אנטוויקלונג אין דער AI אינפרא אינדוסטריע. אויב א DeepSeek-לעוועל מאדעל קען ווערן דיפלויעד לאקאל מיט א נידריגן קאסט, וואלט עס שטארק געהאלפן רעגירונג און פירמעס דיגיטאלע טראנספארמאציע השתדלות. אבער, שוועריקייטן בלייבן, ווייל עטליכע קליענטן קענען האלטן הויכע ערווארטונגען וועגן גרויסע מאדעל מעגלעכקייטן, מאכנדיג עס מער קלאר אז באלאנסירן פערפארמענס און קאסט ווערט וויכטיג אין פראקטישן דיפלוימענט.

צו אפשאצן צי DeepSeek איז בעסער ווי ChatGPT, איז עס וויכטיג צו פארשטיין זייערע הויפט אונטערשיידן, שטארקייטן, און באנוץ-פאלן. דא איז א פולשטענדיגע פארגלייך:

שטריך/אַספּעקט	דיפּסיק	טשאַטGPT
אייגנטומערשאַפט	דעוועלאָפּט דורך אַ כינעזישע פירמע	דעוועלאָפּט דורך OpenAI
מקור מאָדעל	אָפֿן-קוואַל	פּראַפּריעטאַרי
קאָסטן	פריי צו ניצן; ביליקערע API צוטריט אָפּציעס	אַבאָנעמענט אָדער באַצאָלן-פּער-נוצן פּרייזן
קאַסטאַמייזיישאַן	העכסט קאַסטאַמייזאַבאַל, אַלאַוינג ניצערס צו טוויק און בויען אויף עס	לימיטירטע קאַסטאַמייזיישאַן בנימצא
פאָרשטעלונג אין ספּעציפֿישע אויפֿגאַבן	עקסעלס אין געוויסע געביטן ווי דאַטן אַנאַליטיקס און אינפֿאָרמאַציע ריטריוואַל	פילזײַטיק מיט שטאַרקע פאָרשטעלונג אין שעפעריש שרייבן און שמועס אויפגאַבן
שפּראַך שטיצע	שטאַרקע פאָקוס אויף כינעזישער שפּראַך און קולטור	ברייטע שפּראַך שטיצע אָבער יו. עס.-צענטרירט
טרענירונג קאָסטן	נידעריקערע טריינינג קאָסטן, אָפּטימיזירט פֿאַר עפֿעקטיווקייט	העכערע טרענירונג קאסטן, וואס פארלאנגען באדייטנדע קאמפיוטער רעסורסן
ענטפער וואַריאַציע	קען אָנבאָטן פֿאַרשידענע רעאַקציעס, מעגלעך באַאיינפֿלוסט פֿון געאָפּאָליטישן קאָנטעקסט	קאָנסיסטענטע ענטפֿערס באַזירט אויף טראַינינג דאַטן
ציל־פּובליקום	געצילט אויף דעוועלאָפּערס און פאָרשער וואָס ווילן בייגיקייט	געצילט אויף אַלגעמיינע באַניצער וואָס זוכן שמועס מעגלעכקייטן
ניצן קאַסעס	מער עפעקטיוו פֿאַר קאָד דזשענעריישאַן און שנעל טאַסקס	אידעאל פֿאַר שאַפֿן טעקסט, ענטפֿערן פֿראַגעס און אָנטיילנעמען אין דיאַלאָג

א קריטישע פּערספּעקטיוו אויף "דיסראַפּטינג נווידיאַ"

איצט, חוץ הואַוועי, עטלעכע היגע טשיפּ פאַבריקאַנטן ווי מור טרעדס, מוקסי, ביראַן טעכנאָלאָגיע, און טיאַנקסו זשיקסין אַדאַפּטירן זיך אויך צו דיפּסיק'ס צוויי מאָדעלן. א טשיפּ פאַבריקאַנט האָט געזאָגט צו AI טעכנאָלאָגיע רעוויו, "דיפּסיק'ס סטרוקטור ווייזט כידעש, אָבער עס בלייבט אַן LLM. אונדזער אַדאַפּטאַציע צו דיפּסיק איז בפֿרט פאָקוסירט אויף ריזאַנינג אַפּלאַקיישאַנז, מאַכנדיג טעכנישע ימפּלאַמענטיישאַן גאַנץ פּשוט און שנעל." אָבער, דער MoE צוגאַנג ריקווייערז העכערע פאָדערונגען אין טערמינען פון סטאָרידזש און פאַרשפּרייטונג, צוזאַמען מיט ענשורינג קאַמפּאַטאַבילאַטי ווען דיפּלויינג מיט היגע טשיפּס, פּרעזענטינג פילע אינזשענירינג טשאַלאַנדזשיז וואָס דאַרפֿן לייזונג בעשאַס אַדאַפּטיישאַן. "איצט, היגע קאַמפּיוטיישאַנאַל מאַכט טוט נישט גלייַכן Nvidia אין יוזאַביליטי און פעסטקייַט, ריקווייערז אָריגינעל פאַבריק אָנטייל פֿאַר ווייכווארג סוויווע סעטאַפּ, טראָובלעשאָאָטינג, און פונדאַמענטאַל פאָרשטעלונג אָפּטימיזאַטיאָן," אַן אינדוסטריע פּראַקטישנער האט געזאגט באזירט אויף פּראַקטיש דערפאַרונג. סיימאַלטייניאַסלי, "צוליב דעם גרויס פּאַראַמעטער וואָג פון דיפּסיק R1, היגע קאַמפּיוטיישאַנאַל מאַכט נייטיק מער נאָודז פֿאַר פּאַראַלעליזאַטיאָן. דערצו, די היגע ייַזנוואַרג ספּעסאַפאַקיישאַנז זענען נאָך עפּעס הינטערשטעליק; למשל, די הואַוועי 910B דערווייַל קען נישט שטיצן די FP8 ינפֿעראַנס ינטראָודוסט דורך דיפּסיק." איינער פון די הויכפּונקטן פון דעם DeepSeek V3 מאָדעל איז די איינפיר פון א FP8 געמישטע פּרעציזיע טרענירונג פריימווערק, וואָס איז עפֿעקטיוו וואַלידירט געוואָרן אויף אַן עקסטרעם גרויסן מאָדעל, וואָס מאַרקירט אַ באַדייטנדיקע דערגרייכונג. פריער האָבן גרויסע שפּילער ווי מייקראָסאָפֿט און Nvidia פֿאָרגעלייגט ענלעכע אַרבעט, אָבער ספֿקות בלייבן אין דער אינדוסטריע וועגן מעגלעכקייט. מען פֿאַרשטייט אַז פֿאַרגליכן מיט INT8, איז FP8'ס הויפּט מייַלע אַז נאָך-טרענירונג קוואַנטיזאַציע קען דערגרייכן כּמעט אָן פֿאַרלוסט פּרעציזיע בשעת באַדייטנדיק פֿאַרבעסערן די אינפֿערענץ גיכקייט. ווען מען פֿאַרגלייכט עס מיט FP16, קען FP8 דערגרייכן ביז צוויי מאָל אַקסעלעראַציע אויף Nvidia'ס H20 און איבער 1.5 מאָל אַקסעלעראַציע אויף די H100. באַמערקענסווערט, ווי דיסקוסיעס אַרום דעם טרענד פון היגע קאָמפּיוטיישאַנאַל מאַכט פּלוס היגע מאָדעלן געווינען מאָמענטום, ווערט ספּעקולאַציע וועגן צי Nvidia קען ווערן דיסראַפּטיד, און צי די CUDA גראָב קען ווערן בייפּאַסט, אַלץ מער פאַרשפּרייט. איין אומלייקענבאַרער פֿאַקט איז אַז DeepSeek האָט טאַקע געפֿירט צו אַ באַדייטנדיקן פֿאַל אין Nvidia'ס מאַרק ווערט, אָבער דעם פֿאַרשייבונג הייבט אויף פֿראַגעס וועגן Nvidia'ס הויך-ענד קאָמפּיוטיישאַנאַל מאַכט אָרנטלעכקייט. פריער אנגענומענע דערציילונגען וועגן קאפיטאל-געטריבענע קאמפיוטער אקומולאציע ווערן ארויסגערופן, אבער עס בלייבט שווער פאר Nvidia צו ווערן אינגאנצן ערזעצט אין טרענירונג סצענארן. אנאליז פון DeepSeek'ס טיפע באנוץ פון CUDA ווייזט אז פלעקסיביליטי - ווי למשל באנוצן SM פאר קאמוניקאציע אדער דירעקט מאניפולירן נעטווארק קארטלעך - איז נישט מעגליך פאר רעגולערע GPUs צו אקאמאדירן. אינדוסטריע מיינונגען באטאנען אז Nvidia'ס "moat" נעמט ארום דעם גאנצן CUDA עקא-סיסטעם אנשטאט נאר CUDA אליין, און די PTX (Parallel Thread Execution) אינסטרוקציעס וואס DeepSeek באנוצט זענען נאך אלץ טייל פון דעם CUDA עקא-סיסטעם. "אין קורצן טערמין, קען Nvidia'ס קאמפיוטער-קראפט נישט ווערן בייגעגאנגען - דאס איז ספעציעל קלאר אין טרענירונג; אבער, דיפּלויען פון דינערישע קארטלעך פאר ריזאנירונג וועט זיין רעלאטיוו גרינגער, אזוי וועט פארשריט מסתמא זיין שנעלער. די אדאפטאציע פון דינערישע קארטלעך פאקוסירט בפֿרט אויף אינפערענץ; קיינער האט נאך נישט געראטן צו טרענירן א מאדעל פון DeepSeek'ס פערפארמענס אויף דינערישע קארטלעך אין גרויסן פארנעם," האט אן אינדוסטריע אנאליסט באמערקט צו AI Technology Review. בכלל, פון אן אינפערענץ שטאנדפונקט, זענען די אומשטענדן ענקערידזשינג פאר דינערישע גרויסע מאדעל טשיפס. די געלעגנהייטן פאר דינער טשיפּ פאַבריקאַנטן אין דער וועלט פון אינפֿערענץ זענען מער קלאָר צוליב די איבערגעטריבענע הויכע רעקווייערמענץ פון טרענירונג, וואָס שטערן דעם אריינגאַנג. אַנאַליסטן טענהן אז פשוט אויסנוצן דינער אינפֿערענץ קאַרטלעך איז גענוג; אויב נייטיק, איז מעגלעך צו באַקומען אַן נאָך מאַשין, בשעת טרענירונג מאָדעלן שטעלן אייגענאַרטיקע טשאַלאַנדזשיז - פאַרוואַלטן אַ גרעסערע צאָל מאַשינען קען ווערן אַ שווערע לאַסט, און העכערע טעות ראַטעס קענען נעגאַטיוו ווירקן אויף טרענירונג רעזולטאַטן. טרענירונג האט אויך ספּעציפֿישע קלאַסטער וואָג רעקווייערמענץ, בשעת די רעקווייערמענץ אויף קלאַסטערס פֿאַר אינפֿערענץ זענען נישט אַזוי שטרענג, אַזוי לייכטער די GPU רעקווייערמענץ. איצט, די פאָרשטעלונג פון Nvidia'ס איין H20 קאַרטל איז נישט העכער ווי די פון Huawei אָדער Cambrian; איר שטאַרקייט ליגט אין קלאַסטערינג. באַזירט אויף די אַלגעמיינע השפּעה אויף די קאַמפּיוטיישאַנאַל מאַכט מאַרק, דער גרינדער פון Luchen Technology, You Yang, האט באמערקט אין אַן אינטערוויו מיט AI Technology Review, "DeepSeek קען צייטווייליק אונטערמינירן די גרינדונג און דינגען פון זייער גרויסע טרענירונג קאַמפּיוטיישאַנאַל קלאַסטערס. אין דער לאַנגער לויף, דורך באַדייטנד רעדוצירן די קאָסטן פֿאַרבונדן מיט גרויס מאָדעל טרענירונג, ריזאַנינג און אַפּלאַקיישאַנז, וועט די מאַרק פאָדערונג מסתּמא וואַקסן. שפּעטערדיקע איטעראַציעס פון AI באַזירט אויף דעם וועלן דעריבער קעסיידער פירן די סאַסטיינד פאָדערונג אין די קאַמפּיוטיישאַנאַל מאַכט מאַרק." דערצו, "דיפּסיק'ס פארשטארקטע נאכפראגע פאר לאגישע און פיין-טונינג סערוויסעס איז מער קאמפאטיבל מיט'ן לאקאלן קאמפיוטער לאנדשאפט, וואו לאקאלע מעגלעכקייטן זענען רעלאטיוו שוואך, וואס העלפט צו פארמינערן פארלוסט פון ליידיגע רעסורסן נאך'ן קלאסטער אויפשטעלן; דאס שאפט לעבנס-פעאיגע געלעגנהייטן פאר פאבריקאנטן איבער פארשידענע לעוועלס פון דעם לאקאלן קאמפיוטער עקאסיסטעם." לוטשען טעכנאלאגיע האט צוזאמענגעארבעט מיט הואַוועי קלאָוד צו לאנטשירן די דיפּסיק ר1 סעריע לאגישע אַפּיס און קלאָוד בילדגעבונג סערוויסעס באזירט אויף לאקאלער קאמפיוטער קראפט. יו יאנג האט אויסגעדריקט אפטימיזם וועגן דער צוקונפט: "דיפּסיק ברענגט אריין צוטרוי אין לאקאלער פראדוצירטע לייזונגען, און פארמערט גרעסערע ענטוזיאזם און אינוועסטירונג אין לאקאלע קאמפיוטער מעגלעכקייטן אין דער צוקונפט."

מסקנא

צי DeepSeek איז "בעסער" ווי ChatGPT ווענדט זיך אין די ספעציפישע באדערפענישן און צילן פונעם באניצער. פאר אויפגאבן וואס דארפן פלעקסיבילאַטי, נידריגע קאסטן, און קאסטומיזאציע, קען DeepSeek זיין בעסער. פאר שעפעריש שרייבן, אלגעמיינע אויספארשונגען, און באניצער-פריינדלעכע שמועס אינטערפייסעס, קען ChatGPT נעמען די פירערשאפט. יעדעס געצייג סערווירט אנדערע צוועקן, אזוי וועט די אויסוואל שטארק אפהענגען פונעם קאנטעקסט אין וועלכן זיי ווערן גענוצט.