Získajte bezplatnú cenovú ponuku

Náš zástupca Vás bude kontaktovať čo najskôr.
Email
Tel/WhatsApp
Meno
Názov spoločnosti
Správa
0/1000

Správy

Domov >  Správy

Aethlumis predstavil AI server novej generácie TG990V3, ktorý prináša až 40 % zlepšenie efektivity trénovania rozsiahlych modelov

2025.11.18

Šen-čchen, Čína – 18. november 2025 – Vzhľadom na stále rastúcu globálnu poptávku po výpočtovom výkone umelej inteligencie dnes spoločnosť Aethlumis oznámila uvedenie svojho nového vlajkového servera pre umelú inteligenciu, model TG990V3. Po dokončení nasadenia vo fázach skorého nasadenia u hlavných internetových spoločností, inštitúcií zaoberajúcich sa výskumom umelej inteligencie a poskytovateľov cloudových služieb, server TG990V3 demonštroval významné výkonnostné pokroky pri trénovaní rozsiahlych modelov. Pri testoch s úlohami s biliónmi parametrov dosiahol až 40-percentné zlepšenie celkovej efektivity trénovania, pričom doba trénovacích cyklov sa skrátila o 30–32 % oproti predchádzajúcej generácii.

1-1.jpg

Infraštruktúra pre umelú inteligenciu dosiahla nový kritický bod

S tým, ako sa veľkosť modelov za posledné dva roky zväčšila od miliárd na bilióny parametrov, sa stále zrejmiejsou medzery medzi pokrokom algoritmov a výpočtovou infraštruktúrou. Generálny riaditeľ spoločnosti Aethlumis, Wang Čchi-chang, zdôraznil počas predstavenia produktu:

tempo vývoja veľkých modelov prekonalo rýchlosť tradičných aktualizácií infraštruktúry. TG990V3 je navrhnutý tak, aby poskytoval vyššiu efektivitu trénovania bez zvyšovania nákladov na hardvér alebo spotreby energie, čo umožňuje tímom pracujúcim s umelou inteligenciou rýchlejšiu a udržateľnejšiu iteráciu.

Odborní analytici upozorňujú, že súťaž o AI servery sa posunula od čistej kumulácie hardvéru k optimalizácii architektúry na úrovni systému – smer, ktorý model TG990V3 zosobňuje.

2.jpg

 

01.jpg

Vysokoefektívna interkonekčná architektúra: využitie širokého pásma medzi jednotlivými uzlami vyše 95 % pri trénovaní modelu s jedným tera-parametrom

TG990V3 je vybavený osemou modulmi OAM GPU podľa štandardu OAI 2.0 a využíva modernú viacúrovňovú topológiu interkonekcie optimalizovanú pre rozsiahle distribuované trénovanie.

Vo vnútornom testovaní vykonanom vedúcou internetovou spoločnosťou na modeli s tera-parametrami:

• Efektivita interkonekcie GPU na GPU zostala stabilná na úrovni 95–96 %

• Latencia synchronizácie gradientov klesla o 27 %

• Celkový výkon klastra sa zvýšil o 21 %

Technický riaditeľ hodnotiacej AI laboratórie uviedol:

„Pri trénovaní modelov v takomto rozsahu má každý percentuálny bod efektivity komunikácie význam. TG990V3 udržiava stabilný výkon aj pri zväčšovaní veľkosti klastra, čo je veľkou výhodou.“


02.jpg

Návrh I/O „Zlatého pomeru“: Odstránenie úzkych miest s prenosom dát pri trénovaní AI

Trvalou výzvou pri trénovaní umelé inteligencie je, že vysoký výkon GPU často zostáva nevyužitý kvôli úzkym miestam vstupu/výstupu — nedostatočná sieťová šírka pásma, obmedzená propustnosť úložiska alebo pomalé potrubia na načítavanie dát.

Na vyriešenie tohto problému spoločnosť Aethlumis predstavila v priemysle vzácnu architektúru 8 : 8 : 16 (GPU : NIC : NVMe):

• Špecifické sieťové pásmo 400 Gbps na jedno GPU

• Dva nezávislé NVMe SSD disky Gen4/Gen5 na jedno GPU

• Viac ako 60 % zníženie latencie pri načítavaní dát

Domáci AI štart-up, ktorý sa zúčastnil skorého testovania, zaznamenal, že využitie GPU zostávalo stále medzi 94 % až 97 %, čo je výrazne viac ako rozsah 70–75 %, ktorý pozorovali na svojich existujúcich serveroch.


03.jpg

Spoľahlivosť na úrovni klastra: MTTR pod 3 minúty, lineárne škálovanie až do 92 %

Navrhnuté pre dlhodobé a rozsiahle tréningové úlohy, model TG990V3 disponuje plne modulárnou architektúrou s horúco vymieňateľnými GPU, ventilátormi, napájaním a sieťovými modulmi.

Výsledky testov prvých zákazníkov uvádzajú:

• Priemerný čas opravy (MTTR) skrátený z 10–12 minút na menej ako 3 minúty

• Dostupnosť systému 99,95 % počas nepretržitých 24/7 tréningových cyklov

• Účinnosť lineárneho škálovania 92 % v klastroch tisícovej kapacity

• Zabezpečuje bezprecedentnú spoľahlivosť pre podniky prevádzkujúce rozsiahle distribuované tréningové prostredia.

 

Metriky výkonu z reálneho používania (od prvých používateľov)

• Skrátenie tréningového času o 32 % pre LLM s biliónmi parametrov

• Viac ako 60 % zlepšenie priepustnosti načítania dát

• 92 % efektivita škálovania v zhlukoch s viacerými uzlami

• Dostupnosť 99,95 % pri úlohách s dlhšou dobou trvania

Aplikácie zahŕňajú:

• Trénovanie veľkých jazykových modelov (LLM) (LLaMA, séria GPT atď.)

• Trénovanie multimódových modelov (vizuálne, audio, video, 3D)

• Podnikové AI platformy a inferenčné zhluky

• Výpočtové prostredia pre výskum na univerzitách a národnej úrovni

3.jpg

Vytváranie infraštruktúry pre novú generáciu umelé inteligencie

Dr. Li Zhang, viceprezidentka produktu v spoločnosti Aethlumis, uzavrela:

„TG990V3 nie je len jednoduchá aktualizácia hardvéru. Predstavuje optimalizáciu na úrovni systému celého procesu trénovania veľkých modelov — vrátane architektúry pripojenia, I/O subsystému a inteligentných operácií. Navrhli sme ho tak, aby podporoval nasledujúce tri roky zrýchleného rastu veľkosti modelov.“

TG990V3 je teraz k dispozícii pre nasadenie v podnikovej škále a už sa používa na niekoľkých cloudových platformách a v AI spoločnostiach.