Aethlumis představuje AI server nové generace TG990V3, který zvyšuje efektivitu školení rozsáhlých modelů až o 40 %

2025.11.18

Šen-čen, Čína — 18. listopadu 2025 — Vzhledem k rostoucí globální poptávce po výpočetním výkonu pro umělou inteligenci dnes společnost Aethlumis oznámila uvedení svého nového vlajkového serveru pro umělou inteligenci, model TG990V3. Po dokončení nasazení v rané fázi u hlavních internetových společností, výzkumných institucí zabývajících se umělou inteligencí a poskytovatelů cloudových služeb prokázal server TG990V3 významné průlomy výkonu při škálovém trénování modelů. Při testech zahrnujících úlohy s biliony parametrů dosáhl server až 40% zlepšení celkové efektivity trénování, doba trénovacích cyklů se ve srovnání s předchozí generací zkrátila o 30 % až 32 %.

Infrastruktura pro umělou inteligenci dosahuje nového zlomového bodu

S tím, jak se za poslední dva roky velikost modelů rozrostla z miliard na biliony parametrů, se stále více projevuje mezera mezi pokrokem algoritmů a výpočetní infrastrukturou. Během akce k uvedení serveru zdůraznil generální ředitel společnosti Aethlumis Wang Qihang:

tempo vývoje velkých modelů překonalo rychlost tradičních aktualizací infrastruktury. TG990V3 je navržen tak, aby poskytoval vyšší efektivitu trénování bez zvyšování nákladů na hardware nebo spotřeby energie, což umožňuje týmům zabývajícím se umělou inteligencí rychlejší a udržitelnější iterace.

Odborní analytici upozorňují, že soutěž o AI servery se posunula od čistého nasazování hardwaru k optimalizaci architektury na úrovni systému – směr, který je inkarnován právě v modelu TG990V3.

Vysoce efektivní architektura propojení: využití šířky pásma mezi uzly 95 % a více při trénování modelu s trilionem parametrů

TG990V3 je vybaven osmi OAM GPU moduly dle standardu OAI 2.0 a využívá novou víceúrovňovou topologii propojení optimalizovanou pro rozsáhlé distribuované trénování.

Ve vnitřním testování provedeném vedoucí internetovou společností na modelu s trilionem parametrů:

• Efektivita propojení GPU na GPU zůstala stabilní na úrovni 95–96 %

• Latence synchronizace gradientů klesla o 27 %

• Celkový výkon klastru se zvýšil o 21 %

Technický ředitel vyhodnocovacího AI laboratoře uvedl:

„Při trénování modelů v tomto rozsahu záleží každý procentní bod komunikační efektivity. TG990V3 udržuje stabilní výkon i při rozšiřování velikosti klastru, což je velkou výhodou.“

Návrh I/O „zlatého poměru“: Odstranění datové zácpy při trénování AI

Trvalou výzvou při trénování AI je, že vysoký výkon GPU často zůstává nevyužitý kvůli I/O zácpám – nedostatečné šířce pásma sítě, omezené propustnosti úložiště nebo pomalým kanálům načítání dat.

K tomuto účelu představila společnost Aethlumis průmyslem vzácnou architekturu 8 : 8 : 16 (GPU : NIC : NVMe):

• 400 Gbps vyhrazené síťové šířky pásma na jedno GPU

• Dva nezávislé NVMe Gen4/Gen5 SSD disky na jedno GPU

• Snížení latence načítání dat o více než 60 %

Domácí AI startup, který se účastnil raného testování, poznamenal, že využití GPU zůstávalo stále mezi 94–97 %, což je výrazně vyšší než rozsah 70–75 % na stávajících serverech.

Spolehlivost na úrovni clusteru: MTTR pod 3 minuty, lineární škálování až do 92 %

Navrženo pro dlouhodobé a rozsáhlé tréninkové zátěže, model TG990V3 využívá plně modulární architekturu s horkým výměnnými moduly GPU, ventilátorů, napájení a sítě.

Výsledky testů prvních zákazníků uvádějí:

• Průměrný čas opravy (MTTR) se snížil z 10–12 minut na méně než 3 minuty

• Dosaženo 99,95 % dostupnosti systému během nepřetržitých 24/7 tréninkových cyklů

• 92% efektivita lineárního škálování v clusterech tisíců karet

• To zajišťuje bezprecedentní spolehlivost pro podniky provozující rozsáhlá distribuovaná tréninková prostředí.

Metriky výkonu z reálného nasazení (od prvních uživatelů)

• 32% snížení doby tréninku pro LLM s triliony parametrů

• Vylepšení propustnosti načítání dat o více než 60 %

• 92 % škálovací efektivita v multiuzlových clusterech

• 99,95% dostupnost při úlohách s dlouhou dobou trvání

Aplikace zahrnují:

• Trénování velkých jazykových modelů (LLM) (LLaMA, GPT série atd.)

• Trénování multimodálních modelů (vizuální, zvukové, video, 3D)

• Podnikové AI platformy a inferenční clustery

• Výpočetní prostředí pro výzkum na univerzitách a národní úrovni

Výstavba infrastruktury umělé inteligence nové generace

Dr. Li Zhang, viceprezident produktu ve společnosti Aethlumis, uzavřel:

„TG990V3 není pouhá aktualizace hardwaru. Představuje optimalizaci na úrovni systému celého procesu trénování velkých modelů – včetně architektury propojení, I/O subsystému a inteligentních operací. Navrhli jsme jej tak, aby podporoval urychlený růst velikosti modelů v následujících třech letech.“

TG990V3 je nyní k dispozici pro nasazení ve velkém podnikovém měřítku a již je využíván na několika cloudových platformách a AI společnostech.

Ovládejte své zařízení s plným vědomím situace

Kvítkující čínské domácí značky serverů převyšují tradiční globální počítací prostředí

Novinky

Aethlumis představuje AI server nové generace TG990V3, který zvyšuje efektivitu školení rozsáhlých modelů až o 40 %

Naše produkty

Rychlé odkazy

KONTAKT

Získejte bezplatnou nabídku

Novinky

Aethlumis představuje AI server nové generace TG990V3, který zvyšuje efektivitu školení rozsáhlých modelů až o 40 %

Naše produkty

Rychlé odkazy

KONTAKT