Затражите бесплатну понуду

Наши представник ће вас контактирати у наредном периоду.
Е-маил
Тел/ВхатсАпп
Име
Назив компаније
Порука
0/1000

Novosti

Početna Stranica >  Novosti

Aethlumis представио AI сервер нове генерације TG990V3, који омогућава до 40% побољшања ефикасности тренирања модела велике скале

2025.11.18

Шенжен, Кина — 18. новембар 2025. — Док глобална тражња за рачунарском снагом вештачке интелигенције наставља да расте, Aethlumis данас објављује покретање свог новог флагшип АИ сервера, TG990V3. Након што је завршена рана имплементација у оквиру главних интернет компанија, институција за истраживање вештачке интелигенције и пружаоца облачних услуга, TG990V3 показао је значајне пробоје у перформансама приликом тренирања модела великих размера. У тестовима са оптерећењем од трилион параметара, сервер је постигао до 40% побољшање укупне ефикасности тренирања, а циклуси тренирања су скраћени за 30–32% у односу на претходну генерацију.

1-1.jpg

Инфраструктура вештачке интелигенције достигла је нову прекретницу

С обзиром да су се величине модела прошириле са милијарде на трилионе параметара у последње две године, разлика између развоја алгоритама и рачунарске инфраструктуре постаје све очигледнија. CEO компаније Aethlumis, Ванг Циханг, нагласио је током догађаја лансирања:

„Tempo evolucije velikih modela premašilo je brzinu tradicionalnih nadogradnji infrastrukture. TG990V3 je dizajniran da obezbedi veću efikasnost obuke bez povećanja troškova hardvera ili potrošnje energije, omogućavajući AI timovima bržu i održiviju iteraciju.“

Analitičari iz industrije napominju da se takmičenje u oblasti AI servera pomaklo sa čiste ugradnje hardvera ka optimizaciji arhitekture na nivou sistema, što je pravac koji TG990V3 u potpunosti predstavlja.

2.jpg

 

01.jpg

Visokoefikasna arhitektura međuveze: iskorišćenje propusne širine veze GPU-GPU od 95%+ tokom obuke modela sa 1T parametara

Opremljen osam OAM GPU modula zasnovanih na OAI 2.0 standardu, TG990V3 koristi višeslojnu topologiju sledeće generacije optimizovanu za distribuiranu obuku velikih modela.

U unutrašnjim testovima koje je sproveo vodeći internet kompanija na modelu sa trilion parametara:

• Efikasnost međuveze GPU-GPU ostala stabilna na nivou od 95–96%

• Kašnjenje pri sinhronizaciji gradijenata smanjeno za 27%

• Ukupni protok klastera poboljšan za 21%

Технички директор са лабораторије која је вршила процену изјавио је:

„Када се модел тренира у овом обиму, сваки проценат ефикасности комуникације има значај. TG990V3 одржава стабилан рад чак и када се величина кластера повећава, што је велика предност.”


02.jpg

I/O „златни пресек“ дизајн: Елиминисање блокаде података у тренингу ИИ-ја

Стални изазов у тренингу вештачке интелигенције је да се високоперформантне GPU јединице често непотпуно искоришћавају због I/O блокада — недовољна пропусна ширина мреже, ограничена брзина складиштења или спори пипелини за учитавање података.

Како би решио овај проблем, Aethlumis је увео ретку архитектуру у индустрији 8 : 8 : 16 (GPU : NIC : NVMe):

• 400 Gbps посвећене мрежне пропусне ширине по GPU јединици

• Два независна NVMe Gen4/Gen5 SSD-а по GPU јединици

• Смањење кашњења при учитавању података за више од 60%

Домаћи стартап специјализован за вештачку интелигенцију, који је учествовао у раном тестирању, истакао је да је искоришћеност GPU-а стално била између 94%–97%, што је знатно више у односу на 70–75% на њиховим постојећим серверима.


03.jpg

Pouzdanost na nivou klastera: MTTR ispod 3 minute, linearno skaliranje do 92%

Dizajnirana za rad sa velikim opterećenjem i dugotrajnim zadacima, TG990V3 poseduje potpuno modularnu arhitekturu sa mogućnošću zamene GPU, ventilatora, napajanja i mrežnih modula pod naponom.

Testovi kod ranih korisnika su pokazali:

• Srednje vreme popravke (MTTR) smanjeno sa 10–12 minuta na manje od 3 minute

• Dostupnost sistema od 99,95% tokom kontinuiranih 24/7 ciklusa obuke

• Efikasnost linearnog skaliranja od 92% u klasterima sa hiljadama kartica

• Ovo obezbeđuje bez presedana pouzdanost za preduzeća koja rade u velikim distribuiranim okruženjima za obuku.

 

Metrike stvarne performanse (od strane ranijih korisnika)

• Smanjenje vremena obuke za LLM modele sa trilionima parametara za 32%

• Poboljšanje propusnosti učitavanja podataka za više od 60%

• 92% ефикасност скалирања у вишечланим кластерима

• 99,95% доступност у задацима дугог трајања

Пријаве укључују:

• Тренирање великих језичних модела (LLM) (LLaMA, GPT серија итд.)

• Тренирање мултимодалних модела (вид, аудио, видео, 3D)

• Предузећа ИИ платформе и инференци кластери

• Универзитетске и националне научне рачунске средине

3.jpg

Градимо следећу генерацију ИИ инфраструктуре

Др Ли Чанг, потпредседник производа у Aethlumis-у, закључио је:

„TG990V3 није само једноставна надоградња хардвера. Овај систем представља оптимизацију на нивоу целокупног система за тренирање великих модела — укључујући архитектуру повезаности, I/O подсистем и интелигентне операције. Пројектовали смо га да подржи наредне три године убрзаног раста величине модела.”

TG990V3 је сада доступан за имплементацију у предузећима и већ се користи на неколико облачних платформи и у компанијама које се баве вештачком интелигенцијом.