Добијте бесплатни цитат

Наш представник ће вас ускоро контактирати.
Е-маил
Телефон/Ватсап
Име
Име компаније
Порука
0/1000

Aethlumis представио AI сервер нове генерације TG990V3, који омогућава до 40% побољшања ефикасности тренирања модела велике скале

2025.11.18

Шенжен, Кина — 18. новембар 2025. — Док глобална тражња за рачунарском снагом вештачке интелигенције наставља да расте, Aethlumis данас објављује покретање свог новог флагшип АИ сервера, TG990V3. Након што је завршена рана имплементација у оквиру главних интернет компанија, институција за истраживање вештачке интелигенције и пружаоца облачних услуга, TG990V3 показао је значајне пробоје у перформансама приликом тренирања модела великих размера. У тестовима са оптерећењем од трилион параметара, сервер је постигао до 40% побољшање укупне ефикасности тренирања, а циклуси тренирања су скраћени за 30–32% у односу на претходну генерацију.

1-1.jpg

Инфраструктура вештачке интелигенције достигла је нову прекретницу

С обзиром да су се величине модела прошириле са милијарде на трилионе параметара у последње две године, разлика између развоја алгоритама и рачунарске инфраструктуре постаје све очигледнија. CEO компаније Aethlumis, Ванг Циханг, нагласио је током догађаја лансирања:

„Tempo evolucije velikih modela premašilo je brzinu tradicionalnih nadogradnji infrastrukture. TG990V3 je dizajniran da obezbedi veću efikasnost obuke bez povećanja troškova hardvera ili potrošnje energije, omogućavajući AI timovima bržu i održiviju iteraciju.“

Analitičari iz industrije napominju da se takmičenje u oblasti AI servera pomaklo sa čiste ugradnje hardvera ka optimizaciji arhitekture na nivou sistema, što je pravac koji TG990V3 u potpunosti predstavlja.

2.jpg

 

01.jpg

Visokoefikasna arhitektura međuveze: iskorišćenje propusne širine veze GPU-GPU od 95%+ tokom obuke modela sa 1T parametara

Opremljen osam OAM GPU modula zasnovanih na OAI 2.0 standardu, TG990V3 koristi višeslojnu topologiju sledeće generacije optimizovanu za distribuiranu obuku velikih modela.

У унутрашњем тестирању које је спровела водећа интернет компанија на моделу од трилиона параметара:

• Ефикасност међусобног повезивања ГПУ-ГПУ остала је стабилна на 95-96%

• Латентност синхронизације градијента смањена за 27%

• Укупна прометност кластера побољшана је за 21%

Технички директор из лабораторије за оцену вештачке интелигенције је коментарисао:

када се обучавају модели на овој скали, сваки проценат ефикасности комуникације је важан. TG990V3 одржава стабилне перформансе чак и када се величина кластера проширује, што је велика предност.


02.jpg

И/О Златни однос Дизајн: Уклањање углића података у обуци ИИ

Увек се дешава да су високопродуктивни ГПУ често недостаточно коришћени због увозних/излазних вузла недовољног мрежног просек, ограниченог прометности складиштења или спорих цеви за учитавање података.

Да би се ово решило, Аетхлумис је увео индустријску архитектуру 8: 8: 16 (ГПУ: НИЦ: НВМЕ):

• 400 Гбит / с посвећеног мрежног пропускања по ГПУ-у

• Два независна NVMe Gen4/Gen5 SSD-а по GPU-у

• Преко 60% смањење латентности учитавања података

Домашњи стартап АИ који је учествовао у раним тестовима приметио је да је коришћење ГПУ-а постојано остало између 94%97%, знатно више од 7075% опсега који се види на њиховим постојећим серверима.


03.jpg

Поузданност кластера: МТТР мање од 3 минута, линеарно скалирање до 92%

Дизајниран за дуготрајне, великог обима обуке, TG990V3 има потпуно модуларну архитектуру са топлом замененим GPU, вентилатором, напаном и мрежним модулима.

Ранне тестове клијената су извештавали:

• Просечно време за поправку (MTTR) смањено са 1012 минута на мање од 3 минута

• 99,95% доступности система током континуираних циклуса обуке 24/7.

• 92% линеарне ефикасности скалирања у кластерима од хиљаду картица

• Ово обезбеђује невиђену поузданост за предузећа која управљају великим дистрибуираним окружењима за обуку.

 

Метрике перформанси у стварном свету (од раних прихватача)

• 32% смањење времена обуке за ЛЛМ-ове са трилион параметара

• 60%+ побољшање прометности учитавања података

• 92% ефикасност скалирања у мулти-ноду кластерима

• 99,95% доступности у дуготрајним задатцима

Апликације укључују:

• Обука о великом језичком моделу (LLM) (LLaMA, GPT серије итд.)

• Мультимодална обука модела (визија, аудио, видео, 3Д)

• Платформе за корпоративну вештачку интелигенцију и кластери закључења

• Универзитетска и национална истраживачка рачунарска окружења

3.jpg

Изградња инфраструктуре вештачке интелигенције нове генерације

Др Ли Џанг, потпредседник за производе у Аетхлумису, закључио је:

тГ990В3 није једноставно ажурирање хардвера. То представља оптимизацију целог обучавања великих модела на нивоу система, укључујући архитектуру међусобног повезивања, подсистеме И/О и интелигентне операције. Дизајнирали смо га да подржи следеће три године забрзаног раста у моделном обиму.

TG990V3 је сада доступан за распоређивање на enterprise маштабу и већ се користи на неколико платформи облака и компанија ИИ.