Тегін ұсыныс алыңыз

Біздің өкіліміз сізге жақын арада хабарласады.
Email
Телефон/WhatsApp
Name
Company Name
Хабарлама
0/1000

Жаңалықтар

Басты бет >  Жаңалықтар

Aethlumis үлкен көлемді модельдерді оқыту тиімділігін 40% дейін арттыратын келесі ұрпақтың AI сервері TG990V3-ті таныстырды

2025.11.18

Қытай, Шэньчжэнь — 2025 жылғы 18 қараша — Жасанды интеллект есептеу қуатына деген глобалды сұраныс өсуін жалғастырған кезде Aethlumis бүгін жаңа флагман AI сервері TG990V3-ті шығарғанын жариялады. Ірі интернет компаниялары, ЖІ зерттеу институттары мен бұлттық қызмет көрсетушілер арасында бастапқы сатыда орнатылуды аяқтаған TG990V3 үлкен көлемді модельдерді оқытуда маңызды жетістіктерге жетті. Триллион параметрлі жүктемелерді пайдаланатын тестілеулерде сервер бірлескен оқыту тиімділігін алдыңғы нұсқаға қарағанда 40% жақсартты, ал оқыту циклдары 30%-ден 32%-ға дейін қысқарды.

1-1.jpg

ЖІ инфрақұрылымы жаңа бұрылыс нүктесіне жетті

Өткен екі жыл ішінде модельдердің көлемі миллиардтан триллион параметрге дейін өскенімен, алгоритмдердің дамуы мен есептеу инфрақұрылымы арасындағы айырма баршаға айқын көрініп тұр. Шығару мерекесінде Aethlumis компаниясының генерал-директоры Ван Цихан былай деді:

үлкен модельдердің даму темпі кәдімгі инфрақұрылымды жаңарту жылдамдығын басып озған. TG990V3 жасанды интеллект топтарының тезірек және тиімдірек итерациялауын қамтамасыз ету үшін аппараттық шығындарды немесе электр энергиясын пайдалануды арттырмай, жоғарырақ оқыту тиімділігін қамтамасыз ету үшін жасалған.

Сала сарапшыларының айтуынша, AI серверлеріндегі бәсеке қатты аппараттық компоненттерді жинақтаудан жүйелік деңгейдегі архитектуралық оптимизацияға өтті, бұл бағыт TG990V3-те көрсетілген.

2.jpg

 

01.jpg

Жоғары Тиімділікті Интерконнект Архитектурасы: 1 Терабайттық Параметрлі Оқытуда 95%+ Жұптасқан Байланыс Жолақтылығын Пайдалану

OAI 2.0 стандартына негізделген сегіз OAM GPU модулімен жабдықталған TG990V3 үлкен көлемді үлестірілген оқыту үшін оптимизацияланған келесі ұрпақ көп деңгейлі интерконнект топологиясын қолданады.

Ағымдағы интернет компаниясының триллион параметрлі модель бойынша ішкі тестілеуінде:

• GPU-дан GPU-ға дейінгі интерконнект тиімділігі 95–96% деңгейінде тұрақты болды

• Градиентті синхрондау кідірісі 27% төмендеді

• Жинақтың жалпы өткізу қабілеті 21% артты

Бағалайтын AI зертханасының техникалық директоры былай деді:

«Мұндай масштабта модельдерді оқытқан кезде, байланыс тиімділігінің әрбір пайызы маңызды. TG990V3 кластер көлемі ұлғайған сайын тұрақты өнімділікті сақтайды, бұл үлкен артықшылық.»


02.jpg

I/O «Алтын қатынас» дизайны: AI оқыту кезіндегі деректердің буынын жою

AI оқытудағы тұрақты қиыншылық — жеткіліксіз желілік жолақтық, шектеулі сақтау өткізгіштігі немесе баяу деректерді жүктеу каналдары салдарынан жоғары өнімді GPU-лар жиі толық пайдаланылмайды.

Осыны шешу үшін Aethlumis өнеркәсіпте сирек кездесетін 8 : 8 : 16 (GPU : NIC : NVMe) архитектурасын енгізді:

• Әрбір GPU үшін 400 Гбит/с жеке желілік жолақтығы

• Әрбір GPU үшін екі тәуелсіз NVMe Gen4/Gen5 SSD

• Деректерді жүктеу латенттілігін 60%-дан астам азайту

Ерте тестілеуге қатысқан отандық AI стартап компаниясы өзінің қолданыстағы серверлерінде 70–75% аралығында болатыннан гөрі едәуір жоғары, GPU пайдаланылуы тұрақты түрде 94–97% аралығында болды деп белгіледі.


03.jpg

Кластерлік деңгейдегі сенімділік: ҚМҚ 3 минуттан кем, сызықтық масштабтау 92%-ға дейін

Ұзақ уақытқа созылатын, кең көлемді оқыту жұктемелері үшін арналған TG990V3 толығымен модульді құрылымға ие, оған GPU, желдеткіш, қуат және желілік модульдерін ыңғайлы алмастыру мүмкіндігі енгізілген.

Бастапқы тұтынушылардың сынақ нәтижелері бойынша:

• Орташа жөндеу уақыты (ҚМҚ) 10–12 минуттан 3 минуттан кем болып қысқарды

• Үздіксіз 24/7 оқыту циклдары кезінде жүйенің 99,95% қолжетімділігі

• Мыңдаған карталы кластерлерде 92% сызықтық масштабтау тиімділігі

• Бұл үлкен көлемді таратылған оқыту орталарын пайдаланатын кәсіпорындар үшін бұрын болмаған сенімділікті қамтамасыз етеді.

 

Шынайы әлемдегі өнімділік көрсеткіштері (бастапқы қолданушылардан)

• Триллион параметрлі ҮІЖ үшін оқыту уақытының 32% қысқаруы

• Мәліметтерді жүктеу өткізгіштігінің 60%-дан астам жақсаруы

• Көп түйінді кластерлерде 92% масштабтау тиімділігі

• Ұзақ мерзімді тапсырмаларда 99,95% қолжетімділік

Пайдалану үшін:

• Үлкен тілдік модельдерді (LLM) оқыту (LLaMA, GPT сериясы және т.б.)

• Көпмодальды модельдерді оқыту (көру, дыбыс, бейне, 3D)

• Кәсіпорындарға арналған жасанды интеллект платформалары мен қорытындылау кластерлері

• Университеттер мен ұлттық деңгейдегі зерттеу есептеу орталары

3.jpg

Жасанды интеллект инфрақұрылымының келесі ұрпағын құру

Aethlumis компаниясының өнімдері бойынша вице-президенті, доктор Ли Жан мынадай қорытынды жасады:

«TG990V3 — бұл қарапайым аппараттық жаңарту емес. Бұл интерконнект архитектурасы, енгізу/шығару ішкі жүйесі және интеллектуалды операцияларды қоса алғанда, бүкіл үлкен модельдерді оқыту каналының жүйелік деңгейдегі оптимизациясы. Біз оны модель көлемінің келесі үш жылда үдей түскен өсуін қолдау үшін жасадық».

TG990V3 қазір кәсіпорын масштабында орнатуға болады және бірнеше бұлттық платформалар мен ЖИ компанияларында қолданылуда.