Shenzhen, Kiina — 18. marraskuuta 2025 — Kun kysyntä tekoälylaskentatehollle jatkaa kasvamistaan maailmanlaajuisesti, Aethlumis ilmoitti tänään uuden liputustornipalvelimensa TG990V3:n julkaisusta. Varhaiset käyttöönotot suurissa internet-yhtiöissä, tekoälytutkimuslaitoksissa ja pilvipalveluntarjoajissa ovat osoittaneet, että TG990V3 on saavuttanut merkittäviä suorituskykyläpimurtoja laajakantoisten mallien koulutuksessa. Testeissä, jotka sisälsivät triljoonan parametrin työmääriä, palvelin saavutti jopa 40 %:n parannuksen koko koulutustehokkuudessa, ja koulutussyklit lyhenivät 30–32 % edelliseen sukupolveen verrattuna.

Tekoälyinfrastruktuuri saavuttaa uuden käännepisteen
Koska mallikoot ovat laajentuneet miljardeista triljooniin parametreihin viimeisen kahden vuoden aikana, algoritmikehityksen ja laskentainfrastruktuurin välinen kuilu on käynyt yhä selvemmin ilmi. Aethlumisin toimitusjohtaja Wang Qihang korosti julkistustilaisuudessa:
„Suurten mallien kehitysvauhti on ohittanut perinteisten infrastruktuuripäivitysten nopeuden. TG990V3 on suunniteltu tarjoamaan korkeampaa koulutustehokkuutta lisäämättä laitteistokustannuksia tai virrankulutusta, mikä mahdollistaa tekoälytiimien nopeamman ja kestävämmän iteraation.“
Alan analyytikot huomauttavat, että tekoälypalvelinten kilpailu on siirtynyt raakojen laitteistojen keräilyltä järjestelmätason arkkitehtoniseen optimointiin, mikä on suunta, jota TG990V3 edustaa.


Korkea tehokkuus -liitäntäarkkitehtuuri: yli 95 %:n vertaisverkon kaistanleveyden hyödyntäminen 1 T-parametrisessa koulutuksessa
Varustettu kahdeksalla OAM-GPU-moduulilla, jotka perustuvat OAI 2.0 -standardiin, TG990V3 käyttää seuraavan sukupolven monitasoista liitäntätopologiaa, joka on optimoitu laajakaavoiseen hajautettuun koulutukseen.
Yhden johtavan internet-yhtiön sisäisissä testeissä triljoonan parametrin mallilla:
• GPU-GPU-liitäntätehokkuus pysyi vakiona 95–96 %:n tasolla
• Gradienttien synkronointiviive pieneni 27 %
• Kokonaisklusterin läpäisykyky parani 21 %
Arvioivan tekoälylabran tekninen johtaja totesi:
"Kun malleja koulutetaan tällä skaalalla, jokainen prosenttiyksikkö kommunikaation tehokkuudessa merkitsee. TG990V3 säilyttää vakaa suorituskykynsä, vaikka klusterin koko kasvaa, mikä on merkittävä etu."

I/O "kultainen leikkaus" -rakenne: tiedonsiirron pullonkaulojen poistaminen tekoälyn koulutuksessa
Tekoälyn koulutuksessa esiintyy jatkuva haaste: suorituskykyiset GPU:t jäävät usein käyttämättä I/O-pullonkaulojen vuoksi — riittämätön verkkokaistanleveys, rajallinen tallennuskäsittelynopeus tai hitaat datan latausputket.
Tämän ratkaisemiseksi Aethlumis esitteli harvinaisen 8 : 8 : 16 (GPU : NIC : NVMe) -arkkitehtuurin:
• 400 Gbps:n erillinen verkkokaistanleveys per GPU
• Kaksi itsenäistä NVMe Gen4/Gen5 SSD:tä per GPU
• Yli 60 %:n vähennys datan latausviiveessä
Kotimainen tekoälystartti, joka osallistui varhaiseen testaukseen, huomasi, että GPU:n käyttöaste pysyi tasaisesti 94–97 %:n välillä, mikä on huomattavasti korkeampi kuin nykyisillä palvelimilla havaittu 70–75 %:n alue.

Ryhmätason luotettavuus: Keskimääräinen korjausaika (MTTR) alle 3 minuutissa, lineaarinen skaalaus jopa 92 %:iin
Suunniteltu pitkäkestoisiin ja laajamittaisiin koulutustyömääriin, TG990V3:n täysin modulaarinen arkkitehtuuri sisältää vaihdettavat GPU-, tuuletin-, virta- ja verkkomoduulit lämpötilan vaihduessa.
Aikaiset asiakastestit raportoivat:
• Keskimääräinen korjausaika (MTTR) vähentynyt 10–12 minuutista alle 3 minuuttiin
• 99,95 %:n järjestelmän saatavuus jatkuvissa 24/7-koulutussykleissä
• 92 %:n lineaarinen skaalautumistehokkuus tuhansien korttien ryhmissä
• Tämä takaa ennennäkemättömän luotettavuuden yrityksille, jotka käyttävät suuria hajautettuja koulutusympäristöjä.
Käytännön suorituskykyindikaattorit (varhaisilta käyttäjiltä)
• 32 %:n vähennys triljoonan parametrin isojen kielimallien koulutusaikoja
• Yli 60 %:n parannus tietojen latausläpimenossa
• 92 %:n skaalaustehokkuus monisoluisissa klustereissa
• 99,95 %:n saatavuus pitkäkestoisissa tehtävissä
Sovellukset sisältävät:
• Suurten kielimallien (LLM) koulutus (LLaMA, GPT-sarja jne.)
• Monimuotoisten mallien koulutus (näkö, ääni, video, 3D)
• Yritysten tekoälyalustat ja päättelyklusterit
• Yliopistojen ja kansallisten tutkimuslaitosten laskentaympäristöt

Seuraavan sukupolven tekoälyinfrastruktuurin rakentaminen
Dr. Li Zhang, Aethlumiksen tuotejohtaja, päättelee:
”TG990V3 ei ole pelkkä laitepohjainen päivitys. Se edustaa järjestelmätasoa olevaa optimointia koko suuren mallin koulutusputkessa — mukaan lukien yhteyksien arkkitehtuuri, I/O-alijärjestelmä ja älykäs käyttö. Suunnittelimme sen tukemaan seuraavat kolme vuotta mallikoon nopeaa kasvua.”
TG990V3 on nyt saatavilla yrityskäyttöön ja sitä käytetään jo useissa pilvialustoissa ja tekoälyyrityksissä.