शेन्ज़ेन, चीन — 18 नवंबर, 2025 — जैसे-जैसे वैश्विक स्तर पर AI कंप्यूटिंग पावर की मांग बढ़ती जा रही है, Aethlumis ने आज अपने नए फ्लैगशिप AI सर्वर TG990V3 के लॉन्च की घोषणा की। प्रमुख इंटरनेट कंपनियों, AI अनुसंधान संस्थानों और क्लाउड सेवा प्रदाताओं में प्रारंभिक तैनाती पूरी करने के बाद, TG990V3 ने बड़े पैमाने पर मॉडल प्रशिक्षण में महत्वपूर्ण प्रदर्शन उपलब्धि दिखाई है। खरबों पैरामीटर वाले भार (workloads) के परीक्षण में, सर्वर ने पिछली पीढ़ी की तुलना में कुल प्रशिक्षण दक्षता में 40% तक का सुधार प्राप्त किया, जबकि प्रशिक्षण चक्र 30%–32% तक कम हो गए।

AI इंफ्रास्ट्रक्चर एक नए मोड़ पर पहुंच गया है
पिछले दो वर्षों में जैसे-जैसे मॉडल के आकार अरबों से खरबों पैरामीटर तक बढ़े हैं, एल्गोरिदम के विकास और कंप्यूटेशन इंफ्रास्ट्रक्चर के बीच का अंतर बढ़ता जा रहा है। लॉन्च इवेंट के दौरान Aethlumis के सीईओ वांग क़िहांग ने जोर देकर कहा:
“बड़े मॉडल के विकास की गति पारंपरिक बुनियादी ढांचे के अपग्रेड की गति से आगे निकल चुकी है। TG990V3 को हार्डवेयर लागत या बिजली की खपत बढ़ाए बिना उच्च प्रशिक्षण दक्षता प्रदान करने के लिए डिज़ाइन किया गया है, जिससे एआई टीमें तेज़ी से और अधिक स्थायी ढंग से पुनरावृत्ति कर सकती हैं।”
उद्योग विश्लेषकों का कहना है कि एआई सर्वर प्रतिस्पर्धा कच्चे हार्डवेयर के ढेर से सिस्टम-स्तरीय वास्तुकला अनुकूलन की ओर बढ़ गई है, जिस दिशा को TG990V3 दर्शाता है।


उच्च-दक्षता इंटरकनेक्ट वास्तुकला: 1T-पैरामीटर प्रशिक्षण में 95%+ पीयर-टू-पीयर बैंडविड्थ उपयोग
OAI 2.0 मानक पर आधारित आठ OAM GPU मॉड्यूल से लैस, TG990V3 बड़े पैमाने पर वितरित प्रशिक्षण के लिए अनुकूलित अगली पीढ़ी के बहु-स्तरीय इंटरकनेक्ट टोपोलॉजी अपनाता है।
एक प्रमुख इंटरनेट कंपनी द्वारा एक ट्रिलियन पैरामीटर मॉडल पर आंतरिक परीक्षण में:
• GPU-से-GPU इंटरकनेक्ट दक्षता 95–96% पर स्थिर रही
• ग्रेडिएंट सिंक्रनाइज़ेशन विलंब में 27% की कमी आई
• कुल क्लस्टर माध्यमिक उत्पादन में 21% का सुधार हुआ
मूल्यांकन करने वाली एआई प्रयोगशाला के एक तकनीकी निदेशक ने टिप्पणी की:
“इस स्तर पर मॉडल्स को प्रशिक्षित करते समय, संचार दक्षता का हर प्रतिशत महत्वपूर्ण होता है। TG990V3 क्लस्टर के आकार में वृद्धि के बावजूद स्थिर प्रदर्शन बनाए रखता है, जो एक बड़ा लाभ है।”

I/O “गोल्डन रेशियो” डिज़ाइन: एआई प्रशिक्षण में डेटा-बॉटलनेक को खत्म करना
एआई प्रशिक्षण में एक लगातार चुनौती यह है कि अक्सर उच्च-प्रदर्शन वाले GPU I/O बॉटलनेक के कारण अपूर्ण उपयोग में रह जाते हैं — अपर्याप्त नेटवर्क बैंडविड्थ, सीमित भंडारण थ्रूपुट, या धीमी डेटा लोडिंग पाइपलाइन्स।
इस समस्या का समाधान करने के लिए, एथलमिस ने उद्योग में दुर्लभ 8 : 8 : 16 (GPU : NIC : NVMe) वास्तुक्रम पेश किया है:
• प्रति GPU के लिए समर्पित 400 Gbps की नेटवर्क बैंडविड्थ
• प्रति GPU के लिए दो स्वतंत्र NVMe Gen4/Gen5 SSD
• डेटा लोडिंग विलंबता में 60% से अधिक की कमी
घरेलू एआई स्टार्टअप जो प्रारंभिक परीक्षण में भाग ले रहा था, उसने टिप्पणी की कि GPU उपयोग लगातार 94%–97% के बीच बना रहा, जो उनके मौजूदा सर्वर्स पर देखी जाने वाली 70–75% की सीमा से काफी अधिक है।

क्लस्टर-स्तरीय विश्वसनीयता: 3 मिनट से कम MTTR, 92% तक रैखिक स्केलिंग
लंबी अवधि और बड़े पैमाने पर प्रशिक्षण भार के लिए डिज़ाइन किया गया, TG990V3 में पूर्ण रूप से मॉड्यूलर आर्किटेक्चर है जिसमें GPU, पंखा, बिजली और नेटवर्किंग मॉड्यूल को गर्म स्थानांतरित किया जा सकता है।
प्रारंभिक ग्राहक परीक्षणों में बताया गया:
• माध्य मरम्मत समय (MTTR) 10–12 मिनट से घटकर 3 मिनट से कम हो गया
• निरंतर 24/7 प्रशिक्षण चक्र के दौरान 99.95% प्रणाली उपलब्धता
• हजारों कार्ड क्लस्टर में 92% रैखिक स्केलिंग दक्षता
• इससे बड़े वितरित प्रशिक्षण वातावरण में काम कर रहे उद्यमों के लिए बेमिसाल विश्वसनीयता सुनिश्चित होती है।
वास्तविक दुनिया के प्रदर्शन मेट्रिक्स (प्रारंभिक उपयोगकर्ताओं से)
• ट्रिलियन पैरामीटर वाले LLM के लिए प्रशिक्षण समय में 32% कमी
• डेटा लोडिंग थ्रूपुट में 60% से अधिक सुधार
• मल्टी-नोड क्लस्टर में 92% स्केलिंग दक्षता
• लंबी अवधि के कार्यों में 99.95% उपलब्धता
अनुप्रयोगों में शामिल हैं:
• लार्ज लैंग्वेज मॉडल (LLM) प्रशिक्षण (LLaMA, GPT श्रृंखला, आदि)
• बहु-संवेदी मॉडल प्रशिक्षण (दृष्टि, ऑडियो, वीडियो, 3D)
• उद्यम AI प्लेटफॉर्म और इन्फेरेंस क्लस्टर
• विश्वविद्यालय एवं राष्ट्रीय स्तर के अनुसंधान कंप्यूटिंग वातावरण

एआई बुनियादी ढांचे की अगली पीढ़ी का निर्माण
Aethlumis में उत्पाद के उपाध्यक्ष डॉ. ली झांग ने निष्कर्ष निकाला:
“TG990V3 केवल हार्डवेयर का अद्यतन नहीं है। यह संपूर्ण बड़े मॉडल प्रशिक्षण पाइपलाइन — इंटरकनेक्ट आर्किटेक्चर, I/O सबसिस्टम और बुद्धिमान संचालन सहित — के सिस्टम-स्तरीय अनुकूलन का प्रतिनिधित्व करता है। हमने इसे मॉडल स्केल में अगले तीन वर्षों के त्वरित विकास का समर्थन करने के लिए डिज़ाइन किया है।”
TG990V3 अब उद्यम-स्तरीय तैनाती के लिए उपलब्ध है और कई क्लाउड प्लेटफॉर्म और AI कंपनियों में पहले से उपयोग में है।