চীনের শেনজেন — ২০২৫ এর ১৮ নভেম্বর — বিশ্বব্যাপী কৃত্রিম বুদ্ধিমত্তা (AI) কম্পিউটিং ক্ষমতার চাহিদা যে অবিরাম বৃদ্ধি পাচ্ছে, তার মধ্যে আজ Aethlumis তার নতুন ফ্ল্যাগশিপ AI সার্ভার TG990V3 চালু করার ঘোষণা দিয়েছে। প্রধান ইন্টারনেট কোম্পানি, AI গবেষণা প্রতিষ্ঠান এবং ক্লাউড সার্ভিস প্রদানকারীদের মধ্যে প্রাথমিক পর্যায়ের বিস্তারের কাজ সম্পন্ন করে, TG990V3 বড় আকারের মডেল প্রশিক্ষণে উল্লেখযোগ্য কার্যকারিতা অর্জন করেছে। ট্রিলিয়ন-প্যারামিটার কাজের পরীক্ষায়, সার্ভারটি মোট প্রশিক্ষণ দক্ষতায় 40% পর্যন্ত উন্নতি দেখিয়েছে, এবং পূর্ববর্তী প্রজন্মের তুলনায় প্রশিক্ষণ চক্র 30%–32% কমিয়ে দিয়েছে।

AI অবকাঠামো একটি নতুন সন্ধিক্ষণে পৌঁছেছে
গত দুই বছরে বিলিয়ন থেকে ট্রিলিয়ন প্যারামিটারে মডেলের আকার বৃদ্ধির সাথে সাথে অ্যালগরিদম উন্নয়ন এবং কম্পিউটেশনাল অবকাঠামোর মধ্যে ফারাক ক্রমশ স্পষ্ট হয়ে উঠছে। চালু অনুষ্ঠানে Aethlumis-এর সিইও ওয়াং কিহাং জোর দিয়ে বলেন:
“বড় মডেলের বিকাশের গতি আগের প্রচলিত অবকাঠামো উন্নয়নের গতি ছাড়িয়ে গেছে। হার্ডওয়্যার খরচ বা বিদ্যুৎ খরচ বাড়ানো ছাড়াই উচ্চতর প্রশিক্ষণ দক্ষতা প্রদানের জন্য TG990V3 ডিজাইন করা হয়েছে, যা AI দলগুলিকে আরও দ্রুত এবং টেকসইভাবে পুনরাবৃত্তি করতে সক্ষম করে।”
শিল্প বিশ্লেষকদের মতে, AI সার্ভার প্রতিযোগিতা কেবল হার্ডওয়্যার স্তরের উপর নির্ভরশীলতা থেকে সিস্টেম-স্তরের স্থাপত্য অপ্টিমাইজেশনের দিকে স্থানান্তরিত হয়েছে, যা TG990V3 মডেলটির মধ্যে প্রতিফলিত হয়েছে।


উচ্চ-দক্ষতা ইন্টারকানেক্ট স্থাপত্য: 1T-প্যারামিটার প্রশিক্ষণে 95%+ পিয়ার-টু-পিয়ার ব্যান্ডউইথ ব্যবহার
OAI 2.0 স্ট্যান্ডার্ড অনুযায়ী আটটি OAM GPU মডিউল সহ, TG990V3 বৃহৎ পরিসরে বিতরণকৃত প্রশিক্ষণের জন্য অনুকূলিত পরবর্তী প্রজন্মের বহু-স্তর ইন্টারকানেক্ট টপোলজি গ্রহণ করে।
একটি প্রধান ইন্টারনেট কোম্পানি দ্বারা এক ট্রিলিয়ন প্যারামিটারের মডেলে অন্তর্নিহিত পরীক্ষায় দেখা গেছে:
• GPU থেকে GPU ইন্টারকানেক্ট দক্ষতা 95–96% এ স্থিতিশীল ছিল
• গ্রেডিয়েন্ট সিঙ্ক্রোনাইজেশন ল্যাটেন্সি 27% কমেছে
• মোট ক্লাস্টার থ্রুপুট 21% উন্নত হয়েছে
মূল্যায়নকারী এআই ল্যাবের একজন কারিগরি পরিচালক মন্তব্য করেন:
"এই ধরনের বিশাল আকারে মডেল প্রশিক্ষণের সময়, প্রতি শতাংশ যোগাযোগের দক্ষতা গুরুত্বপূর্ণ। TG990V3 ক্লাস্টারের আকার বৃদ্ধির সাথে সাথেও স্থিতিশীল কর্মক্ষমতা বজায় রাখে, যা একটি বড় সুবিধা।"

I/O "সোনালি অনুপাত" ডিজাইন: এআই প্রশিক্ষণে ডেটা-বোতলের সমস্যা দূরীভবন
এআই প্রশিক্ষণের একটি চিরস্থায়ী চ্যালেঞ্জ হল যে, উচ্চ কর্মক্ষমতার GPU গুলি প্রায়শই I/O বোতলের সমস্যার কারণে অপ্রতুলভাবে ব্যবহৃত হয় — অপর্যাপ্ত নেটওয়ার্ক ব্যান্ডউইথ, সীমিত স্টোরেজ থ্রুপুট বা ধীর ডেটা লোডিং পাইপলাইন।
এই সমস্যা সমাধানের জন্য, Aethlumis একটি শিল্প-বিরল 8 : 8 : 16 (GPU : NIC : NVMe) স্থাপত্য চালু করেছে:
• প্রতি GPU-এর জন্য 400 Gbps-এর নিবেদিত নেটওয়ার্ক ব্যান্ডউইথ
• প্রতি GPU-এর জন্য দুটি স্বাধীন NVMe Gen4/Gen5 SSD
• ডেটা লোডিং বিলম্বে 60% এর বেশি হ্রাস
প্রাথমিক পরীক্ষায় অংশগ্রহণকারী একটি দেশীয় এআই স্টার্টআপ লক্ষ্য করেছে যে GPU ব্যবহার স্থিতিশীলভাবে 94%–97%-এর মধ্যে ছিল, যা তাদের বর্তমান সার্ভারগুলিতে দেখা 70–75% পরিসরের তুলনায় উল্লেখযোগ্যভাবে বেশি।

ক্লাস্টার-গ্রেড নির্ভরযোগ্যতা: 3 মিনিটের কম MTTR, 92% পর্যন্ত লিনিয়ার স্কেলিং
দীর্ঘ সময়ের জন্য, বড় পরিসরের ট্রেনিং কাজের জন্য তৈরি, TG990V3-এ সম্পূর্ণ মডুলার আর্কিটেকচার রয়েছে যাতে হট-সোয়াপযোগ্য GPU, ফ্যান, পাওয়ার এবং নেটওয়ার্কিং মডিউল রয়েছে।
প্রাথমিক গ্রাহক পরীক্ষায় প্রতিবেদিত:
• গড় মেরামতের সময় (MTTR) 10–12 মিনিট থেকে কমে 3 মিনিটের কম
• ধারাবাহিক 24/7 ট্রেনিং চক্রের সময় 99.95% সিস্টেম উপলব্ধতা
• হাজার হাজার কার্ডের ক্লাস্টারে 92% লিনিয়ার স্কেলিং দক্ষতা
• এটি বৃহৎ বিতরণকৃত ট্রেনিং পরিবেশে কাজ করে এমন এন্টারপ্রাইজগুলির জন্য অভূতপূর্ব নির্ভরযোগ্যতা নিশ্চিত করে।
বাস্তব জীবনের কর্মক্ষমতার মেট্রিক্স (প্রাথমিক গ্রহণকারীদের কাছ থেকে)
• ট্রিলিয়ন প্যারামিটারের LLM-এর জন্য ট্রেনিং সময়ে 32% হ্রাস
• ডেটা লোডিং থ্রুপুটে 60% এর বেশি উন্নতি
• মাল্টি-নোড ক্লাস্টারে 92% স্কেলিং দক্ষতা
• দীর্ঘ সময়ের কাজে 99.95% উপলব্ধতা
অ্যাপ্লিকেশন অন্তর্ভুক্ত:
• লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) প্রশিক্ষণ (LLaMA, GPT সিরিজ, ইত্যাদি)
• মাল্টিমোডাল মডেল প্রশিক্ষণ (দৃষ্টি, শ্রবণ, ভিডিও, 3D)
• এন্টারপ্রাইজ AI প্ল্যাটফর্ম এবং অনুমান ক্লাস্টার
• বিশ্ববিদ্যালয় এবং জাতীয় পর্যায়ের গবেষণা কম্পিউটিং পরিবেশ

AI ইনফ্রাস্ট্রাকচারের পরবর্তী প্রজন্ম গঠন
Aethlumis-এর পণ্য উপ-সভাপতি ডঃ লি ঝাং বলেন:
"TG990V3 কেবল হার্ডওয়্যার আপডেট নয়। এটি সম্পূর্ণ লার্জ-মডেল প্রশিক্ষণ পাইপলাইনের সিস্টেম-স্তরের অপ্টিমাইজেশন প্রতিনিধিত্ব করে — যার মধ্যে ইন্টারকানেক্ট আর্কিটেকচার, I/O সাবসিস্টেম এবং বুদ্ধিমান অপারেশন অন্তর্ভুক্ত — আমরা মডেল স্কেলের আগামী তিন বছরের ত্বরিত বৃদ্ধি সমর্থনের জন্য এটি ডিজাইন করেছি।"
TG990V3 এখন এন্টারপ্রাইজ-স্কেল ব্যবহারের জন্য উপলব্ধ এবং ইতিমধ্যে কয়েকটি ক্লাউড প্ল্যাটফর্ম এবং AI কোম্পানিতে ব্যবহৃত হচ্ছে।