שנזהן, סין — 18 בנובמבר 2025 — ככל שדרישת עוצמת החישוב הבינלאומית בתחום הבינה המלאכותית ממשיכה לגדול במהירות, Aethlumis הודיעה היום על השקה של שרת הבינה המלאכותית הדגל החדש שלה, ה-TG990V3. לאחר השלמת פריסות שלבים מוקדמים בחברות אינטרנט גדולות, מוסדות מחקר בינה מלאכותית וספקים של שירותי ענן, ה-TG990V3 הדגים שיפור משמעותי בביצועים באימון מודלים בקנה מידה גדול. בבדיקות הכוללות עומסי עבודה של טריליון פרמטרים, השרת השיג שיפור של עד 40% בכלליות יעילות האימון, ומחזורי האימון התקצרו ב-30%–32% בהשוואה לדור הקודם.

האינפראструкטורה להוראת בינה מלאכותית מגיעה לנקודת מפנה חדשה
בעוד שגדלי המודלים גדלו ממיליארדים לטריליונים של פרמטרים בשנתיים האחרונות, הפער בין התקדמות האלגוריתמים לבין אינפראstrukורת החישוב נעשה ברור יותר. מנכ"ל Aethlumis, וואנג צ'יהנג, דגש במהלך אירוע השקה:
קצב ההתפתחות של מודלים גדולים עקף את מהירות שדרוגי התשתיות המסורתית. ה-TG990V3 תוכנן כדי לספק יעילות אימון גבוהה יותר ללא העלאת עלות החומרה או צריכה של חשמל, ומאפשר לצוותי AI להתקדם במהירות רבה יותר ובצורה ברת קיימא.
מומחים של ענף מדגישים כי התחרות בשוקי שרתים ל-AI השתנתה מהרכבת חומרה גולמית לאופטימיזציה של ארכיטקטורת המערכת, כיוון שבו מתגשמת ה-TG990V3.


ארכיטקטורת חיבור בעלת יעילות גבוהה: ניצולת רוחב פס בין עמית לעמית של 95% ואילך באימון של מודל עם טריליון פרמטרים
ה-TG990V3 מצויד בשמונה מודולי OAM GPU בהתאם לתקן OAI 2.0, ונעזר בטופולוגיה חדשה של חיבור רב-שכבתי המותאמת במיוחד לאימון מבוזר בקנה מידה גדול.
בבדיקות פנימיות שביצע חברה מובילה באינטרנט על מודל בעל טריליון פרמטרים:
• יעילות חיבור בין GPU ל-GPU נשארה יציבה בטווח 95–96%
• עיכוב בסנכרון גרדיאנטים ירד ב-27%
• תפוקת אשכול כוללת עלתה ב-21%
מנהל טכני מעבדת ה-AI הערכה отметил:
"בזמן אימון מודלים בקנה מידה זה, כל אחוז של יעילות תקשורת הוא חשוב. ה-TG990V3 שומר על ביצועים יציבים גם כאשר גודל הקלאסטר גדל, מה שמהווה יתרון משמעותי."

עיצוב יחס הזהב של קלט/פלט: הסרת צוואר הבקבוק בנתונים באימון AI
אתגר מתמיד באימון AI הוא ש-GPU-ים בעלי ביצועים גבוהים נותרים לעיתים קרובות לא מנוצלים בשל צווארי בקבוק ב-I/O — רוחב פס תקשורת לא מספיק, נפח אחסון מוגבל או לולאות טעינת נתונים איטיות.
כדי לפתור זאת, Aethlumis הציגה מבנה ייחודי במגזר של 8 : 8 : 16 (GPU : NIC : NVMe):
• 400 ג'יגה-ביט לשנייה של רוחב פס תקשורת ייעודי לכל GPU
• שני דיסקים עצמאיים מסוג NVMe Gen4/Gen5 SSD לכל GPU
• ירידה של מעל 60% בהשהיית טעינת הנתונים
סטארט-אפ מקומי בתחום ה-AI שהשתתף בבדיקות מוקדמות ציין כי ניצולת ה-GPU נשארה יציבה בטווח של 94%–97%, מה שיותר משמעותית מהטווח של 70–75% שנמדד על השרתים הקיימים שלהם.

אמינות ברמת קלאסטר: MTTR מתחת ל-3 דקות, הגדלה ליניארית עד 92%
עוצב עבור עומסי עבודה של הדרכה לאורך זמן ובקנה מידה גדול, ה-TG990V3 מציע ארכיטקטורה מודולרית מלאה עם מודולי GPU, מאוורר, חשמל ורשתות ניתנים להחלפה חמה.
מבחני לקוחות מוקדמים דיווחו:
• זמן ממוצע לתיקון (MTTR) ירד מ-10–12 דקות למטה מ-3 דקות
• זמינות מערכת של 99.95% במהלך מחזורי הדרכה מתמשכים 24/7
• יעילות הגדלה ליניארית של 92% בקבוצות של אלפי כרטיסים
• זה מבטיח אמינות ללא תקדים לארגונים המפעילים סביבות הדרכה מורכבות בקנה מידה גדול.
מדדי ביצועים בעולם האמיתי (ממאמינים מוקדמים)
• צמצום של 32% בזמן הדרכה של מודלי LLM בני טריליון פרמטרים
• שיפור של מעל 60% בעומס נתוני קלט
• יעילות של 92% בסקלולציה במתקנים מרובי צמתים
• זמינות של 99.95% במשימות ארוכות-טווח
ת Pebrotations כוללות:
• אימון מודלים לשפות גדולות (LLM) (LLaMA, סדרת GPT, וכו')
• אימון מודלים מולטימודליים (ראייה, שמע, וידאו, 3D)
• פלטפורמות AI مؤسسתיות ומתקני הסקה
• סביבות חישוב למחקר באוניברסיטאות וברמה לאומית

בניית הדור הבא של תשתיות בינה מלאכותית
ד"ר לי ג'אנג, סגנית נשיא למוצר ב-Aethlumis, סיכמה:
"ה-TG990V3 אינו עדכון חומרה פשוט. הוא מייצג אופטימיזציה ברמת המערכת של כל תהליך האימון של מודלים גדולים — כולל ארכיטקטורת החיבור, תת-מערכת הקלט/פלט, והפעלה חכמה. עיצבנו אותו כדי לתמוך בשלוש השנים הבאות של צמיחה מאיצה בגודל המודלים."
ה-TG990V3 זמין כעת לפריסה בקנה מידה של ארגונים ומשמש כבר במספר פלטפורמות ענן וחברות AI.