Бид HPE, Dell, Huawei зэрэг дэлхийн технологийн лидер компаниудтай гүнзгий харилцаатайгаар Aethlumis-д шийдвэрчиг талбарт дэвшилтэт инфраструктурыг нэвтрүүлэхийн ирмэгт очсон байна. Хийсвэр оюун ухааны салбарт нэгэн архитектур технологи бий болсон бөгөөд энэ нь өнөөгийн хийсвэр оюун ухааныг эрчимжүүлдэг супер компьютерийн системийг барьж байгуулахад үндсэн болсон: OAM (Open Accelerator Module) GPU сервер . Энэ бол зүгээр л хатуу хангамж биш, харин манай цаг үеийн хамгийн нарийн төвөгтэй хийсвэр оюун ухааны ачааллын хэмжээ, үйлдэл, үр ашгийг бий болгож буй үндсэн суурь юм.

Стандартаар тохируулах ба нягтралын хөдөлгүүр.
Анхдагч хэмжээний ИН-ийн загвар, тухайлбал Том Хэлний Загвар (LLM) болон илүү нарийн сүлжээний загварууд нь энгийн загваруудтай ажиллах зориулалттай хуучин байгууламжийг ашиглах боломжгүй болгожээ. Эдгээр загварууд нь урьд нь байгаагүй зэрэгцээ боловсруулалтын чадал шаарддаг бөгөөд үүнд систем дотор нэгдсэн арван, зарим тохиолдолд зуун GPU шаардлагатай. OAM нь GPU хурдасгуур болон түүний онцгой хэлбэр гэх хоёр хэсгийг тусгаарласан нээлттэй стандарт юм. Үйлдвэрлэлийн консорциумын удирдлага дор хэрэгжиж буй энэ стандартчлал нь NVIDIA, AMD гэх мэт вендоруудад стандартжуулсан, хялбаршуулсан хаас дотор суугдах өндөр үзүүлэлттэй GPU-уудыг хөгжүүлэх боломжийг олгодог. Санхүү, үйлдвэрлэл, энерги салбарын бидний үйлчлүүлэгчдэд энэ нь цорын ганц вендорын экосистемд холбоотой байх шаардлагагүйгээр том, өндөр үзүүлэлттэй компьютерийн кластеруудыг бий болгох боломжийг олгох бөгөөд хөгжилдөө тэвчээртэй, уян хатан байдал хангана.

Холболтын саатлыг давах.
Ердийн хурдаас хэтэрсэн харилцаагүй, GPU-ууд шиг цэвэр тооцооллын чадал байх нь ямар ч ач холбогдолгүй. Триллион параметрт загвар сургахын тулд хэсэг GPU-тай ганц серверийг ч ашиглаж болохгүй. OAM архитектурын жинхэнэ ухаантай тал нь өндөр хурдны, бага задралын холболтын оюунлаг зүйлс (NVIDIA экосистем дэх NVLink, NVSwitch эсвэл тэдгээрийн аналог) -тэй нэгдсэн байдагт оршдог. OAM серверүүдийг модуль бүхий шатан дэх GPU-уудын хооронд уламжлалт удаан PCIe замыг ашиглахгүйгээр шууд харилцах боломжийг дэмждэг шалан дээр тусгайлан хэрэгжүүлдэг. Энэ нь терабайт орчим симуляцийн өгөгдлийг бараг бодит цагт солилцож чадах томоохон цорын ганц хурдасгуур байгуулдаг. Энэ бол хувь хүний компьютерийн цуглуулгийг жинхэнэ, нэг бүтэн ХИ-ийн суперкомпьютер болгодог. Энэ нь шууд тэдгээргүйгээр тэдгээрийг хийж чадахгүй байх төслүүдийг үр дүнтэй, цаг хугацаандаа хүргэх боломжийг олгодог.

Дулаан ба Цахилгааны Загварчлал: Масштаблах Инженерчлэл
Нэг зогсоцол доторх том чадал нь дулаан ба цахилгааны хувьд ач холбогдолтой асуудал үүсгэдэг. OAM сервер нь зөвхөн GPU-ийн хайрцаг биш, урт хугацааны үйл ажиллагааг анхаарч системийн инженерчлэлийн дээд зэргийн бүтээл юм. Эдгээр системүүд нь ихэвчлэн шууд чипэнд хийгдэх шингэн хөргөлтийг ашигласан дэвшмэл, координатжуулсан хөргөлтийн системтэй байдаг бөгөөд энэ нь киловаттын хүрээнд хүрэх чадлыг задлахад үр дүнтэй ажилладаг. Ингэснээр GPU-ууд долоо хоног орчим үргэлжлэх сургалтын програмуудад удаан хугацааны турш дохионы давтамжийг тогтвортой байлгах чадвартай болдог. Үүнээс гадна, нэгтгэсэн цахилгааны дизайн нь том масштабаар тогтвортой, цэвэр хангамжийг нийлүүлдэг. Энэ нь шийдчигдэшгүй, урт хугацааны AI сургалт эсвэл том масштабын дүгнэлтийн үйл ажиллагааны үед манай үйлчлүүлэгчдэд найдвартай ажиллах боломжийг олгох бөгөөд зогсонги байдалд орох эрсдэлийг багасгадаг.

Хиймэл оюун ухааны масштабжилт
Эцэст нь OAM-ийн хэв гажилт нь масштаблагдах ИНС-ийн суурин байгууламжийн нэгж юм. Энэ нь цацангийн төвүүдийг масштаблах замаар хурдасгалтыг масштаблахад шилжих боломжийг олгоно. Тусдаа OAM модулиудыг холбосноор падийг цуглуулж, падуудыг холбосноор суперкомпьютерийн кластерийг цуглуулна. HPE, Huawei зэрэг хамтрагчидтайгаа системийг интеграцуулах туршлага нь байгууллагууд өөрсдийн шаардлагад нийцүүлэн маш үр дүнтэй алхам алхмаар аргаар ИНС-ийн чадавхийг хөгжүүлэх боломжийг олгох энэ модульчлалыг биднийг үзүүлэх боломжийг олгодог. Энэ нь үүсгэгч ИНС-ээс хамаараагүй бодит цагт мохооны илрүүлэлт, олон талт ба дижитал хоёртууд, урьдчилан таамаглах засвар үйлчилгээний симуляци зэрэг мэдрэг үйлдвэрлэл, санхүүгийн ИНС-ийн хэрэглээнүүдийг шаарддаг үйл ажиллагаа, найдвартай байдлыг хангана.
Эцэст нь, OAM GPU серверүүд зүгээр л шинэчлэлт хийсэн гэсэн үг биш юм. Эдгээр нь өгөгдлийн төвийн загварчлалд шинэ үзэл баримтлалыг оруулж ирсэн бөгөөд ялангуяа хиймэл оюун ухааны суперкомпьютерийн тодорхой саад бэрхшээлийг даван тулах зорилгоор зохион бүтээгдсэн. Стандарчлагдсан нягтшил, шилжилтийн үеийн холболт болон үр дүнтэй дулаан зохицуулалтын үндсэн гурван бүрэлдэхүүн хэсгийг санал болгож, хиймэл оюун ухааны ирээдүйг бий болгох эмх замбараагүй суурь үндсийг бүрдүүлдэг. Бид санхүү, үйлдвэрлэл, энерги гэх мэт салбарын өөрийн үйлчлүүлэгчдийнхаа үр дүнтэй, найдвартай хувьсгалыг дэмжихийн тулд Aethlumis-д энэ суурь инфраструктурыг хангах, засвар үйлчилгээг хийхэд бидний холбоос болон техникийн мэдлэгийг ашигладаг.