Компанія ASUS представила на міжнародній конференції NVIDIA GTC, присвяченій технологіям штучного інтелекту, власні серверні рішення: новітні GPU-сервери ASUS ESC NM1-E1 і ESC NM2-E1 на основі еталонної модульної архітектури NVIDIA MGX, які пришвидшують суперкомп’ютерні обчислення завдань штучного інтелекту.
Щоб задовольнити зростаючий попит на рішення для генеративного ШІ, ASUS використовує новітні технології NVIDIA, зокрема графічний прискорювач B200 Tensor Core й суперчіпи GB200 Grace Blackwell і NVL H200, які допомагають створювати ефективні серверні рішення, що сприяють впровадженню ШІ-технологій в широкому спектрі сфер діяльності.
Для підтримки компаній у створенні власних середовищ генеративного штучного інтелекту ASUS пропонує широку лінійку серверів, від серверів початкового рівня до високопродуктивних серверних рішень на основі графічних прискорювачів, а також широкий асортимент стійкових рішень із рідинним охолодженням, які відповідають вимогам найрізноманітніших завдань. Крім того, використовуючи досвід MLPerf, команда ASUS працює над оптимізацією апаратного й програмного забезпечення для навчання на великих мовних моделях (LLM) і побудови висновків (інференсу), а також інтегрує комплексні рішення, щоб задовольнити високі вимоги до суперкомп'ютерних обчислень у сфері ШІ.
Новітні 2U-сервери ASUS на основі архітектури NVIDIA MGX, ESC NM1-E1 і ESC NM2-E1, оснащені суперчіпами NVIDIA GH200 Grace Hopper Superchip. Мікросхеми NVIDIA Grace використовують процесорні ядра Arm Neoverse V9 з розширеннями Scalable Vector Extensions (SVE2) і шиною NVIDIA NVLink-C2C. Завдяки інтеграції з блоками обробки даних NVIDIA BlueField-3 і мережевими адаптерами ConnectX-7 сервери ASUS на основі архітектури MGX забезпечують пропускну здатність до 400 Гбіт/с і є хорошим рішенням для розробки та розгортання ШІ-систем у різноманітних компаніях.
Сучасні технології рідинного охолодження
Стрімке зростання популярності ШІ-застосунків призвело до зростання попиту на найсучасніші технології охолодження серверів. Система прямого охолодження кристала (D2C) від ASUS – це надійне й просте рішення, що вигідно вирізняє її сервери на тлі конкурентів. Її може бути розгорнуто максимально швидко, що дасть змогу підвищити ефективність споживання електроенергії центрами обробки даних. Сервери ASUS ESC N8-E11 і RS720QN-E11-RS24U підтримують колектори й охолоджувальні плити рідинного охолодження для створення широкого спектру рішень охолодження. Крім того, серверні рішення ASUS оснащені теплообмінником задніх дверцят, сумісним зі стандартними серверними стійками, що усуває необхідність заміни стійок – для забезпечення рідинного охолодження в стійці потрібні лише встановити відповідні задні дверцята. Тісно співпрацюючи з провідними постачальниками рішень для охолодження, ASUS пропонує комплексні системи охолодження корпоративного рівня, які дають змогу мінімізувати викиди вуглекислого газу та витрати електроенергії в центрах обробки даних.
Програмні рішення для ШІ
ASUS пропонує клієнтам оптимізовані серверні рішення для встановлення в стійки, здатні впоратися із обробкою значних обсягів даних. На виставці GTC ASUS презентувала ESC4000A-E12 – платформу для штучного інтелекту, що не потребує кодування, з інтегрованим стеком програмного забезпечення, яка дозволяє компаніям прискорити навчання, тонке налаштування і побудову висновків з використанням LLM-моделей. Крім того, ASUS пропонує комплексне рішення для підтримки різних LLM-токенів розміром 7B, 33B і навіть понад 180B параметрів за допомогою спеціального програмного забезпечення, що полегшує диспетчеризацію даних. Оптимізуючи виділення ресурсів графічного прискорювача для точного навчання, стек програмного забезпечення гарантує, що застосунки й завдання штучного інтелекту працюватимуть без витрачання надлишкових ресурсів – це допоможе максимально підвищити ефективність рішення і отримати максимальну рентабельність інвестицій (ROI).
На додаток, поєднання програмного та апаратного забезпечення від ASUS надає компаніям гнучкість у виборі можливостей штучного інтелекту, які найкраще відповідають їхнім потребам, що дозволяє їм ще більше підвищити ROI. Цей інноваційний програмний підхід оптимізує розподіл виділених ресурсів графічного прискорювача для завдань машинного навчання і формування висновків, підвищуючи продуктивність системи.