Віртуалізація/хмарні обчислення

	Версия для печати
	Версия для печати с изображениями
	Отправить ссылку
	Поместить в блог
	Добавить комментарий
	Написать в редакцию
	Подписаться на рассылки

Alibaba Cloud зменшила використання графічних процесорів Nvidia AI в 5 разів завдяки пулінгу

21.10.2025

Компанія Alibaba Cloud стверджує, що її нова система пулінгу графічних процесорів Aegaeon скорочує використання графічних процесорів Nvidia на 82%, за рахунок чого 213 прискорювачів H20 обробляють робочі навантаження, для яких раніше було потрібно 1192.

Пулінг графічних процесорів (GPU pooling) — це технологічний підхід, за якого кілька графічних процесорів (GPU) об’єднуються в спільний пул — тобто в єдиний ресурс, який можна динамічно розподіляти між різними користувачами, застосунками або віртуальними машинами.

Замість того, щоб один GPU був закріплений за одним сервером чи користувачем, створюється «пул» обчислювальних потужностей, до якого можна підключати різні задачі за потреби. Це підвищує ефективність використання обладнання.

На відміну від проривів у часі навчання, які переслідують якість або швидкість моделі, Aegaeon — це планувальник часу виведення, призначений для максимального використання GPU в багатьох моделях з нестабільним або непередбачуваним попитом. Замість прив'язки одного прискорювача до однієї моделі, Aegaeon віртуалізує доступ до GPU на рівні токенів, що дозволяє йому планувати невеликі фрагменти роботи в спільному пулі. Це означає, що один H20 може обслуговувати кілька різних моделей одночасно, при цьому «goodput» (показник ефективної продуктивності) в масштабі всієї системи зростає в дев'ять разів порівняно зі старими безсерверними системами.

Повідомляється, що система тестувалася в умовах виробництва протягом декількох місяців. За цей період кількість графічних процесорів, необхідних для підтримки десятків різних LLM (розміром до 72 мільярдів параметрів), зменшилася з 1192 до всього 213. Хоча в статтіне сказано, які моделі найбільше сприяли економії, у повідомленні South China Morning Post йдеться, що тести проводилися з використанням Nvidia H20, одного з небагатьох прискорювачів, які все ще легально доступні китайським покупцям за чинним експортним контролем США.

Поместить в блог

<table border="0" width="75%" style="margin:10px; border:2px solid #036; background-color:#FFF;"><tr><td align="right"><a href="http://www.pcweek.ua" target="_blank"><img src="http://www.pcweek.ua/images/pcweek/logo-blog.gif" style="width:100px; height:30px; border:0;" alt="PC Week/UE"></a></td></tr><tr><td><a href="http://www.pcweek.ua/themes/detail.php?ID=171435" target="_blank"><img src="http://www.pcweek.ua/upload/iblock/84d/videocard70.jpg" alt="Открыть материал" style="width:70px; height:50px; border:1px solid #000; float:left; margin:0 5px 5px 0;"></a><a href="http://www.pcweek.ua/themes/detail.php?ID=171435" target="_blank" style="font:14px Arial; color:#000; text-decoration:none; font-weight:bold;">Alibaba Cloud зменшила використання графічних процесорів Nvidia AI в 5 разів завдяки пулінгу</a><br><a href="http://www.pcweek.ua/themes/detail.php?ID=171435" target="_blank" style="font:12px Arial; color:#000; text-decoration:none;">Пулінг графічних процесорів (GPU pooling) — це технологічний підхід, за якого кілька графічних процесорів (GPU) об’єднуються в спільний пул — тобто в єдиний ресурс, який можна динамічно розподіляти між різними користувачами...</a></td></tr><tr><td align="right"><a href="http://www.pcweek.ua/themes/detail.php?ID=171435" target="_blank" style="font:12px Arial;">Открыть материал</a></td></tr></table>

Комментарии к статье

Статьи по теме

Ландшафт віртуалізації трансформується: нові пріоритети для компаній

Згідно з новим звітом Red Hat "State of Virtualization", організації переосмислюють свій підхід до віртуалізації, фокусуючись на створенні довгострокової основи, що забезпечуватиме гнучкість, оптимізацію витрат та масштабованість. При цьому активно враховуються...

Український хмарний оператор Ucloud отримав атестат відповідності КСЗІ

Отримання сертифіката є підтвердженням того, що збереження клієнтських даних відповідає вимогам законодавства та українським галузевим стандартам, що пов’язані із захистом інформації. Також КСЗІ дозволяє компанії співпрацювати...

Microsoft, Amazon та Google заблокують російському бізнесу доступ до хмарних сервісів

Ці обмеження визначені так званим «12 пакетом санкцій Європейського союзу» від 19 грудня 2023 року, який обмежує постачання до рф програмного забезпечення для бізнес-аналітики (BI)...

Харківський університет переїхав з Amazon до української хмари

Спочатку університет скористався безкоштовними кредитами від Amazon Web Services та Dutch Cloud Community, і розмістив свої сервіси на потужностях за кордоном. Згодом, переніс їх в українську хмару оператора GigaCloud.

Приватна хмара: для чого вона потрібна

Хмарні технології набули популярності за рахунок оптимізації витрат, обробки великих обсягів інформації та самообслуговування. Приватна хмара — це один із різновидів...

Форум

Наступило время экспериментов (Noname, 08.04.2016 09:45:00)

Укртелеком в 4 раза снижает стоимость звонков на мобильные (СЕргей, 06.04.2016 19:11:59)

Укравтодор отмечает дорожные работы и перекрытия на Яндекс.Картах (Noname, 05.04.2016 17:30:44)

Яндекс.Карты объявляют конкурс для киевлян (Хтось, 17.02.2016 12:24:08)

Информационная безопасность: в поисках совершенной защиты (Лариса Ершова, 09.11.2015 18:39:47)

Другие темы

Газета PC Week Ukrainian Edition печатается по лицензионному соглашению с компанией Ziff Davis Publishing Inc. Перепечатка материалов допускается только c разрешения редакции. За содержание рекламных объявлений редакция ответственности не несет. Editorial items appearing in PC Week/UE that were originally published in the U.S. edition of PC Week are the copyright property of Ziff Davis Publishing Inc. Copyright 2015 Ziff Davis Inc. All rights reserved. PC Week is trademark of Ziff Davis Publishing Holding Inc.
© 2026 ООО “ПИСИВИК УКРАИНА”. Информация об авторских правах и порядке использования материалов сайта