Китайська компанія Huawei Technologies продемонструвала в суботу обчислювальну систему штучного інтелекту CloudMatrix 384, яка може конкурувати з найсучаснішою пропозицією Nvidia, навіть незважаючи на те, що компанія стикається з експортними обмеженнями в США. Система CloudMatrix 384 вперше публічно дебютувала на Всесвітній конференції зі штучного інтелекту (World Artificial Intelligence Conference, WAIC), триденному заході в Шанхаї, де компанії демонструють свої останні інновації в галузі штучного інтелекту. За даними SemiAnalysis, CloudMatrix 384 складається з 384 новітніх чипів Huawei 910C, оптично з'єднаних за топологією «все до всіх», і за деякими показниками перевершує GB200 NVL72 від Nvidia, в якому використовується 72 чипи B200. Повна система CloudMatrix тепер може забезпечити 300 PFLOP обчислень BF16 (brain floating point 16-bit), що майже вдвічі більше, ніж у GB200 NVL72.
Згідно зі звітом SemiAnalysis, завдяки більш ніж 3,6-кратному збільшенню сукупного обсягу пам'яті і в 2,1 рази більшій пропускній здатності, Huawei і Китай «тепер мають можливості системи ШІ, які можуть перевершити можливості Nvidia».
Недолік нової системи полягає в тому, що розробка Huawei потребує в 4,1 рази більше енергії, ніж Nvidia GB200 NVL72, і має в 2,5 рази гірші показники енергоефективності на кожну операцію FLOP, і на кожен ТБ/с пропускної здатності пам'яті. Але SemiAnalysis зазначає, що Китай не має обмежень по потужності, а лише по чипу. Nvidia анонсувала платформу DGX H100 NVL256 «Ranger» з 256 графічними процесорами, але вирішила не запускати її у виробництво через її надмірну дорожнечу, енергоємність і ненадійність через необхідність оптичних приймачів і дворівневу мережу. CloudMatrix Pod потребує неймовірну кількість (майже 7 мільйонів) 400-гігабітних LPO-трансиверів для роботи в мережі, переважна більшість з яких призначена для масштабування мережі.