Xe HPG — это новая микроархитектура дискретной графики, разработанная для игровых систем и решения творческих задач. Микроархитектура Xe HPG используется в семействе Alchemist, и первые соответствующие продукты появятся на рынке в первом квартале 2022 года под торговой маркой Arc. Микроархитектура Xe HPG базируется на новом ядре Xe для вычислительных систем с возможностью масштабирования.
План выпуска клиентских графических решений включает решение Alchemist, ранее известное как DG2, а также последующих Battlemage, Celestial и Druid. Во время презентации Intel представила подробности микроархитектуры и продемонстрировала работу опытных образцов Alchemist на примере реального геймплея, теста работоспособности с игровым движком Unreal Engine 5 и возможностей новой технологии суперсэмплинга под названием XeSS на основе нейронных сетей.
Системы-на-кристалле Alchemist на базе микроархитектуры Xe HPG спроектированы для обеспечения высокой масштабируемости и вычислительной эффективности со следующими ключевыми возможностями:
- до 8 слоев рендеринга с фиксированной функцией для DirectX 12 Ultimate;
- новые ядра Xe с 16 векторными и 16 матричными движками (называемыми XMX — Xe Matrix eXtensions), кэшем и общей локальной памятью;
- новые модули трассировки лучей с поддержкой технологий DirectX Raytracing (DXR) и Vulkan Ray Tracing;
- увеличение частоты в 1,5 раза и соотношения производительности на ватт в 1,5 раза по сравнению с микроархитектурой Xe LP за счет сочетания новой архитектуры, логического построения, схемотехники, технологии производства и оптимизации программного обеспечения;
- производство с нормами технологического процесса TSMC N6.
При разработке графики Intel использует подход, ориентированный на программное обеспечение:
- архитектура Xe создается в тесном сотрудничестве с разработчиками в соответствии с отраслевыми стандартами;
- первый высокопроизводительный игровой графический процессор Intel ставит во главу производительность и качество благодаря разработке драйвера с единым унифицированным исходным кодом для интегрированных и дискретных графических продуктов;
- Intel завершила рефакторинг ключевых компонентов графического драйвера, в том числе диспетчера памяти и компилятора, что привело к повышению производительности в процессорозависимых играх до 18% и уменьшению времени загрузки игры до 25%.
XeSS использует преимущество реализованных в Alchemist ускорителей ИИ для новой технологии масштабирования, которая обеспечивает высокую производительность и высокое качество изображения. Технология использует глубокое обучение для синтеза изображений, близких по качеству к рендерингу с высоким разрешением. Благодаря XeSS, игры, в которые можно играть только при низких настройках качества или разрешения, могут демонстрировать плавный игровой процесс с более высокими настройками качества и разрешения:
- работа XeSS заключается в реконструкции деталей на субпиксельном уровне из соседних пикселей, а также из предыдущих кадров с компенсацией движения;
- реконструкцию выполняет нейронная сеть, обученная обеспечивать высокую производительность и качество, с увеличением производительности в 2 раза;
- XeSS обеспечивает суперсэмплинг на базе ИИ с помощью набора инструкций DP4a на широком списке оборудования, включая интегрированную графику;
- несколько разработчиков игр задействованы в работе над XeSS. SDK для первой версии XMX будет доступен независимым разработчикам программного обеспечения уже в этом месяце, а версия с DP4a будет доступна позже в этом году.
Появление Sapphire Rapids является большим шагом вперед в развитии платформы Intel для датацентров. Процессор обеспечивает существенный прирост вычислительной мощности в центрах обработки данных с динамичными и постоянно растущими нагрузками. Процессор оптимизирован для высокой производительности рабочих нагрузок с такими концепциями эластичных вычислений как облако, микросервисы и ИИ.
В основе Sapphire Rapids заложена модульная архитектура на базе технологии корпусирования Intel EMIB для обеспечения значительной масштабируемости при сохранении преимуществ монолитного процессорного интерфейса. Sapphire Rapids обеспечивает единую сбалансированную архитектуру Unified Memory Access, где каждый вычислительный поток имеет полный доступ ко всем ресурсам всех модулей, включая кэши, память и ввод-вывод. В итоге достигаются стабильно низкие задержки и высокая пропускная способность между всеми модулями микросхемы.
Процессор Sapphire Rapids производится по технологическому процессу Intel 7 и включает в себя новую микроархитектуру процессорного ядра Intel Performance, которая разработана для повышения производительности и уменьшения задержек в однопоточных приложениях.
Дизайн Sapphire Rapids включает в себя широкий набор ускорителей для дата-центров, включая новую архитектуру набора команд и встроенные IP-блоки для увеличения производительности в самом широком диапазоне пользовательских нагрузок и сценариев использования. Список новых встроенных ускорителей включает:
- архитектуру интерфейса ускорителей Intel Accelerator Interfacing Architecture (AIA) — поддержка эффективного управления, синхронизации и передачи сигналов для ускорителей и устройств;
- инструкции Intel Advanced Matrix Extensions (AMX) — новый механизм, впервые представленный в Sapphire Rapids, обеспечивает значительное ускорение тензорных расчетов, которые лежат в основе алгоритмов глубокого обучения. Он может обеспечить значительное ускорение вычислительных возможностей за счет 2K INT8 и 1K BFP16 операций за такт. Тестирование ранних образцов Sapphire Rapids показало, что оптимизированные внутренние микротесты матричного умножения работают в 7 раз быстрее с использованием новых инструкций набора Intel AMX по сравнению с использованием инструкций Intel AVX-512 VNNI, обеспечивая существенный прирост производительности при выполнении ИИ-задач обучения и вывода;
- ускоритель Intel Data Streaming Accelerator (DSA) предназначен для разгрузки наиболее распространенных задач перемещения данных, которые приводят к значительному потреблению ресурсов при масштабировании дата-центров. Intel DSA обеспечивает обработку таких ресурсоемких задач для повышения общей производительности за счет перемещения данных между процессором, памятью и кэшами, а также всей подключенной памятью, хранилищем и сетевыми устройствами.
Эти архитектурные усовершенствования позволяют Sapphire Rapids обеспечить высокую производительность для широкого списка рабочих нагрузок и моделей развертывания в облаке, дата-центре, сети и на интеллектуальной периферии. Процессор создан для перехода на новые отраслевые технологии с использованием усовершенствованной памяти и решений ввода-вывода нового поколения, включая технологии PCIe 5.0, CXL 1.1, DDR5 и HBM.















