Инфраструктурный процессор (Infrastructure Processing Unit, IPU) является программируемым сетевым устройством, с помощью которого поставщики облачных и коммуникационных услуг могут снизить нагрузку на центральные процессоры и высвободить их ресурсы.

Архитектура Intel на базе IPU обладает рядом существенных преимуществ:

  • четкое разделение функций инфраструктуры и рабочих нагрузок пользователя позволяет клиентам полностью контролировать центральный процессор;
  • оператор облачных услуг может переложить инфраструктурные задачи на IPU, увеличивая тем самым пользовательскую загрузку CPU и выгоду от эксплуатации системы;
  • инфраструктурные процессоры могут управлять трафиком системы хранения, что позволяет сократить задержки при эффективном использовании емкости хранилища с бездисковой серверной архитектурой. Использование IPU позволяет заказчикам лучше использовать ресурсы за счет безопасного, программируемого и стабильного решения со сбалансированными ресурсами обработки и хранения данных.

Соглашаясь с принципом «универсального решения не существует», Intel предложила расширенное видение своей архитектуры IPU и рассказала о новых представителях семейства IPU, которые предназначены для решения ряда сложных проблем в разнородных и рассредоточенных центрах обработки данных.

Mount Evans является первым IPU компании Intel в формате специализированной микросхемы (ASIC). Mount Evans, который спроектирован и разработан вместе с ведущим поставщиком облачных услуг, объединил в себе опыт нескольких поколений программируемых матриц SmartNIC:

  • Mount Evans готов к гипермасштабируемым вычислениям, он обеспечивает разгрузку высокопроизводительной сети и виртуализации хранилища при сохранении высокой степени контроля;
  • представляет лучший в своем классе программируемый механизм обработки пакетов с поддержкой таких сценариев использования, как межсетевые экраны и виртуальная маршрутизация;
  • реализует интерфейс хранилища NVMe с аппаратным ускорением, масштабируемый с технологией Intel Optane для эмуляции устройств NVMe;
  • поддерживает расширенное ускорение шифрования и сжатия данных с использованием высокопроизводительной технологии Intel Quick Assist;
  • может быть запрограммирован с помощью уже существующих, традиционно используемых программных сред, включая DPDK, SPDK. Конвейер может быть настроен с помощью программного языка P4, впервые разработанного для маршрутизаторов компании Barefoot, приобретенной Intel.

Oak Springs Canyon является платформой IPU, построенной на базе Intel Xeon-D и программируемых матриц (FPGA) Intel Agilex, индустриальных лидеров по мощности, эффективности и производительности для:

  • разгрузки функций виртуализации сети, таких как Open Virtual Switch (OVS), и функций хранения, таких как NVMe over Fabric и RoCE v2. Обладает усиленным модулем шифрования для большей безопасности высокоскоростного сетевого интерфейса 2×100Gb Ethernet;
  • позволяет партнерам и заказчикам Intel настраивать свои решения с помощью масштабируемой программно-аппаратной инфраструктуры Intel Open FPGA Stack с доступным исходным кодом;
  • может быть запрограммирован с помощью привычных программных сред, включая DPDK и SPDK, которые оптимизированы для архитектуры x86.

Платформа Intel N6000 Acceleration Development Platform с кодовым названием Arrow Creek представляет собой адаптер SmartNIC, созданный для совместного использования с серверами на базе процессоров Xeon. Ее особенности:

  • использование мощной, эффективной и производительной программируемой матрицы Intel Agilex FPGA. Контроллер Intel Ethernet 800 series для высокопроизводительной сети 100G;
  • поддержка нескольких инфраструктурных рабочих нагрузок, позволяющих поставщикам телекоммуникационных услуг предлагать гибкие ускоренные приложения, такие как Juniper Contrail, OVS и SRv6, с упором на успех Intel PAC-N3000, которые уже внедряются рядом ведущих мировых поставщиков телекоммуникационных услуг.

Решение Ponte Vecchio, выполненное на базе микроархитектуры Xe HPC, обеспечивает лучшие в отрасли показатели операций с плавающей запятой в секунду (FLOPs) и вычислительной плотности. Решение предназначено для ускорения рабочих нагрузок ИИ, высокопроизводительных вычислений (HPC) и расширенной аналитики. Intel представила информацию об особенностях микроархитектуры Xe HPC, в том числе о 8 векторных и матричных движках (XMX — Xe Matrix eXtensions) на каждое ядро Xe; данные о слоях, стеках и модулях, включая технологические нормы производства модулей Compute, Base и Xe Link. Intel сообщила о том, что микросхемы степпинга A0 обеспечивают производительность более 45 TFLOPS FP32, пропускную способность интерфейса памяти более 5 терабайт в секунду и пропускную способность подключения более 2 терабайт в секунду. Intel также продемонстрировала производительность инференса ResNet на уровне более 43 тысяч изображений в секунду и обучения ResNet на уровне более 3400 изображений в секунду. Оба показателя являются заявкой на ведущие позиции по производительности.

Ponte Vecchio состоит из нескольких сложных структур в виде базовых модулей. Они собираются воедино с помощью технологии EMIB, которая обеспечивает низкое потребление энергии и высокую скорость соединения между модулями. Все они собраны при помощи технологии Foveros, которая обеспечивает трехмерное послойное расположение кристаллов для высокой плотности вычислительной мощности и межблочных соединений. Высокоскоростное межсоединение MDFI позволяет масштабировать решение с одного до двух стеков.

Вычислительный тайл Compute Tile, является «сердцем» Ponte Vecchio и представляет собой плотно собранный пакет ядер Xe:

  • один модуль содержит 8 ядер Xe с общим объемом кэша L1 4 МБ, что обеспечивает энергоэффективные вычисления;
  • создан с использованием самого передового технологического процесса TSMC N5;
  • Intel заложила основу для использования этого техпроцесса, разработав соответствующую инфраструктуру проектирования, инструментарий и методологию;
  • модуль обладает чрезвычайно малым зазором между контактами — всего 36 микрон, для трехмерной компоновки с помощью технологии Foveros.

Базовый тайл Base Tile, является «соединительной тканью» Ponte Vecchio. Это крупный кристалл, созданный с применением технологического процесса Intel 7 и оптимизированный для технологии корпусирования Foveros:

  • модуль Base Tile — это место, где все сложные компоненты ввода-вывода и скоростного обмена данными объединяются с инфраструктурой микросхемы — шиной PCIe Gen5, памятью HBM2e, каналами MDFI для подключения мостиков между модулями и EMIB;
  • сверхскоростное трехмерное подключение с двухмерным межсоединением и малыми задержками превращают его в «машину безграничного подключения»;
  • команда разработчиков Intel работала над соблюдением требований по производительности, плотности размещения контактов и электромагнитной целостности.

Модуль Xe Link Tile обеспечивает соединение между графическими процессорами, поддерживая 8 каналов на модуль:

  • критически важен для масштабирования систем HPC и ИИ;
  • ориентирован на самые быстрые блоки SerDes, поддерживаемые Intel — до 90G;
  • этот тайл был добавлен для обеспечения масштабирования решений для суперкомпьютера Aurora с производительностью экзафлопсного уровня.

Ponte Vecchio в работе, проходит стадию валидации и уже поставляется в ограниченных пробных количествах заказчикам. Ponte Vecchio будет выпущен в 2022 году для рынков HPC и ИИ.

Отраслевая инициатива oneAPI предоставляет открытый стандартизированный унифицированный программный стек, который является решением, не зависимым от конкретной архитектуры и производителя. Он позволяет разработчикам перейти от проприетарных языков программирования и программных моделей к индустриальным стандартам. В настоящее время существуют реализации языка Data Parallel C++ (DPC++) и библиотеки oneAPI для графических процессоров NVIDIA, процессоров AMD и процессоров Arm. oneAPI широко применяется независимыми разработчиками программного обеспечения, поставщиками операционных систем, конечными пользователями и научным сообществом. Ключевые отраслевые лидеры помогают развивать спецификацию для поддержки дополнительных моделей использования и архитектур. Intel также предлагает коммерческий продукт, в который входит базовый инструментарий oneAPI Base Toolkit, помимо спецификаций языка и библиотек предлагающий компиляторы, анализаторы производительности и корректности, отладчики и инструменты для миграции кода.

oneAPI обеспечивает переносимость кода между архитектурами, повышая продуктивность разработчиков и эффективность инноваций:

  • насчитывается более 200 тысяч уникальных установок инструментария oneAPI от Intel;
  • на рынке более 300 приложений, использующих унифицированную программную модель oneAPI;
  • более 80 приложений для HPC и ИИ работают с микроархитектурой Xe HPC с применением инструментов Intel oneAPI;
  • в предварительной версии спецификации 1.1, выпущенной в мае, добавлены новые программные интерфейсы для задач глубокого обучения и расширения для библиотек рендеринга с трассировкой лучей. Ожидается, что работа над ними будет закончена к концу года.