Новая микроархитектура ядра Efficient, представленная Intel ранее с кодовым названием Gracemont, разработана для энергоэффективной производительности и оптимальной разгрузки фоновых задач в современных режимах многозадачности. Это самая энергоэффективная x86 микроархитектура Intel, занимающая немного площади на кристалле и позволяющая многопоточным приложениям эффективно распределяться по ядрам. E-ядро работает в широком диапазоне частот и экономит энергию за счет пониженного напряжения питания, обладая при этом резервом для наращивания частоты и увеличения производительности под более тяжелыми нагрузками.

E-ядро для приоритезации нагрузок без перерасхода процессорной мощности напрямую повышает производительность с помощью функций, увеличивающих число инструкций на такт, таких как:

  • кэш подсистемы предсказания ветвлений на 5 тысяч записей для более точного результата;
  • 64-килобайтный кэш инструкций позволяет обрабатывать больше кода и экономить ресурсы подсистемы за счет более редких обращений к внешней памяти;
  • первый декодер длины инструкций Intel, который делает предварительную обработку данных до запроса;
  • кластеризованный внеочередной (out-of-order) декодер, который позволяет декодировать до 6 инструкций за такт с сохранением уровня энергоэффективности;
  • расширенный исполнительный модуль с 5 регистрами переназначения и 8 регистрами завершения инструкций, буфером на 256 внеочередных инструкций и 17 исполнительными портами;
  • надежные функции безопасности, включая аппаратную защиту от кибератак Intel® Control-Flow Enforcement Technology (CET) и защиту от перенаправлений Intel® Virtualization Technology;
  • реализация расширения системы команд AVX наряду с новыми дополнениями для поддержки целочисленных операций ИИ.

По сравнению с наиболее распространенной процессорной микроархитектурой Skylake, ядро Efficient в однопоточном режиме обеспечивает на 40% большую производительность при том же уровне энергопотребления, или сравнимую производительность при снижении энергопотребления на 40%. Четыре физических ядра Efficient обеспечивают на 80% больше производительности при меньшем энергопотреблении, нежели четыре потока двух физических ядер Skylake, или такую же производительность при энергопотреблении, уменьшенном на 80%.

Новая микроархитектура ядра Performance, представленная Intel ранее с кодовым названием Golden Cove, дает снижение задержек и повышение производительности в однопоточных приложениях. Увеличение объема кода и данных приложений требует больше ресурсов и большей пропускной способности. Новая процессорная микроархитектура Performance значительно повышает общую производительность и обеспечивает лучшую поддержку приложений с большим объемом кода.

P-ядро отличается более широким, глубоким и интеллектуальным исполнительным конвейером:

  • шире: 6 декодеров (ранее 4), кэш на 8 микроопераций (ранее до 6), 6 портов переименования/распределения (ранее 5), 12 исполнительных портов (ранее 10);
  • глубже: больше файлы регистров, больше файлы физических регистров, более глубокий буфер переупорядочивания инструкций на 512 записей;
  • эффективнее: повышенная точность предсказания ветвлений, уменьшенная эффективная латентность кэша L1, полная предикативная оптимизация записи кэша L2.

Ядро Performance — это самое производительное процессорное ядро из когда-либо созданных Intel, в котором удалось добиться снижения задержек и повышения производительности в однопоточных приложениях благодаря:

  • росту производительности до 19% при тестах на большом количестве популярных приложений по сравнению с архитектурой Intel Core 11-го поколения (Cypress Cove) при сравнимой тактовой частоте (общий показатель роста считается как среднее геометрическое);
  • упору на параллелизм и наращиванию исполнительного параллелизма;
  • расширениям Intel Advanced Matrix — встроенным средствам ускорения ИИ нового поколения, предназначенным для инференса глубокого обучения и повышения эффективности обучения. Они включают выделенные аппаратные модули и новую архитектуру набора инструкций для значительного ускорения операций перемножения матриц;
  • оптимизации работы с приложениями, имеющими большой объем данных и кода, в том числе c точки зрения уменьшения задержек.
Отмечая важность архитектурного прогресса, в компании отметили, что «архитектура — это алхимия между софтом и железом. Она смешивает лучшие транзисторы для каждого компонента, собирает их с помощью передовых технологий, интегрирует с высокопроизводительным энергоэффективным кэшом, снабжает большой памятью и быстрыми интерфейсами с низкими задержками для создания гибридных вычислительных кластеров в едином корпусе, обеспечивая поступательное ускорение всего софта».