Новая микроархитектура ядра Efficient, представленная Intel ранее с кодовым названием Gracemont, разработана для энергоэффективной производительности и оптимальной разгрузки фоновых задач в современных режимах многозадачности. Это самая энергоэффективная x86 микроархитектура Intel, занимающая немного площади на кристалле и позволяющая многопоточным приложениям эффективно распределяться по ядрам. E-ядро работает в широком диапазоне частот и экономит энергию за счет пониженного напряжения питания, обладая при этом резервом для наращивания частоты и увеличения производительности под более тяжелыми нагрузками.
E-ядро для приоритезации нагрузок без перерасхода процессорной мощности напрямую повышает производительность с помощью функций, увеличивающих число инструкций на такт, таких как:
- кэш подсистемы предсказания ветвлений на 5 тысяч записей для более точного результата;
64-килобайтный кэш инструкций позволяет обрабатывать больше кода и экономить ресурсы подсистемы за счет более редких обращений к внешней памяти;- первый декодер длины инструкций Intel, который делает предварительную обработку данных до запроса;
- кластеризованный внеочередной (out-of-order) декодер, который позволяет декодировать до 6 инструкций за такт с сохранением уровня энергоэффективности;
- расширенный исполнительный модуль с 5 регистрами переназначения и 8 регистрами завершения инструкций, буфером на 256 внеочередных инструкций и 17 исполнительными портами;
- надежные функции безопасности, включая аппаратную защиту от кибератак Intel® Control-Flow Enforcement Technology (CET) и защиту от перенаправлений Intel® Virtualization Technology;
- реализация расширения системы команд AVX наряду с новыми дополнениями для поддержки целочисленных операций ИИ.
По сравнению с наиболее распространенной процессорной микроархитектурой Skylake, ядро Efficient в однопоточном режиме обеспечивает на 40% большую производительность при том же уровне энергопотребления, или сравнимую производительность при снижении энергопотребления на 40%. Четыре физических ядра Efficient обеспечивают на 80% больше производительности при меньшем энергопотреблении, нежели четыре потока двух физических ядер Skylake, или такую же производительность при энергопотреблении, уменьшенном на 80%.
Новая микроархитектура ядра Performance, представленная Intel ранее с кодовым названием Golden Cove, дает снижение задержек и повышение производительности в однопоточных приложениях. Увеличение объема кода и данных приложений требует больше ресурсов и большей пропускной способности. Новая процессорная микроархитектура Performance значительно повышает общую производительность и обеспечивает лучшую поддержку приложений с большим объемом кода.
P-ядро отличается более широким, глубоким и интеллектуальным исполнительным конвейером:
- шире: 6 декодеров (ранее 4), кэш на 8 микроопераций (ранее до 6), 6 портов переименования/распределения (ранее 5), 12 исполнительных портов (ранее 10);
- глубже: больше файлы регистров, больше файлы физических регистров, более глубокий буфер переупорядочивания инструкций на 512 записей;
- эффективнее: повышенная точность предсказания ветвлений, уменьшенная эффективная латентность кэша L1, полная предикативная оптимизация записи кэша L2.
Ядро Performance — это самое производительное процессорное ядро из когда-либо созданных Intel, в котором удалось добиться снижения задержек и повышения производительности в однопоточных приложениях благодаря:
- росту производительности до 19% при тестах на большом количестве популярных приложений по сравнению с архитектурой Intel Core
11-го поколения (Cypress Cove) при сравнимой тактовой частоте (общий показатель роста считается как среднее геометрическое); - упору на параллелизм и наращиванию исполнительного параллелизма;
- расширениям Intel Advanced Matrix — встроенным средствам ускорения ИИ нового поколения, предназначенным для инференса глубокого обучения и повышения эффективности обучения. Они включают выделенные аппаратные модули и новую архитектуру набора инструкций для значительного ускорения операций перемножения матриц;
- оптимизации работы с приложениями, имеющими большой объем данных и кода, в том числе c точки зрения уменьшения задержек.