> > > > HotChips 2023: Intel рассказала о Xeon на P- и E-ядрах (обновление)

HotChips 2023: Intel рассказала о Xeon на P- и E-ядрах (обновление)

Опубликовано:

hardwareluxx news newНа конференции HotChips 2023 Intel поделилась подробностями грядущей платформы Birch Stream, которая дебютирует в следующем году с процессорами Xeon Sierra Forest на E-ядрах и Granite Rapids на P-ядрах. Разделение на две линейки Xeon с разными ядрами позволит Intel более гибко охватывать разные сегменты серверного рынка. О данном шаге Intel сообщила еще несколько месяцев назад.

В середине июня AMD представила первые процессоры EPYC с ядрами 4C на дизайне Bergamo, которые разработаны под максимальную эффективность и высокое число ядер. Со стороны ARM тоже наблюдается переход на небольшие и эффективные ядра, здесь можно упомянуть линейку Ampere и специализированные дизайны чипов, которые Amazon разрабатывает для себя.

Старт новых CPU запланирован на следующий год. На конференции HotChips Intel решила поделиться первыми подробностями. Ранее уже было известно, что Sierra Forest и Granite Rapids будут совместимы друг с другом, Intel использует одинаковые блоки ввода/вывода, то есть идентичный набор PCI Express 5.0, CXL 2.0 и других интерфейсов. Отличия будут в вычислительных тайлах с ядрами CPU. То есть пользователь платформы Birch Stream не будет ограничен одним типом CPU, теоретически их можно менять. Хотя на практике вряд ли сервер будут переоснащать другими процессорами, обычно конфигурация подбирается заранее, и для нее уже известно, какие процессоры на P- или E-ядрах подходят лучше. Но подобная универсальность все равно дает свои преимущества по программной поддержке, например.

Sierra Forest и Granite Rapids всегда содержат два тайла ввода/вывода на корпусировку, чтобы гарантировать одинаковую конфигурацию. Но вот число тайлов с ядрами может меняться от одного крупного до двух-трех меньших. Соединения на корпусировке реализованы через технологию EMIB. Вычислительные тайлы производятся по техпроцессу Intel 3, но Intel об этом много раз говорила.

Процессоры Granite Rapids будут доступны для серверов от 1S до 8S. В случае Sierra Forest планируются только модели 1S или 2S, поэтому будут поддерживаться, максимум, два сокета. Процессоры будут работать с 12 каналами памяти. На нашем Tech Tour в Малайзии мы смогли ознакомиться с новым тестовым сервером, который поддерживал DDR5-5600. Поэтому можно предположить, что платформа Birch Stream будет поддерживать, как минимум, DDR5-5600. Также будет поддерживаться память DDR4 и MCR. Intel также указывает 144 линии PCI Express 5.0 / CXL.

Intel указывает оптимизацию эффективности новых производительных ядер, но при этом рассчитывает дать максимальную производительность в сегменте. При разработке архитектуры была учтена обратная связь от клиентов. Блоки AMX получили поддержку FP16 для вычислений ИИ. Кэш инструкций L1 составляет 64 кбайт, у все еще современных ядер Golden Cove он в два раза меньше – 32 кбайт. Intel также говорит об улучшенном предсказании ветвлений и оптимизированной пропускной способности вычислений с плавающей запятой.

Появилась и дополнительная информация о микроархитектуре эффективных ядер. Здесь целью при разработке дизайна были пропускная способность и эффективность. Поэтому в фокусе была архитектура кэшей. Кэш инструкций L1 увеличен до 64 кбайт – как и у производительных ядер. Чтобы дать высокую пропускную способность, Intel оснастила E-ядра 6-wide декодированием, 5-wide выделением и 8-wide возвратом, что выводит E-ядра на уровень, идентичный P-ядрам Sapphire Rapids. Модуль с 2 или 4 E-ядрами оснащен 4 Мбайт общего кэша L2.

Intel привела предварительную оценку производительности: вычислительную плотность стойки можно увеличить в 2,5 раза после перехода на Sierra Forst. Вероятно, речь идет о числе ядер. Современные процессоры Sapphire Rapids в сервере 2U могут дать 2x 60 ядер, в случае Sierra Forest получится увеличить их количество до 300 или выше. Раньше ходили слухи о 2x 144 ядрах. В любом случае, Granite Rapids смогут дать намного лучшее соотношение производительности на ватт. То же самое касается и Sierra Forest.

Процессоры Sierra Forest запланированы на первую половину 2024, Granite Rapids выйдут чуть позже. Конечно, ближе к дате выхода мы наверняка получим больше подробностей. Но до этого момента нас ждет еще одно поколение Xeon Emerald Rapids, которое привносит небольшие улучшения к текущему Sapphire Rapids.

Обновление

Приведенную выше информацию мы получили от Intel заранее. Но на конференции HotChips Intel предоставила больше подробностей. Интересно, что оценка производительности в виде двух слайдов выше на презентации отсутствовала. Зато Intel раскрыла строение mesh-сети между отдельными чиплетами, а также добавила подробностей строения E- и P-ядер.

Интерконнект с ячеистой топологией (mesh) – центральный компонент, гарантирующий, что дизайн чиплетов будет работать с такой же производительностью, что и монолитный. Каждый вычислительный модуль тайла оснащен mesh-маршрутизатором, который соединяет его с остальной сетью. Также mesh-маршрутизаторы есть и у других агентов на кристалле, например, у контроллеров памяти.

Вычислительные модули Core Tiles состоят из следующих компонентов:

  • Производительное ядро
  • 2 Мбайт кэша L2
  • 4 Мбайт кэш LLC (с общим доступом для всех ядер)
  • Caching and Home Agent (CHA)
  • Mesh Router

Каждый из грядущих процессоров Xeon оснащен двумя чиплетами ввода/вывода. Они содержат восемь портов, которые доступны как UPI (x24), PCI-Express (x16) или CXL (x16). Также присутствуют два Accelerator Complexes (AC), которые содержат разные ускорители. Интерфейс UPI стал быстрее в 1,8 раза, а интерфейс ускорителей – в 2 раза.

Больше подробностей о E-ядрах

Intel на HotChips рассказала даже больше подробностей об эффективных ядрах (Crestmont), чем о производительных (Redwood Cove).

Фронтальная часть конвейера E-ядер Sierra Forest стала глубже для более эффективного декодирования инструкций, а задняя часть – шире для максимальной пропускной способности вычислений. Кэш инструкций на 64 кбайт дополняет переднюю часть конвейера, он хорошо вписывается в современную тенденцию приложений с большим паттерном кода. Кэш L1I на 64 кбайт был не просто увеличен по сравнению с предшественником, он соответствует емкости L1I у производительных ядер.

Модуль процессоров Xeon с E-ядрами содержит два или четыре ядра Crestmont. Их дополняет общий кэш L2 на 4 Мбайт. Кэш LLC установлен в размере 3 Мбайт на модуль, к нему имеют доступ все ядра в сокете. Но ядра поддерживают выполнение только одного потока.

Intel планирует представить две корпусировки процессоров Xeon на P-ядрах с двумя тайлами ввода/вывода и одним или двумя вычислительными тайлами. Но в случае Xeon на E-ядрах корпусировка будет только одна, с одним вычислительным тайлом. Он будет содержать до 144 E-ядер. Intel в данном случае говорит об «одном домене» с распределенным LLC.

Со 144 ядрами можно рассчитать общий объем кэша L2 и LCC/L3. Если для четырех ядер доступны 4 Мбайт L2, то в сумме объем может достигать 144 Мбайт. Что касается кэша LLC/L3, объем составляет 108 Мбайт.

Контроллеры памяти подключаются к вычислительному тайлу. Платформа Birch Stream поддерживает до 12 каналов памяти и MCR RAM (Multiplexed Combined Rank). С данного поколения официально поддерживается DDR5-6400. TDP процессоров Sierra Forest завялен на 205 Вт.

Обновление: корпусировка Granite Rapids

В маркетинговом видеоролике Intel рассказывает о своих наработках в сфере корпусировки процессоров. На нем была несколько раз показана корпусировка, которую мы определили как Granite Rapids. Хотя сама Intel тип процессора не упоминает.

Корпусировка состоит из трех вычислительных чиплетов, в которых расположены ядра CPU. На первой фотографии корпусировка расположена вертикально, сверху и снизу можно видеть чиплеты ввода/вывода. Во время нашего визита на заводы корпусировки Intel в Малайзии мы обнаружили чипы Emerald Rapids. Пятое поколение Xeon выйдет уже в этом году в вариантах на P- и E-ядрах, а именно Granite Rapids и Sierra Forest, соответственно.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору лучшего процессора Intel и AMD на текущий квартал. Оно поможет выбрать оптимальный CPU за свои деньги и не запутаться в ассортименте моделей на рынке.