> > > > AMD представила новинки в сегменте дата-центров: Genoa-X, Bergamo и MI300X

AMD представила новинки в сегменте дата-центров: Genoa-X, Bergamo и MI300X

Опубликовано:

hardwareluxx news newНа вчерашнем мероприятии "Data Center and AI Technology Premiere" AMD представила несколько новых продуктов. В начале мероприятия AMD поделилась успехом нынешнего поколения Genoa, которое используется в качестве процессоров общего назначения в AWS.

Но перейдем к новостям. Были представлены долгожданные процессоры EPYC на дизайне Bergamo – серверные CPU на адаптированных ядрах Zen 4c, которые устанавливаются в сокет SP5. На прошлой неделе мы уже опубликовали новость, где описали изменения, которые AMD внесла по сравнению с обычными процессорами Genoa (Zen 4). В частности, AMD внесла следующие изменения:

  • Урезала в два раза кэш L3 в Core Complex (CCX) с 32 до 16 Мбайт
  • На каждом CCD теперь работают два CCX с восемью ядрами
  • Убрала соединения TSV для подключения дополнительного кэша 3D V-cache
  • Оптимизировала дизайн под меньшие частоты, что позволило обойтись меньшим числом транзисторов
  • Новые ячейки 6T SRAM

Благодаря описанным мерам, AMD смогла урезать площадь ядра на 35%. В результате ядро Zen 4c занимает площадь 2,48 мм², а ядро Zen 4 – 3,84 мм².

Число ядер на сокет увеличилось до 128, при этом и сами ядра, и процессор в целом работают более эффективно. Конечно, вряд ли на Bergamo стоит запускать приложения, которые выигрывают от высоких тактовых частот процессоров Genoa или большего кэша. Здесь как раз помогут процессоры Genoa-X с кэшем 3D V-Cache, к которым мы вернемся чуть позже.

Изначально AMD выпустит три процессора Bergamo:

AMD EPYC 97x4
Модель Ядра/ потоки Базовая частота/ Boost Кэш L3 TDP
EPYC 9754 128 / 256 2,25 / 3,1 ГГц 256 Мбайт 360 Вт
EPYC 9754S 128 / 128 2,25 / 3,1 ГГц
256 Мбайт 360 Вт
EPYC 9734
112 / 224 2,2 / 3,0 ГГц 256 Мбайт 360 Вт

Процессоры Bergamo предлагают 128 и 112 ядер. SMT в случае EPYC 9754S выключен, что может дать преимущество в некоторых сценариях.

Оппонентом процессоров Bergamo станут Sierra-Forrest E-Core Xeon, которые Intel представит в следующем году.

Genoa-X с кэшем 3D V-cache

Как и ожидалось, на рынок вышли процессоры Genoa с дополнительным кэшем 3D V-Cache под названием Genoa-X. Анонсированы четыре модели, содержащие от 16 до 96 ядер. Такой процессор содержит 12 CCD c 96 Мбайт кэша L3 каждый, что в сумме дает 1.152 Мбайт кэша L3 – больше гигабайта.

Процессоры Genoa-X покажут преимущества в тех сценариях, где данные получится уместить в крупном кэше, чтобы к ним был максимально быстрый доступ. Помимо инструментов EDA, здесь можно упомянуть различные симуляции и вычисления HPC.

AMD EPYC 9x84X
Модель Ядра Базовая частота/ Boost Кэш L3 TDP
EPYC 9684X 96 2,25 / 3,7 ГГц 1.152 Мбайт 400 Вт
EPYC 9384X 32 3,1 / 3,9 ГГц
768 Мбайт 320 Вт
EPYC 9184X
16 3,55 / 4,2 ГГц 768  Мбайт 320 Вт

Microsoft в рамках Azura предложила первые облачные инстанции на Genoa-X (HBv4 и HX VMs).

CPU освобождаются от сетевых задач

Все крупные игроки рынка поняли, что вычислительная производительность дата-центров больше не сводится только к процессорам и ускорителям. Сеть начинает играть все более важную роль. NVIDIA, например, приобрела израильскую компанию Mellanox. AMD тоже не осталась в стороне и купила сетевого специалиста Pensando некоторое время назад.

Сетевые ускорители, которые производители называют DPU, IPU или как-то иначе, используются во многих сферах. Вчера AMD представила D4 DPU. Вместе с умными NIC и коммутаторами сетевые ускорители смогут взять на себя порядка 30% вычислительной нагрузки от CPU благодаря тому, что центральному процессору теперь не требуется управлять сетевыми функциями.

Потенциал ИИ оценивается в $150 млрд.

Конечно, AMD не хочет оставаться в стороне от модной тенденции искусственного интеллекта. Суперкомпьютеры на компонентах AMD сегодня работают, в том числе, и над тренировкой больших языковых моделей LLM. Хотя сильнее всего в данной сфере выигрывает NVIDIA. AMD оценивает объем этого рынка в $150 млрд. и, конечно, хочет «отъесть» свою долю.

Ускорители Instinct MI300A уже были представлены на выставке CES 2023. AMD впервые предложила ускорители на основе APU, которые сочетают 24 ядра Zen 4 с вычислительными чиплетами на основе CDNA-3. Чиплеты производятся по 5- и 6-нм техпроцессам. В корпусировке используется 13 чиплетов: 3x Zen 4 и 10x CDNA 3. Причем для ядер CPU и блоков CDNA-3 доступны 128 Гбайт памяти HBM3. Сложность чипа составляет порядка 146 млрд. транзисторов. Для сравнения, у H100 GPU от NVIDIA содержится 80 млрд. транзисторов. А у Intel Ponte Vecchio – более 100 млрд.

Еще один ускоритель Instinct под названием MI300X отличается тем, что AMD удалила три чиплета Zen-4 и установила вместо них два чиплета CDNA-3. В итоге в корпусировке работают 12 чиплетов CDNA-3, содержащие 153 млрд. транзисторов. Объем памяти HBM3 был увеличен до 192 Гбайт. Пропускная способность памяти составляет 5,2 Тбайт/с. Опять же, если сравнить с NVIDIA: ускоритель H100 оснащен 80 Гбайт HBM3, которая работает с пропускной способностью 3,35 Тбайт/с.

AMD уже начала выпуск пробных образцов Instinct MI300A. MI300X выйдет на эту фазу в третьем квартале. Оба ускорителя будут доступны клиентам в четвертом квартале.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).