На вчерашнем мероприятии "Data Center and AI Technology Premiere" AMD представила несколько новых продуктов. В начале мероприятия AMD поделилась успехом нынешнего поколения Genoa, которое используется в качестве процессоров общего назначения в AWS.
Но перейдем к новостям. Были представлены долгожданные процессоры EPYC на дизайне Bergamo – серверные CPU на адаптированных ядрах Zen 4c, которые устанавливаются в сокет SP5. На прошлой неделе мы уже опубликовали новость, где описали изменения, которые AMD внесла по сравнению с обычными процессорами Genoa (Zen 4). В частности, AMD внесла следующие изменения:
- Урезала в два раза кэш L3 в Core Complex (CCX) с 32 до 16 Мбайт
- На каждом CCD теперь работают два CCX с восемью ядрами
- Убрала соединения TSV для подключения дополнительного кэша 3D V-cache
- Оптимизировала дизайн под меньшие частоты, что позволило обойтись меньшим числом транзисторов
- Новые ячейки 6T SRAM
Благодаря описанным мерам, AMD смогла урезать площадь ядра на 35%. В результате ядро Zen 4c занимает площадь 2,48 мм², а ядро Zen 4 – 3,84 мм².
Число ядер на сокет увеличилось до 128, при этом и сами ядра, и процессор в целом работают более эффективно. Конечно, вряд ли на Bergamo стоит запускать приложения, которые выигрывают от высоких тактовых частот процессоров Genoa или большего кэша. Здесь как раз помогут процессоры Genoa-X с кэшем 3D V-Cache, к которым мы вернемся чуть позже.
Изначально AMD выпустит три процессора Bergamo:
Модель | Ядра/ потоки | Базовая частота/ Boost | Кэш L3 | TDP |
EPYC 9754 | 128 / 256 | 2,25 / 3,1 ГГц | 256 Мбайт | 360 Вт |
EPYC 9754S | 128 / 128 | 2,25 / 3,1 ГГц | 256 Мбайт | 360 Вт |
EPYC 9734 | 112 / 224 | 2,2 / 3,0 ГГц | 256 Мбайт | 360 Вт |
Процессоры Bergamo предлагают 128 и 112 ядер. SMT в случае EPYC 9754S выключен, что может дать преимущество в некоторых сценариях.
Оппонентом процессоров Bergamo станут Sierra-Forrest E-Core Xeon, которые Intel представит в следующем году.
Genoa-X с кэшем 3D V-cache
Как и ожидалось, на рынок вышли процессоры Genoa с дополнительным кэшем 3D V-Cache под названием Genoa-X. Анонсированы четыре модели, содержащие от 16 до 96 ядер. Такой процессор содержит 12 CCD c 96 Мбайт кэша L3 каждый, что в сумме дает 1.152 Мбайт кэша L3 – больше гигабайта.
Процессоры Genoa-X покажут преимущества в тех сценариях, где данные получится уместить в крупном кэше, чтобы к ним был максимально быстрый доступ. Помимо инструментов EDA, здесь можно упомянуть различные симуляции и вычисления HPC.
Модель | Ядра | Базовая частота/ Boost | Кэш L3 | TDP |
EPYC 9684X | 96 | 2,25 / 3,7 ГГц | 1.152 Мбайт | 400 Вт |
EPYC 9384X | 32 | 3,1 / 3,9 ГГц | 768 Мбайт | 320 Вт |
EPYC 9184X | 16 | 3,55 / 4,2 ГГц | 768 Мбайт | 320 Вт |
Microsoft в рамках Azura предложила первые облачные инстанции на Genoa-X (HBv4 и HX VMs).
CPU освобождаются от сетевых задач
Все крупные игроки рынка поняли, что вычислительная производительность дата-центров больше не сводится только к процессорам и ускорителям. Сеть начинает играть все более важную роль. NVIDIA, например, приобрела израильскую компанию Mellanox. AMD тоже не осталась в стороне и купила сетевого специалиста Pensando некоторое время назад.
Сетевые ускорители, которые производители называют DPU, IPU или как-то иначе, используются во многих сферах. Вчера AMD представила D4 DPU. Вместе с умными NIC и коммутаторами сетевые ускорители смогут взять на себя порядка 30% вычислительной нагрузки от CPU благодаря тому, что центральному процессору теперь не требуется управлять сетевыми функциями.
Потенциал ИИ оценивается в $150 млрд.
Конечно, AMD не хочет оставаться в стороне от модной тенденции искусственного интеллекта. Суперкомпьютеры на компонентах AMD сегодня работают, в том числе, и над тренировкой больших языковых моделей LLM. Хотя сильнее всего в данной сфере выигрывает NVIDIA. AMD оценивает объем этого рынка в $150 млрд. и, конечно, хочет «отъесть» свою долю.
Ускорители Instinct MI300A уже были представлены на выставке CES 2023. AMD впервые предложила ускорители на основе APU, которые сочетают 24 ядра Zen 4 с вычислительными чиплетами на основе CDNA-3. Чиплеты производятся по 5- и 6-нм техпроцессам. В корпусировке используется 13 чиплетов: 3x Zen 4 и 10x CDNA 3. Причем для ядер CPU и блоков CDNA-3 доступны 128 Гбайт памяти HBM3. Сложность чипа составляет порядка 146 млрд. транзисторов. Для сравнения, у H100 GPU от NVIDIA содержится 80 млрд. транзисторов. А у Intel Ponte Vecchio – более 100 млрд.
Еще один ускоритель Instinct под названием MI300X отличается тем, что AMD удалила три чиплета Zen-4 и установила вместо них два чиплета CDNA-3. В итоге в корпусировке работают 12 чиплетов CDNA-3, содержащие 153 млрд. транзисторов. Объем памяти HBM3 был увеличен до 192 Гбайт. Пропускная способность памяти составляет 5,2 Тбайт/с. Опять же, если сравнить с NVIDIA: ускоритель H100 оснащен 80 Гбайт HBM3, которая работает с пропускной способностью 3,35 Тбайт/с.
AMD уже начала выпуск пробных образцов Instinct MI300A. MI300X выйдет на эту фазу в третьем квартале. Оба ускорителя будут доступны клиентам в четвертом квартале.
Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).