> > > > DGX GH200 – NVIDIA представила модули Grace Hopper для суперкомпьютеров

DGX GH200 – NVIDIA представила модули Grace Hopper для суперкомпьютеров

Опубликовано:

hardwareluxx news newНа конференции ISC, которая прошла на прошлой неделе, NVIDIA анонсировала новый суперкомпьютер с чипами "Grace CPU Superchip", причем в этом году планируется собрать несколько подобных систем. Чипы "Grace CPU Superchip" и "Grace Hopper Superchip" знаменуют новое поколение суперкомпьютеров, которые будут усиливаться дискретными ускорителями, такими как GH100.

Но NVIDIA предлагает и модульную конструкцию подобных систем на основе DGX и DGX Superpod, что позволяет масштабировать суперкомпьютер до нескольких тысяч GPU. Сейчас NVIDIA представила модули DGX GH200, содержащие "Grace Hopper Superchip". Если быть более точным, модуль DGX GH200 содержит 256 "Grace Hopper Superchip", 144 Тбайт унифицированной памяти, пропускная способность системы составляет 128 Тбайт/с, также используются 32 коммутатора NVLink. Вычислительная производительности ИИ модуля DGX GH200 составляет be 1 ExeFLOPS.

Из DGX GH200 как в конструкторе можно собирать суперкомпьютеры для вычислений ИИ, чем планируют воспользоваться крупные облачные провайдеры. NVIDIA упоминает Meta, Google и Microsoft. Системы DGX GH200 будут доступны ближе к концу года. А чипы "Grace CPU Superchip" и "Grace Hopper Superchip" уже массово производятся.

С помощью чипов GH200 NVIDIA планирует ускорить приложения, которые сегодня почти полностью работают на GPU. Кроме того, с системами DGX H100 NVIDIA столкнулась с ограничениями пропускной способности памяти, которая существенно увеличена с новыми DGX GH200.

NVIDIA указывает, что на GH200 Superchip подобные приложения работают, как минимум, в два раза быстрее, чем на системе x86 с ускорителем H100.

Новые суперкомпьютеры ИИ и HPC на NVIDIA Superchip

Поскольку в Тайбэе открылась конференция Computex, без политики не обошлось. Был анонсирован суперкомпьютер Taipei 1 для вычислений ИИ на основе 64 DGX H100 и такого же числа систем OVX. Вычислительная производительность составляет 2 AI ExaFLOPS. Система Taipei 1 была построена NVIDIA, она же отвечает и за обслуживание. Доступ к суперкомпьютеру будет предоставлен исследовательским институтам острова. Суперкомпьютер Taiwania 4, с другой стороны, опирается на чипы "Grace CPU Superchips", он обеспечит 300 TFLOPS производительности HPC.

Благодаря архитектуре MGX, производители серверов смогут быстрее реагировать на изменения компонентов. Архитектура MGX позволяет использовать NVIDIA GPU, Grace CPU и DPU в разных сочетаниях и конфигурациях. Что позволяет гибко адаптировать систему под нужды клиента.

NVIDIA вновь подчеркнула важность быстрых сетевых интерфейсов. Покупка Mellanox значительно усилила компетенцию NVIDIA в этой сфере, ассортимент продуктов компании расширился коммутаторами Spectrum-X. В частности, представлены коммутаторы Spectrum 4 Ethernet (64x порта 800G или 128x порта 400G, суммарная пропускная способность 51,2 Тбайт/с).

Другие (маленькие) новости

Помимо новых компонентов HPC и AI, NVIDIA также представила ACE.

NVIDIA ACE – платформа с искусственным интеллектом, предназначенная для игровых разработчиков. В платформу встроены компоненты NeMo и Omniverse. Причем суть здесь не в генерации персонажей или 3D-объектов, а в «оживлении» мира с помощью искусственного интеллекта. Например, достаточно указать определенные черты характера персонажа и сюжет, после чего диалоги будет формировать ChatGPT.

В следующем году будет представлена новая архитектура и чипы "Hopper Next". Чипы Hopper (GH100) производятся с октября 2022, скоро из как раз заменят "Hopper Next".