> > > > Occamy – эффективный европейский процессор с 432 ядрами RISC V

Occamy – эффективный европейский процессор с 432 ядрами RISC V

Опубликовано:

hardwareluxx news newНа конференции DATE (Design, Automation and Test in Europe) специалисты ETH Zurich и Болонского университета вместе с разработчиками платформ и партнерами, такими как PULP (Parallel Ultra-Low Power), GlobalFoundries, Rambus, Micron, Synopsys и Avery, представили Occamy – процессор HPC в дизайне чиплетов с 432 ядрами RISC-V.

Occamy состоит из двух вычислительных чиплетов, каждый с 217 ядрами. Одно из ядер выделено под управление, поэтому за вычисления отвечают остальные 2x 216 ядер. На частоте 1 ГГц заявлена вычислительная производительность 768 GFLOPS с двойной точностью (FP64). Что не так много, поскольку тот же ускоритель NVIDIA H100, например, уже дает 34 TFLOPS без ядер Tensor, а с ними – 67 TFLOPS. То есть примерно в 90 раз больше.

Однако ускорители H100 потребляют до 700 Вт мощности, в случае же Occamy она намного ниже – всего 20 Вт (2x 10 Вт на чиплет Occamy), то есть в 35 раз меньше. Столь невысокая мощность позволяет охлаждать чип пассивно.

Весьма интересна история производства корпусировки. Разработка началась в апреле 2021, первые пробные чиплеты (tape out) были получены в июле 2022. Подложку же впервые выпустили 15 октября 2022, и сразу успешно.

PCB корпусировки имеет размер 52,5 x 45 мм. Подложка, на которой установлены два чиплета Occamy и память HBM2E, названа Hedwig – в честь снежной совы Хедвиг из вселенной Гарри Поттера. Пассивная подложка изготавливается по 65-нм техпроцессу на заводах GlobalFoundries и имеет площадь 26,3 x 23,05 мм.

Чиплеты Occamy тоже изготавливаются на мощностях GlobalFoundries по 12-нм техпроцессу GF12LPP, оптимизированному под низкое энергопотребление. Это самый передовой техпроцесс, доступный GlobalFoundries. Каждый чиплет Occamy дополняется чипом памяти 16 Гбайт HBM2E. Пассивная подложка 2.5D обеспечивает связь чиплетов с памятью HBM2E. Для этого используются 850 соединений между чиплетами и HBM2E. Два чиплета Occamy соединяются 600 линиями.

Occamy можно назвать процессором HPC, который предназначен для вычислений с высокой точностью при низком энергопотреблении. Он не ориентирован на пиковую производительность, в приоритете эффективность и масштабируемость. Теперь остается построить экосистему из платформы и программного обеспечения. Платформа PULP как раз разрабатывается порядка десяти лет. Но пока неизвестно, когда процессоры выйдут на рынок.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).