Суперкомпьютер
FORSITE - HGX 8100AI

forsite_hgx_A100_03.jpg

Обзор продукта

Суперкомпьютер FORSITE - HGX 8100AI
на базе высокопроизводительных процессоров AMD EPYC™
и 8 графических ускорителей NVIDIA A100

Огромные наборы данных, большие модели и сложное моделирование требуют нескольких графических процессоров с быстрым интерконнектом и ускоренным программным стеком. Суперкомпьютерная платформа FORSITE HGX для задач ИИ обеспечивает все возможности GPU NVIDIA, NVIDIA® NVLink®, сетей NVIDIA InfiniBand, а также полностью оптимизированного программного стека NVIDIA для ИИ и HPC из каталога NVIDIA NGC™ для максимальной производительности приложений. Благодаря комплексной производительности и гибкости NVIDIA HGX позволяет исследователям и ученым объединять моделирование, анализ данных и ИИ для успеха научных исследований.


forsite_hgx_A100_04.jpg

До

8 GPU NVIDIA A100 80Гб

До

128 ядер 256 потоков

До

2048 Гб оперативной памяти

До

30 TBNVME SSD storage


Особенности продукта

Производительность в задачах HPC

HPC-приложения должны выполнять огромные объемы вычислений в секунду. Повышение вычислительной плотности каждого узла значительно сокращает число требуемых серверов, что приводит к серьезной экономии расходов, электроэнергии и пространства в дата-центре. Перемножение матриц большой размерности для моделирования требует постоянной передачи данных между множеством соседних процессоров, что делает конфигурацию GPU, объединенных интерфейсом NVIDIA NVLink, идеальным решением. Приложения для высокопроизводительных вычислений также могут использовать TF32 в A100 для достижения до 11 раз большей пропускной способности за четыре года для точных операций.

  • Новый уровень производительности,
    Системы Forsite HGX 4100AI на базе GPU A100 80GB обеспечивает увеличение пропускной способности в 2 раза по сравнению с A100 40GB 
  • Multi-Instance GPU (MIG)
    A100 80ГБ PCIe основан на архитектуре NVIDIA Ampere, которая поддерживает технологию Multi-Instance GPU (MIG) для ускорения небольших рабочих нагрузок, таких, как инференс. MIG позволяет HPC-системам уменьшать объем вычислений и объем памяти с гарантированным качеством сервиса.
  • Минимальная задержка доступа к данным на NVMe накопителях
    может справиться с жесткими рабочими нагрузками приложений с меньшими затратами на инфраструктуру, обеспечивая значительную экономию за счет увеличения количества операций ввода-вывода в секунду.
HGX_A100_8-GPU.png

Преимущества

Увеличенная производительность

Заказчики могут рассчитывать на увеличение производительности при выводе данных с помощью искусственного интеллекта в 30 раз по сравнению с предыдущими поколениями ускорителей на графических процессорах для определенных приложений с искусственным интеллектом.


HPC и вычисления для ИИ 

GPU NVIDIA A100 с тензорными ядрами обеспечивает непревзойденное ускорение для ИИ, анализа данных и HPC для решения самых сложных вычислительных задач.

FP64 - 156 терафлопс / TF32 2.5 петафлопса / FP16 5 петафлопсов / INT8 10 POPS

GPU память

До 640 ГБ GPU памяти в одном сервере. Ускорители  A100 80GB обладает самой быстрой в мире пропускной способностью памяти более 2 ТБ/с, что позволяет работать с крупными моделями и наборами данных.

Масштабирование

С помощью NVSwitch соединение NVLink можно расширить на несколько узлов, чтобы создать мультиузловой GPU-кластер с высокой пропускной способностью, который, по сути, будет представлять собой графический процессор величиной с дата-центр. 

NVLink

Технология NVIDIA® NVLink® четвертого поколения обеспечивает в 1,5 раза более высокую пропускную способность и улучшенную масштабируемость для конфигураций с несколькими графическими процессорами

Характеристики

Техническая информация

forsite_hgx_A100_03.jpg

Графический процессор:
8 GPU A100 80Gb SXM4

Доступный объем GPU памяти:
640 Гб

Центральный процессор:
Dual AMD Epic 7763, 128 ядер, 2450-3500 МГц

Системная память:
Тб (до 4 ТБ)

Сетевое подключение:
карты адаптера X-6 VPI, HDR IB (200 Гбит/с) и 200GbE, двухпортовые порты локальной сети 2 x 1 Гбит/с (Intel ® I350)

Управление:
1 x выделенный порт управления

Хранения данных ОC:
2 х 1920 Гб, SSD, U.2, NVMe

Внутренняя память:
30 Тб (4 x 7680 Гб) SSD, U.2, NVMe

Блок питания:
Резервный блок питания 80 PLUS Platinum мощностью 3000 Вт

Программное обеспечение:
ОС Ubuntu Linux