Графические ускорители NVIDIA T4 и библиотеки GPU-ускорения CUDA-X повышают производительность основных серверов, разработанных для современных дата-центров. Благодаря валидации NGC-Ready серверы позволяют успешно выполнять любые рабочие задачи. Дополнительные услуги службы поддержки NVIDIA NGC обеспечивают комфортную работу. Благодаря NVIDIA T4 IT-команды могут создавать стандартные инфраструктуры дата-центров с графическим ускорением на базе ведущих серверов.
Рост производительности и продуктивности
с одной ускоренной платформой
33%
Прирост производительности работы VDI до 33 %*
35x
Тренировка алгоритмов машинного обучения до 35 раз быстрее
10x
Тренировка алгоритмов глубокого обучения до 10 раз быстрее
40x
Получение результатов инференса глубокого обучения до 40 раз быстрее
VDI: ПО GRID vPC протестировано на сервере с двумя процессорами Intel Xeon Gold 6148 (20 ядер, тактовая частота 2,4 ГГц), GRID vPC с T4-1B (64 VM), VMware ESXi 6.7, NVIDIA vGPU Software (410.91/412.16), Windows 10 (1803), 2 vCPU, 4 Гб памяти RAM, разрешение 1920x1080, один монитор, опыт пользователя на VMware Horizon 7.6 был оценен с помощью инструмента NVIDIA для тестирования производительности в приложениях для офисных задач: Microsoft PowerPoint, Word, Excel, Chrome, просмотр PDF-файлов и воспроизведение видео.
Машинное обучение: Серверные узлы (61 Гб памяти, 8 vCPU, платформа 64-бит), Apache Spark. Набор данных в CSV-файле 200 Гб; Подготовка данных включает в себя объединение, трансформацию переменных. Конфигурация сервера на GPU: двухпроцессорный Xeon E5-2698 v4 с тактовой частотой 3,6 ГГц, 20 ускорителей T4 на 5 узлах (4 ускорителя Т4 на узел). Выполнено в сети InfiniBand. Этапы обработки данных на CPU для XGBoost и конвертация данных оцениваются на основе измеренных данных для 20 серверных узлов и уменьшении времени выполнения до 60 % для нормализации при тренировке на наборе данных меньшего размера на Т4.
Тренировка и инференс алгоритмов глубокого обучения: графический процессор: двухпроцессорный Xeon E5-2698 v4 с тактовой частотой 3,6 ГГц. Серверы на GPU: 2 ускорителя T4 для тренировки, 1 ускоритель T4 для инференса, контейнер NGC 18.11-py3 с CUDA 10.0.130; NCCL 2.3.7, cuDNN 7.4.1.5; cuBLAS 10.0.130 | драйвер NVIDIA: 384.145.
Существенное ускорение машинного обучения
Хотя глубокое обучение применяется в мире ИИ-технологий относительно недавно, компании уже десятилетиями используют алгоритмы машинного обучения для извлечения информации из массивов данных. Дата-центр на базе NVIDIA T4 позволяет ускорять эти алгоритмы с помощью RAPIDS, открытых библиотек GPU-ускорения для подготовки данных и машинного обучения. Используя привычные программные инструменты, например, Python, T4 ускоряет машинное обучение до 35 раз по сравнению с сервером на базе процессора, в том числе алгоритмы XGBoost, PCA, K-means, k-NN, DBScan и tSVD.
Непревзойденное ускорение инференса ИИ с тензорными ядрами Turing
Графический ускоритель NVIDIA T4 создан на базе революционной технологии NVIDIA Turing™ с тензорными ядрами для инференса искусственного интеллекта при вычислениях с многократной точностью. Обеспечивая невероятную скорость вычислений всех типов, от FP32 и FP16 до INT8 и INT4, T4 повышает производительность инференса до 40 раз по сравнению с серверами на CPU. А в процессах обучения один сервер с двумя ускорителями T4 заменяет девять двухпроцессорных серверов.
Разработчики могут задействовать все возможности тензорных ядер Turing, используя программные библиотеки NVIDIA CUDA-X AI и интеграцию со всеми фреймворками искусственного интеллекта. Библиотеки CUDA-X созданы на основе CUDA, модели параллельного программирования NVIDIA, и содержат оптимизации для вычислительных требований искусственного интеллекта, автономных устройств, высокопроизводительных вычислений и графики.
Ускорение работы в VDI
Основные серверы на базе NVIDIA T4 сертифицированы нашими партнерами для виртуальных GPU, что позволяет пользователям комфортно работать в VDI из любой точки и на любых устройствах. Для всех специалистов, начиная от удаленных и офисных сотрудников и заканчивая дизайнерами и инженерами, T4 в сочетании с ПО NVIDIA Virtual GPU: NVIDIA GRID® Virtual PC (GRID vPC) и NVIDIA Quadro® Virtual Data Center Workstation (Quadro vDWS) обеспечивает прирост производительности работы в VDI до 33 % по сравнению с инфраструктурой только на CPU.
Сертифицированные серверы с поддержкой NGC
Оптимизация ПО для максимальной производительности требует глубоких знаний нескольких уровней ПО: от операционных систем и драйверов до библиотек, фреймворков и приложений. Контейнеры NGC предварительно настроены и оптимизированы для вычислений на GPU. Они предоставляют прямую связь с экспертами NVIDIA и поддержку для фреймворков глубокого обучения с ускорением на GPU, библиотек RAPIDS, NVIDIA TensorRT™ и более чем 600 приложений для высокопроизводительных вычислений.
Благодаря программе NVIDIA по распространению NGC производители серверов могут внедрять контейнеры NGC на своих системах. Серверы с поддержкой NGC позволяют менеджерам дата-центров легко устанавливать серверы на базе GPU для быстрой и успешной работы со множеством ускоренных приложений.