Microsoft наращивает мощь Azure для ИИ и HPC с NVIDIA Blackwell и AMD EPYC

Всё для ИИ, так уж сейчас принято у IT-гигантов.

Microsoft на конференции Ignite представила мощное обновление своих вычислительных платформ Azure для задач искусственного интеллекта и высокопроизводительных вычислений (HPC). Компания сделала ставку на интеграцию передовых решений от NVIDIA и AMD.

В стремлении укрепить лидерство в области облачных сервисов для ИИ, Microsoft заключила партнёрство с NVIDIA для внедрения её новейшей архитектуры Blackwell в платформу Azure. Результатом сотрудничества стала виртуальная машина Azure ND GB200 V6 — первая в линейке Microsoft, построенная на базе Blackwell. Каждый сервер ND GB200 V6 оснащён двумя суперчипами NVIDIA Grace Blackwell GB200. В свою очередь, каждый суперчип содержит пару высокопроизводительных графических процессоров Blackwell и CPU Grace, объединённых интерфейсом NVLink. Благодаря многочисленным NVLink-мостам, Microsoft может объединить до 18 вычислительных серверов в единую платформу, предоставляя доступ к 72 GPU Blackwell.

Масштабируемость системы обеспечивается технологией InfiniBand от NVIDIA. Сейчас Azure ND GB200 V6 проходит закрытое тестирование, но вскоре Microsoft обещает открыть доступ к платформе более широкому кругу пользователей. Помимо этого, Microsoft анонсировала Azure HBv5 — виртуальную машину, ориентированную на ресурсоёмкие HPC-приложения с высокой потребностью в пропускной способности памяти. В основе HBv5 лежат процессоры AMD EPYC 4-го поколения, специально разработанные для достижения максимальной эффективности.

Вот подробные характеристики Azure HBv5:

  • Пропускная способность памяти 6,9 ТБ/с (STREAM Triad) при объёме 400–450 ГБ ОЗУ (HBM3)
  • До 9 ГБ памяти на ядро (настраивается пользователем)
  • До 352 ядер AMD EPYC “Zen4” с пиковой частотой 4 ГГц (настраивается пользователем)
  • Удвоенная общая пропускная способность Infinity Fabric для процессоров, как и на любой другой серверной платформе AMD EPYC на сегодняшний день
  • SMT отключен, конструкция только для одного клиента (1 виртуальная машина на сервер)
  • 800 Гбит/с NVIDIA Quantum-2 InfiniBand, сбалансировано как 200 Гбит/с на процессорный SoC
  • Azure VMSS Flex для масштабирования MPI-нагрузок до сотен тысяч ядер с поддержкой HBM
  • 160 Гбит/с Azure Accelerated Networking через Azure Boost NIC второго поколения
  • 14 ТБ локального NVMe SSD со скоростью чтения до 50 ГБ/с и записи до 30 ГБ/с

Microsoft отмечает 20-кратный прирост производительности Azure HBv5 по сравнению с предыдущим поколением. Этот факт подтверждает лидирующие позиции AMD EPYC на рынке серверных решений. Расширение портфеля Azure за счёт передовых технологий NVIDIA и AMD позволит Microsoft удовлетворить растущий спрос на решения в области искусственного интеллекта и высокопроизводительных вычислений.

Данные о правообладателе фото и видеоматериалов взяты с сайта «Overclockers.ru», подробнее в Правилах сервиса