Всё для ИИ, так уж сейчас принято у IT-гигантов.
Microsoft на конференции Ignite представила мощное обновление своих вычислительных платформ Azure для задач искусственного интеллекта и высокопроизводительных вычислений (HPC). Компания сделала ставку на интеграцию передовых решений от NVIDIA и AMD.
В стремлении укрепить лидерство в области облачных сервисов для ИИ, Microsoft заключила партнёрство с NVIDIA для внедрения её новейшей архитектуры Blackwell в платформу Azure. Результатом сотрудничества стала виртуальная машина Azure ND GB200 V6 — первая в линейке Microsoft, построенная на базе Blackwell. Каждый сервер ND GB200 V6 оснащён двумя суперчипами NVIDIA Grace Blackwell GB200. В свою очередь, каждый суперчип содержит пару высокопроизводительных графических процессоров Blackwell и CPU Grace, объединённых интерфейсом NVLink. Благодаря многочисленным NVLink-мостам, Microsoft может объединить до 18 вычислительных серверов в единую платформу, предоставляя доступ к 72 GPU Blackwell.
Масштабируемость системы обеспечивается технологией InfiniBand от NVIDIA. Сейчас Azure ND GB200 V6 проходит закрытое тестирование, но вскоре Microsoft обещает открыть доступ к платформе более широкому кругу пользователей. Помимо этого, Microsoft анонсировала Azure HBv5 — виртуальную машину, ориентированную на ресурсоёмкие HPC-приложения с высокой потребностью в пропускной способности памяти. В основе HBv5 лежат процессоры AMD EPYC 4-го поколения, специально разработанные для достижения максимальной эффективности.
Вот подробные характеристики Azure HBv5:
- Пропускная способность памяти 6,9 ТБ/с (STREAM Triad) при объёме 400–450 ГБ ОЗУ (HBM3)
- До 9 ГБ памяти на ядро (настраивается пользователем)
- До 352 ядер AMD EPYC “Zen4” с пиковой частотой 4 ГГц (настраивается пользователем)
- Удвоенная общая пропускная способность Infinity Fabric для процессоров, как и на любой другой серверной платформе AMD EPYC на сегодняшний день
- SMT отключен, конструкция только для одного клиента (1 виртуальная машина на сервер)
- 800 Гбит/с NVIDIA Quantum-2 InfiniBand, сбалансировано как 200 Гбит/с на процессорный SoC
- Azure VMSS Flex для масштабирования MPI-нагрузок до сотен тысяч ядер с поддержкой HBM
- 160 Гбит/с Azure Accelerated Networking через Azure Boost NIC второго поколения
- 14 ТБ локального NVMe SSD со скоростью чтения до 50 ГБ/с и записи до 30 ГБ/с
Microsoft отмечает 20-кратный прирост производительности Azure HBv5 по сравнению с предыдущим поколением. Этот факт подтверждает лидирующие позиции AMD EPYC на рынке серверных решений. Расширение портфеля Azure за счёт передовых технологий NVIDIA и AMD позволит Microsoft удовлетворить растущий спрос на решения в области искусственного интеллекта и высокопроизводительных вычислений.