Вчера NVIDIA анонсировала еще один вариант вычислительного модуля GB200 — односерверное решение GB200 NVL4. GB200 NVL4 содержит два Grace CPU и четыре Blackwell GPU. На выставке Computex NVIDIA уже представила вариант GB200 NVL2 с двумя Grace CPU и двумя GPU Blackwell, а также готовые стоечные решения GB200 NVL36 и GB200 NVL72. Цифра после обозначения «NVL» указывает количество графических процессоров, работающих вместе в домене NVLink.
Коллега Патрик Кеннеди из ServeTheHome сообщил, что, по всей видимости, производители оборудования в последний момент изменили экспозицию на Supercomputing 24. Судя по всему, выставлять стойки на базе дизайна GB200 NVL36×2 больше не планируют. Еще в начале октября аналитик по цепочкам поставок Минг-Чи Куо сообщил, что NVIDIA прекратила разработку дизайна GB200 NVL36×2.
До сих пор NVIDIA официально не комментировала этот вопрос. Однако такие краткосрочные изменения в ассортименте довольно необычны, особенно когда они затрагивают выставочные стенды. Кеннеди, основываясь на заявлениях OEM-производителей, считает, что спрос покупателей на дизайн GB200 NVL36×2 оказался низким.
GB200 NVL36 и GB200 NVL72 по-прежнему доступны в виде одностоечных решений. Всего несколько дней назад появилась информация, что NVIDIA совместно с OEM-производителями столкнулась с трудностями в обеспечении достаточного охлаждения стоек NVL72. Ведь речь идет о потребляемой мощности в 120 кВт на стойку. У GB200 NVL36 она составляет примерно половину.
GB200 NVL36×2 распределяет вычислительную мощность дизайна GB200 NVL72 между двумя стойками. Однако интерес заказчиков к этому решению, по-видимому, оказался низким. С одной стороны, стойки GB200 NVL72 создают огромные проблемы для инфраструктуры дата-центра из-за их энергопотребления, охлаждения и веса. С другой стороны, заказчикам в любом случае приходится создавать собственную инфраструктуру дата-центра для дизайна GB200 NVL72. Поэтому имеет смысл сразу перейти на GB200 NVL72 вместо GB200 NVL36×2.
Если отмену дизайна GB200 NVL36×2 подтвердят, это будет еще одним ударом по не совсем планомерному внедрению GPU Blackwell. В августе стало известно, что в GPU Blackwell обнаружили дефект дизайна, который приводил к крайне низкому выходу годных чипов. NVIDIA совместно с TSMC устранила эту проблему, но потребовались новые маски для литографии, что задержало запуск финальной версии.
С середины октября NVIDIA поставляет первые системы Blackwell своим крупным клиентам, таким как OpenAI, Microsoft и Google, включая GB200 NVL72. Однако массовое производство чрезвычайно сложных стоечных систем ожидается не раньше первой половины 2025 года.
Количество стоек | Количество Grace CPU | Количество Blackwell GPU | Потребляемая мощность | |
GB200 NVL72 | 1 | 36 | 72 | 120 kW |
GB200 NVL36×2 | 2 | 36 | 72 | 120 kW |
GB200 NVL32 | 1 | 18 | 36 | 50 kW |
GB200 NVL4 | Односерверное решение | 2 | 4 | 5,4 kW |
GB200 NVL2 | Односерверное решение | 2 | 2 | 2,7 kW |