GTC 25 и Blackwell Ultra, а также Rubin: в середине марта нас ждут новые подробности

hardwareluxx news new

Сегодня, в рамках последних результатов MLPerf, представили первые независимые бенчмарки производительности обучения ускорителя B200 от NVIDIA. Гигант в области искусственного интеллекта уже говорил в этом году о преемниках Blackwell Ultra и Rubin, но на GTC 2025 можно ожидать больше подробностей. Теперь известна официальная дата проведения GTC: с 17 по 20 марта 2025 года в Сан-Хосе — примерно в тот же период и в том же месте, что и в этом году.

В последнее время NVIDIA неоднократно заявляла, что только с ежегодным циклом обновлений можно удовлетворить потребности сегмента ИИ. Ускоритель H200 быстро последовал за H100, а ускорители Blackwell — B200 и GB200 — сейчас поставляют во всё больших объёмах. В начале 2025 года объёмы поставок должны составить несколько сотен тысяч штук в квартал.

NVIDIA теперь разрабатывает и производит многое самостоятельно: от чипов-ускорителей до чипов NVLink для сверхбыстрых межсоединений, а также чипов Quantum, Connect-X и Spectrum для InfiniBand и Ethernet. Текущий продуктовый портфель для Blackwell уже огромен, и для следующего поколения Blackwell Ultra его оставят прежним. Для последующего поколения Rubin планируют целый ряд новых сетевых чипов и чипов межсоединений.

С выходом Blackwell Ultra NVIDIA будет опираться на существующую архитектуру Blackwell, но оснастит GPU большим объёмом памяти — предполагается 288 ГБ HBM3E. Скорость памяти и пропускная способность межсоединений, вероятно, не изменятся.

Такие изменения планируют только с приходом Rubin. Шестое поколение межсоединения NVLink достигнет скорости 1,8 ТБ/с в каждом направлении. В то время как для Superchip Hopper и Blackwell используют CPU Grace, для Rubin будут добавлять новый процессор под названием Vera. Таким образом, за GB200 (Grace Hopper) последует VR200 (Vera Rubin). Кроме того, появятся новые CX9 SuperNIC со скоростью 1,6 Тбит/с на порт и коммутаторы Spectrum X1600 Ethernet/InfiniBand также со скоростью 1,6 Тбит/с на порт.

Кроме того, Rubin, по-видимому, будет использовать HBM4 с восемью стеками памяти. Обновление Rubin Ultra планируют на 2026 год.

Сравнение ускорителей
RubinB200H200
Техпроцесс-4 нм4 нм
Производительность FP64-40 TFLOPS67 TFLOPs
Производительность FP32-80 TFLOPS67 TFLOPs
Производительность TF32-2.200 TFLOPS989 TFLOPs
Произодительность BFLOAT16/FP16-4.500 TFLOPS1.979 TFLOPS
Производительность FP8/INT8-9.000 TFLOPS3.958 TFLOPS
Производительность FP4-18 PFLOPS-
Память288 GBHBM3E8 Тбайт/с192 GBHBM3E8 Тбайт/с141 GBHBM34,8 Тбайт/с
ИнтерконнектNVLink3,6 Тбайт/сNVLink1,8 Тбайт/сNVLink900 Гбайт/с
PCI Express-6.05.0
Данные о правообладателе фото и видеоматериалов взяты с сайта «HardwareLUXX Russia», подробнее в Правилах сервиса