Сегодня, в рамках последних результатов MLPerf, представили первые независимые бенчмарки производительности обучения ускорителя B200 от NVIDIA. Гигант в области искусственного интеллекта уже говорил в этом году о преемниках Blackwell Ultra и Rubin, но на GTC 2025 можно ожидать больше подробностей. Теперь известна официальная дата проведения GTC: с 17 по 20 марта 2025 года в Сан-Хосе — примерно в тот же период и в том же месте, что и в этом году.
В последнее время NVIDIA неоднократно заявляла, что только с ежегодным циклом обновлений можно удовлетворить потребности сегмента ИИ. Ускоритель H200 быстро последовал за H100, а ускорители Blackwell — B200 и GB200 — сейчас поставляют во всё больших объёмах. В начале 2025 года объёмы поставок должны составить несколько сотен тысяч штук в квартал.
NVIDIA теперь разрабатывает и производит многое самостоятельно: от чипов-ускорителей до чипов NVLink для сверхбыстрых межсоединений, а также чипов Quantum, Connect-X и Spectrum для InfiniBand и Ethernet. Текущий продуктовый портфель для Blackwell уже огромен, и для следующего поколения Blackwell Ultra его оставят прежним. Для последующего поколения Rubin планируют целый ряд новых сетевых чипов и чипов межсоединений.
С выходом Blackwell Ultra NVIDIA будет опираться на существующую архитектуру Blackwell, но оснастит GPU большим объёмом памяти — предполагается 288 ГБ HBM3E. Скорость памяти и пропускная способность межсоединений, вероятно, не изменятся.
Такие изменения планируют только с приходом Rubin. Шестое поколение межсоединения NVLink достигнет скорости 1,8 ТБ/с в каждом направлении. В то время как для Superchip Hopper и Blackwell используют CPU Grace, для Rubin будут добавлять новый процессор под названием Vera. Таким образом, за GB200 (Grace Hopper) последует VR200 (Vera Rubin). Кроме того, появятся новые CX9 SuperNIC со скоростью 1,6 Тбит/с на порт и коммутаторы Spectrum X1600 Ethernet/InfiniBand также со скоростью 1,6 Тбит/с на порт.
Кроме того, Rubin, по-видимому, будет использовать HBM4 с восемью стеками памяти. Обновление Rubin Ultra планируют на 2026 год.
Rubin | B200 | H200 | |
Техпроцесс | - | 4 нм | 4 нм |
Производительность FP64 | - | 40 TFLOPS | 67 TFLOPs |
Производительность FP32 | - | 80 TFLOPS | 67 TFLOPs |
Производительность TF32 | - | 2.200 TFLOPS | 989 TFLOPs |
Произодительность BFLOAT16/FP16 | - | 4.500 TFLOPS | 1.979 TFLOPS |
Производительность FP8/INT8 | - | 9.000 TFLOPS | 3.958 TFLOPS |
Производительность FP4 | - | 18 PFLOPS | - |
Память | 288 GBHBM3E8 Тбайт/с | 192 GBHBM3E8 Тбайт/с | 141 GBHBM34,8 Тбайт/с |
Интерконнект | NVLink3,6 Тбайт/с | NVLink1,8 Тбайт/с | NVLink900 Гбайт/с |
PCI Express | - | 6.0 | 5.0 |