NVIDIA B300: на 50% больше производительности благодаря новому чипу Blackwell

В ближайшие месяцы NVIDIA значительно увеличит поставки ускорителей искусственного интеллекта, построенных на архитектуре Blackwell. Компания устранила начальные проблемы с производством GPU Backwell и наладила выпуск решений (B200 HGX, GB200, GB200 NVL72 и другие) в четвертом квартале 2024 года.

Хотя 2025 год станет годом Blackwell, крупные клиенты, такие как Microsoft, Meta, Amazon, xAI, Google, Tencent и ByteDance, уже закупили почти 2 миллиона ускорителей Hopper в 2024 году. NVIDIA планирует переключить поставки с Hopper на Blackwell в ближайшие месяцы.

Компания пока не способна выпускать Blackwell в больших объемах, но уже обсуждает следующую версию — Blackwell Ultra (B300). Как и с Hopper H100 и H200, NVIDIA намерена перейти с 8-Hi на 12-Hi HBM3E для B300, увеличив объем памяти с 192 до 288 ГБ. Однако, по данным SemiAnalysis, NVIDIA готовит дополнительные улучшения.

GPU B300 получил совершенно новый процесс Tape Out, но по-прежнему производится на мощностях TSMC по техпроцессу 4NP . Эта модернизация потребовалась из-за изменений в дизайне по сравнению с предыдущей версией GPU Blackwell. По предварительным данным, GPU B300 с двумя оптимизированными Blackwell GPU увеличивает вычислительную мощность на 50% по сравнению с GPU B200.

Увеличение производительности стало возможным благодаря нескольким улучшениям. NVIDIA подняла TDP с 1.000 до 1.200 Вт для версии HGX и с 1.200 до 1.400 Вт для варианта GB с Grace CPU. Основной прирост производительности обеспечивают изменения в архитектуре Blackwell и доработка GPU. Однако компания пока не раскрыла подробностей. Более масштабные изменения невозможны из-за ограничений EUV-литографии, так как площадь чипов уже превышает 800 мм².

GB300 объединяет два GPU Blackwell с Grace CPU и опирается на оптимизированное распределение мощности между GPU и CPU. Объем памяти HBM3E 288 ГБ работает с прежней пропускной способностью 8 ТБ/с на каждый GPU. Это увеличение объема памяти с 192 до 288 ГБ особенно помогает в задачах Reasoning Model Inference.

Ранее NVIDIA размещала два GPU Blackwell, Grace CPU и LPDDR5X на одной плате. Партнеры Wistrom и FII выпускали платы GB200 Bianca в готовом виде, затем OEM и ODM приобретали полностью завершенные решения.

Эталонная плата GB300 включает два модуля, каждый из которых содержит два GPU B300 и процессор Grace. NVIDIA перешла на память LPCAMM для Grace CPU, Micron как раз поставляет соответствующие модули, которые устанавливают рядом с Grace CPU. Вместо интеграции GPU Blackwell на плату NVIDIA использует модуль SXM7, который размещается на плате GB300. Компания FII производит SXM7, а OEM и ODM могут приобретать модуль для использования на собственных платах GB300. NVIDIA передала OEM и ODM возможность проектировать и изготавливать VRM-область самостоятельно.

NVIDIA оснащает ускоритель GB300 сетевой картой ConnectX-8 с пропускной способностью 800 Гбит/с, что вдвое превышает показатели ConnectX-7. Новая сетевая карта использует 48 линий PCI Express вместо 32, как у предшественника.

Гибкость в производстве

NVIDIA сделала ускорители B300 и GB300 более привлекательными, улучшив гибкость в производстве. Ранее компания опиралась на ограниченное число поставщиков для ключевых компонентов, что заставляло даже крупных OEM и ODM соблюдать жесткие спецификации. Такой подход создавал риски: небольшие ошибки в дизайне влияли на весь продукт, а отсутствие альтернативных поставщиков приводило к задержкам. Новый подход NVIDIA устраняет эти проблемы и снижает производственные ограничения.