Aurora на базе Intel стал самым быстрым суперкомпьютером для искусственного интеллекта

Суперкомпьютер Aurora наконец-то преодолел экзафлопсный барьер, достигнув рекордной производительности в области искусственного интеллекта благодаря аппаратному обеспечению Intel Ponte Vecchio.

Разработанный в сотрудничестве с HPE (Hewlett Packard Enterprise) и развернутый в Аргоннской национальной лаборатории, суперкомпьютер Aurora был предназначен для лидерства в сфере высокопроизводительных вычислений и искусственного интеллекта. Оборудованный процессорами Intel Xeon CPU Max и Data Center GPU Max, он конкурировал с AMD, которой первой удалось преодолеть экзафлопсный рубеж. Несмотря на анонс в 2019 году и затянувшееся ожидание, Aurora наконец достигла 87% своей проектной мощности, что соответствует 9234 узлам из 10 624.

Технические характеристики Aurora впечатляют: система состоит из 166 стоек, включающих 10 624 блейд-сервера, 21 248 процессоров Intel Xeon CPU Max (4-го поколения Sapphire Rapids) и 63 744 блока Intel Data Center GPU Max (Ponte Vecchio). Для межсетевых соединений используется матрица HPE Slingshot с 84 992 конечными точками.

В тесте HPL LINPACK Aurora заняла второе место, преодолев экзафлопсный барьер с показателем 1,012 эксафлопса, используя лишь 87% мощности узлов. В тесте HPCG система заняла третье место с производительностью 5612 терафлопсов, задействовав 39% мощности.

Благодаря архитектуре ядра Xe и нескольким аппаратным блокам искусственного интеллекта, Aurora теперь возглавляет рейтинги производительности искусственного интеллекта с общей номинальной мощностью 10,6 экзафлопса ИИ, измеренной с помощью теста смешанной точности LINPACK (HPL-MxP).

В дальнейшем Intel планирует продолжать развивать высокопроизводительные вычисления и искусственный интеллект с использованием технологий серии Intel Xeon CPU Max и Intel Data Center GPU Max. Эти системы включают Cassandra Европейско-Средиземноморского центра по изменению климата (CMCC) для ускорения климатического моделирования; CRESCO 8 Итальянского национального агентства по новым технологиям, энергетике и устойчивому экономическому развитию (ENEA) для прорывов в термоядерной энергетике; Техасский центр перспективных вычислений (TACC) для анализа биологических данных, сверхзвуковых турбулентных потоков и атомистического моделирования; а также Управление по атомной энергии Великобритании (UKAEA) для решения проблем, связанных с проектированием будущих термоядерных электростанций.

Результаты тестов ИИ смешанной точности лягут в основу следующего поколения графических процессоров Intel для ИИ и HPC под кодовым названием Falcon Shores. Falcon Shores будет использовать передовую архитектуру Intel Xe и достижения Intel Gaudi, обеспечивая единый интерфейс программирования.

Первые результаты производительности процессора Intel Xeon 6 с P-ядрами и памятью комбинированного ранга мультиплексора (MCR) со скоростью 8800 МТ/с демонстрируют до 2,3-кратного увеличения производительности для реальных HPC приложений, таких как Nucleus для европейского моделирования океана (NEMO), по сравнению с предыдущим поколением, что делает его предпочтительным хост-ЦП для решений HPC.