Создание современных чат-ботов на основе искусственного интеллекта основано на специализированных компьютерных чипах, впервые разработанных компанией Nvidia, которая доминирует на рынке и стала олицетворением бума ИИ.
Однако те же самые качества, которые делают эти графические процессоры (GPU) столь эффективными при создании мощных систем ИИ с нуля, делают их менее эффективными при запуске продуктов ИИ в работу.
Это открыло индустрию ИИ-чипов для конкурентов, которые считают, что могут конкурировать с Nvidia в продаже так называемых ИИ-чипов вывода, которые больше приспособлены к повседневной работе инструментов ИИ и разработаны для снижения огромных вычислительных затрат генеративного ИИ.
«Эти компании видят возможности для такого рода специализированного оборудования», — сказал Джейкоб Фелдгойз, аналитик Центра безопасности и новых технологий Джорджтаунского университета. «Чем шире будет внедрение этих моделей, тем больше компьютеров понадобится для вывода и тем больше будет спрос на чипы вывода».
Что такое вывод ИИ?
Для создания чат-бота на основе ИИ требуется много вычислительной мощности. Все начинается с процесса, называемого обучением или предварительным обучением — «P» в ChatGPT — который включает в себя «обучение» систем ИИ на основе шаблонов огромных массивов данных. Графические процессоры хорошо справляются с этой работой, поскольку они могут выполнять множество вычислений одновременно в сети устройств, взаимодействующих друг с другом.
Однако после обучения генеративному инструменту ИИ все еще нужны чипы для выполнения работы — например, когда вы просите чат-бота составить документ или сгенерировать изображение. Вот где вступает в дело вывод. Обученная модель ИИ должна принимать новую информацию и делать выводы из того, что она уже знает, чтобы выдать ответ.
Графические процессоры тоже могут это делать. Но это немного похоже на то, как если бы вы взяли кувалду, чтобы расколоть орех.
«С обучением вы делаете гораздо больше, гораздо больше работы. С выводом это более легкий вес», — сказал аналитик Forrester Элвин Нгуен.
Это побудило такие стартапы, как Cerebras, Groq и d-Matrix, а также традиционных конкурентов Nvidia в производстве микросхем, таких как AMD и Intel, представить более удобные для вывода чипы, поскольку Nvidia сосредоточена на удовлетворении огромного спроса со стороны крупных технологических компаний на свое высококлассное оборудование.
Внутри лаборатории чипов вывода искусственного интеллекта
Компания D-Matrix, которая на этой неделе запускает свой первый продукт, была основана в 2019 году — немного опоздав на рынок чипов ИИ, как объяснил ее генеральный директор Сид Шет во время недавнего интервью в штаб-квартире компании в Санта-Кларе (Калифорния), том самом городе Кремниевой долины, где также находятся AMD, Intel и Nvidia.
«Там уже было более 100 компаний. Поэтому, когда мы вышли туда, первой реакцией, которую мы получили, было: «Вы опоздали», — сказал он. Пандемия, начавшаяся шесть месяцев спустя, не помогла, поскольку технологическая индустрия переключилась на программное обеспечение для обслуживания удаленной работы.
Однако теперь Шет видит большой рынок в области выводов на основе ИИ, сравнивая эту позднюю стадию машинного обучения с тем, как люди применяют знания, полученные в школе.
«Первые 20 лет своей жизни мы провели в школе, занимаясь самообразованием. Это ведь обучение, верно?» — сказал он. «А затем следующие 40 лет своей жизни вы как бы идете туда и применяете эти знания — и тогда вас вознаграждают за эффективность».
Продукт под названием Corsair состоит из двух чипов с четырьмя чиплетами в каждом, произведенных компанией Taiwan Semiconductor Manufacturing Company (которая также производит большинство чипов Nvidia), и упакованных вместе таким образом, чтобы они не перегревались.
Чипы разрабатываются в Санта-Кларе, собираются на Тайване, а затем тестируются в Калифорнии. Тестирование — это долгий процесс, который может занять шесть месяцев — если что-то не так, его можно отправить обратно на Тайвань.
Сотрудники D-Matrix проводили финальное тестирование чипов во время недавнего визита в лабораторию с синими металлическими столами, заваленными кабелями, материнскими платами и компьютерами, и холодной серверной по соседству.
Кому нужны чипы вывода с использованием искусственного интеллекта?
В то время как такие технологические гиганты, как Amazon, Google, Meta (запрещена в России) и Microsoft, поглощают поставки дорогостоящих графических процессоров в гонке за то, чтобы превзойти друг друга в разработке искусственного интеллекта, производители чипов для вывода с помощью искусственного интеллекта нацеливаются на более широкую клиентуру.
Нгуен из Forrester сказал, что это может включать компании из списка Fortune 500, которые хотят использовать новую генеративную технологию ИИ без необходимости создания собственной инфраструктуры ИИ. Шет сказал, что он ожидает большого интереса к генерации видео с помощью ИИ.
«Мечта об ИИ для многих этих корпоративных компаний заключается в том, чтобы вы могли использовать свои собственные корпоративные данные», — сказал Нгуен. «Покупка (чипов вывода ИИ) должна быть дешевле, чем покупка конечных графических процессоров от Nvidia и других. Но я думаю, что потребуется обучение в плане интеграции».
Фелдгойс отметил, что в отличие от чипов, ориентированных на обучение, работа ИИ-выводов ставит во главу угла то, как быстро человек получит ответ чат-бота.
Он сказал, что еще целый ряд компаний разрабатывает аппаратное обеспечение на основе ИИ для вывода данных, которое может работать не только в крупных центрах обработки данных, но и локально на настольных компьютерах, ноутбуках и телефонах.
Почему это важно?
Более совершенные чипы могли бы снизить огромные затраты на эксплуатацию ИИ для предприятий. Это также могло бы повлиять на экологические и энергетические затраты для всех остальных.
Шет говорит, что сейчас главная проблема заключается в следующем: «Не спалим ли мы планету дотла в наших поисках того, что люди называют ОИИ — человекоподобного интеллекта?»
Пока еще неясно, когда ИИ сможет достичь точки искусственного интеллекта общего назначения — прогнозы варьируются от нескольких лет до десятилетий. Но, отмечает Шет, только несколько технологических гигантов находятся в этом поиске.
«Но как же тогда быть остальным?» — сказал он. «Их нельзя поставить на тот же путь».
Другая группа компаний не хочет использовать очень большие модели ИИ — это слишком дорого и требует слишком много энергии.
«Я не знаю, действительно ли люди понимают, что вывод на самом деле будет гораздо большей возможностью, чем обучение. Я не думаю, что они это понимают. Обучение по-прежнему остается темой для обсуждения во всех заголовках», — сказал Шет.