В числе тех, кому мы обязаны появлением нашумевшего за последние несколько месяцев чат-бота ChatGPT, программист с российскими корнями, уроженка Албании, работавшая до OpenAI во французской аэрокосмической компании и помогавшая разрабатывать Tesla Model X, а также серийные предприниматели, трудоголики и техноэнтузиасты из Кремниевой долины. Как они сейчас рассказывают, никто из них не ожидал того бума, который вызвала очередная версия их продукта. Как зародилась идея ChatGPT и какие цели преследуют ее создатели?
За последний год искусственный интеллект (ИИ) стал мейнстримом. В начале февраля 2023 года количество пользователей чат-бота на основе языковой модели с генеративным искусственным интеллектом (ChatGPT) достигло 100 млн человек. С его помощью уже как минимум одному студенту удалось успешно защитить диплом, а в электронном книжном магазине Amazon в феврале насчитывалось около 200 книг, написанных ChatGPT, в том числе книга с названием «Как писать и создавать контент с помощью ChatGPT».
У огромного количества людей (от журналистов до экспертов по новым технологиям и венчурных инвесторов), которые активно взялись тестировать возможности генеративного ИИ, появилась новая тема для обсуждений и продуктивных дискуссий о том, как ChatGPT может повлиять на ментальные способности людей, на рынок труда в самых разных сферах и на расстановку сил в мире технологических гигантов.
Звездный час генеративного ИИ
Чат-бот ChatGPT, созданный компанией OpenAI, работает на основе технологии, которую принято называть «генеративным искусственным интеллектом». Эта технология позволяет создавать новый оригинальный контент на основе большого объема данных и алгоритмов машинного обучения. Таких инструментов существует на рынке довольно много, ChatGPT — не единственный в своем роде. Например, другая популярная нейросеть, Midjourney, умеет по текстовому описанию генерировать изображение. Однако пока еще ни одной нейросети не удавалось достичь такой виральности, как у ChatGPT.
По словам Сэма Олтмена, генерального директора OpenAI, за пять дней после запуска чат-бота им воспользовался 1 млн человек. А уже к январю количество пользователей достигло 100 млн. TikTok потребовалось девять месяцев, чтобы достичь такого же успеха, а Instagram — два с половиной года. Для сравнения, на сервере Midjourney в Discord сейчас 13,4 млн участников. Финансовый холдинг UBS называл ChatGPT самым быстрорастущим приложением в истории.
ChatGPT вызвал такой интерес отчасти благодаря сравнительной простоте и доступности — бесплатная бета-версия сейчас доступна для всех и работает по крайней мере на 95 языках. При этом она умеет писать длинные тексты, отвечать на вопросы и составлять практически любые материалы: бизнес-планы, рекламные стратегии, шутки, сценарии фильмов, приглашения на вечеринку и многое другое. Например, в феврале 2023 года ChatGPT сдал медицинский экзамен United States Medical Licensing Examination (USMLE), который дает право работать врачом в США. Результаты этой нейросети обошли модель, которая обучалась исключительно на медицинской литературе, — PubMedGPT.
Этому триумфу предшествовали долгие годы предварительной подготовки и научных исследований в области машинного обучения и языковых моделей. ChatGPT создан на основе языковой модели GPT-3, разработанной OpenAI еще в 2020 году; перед этим были GPT and GPT-2 (от английского Generative Pre-trained Transformer — генеративный предобученный трансформер), появившиеся еще в 2018 и 2019 годах. Изначально компания OpenAI придумала сделать чат для общения с ИИ, чтобы улучшить свои большие языковые модели (LLM), в частности GPT-3. Модель стала одной из самых мощных LLM в мире — она работала на основе 175 млрд параметров и обучалась примерно на ⅔ данных со всего интернета.
В марте 2023 года компания запустила еще более продвинутую версию — GPT-4, которая, если верить обещаниям разработчиков, работает на основе уже 100 трлн параметров, умеет распознавать не только текст, но и картинки, а также реже ошибается и стала креативнее. Предыдущую версию уличали в предвзятости и подлоге научных исследований, а новая, как утверждают разработчики, менее склонна к такому деструктивному поведению.
В середине ноября, как рассказывает The New York Times со ссылкой на сотрудников OpenAI, команда получила неожиданную задачу — за две недели выпустить чат-бот под названием Chat with GPT-3.5. Это смутило некоторых сотрудников, так как весь год компания работала над моделью GPT-4, которая была почти готова. Планировалось, что новая нейросеть выйдет в начале 2023 года вместе с несколькими чат-ботами, с помощью которых пользователи могли бы опробовать GPT-4.
Но руководство беспокоилось, что конкурирующие компании выпустят свои чат-боты с ИИ до запуска GPT-4. А приложение, работающее на старой версии, поможет быстрее собрать обратную связь для улучшения GPT-4.
По другой версии, которую излагает Fortune, идея выкатить на широкую аудиторию чат для более эффективного обучения модели появилась у одной из команд внутри компании. Чат-бот казался им отличным решением, потому что тогда бы нейросеть регулярно получала обратную связь. В итоге в начале 2022 года команда начала создавать проект, который стал ChatGPT.
Есть и третья версия — ее предлагают в эксклюзивном интервью изданию MIT Technology Review четверо топ-менеджеров компании, включая сооснователя Джона Шульмана. Согласно их рассказу, ChatGPT представляет собой слегка улучшенную версию уже существовавшей модели для обучения InstructGPT, в которую добавили данные для разговорной речи и слегка изменили процесс обучения. По их словам, именно разговорные модели, судя по всему, стали тем секретным ингредиентом, который обеспечил популярность чата.
Они говорят также, что, поскольку этот чат-бот представлял собой, по сути, лишь слегка модифицированный в исследовательских целях предыдущий продукт, они не придавали этому запуску большого значения, вызванный им хайп их самих сильно удивил. «Был период, когда вся моя лента в соцсети практически полностью состояла из скриншотов ChatGPT, — говорит Джон Шульман. — Я предполагал, что этот чат-бот интуитивно понятен людям, и надеялся, что он вызовет интерес, но такого уровня массовой популярности я не мог ожидать».
В этой части все три версии сходятся: ни основатели, ни сотрудники не предполагали, что выпускают мегахит. Официально OpenAI отказалась комментировать статью The New York Times про гонку вооружений ИИ и ChatGPT, в частности. Но, по информации неназванных источников, некоторые из сотрудников скептически отнеслись к возможному успеху ChatGPT. Они считали, что модель двухлетней давности покажется людям скучной.
В истории, которую рассказывает Fortune со ссылкой на сотрудников, когда появилась первая версия, ее дали попробовать бета-тестировщикам, но те не поняли, о чем надо говорить с чат-ботом. На какое-то время в OpenAI переключились и решили сделать ботов-экспертов, которые помогали бы профессионалам. Но и тут компания столкнулась с проблемами. Одна из них заключалась в том, что не было нужных данных для обучения. Тогда решили выпустить в свет ChatGPT. Соучредитель OpenAI Грег Брокман говорит, что «не знал, сработает ли это».
Мгновенная популярность застала компанию врасплох, пишет Fortune. «Это было удивительно», — комментирует успех технический директор OpenAI Мира Мурати. Генеральный директор компании Сэм Олтмен сказал, что он ожидал «на порядок меньше хайпа».
С чего все начиналось
Еще несколько лет назад компания OpenAI, которая создала ChatGPT, была небольшой лабораторией, выполняющей академические исследования. Все началось в 2015 году. Однажды июльским вечером Сэм Олтмен, тогда еще глава инкубатора Y Combinator, устроил ужин в роскошном отеле Rosewood Sand Hill в сердце Кремниевой долины, Менло-Парке.
На этой встрече присутствовали Илон Маск и Грег Брокман — 26-летний парень, который бросил MIT и работал техническим директором в стартапе Stripe. Были и другие люди: опытные исследователи ИИ или новички почти без навыков в машинном обучении, но всех объединяло то, что они верили в возможное существование AGI (Artificial General Intelligence) — общего искусственного интеллекта, который будет справляться с задачами не хуже человека.
Участники ужина хотели создать лабораторию, которая будет конкурировать с Google. В тот год IТ-гигант приобрел стартап DeepMind, который, в случае успеха, помог бы Google монополизировать всемогущую технологию. Так появилась некоммерческая компания, которая заявляла своей миссией демократизацию передовых технологий ИИ. Команда проекта пообещала публиковать все свои разработки и открыть исходный код новых технологий. Эту идею они отразили в названии — OpenAI.
Спонсоры-учредители пообещали выделить $1 млрд на новую идеалистическую компанию. Но обучение гигантских нейросетей оказалось намного дороже — стоимость достигла десятков миллионов долларов. Недешево обходилась и работа исследователей. Например, ученый с российскими корнями Илья Суцкевер, который на старте работал ведущим научным сотрудником, получал годовой оклад в размере $1,9 млн в первые несколько лет работы. Поэтому Олтмен и другие сотрудники OpenAI пришли к выводу, что компания не может оставаться некоммерческой, если планирует конкурировать с техногигантами. Коммерческое подразделение позволило бы OpenAI привлечь венчурный капитал.
На сайте компании в разделе «Часто задаваемые вопросы» первый такой вопрос касается причин запуска коммерческого продукта. Ответ гласит: «В конечном счете самое главное для нас — это добиться, чтобы общий искусственный интеллект приносил пользу всем. Мы считаем разработку коммерческого продукта одним из способов получить достаточное финансирование, чтобы этого удалось достичь».
Кто все эти люди?
Сэм Олтмен, сооснователь и генеральный директор OpenAI
Олтмен — серийный технический предприниматель, известный своей деловой хваткой. Fortune пишет, что он олицетворяет загадочную природу OpenAI. New Yorker охарактеризовал его как исключительный образец радикального трудоголика даже для Кремниевой долины с ее культом продуктивности: «Он просматривает почту и проводит рабочие встречи с целеустремленностью человека, привязанного к бомбе замедленного действия, а его немигающий взгляд ускоряет его коллег так, что они начинают говорить скороговоркой».
До того как основать и возглавить OpenAI, Олтмен руководил одним из самых известных акселераторов мира, Y Combinator, и, как писал New Yorker, тогда его мало интересовали особенности приложений, которые создавали стартапы, а важным он считал только то, как они могут изменить мир. Журнал писал также, что сильные стороны Олтмена — ясность мысли и интуитивное понимание сложных систем, а главная слабость — полное отсутствие интереса к неэффективным людям.
В истории с ChatGPT Олтмен проявил неожиданную позицию: он пытался преуменьшить значение нейросети, говорят источники New York Times. Его якобы беспокоило, что большой ажиотаж вокруг ChatGPT может спровоцировать негативную реакцию со стороны регулирующих органов и сформировать завышенные ожидания от последующих обновлений и продуктов. Олтмен даже отговорил сотрудников хвастаться успехами ChatGPT.
Грег Брокман, сооснователь и президент OpenAI
В 2008 году Брокман поступил в Гарвард и планировал получить двойную специальность по математике и информатике. Но уже через год бросил учебу и поступил в Массачусетский технологический институт, который тоже покинул через несколько месяцев. Это решение стало окончательным, больше к учебе он не возвращался.
В 2010 году Брокман присоединился к платежному стартапу Stripe, который основал его однокурсник Патрик Коллисон вместе с братом Джоном. Там он занимался внутренней инфраструктурой: проектировал серверную архитектуру, создавал хранилище кредитных карт и продукты для облегчения работы сотрудников. Кроме разработки, Брокман много времени уделял рекрутинговой программе и формированию корпоративной культуры. А в начале 2013 года Брокман официально стал техническим директором компании. В Stripe Брокман помог увеличить штат с четырех до 250 сотрудников.
В 2015 году Брокман покинул Stripe и стал техническим директором OpenAI. Спустя 15 месяцев, в 2017 году Брокман с другими руководителями начал работу над внутренним документом, в котором предлагалась дорожная карта развития AGI.
Именно в этот момент руководители поняли, что не могут себе больше позволить оставаться некоммерческой организацией. Поэтому потребовалась новая операционная модель, которая позволила бы быстро привлекать деньги, сохраняя приверженность своей миссии.
Так в 2018 году появился устав OpenAI, в котором сформулировали основные ценности лаборатории. Например, появилось обязательство «избегать использования ИИ, который наносит ущерб человечеству или чрезмерно концентрирует власть». Брокман говорит, что компания потратила много времени, чтобы убедить всех сотрудников придерживаться базового набора таких принципов: «Это вещи, которые должны были оставаться неизменными, даже если мы меняем нашу структуру».
Сейчас в роли президента Брокман отвечает за общую стратегию и направление деятельности компании, сотрудничает с исследовательскими и инженерными компаниями, а также с политиками и лидерами. «Мы явно движемся в мир, где интернет — это живое существо. С ним можно разговаривать, он понимает и помогает вам», — сказал Брокман на своем выступлении в марте 2023 года в рамках конференции SXSW.
Илья Суцкевер, сооснователь и директор по исследованиям OpenAI
Суцкевер родился в Нижнем Новгороде, в детстве переехал с семьей в Израиль, а в 2012 году получил докторскую степень в Университете Торонто, где работал с известным ученым в области ИИ Джеффри Хинтоном. Сейчас он один из самых цитируемых ученых в области компьютерных наук. По данным Google Scholar, у Суцкевера более 380 000 упоминаний.
Еще будучи аспирантом, он стал соавтором нейросети AlexNet. Это исследование полностью изменило индустрию ИИ и привело к широкому внедрению глубокого обучения и волне прорывов в области ИИ в течение ближайших 10 лет. А статья стала одной из самый цитируемых в области компьютерных наук.
Позже Суцкевер, Хинтон и Алекс Крижевский создали стартап DNNresearch, который в 2013 году приобрел Google. Тогда Университет Торонто заявил, что исследование команды «имеет серьезные последствия для таких областей, как распознавание речи, компьютерное зрение и понимание языка».
В 2015 году MIT Technology Review включил Суцкевера в рейтинг новаторов моложе 35 лет в номинации «Визионеры». На тот момент он был ключевым сотрудником исследовательской группы Google Brain. Во время работы в Google Суцкевер изобрел нейросеть для перевода с английского на французский язык. Эта работа послужила основой для серьезного обновления Google Translate. По словам Суцкевера, «исследователи не верили, что нейронные сети могут переводить текст, поэтому, когда они все же смогли, это стало большим сюрпризом».
В том же 2015 году Суцкевер стал сооснователем OpenAI вместе с Сэмом Олтменом и Грегом Брокманом. В новой компании Суцкевер возглавил работу над созданием модели GPT, которая впоследствии выросла до GPT-2, GPT-3 и GPT-4. А также DALL-E 1 — нейросети для генерации изображений.
«Раньше я думал, что ИИ будет просто бесконечным добром. Сейчас, когда стало понятно, что у него будет много действительно невероятных и невообразимых применений, которые кардинально улучшат нашу жизнь, я вижу ситуацию более комплексно. И я думаю, что будет и много проблем, связанных с неправильным использованием ИИ и его специфическими свойствами, которые людям может быть трудно понять», — поделился Суцкевер в 2021 году в интервью на конференции Scale. А в феврале 2022 года Суцкевер написал в Twitter (заблокирован в России): «Возможно, существующие крупные нейросети немного сознательны».
Мира Мурати, технический директор OpenAI
Мурати закончила Дартмутский колледж, где получила степень бакалавра в области машиностроения. Затем проходила летнюю стажировку в качестве аналитика в Goldman Sachs и продолжила свою карьеру во французской аэрокосмической компании Zodiac Aerospace. Также она работала старшим менеджером по продукту в Tesla, где участвовала в разработке Model X. Там же она заинтересовалась ИИ.
Последним ее местом работы перед OpenAI стала должность вице-президента по продукту и разработке в Leap Motion — компания создает контроллеры, которые позволяют управлять цифровыми объектами с помощью рук. Она хотела сделать взаимодействие человека с компьютером «таким же интуитивным, как игра с мячом». Но быстро поняла, что технология пока слишком ранняя для гарнитур виртуальной реальности.
В OpenAI Мурати нашла единомышленников. Она пришла в компанию в 2018 году в роли вице-президента по прикладному искусственному интеллекту и партнерским отношениям. К тому моменту в компании поняли, что коммерциализация — это одновременно и экономическая необходимость, и способ освоить мир технологий.
По мере того как OpenAI двигалась по новому курсу, компания начала искать способы, как усовершенствовать свои модели, чтобы они лучше соответствовали намерениям человека. Например, понимали, что такое крутая песня или модный ресторан. Мурати была среди тех сотрудников, которые напрямую занимались поисками таких решений. В мае 2022 года она заняла должность технического директора компании.
Мурати утверждает, что создание AGI исключительно в пределах лаборатории может еще более встревожить общественность, когда такой ИИ выйдет наружу. Поэтому она убеждена в необходимости тестировать продукты OpenAI с привлечением широкой аудитории. Обучение языковых моделей с подкреплением в виде обратной связи от человека — это более эффективный метод решения любых проблем, связанных с работой ИИ, считает она. В интервью Time в феврале 2023 года она заявила: «Это уникальный момент, когда мы действительно можем повлиять на то, как ИИ формирует общество. И это работает в обоих направлениях: технология формирует нас, а мы формируем ее».
Среди сооснователей OpenAI есть и другие инженеры-исследователи и ученые мирового уровня: Тревор Блэквелл, Вики Чунг, Андрей Карпати, Дурк Кингма, Джон Шульман, Памела Вагата и Войцех Заремба. Сейчас в OpenAI работают 375 исследователей, инженеров и других специалистов, ответственных за создание прорывной технологии.
Сверхразум нечеловеческого типа: как будет развиваться ChatGPT
ChatGPT — это один из лидеров новой волны чат-ботов, которые используют генеративный ИИ. Нейросеть учится на больших объемах информации и умеет выдавать более сложные по структуре и содержанию ответы, чем привычные чат-боты. С этим связаны в том числе некоторые тревоги, которые создатели таких сетей будут пытаться успокоить либо решить эти проблемы.
Футуролог и сооснователь венчурного фонда Orbita Capital Partners Евгений Кузнецов считает, что один из главных рисков не в том, что машинный интеллект заменит человека, а в том, что появляется альтернативный человеческому тип интеллекта: «Современные нейросети решают задачи совершенно нечеловеческим способом. Поэтому возникают два вопроса. Первый: насколько такая эволюция вообще безопасна? То есть не может ли один тип интеллекта подавить и вытеснить другой, притом что машинный интеллект развивается на десятки порядков быстрее человеческого. А второй вопрос: есть ли потолок у развития машинного интеллекта? Если этот потолок находится значительно выше человеческого интеллекта, то не возникает ли риск появления сверхразума нечеловеческого типа?» Кроме того, отмечает Кузнецов, с появлением новой эффективной технологии на основе ИИ может возникнуть диспропорция в доступе разных стран к этим технологиям и еще сильнее укрепиться технологическое доминирование одних стран над другими.
Также есть опасения, связанные с кибербезопасностью. Компания Check Point Research (CPR), которая занимается исследованиями в области информационной безопасности, 6 января опубликовала статью о том, как киберпреступники используют ChatGPT. Например, злоумышленники могут писать вредоносные программы, не обладая навыками программирования, на основе существующих в открытом доступе публикаций про вирусы. OpenAI придется уже в ближайшее время искать способы предотвратить такие антиобщественные способы применения их технологии, не отказываясь при этом от своих базовых принципов.
ChatGPT претендует на звание самого известного и потенциально ценного алгоритма на данный момент, но сама технология не уникальна. Стартап Stability AI разработал технологию для генерации изображений, а теперь работает над конкурентом ChatGPT с открытым исходным кодом. «До релиза осталось несколько месяцев», — поделился Эмад Мостак, генеральный директор Stability AI с Wired в марте 2023 года.
«Пять лет назад появилась поговорка: «ИИ — лучшее решение любой задачи». А ведь буквально еще 10 лет назад придумывали алгоритм на каждую задачу и дорабатывали нейросеть. Если сейчас GPT-3 и его аналоги — универсальный, но дорогой в разработке инструмент, то в будущем генеративные технологии будут на порядок дешевле для своих создателей. Генерация — это только вершина, за который скрывается продвинутое распознавание не только языка, но и изображений. ChatGPT — это всего лишь демо того, что могут технологии», — размышляет основатель ProgKids Сергей Жучков.
В январе 2023 года Microsoft заявила, что инвестирует в OpenAI. По данным Bloomberg, сумма финансирования составила $10 млрд. Также Stability AI планирует привлечь около $4 млрд в следующем раунде, при этом в октябре 2022 года компания уже привлекла $101 млн при оценке около $1 млрд.
За лидерство в сфере ИИ борются и другие технологические гиганты, включая Alphabet, Amazon и Meta Platforms. В частности, даже основатель Google Сергей Брин вернулся к разработке после долгого перерыва. Источники Forbes пояснили, что предприниматель попросил открыть доступ к работе над чат-ботом LaMDA (Language Model for Dialogue Application), работающем на базе ИИ и способном имитировать речь человека.
«Развитие ИИ — это явление, схожее по масштабам с появлением интернета или мобильных телефонов. Оно заметно повлияет на все стороны человеческой деятельности. И генеративные сети — важная волна в этом общем явлении. ChatGPT оказался суперудачной демоверсией новых технологий. Его появление популяризовало идею ИИ как среди обычных потребителей, так и среди инвесторов. Аналогичные продукты будут выпущены десятками конкурентов. У OpenAI сейчас есть технологическое преимущество и отрыв по времени, но они не очень большие, условные Google или даже «Яндекс» могут их догнать», — комментирует сооснователь United Investors Александр Горный.