В четверг компания Codeium сообщила о закрытии раунда Серии С объемом 150 миллионов долларов под руководством General Catalyst, что оценивает компанию в 1.25 миллиарда долларов. В результате раунда, в котором также приняли участие существующие инвесторы Kleiner Perkins и Greenoaks, общий объем привлеченного финансирования компании достиг почти четверти миллиарда долларов (243 миллиона долларов) всего за три года с момента ее запуска.
Сооснователь и генеральный директор Codeium Варун Мохан рассказал TechCrunch, что Codeium еще даже не прикоснулась к траншу Серии B в размере 65 миллионов долларов, который она привлекла в январе. Тогда, всего восемь месяцев назад, Codeium оценивалась в полмиллиарда долларов.
«Несмотря на то, что мы едва освоили имеющееся финансирование, мы уверены, что это вливание капитала позволит нам значительно увеличить объемы исследований и разработок, а также темпы роста, делая еще более крупные стратегические ставки», — сказал он.
Компания Codeium была основана в 2021 году Моханом и его другом детства и выпускником MIT Дугласом Ченом. До Codeium Чен работал в компании Meta*, где помогал создавать программные инструменты для гарнитур виртуальной реальности, таких как Oculus Quest. Мохан был техническим руководителем в Nuro, стартапе автономной доставки, и отвечал за управление командой инфраструктуры автономности.
Стартап начинался как совершенно другая компания под названием Exafunction, которая занималась оптимизацией и виртуализацией GPU для рабочих нагрузок искусственного интеллекта. Но в 2022 году Мохан и Чен почувствовали, что генеративное программирование открывает более широкие возможности, и решили провести ребрендинг — и изменить направление деятельности.
«Несмотря на приток инструментов генеративного ИИ, разработчики все еще борются с трудоемкими задачами программирования», — говорит Мохан. «Многие решения, основанные на искусственном интеллекте, предоставляют общие фрагменты кода, которые требуют значительной ручной работы для интеграции и обеспечения безопасности в существующих кодовых базах. Именно здесь на помощь приходит наша помощь ИИ».
Платформа Codeium, основанная на генеративных моделях искусственного интеллекта, обученных на публичном коде, выдает предложения в контексте всей кодовой базы приложения. Она поддерживает около 70 языков программирования и интегрируется с рядом популярных сред разработки, включая Microsoft Visual Studio и JetBrains.
Чтобы отвлечь разработчиков от Copilot и других конкурентов, Codeium запустил щедрый бесплатный уровень. Похоже, стратегия сработала. Сегодня у стартапа более 700,000 пользователей и более 1,000 корпоративных клиентов, включая Anduril, Zillow и Dell.
Квентин Кларк, управляющий директор General Catalyst, считает, что Codeium выиграла некоторые из своих крупных контрактов благодаря тому, что в исследованиях продуктов она неизменно ориентировалась на клиента.
«Подход команды всегда заключался в том, чтобы следовать за своими клиентами, что привело компанию к созданию решений на их условиях — с возможностью развертывания в любой среде и поддержкой большего количества языков, чем у кого-либо еще», — говорится в заявлении Кларка. «То, что создала Codeium, — это не просто демонстрация, анонс или идея — это полностью масштабируемый бизнес, в котором крупные предприятия внедряют продукт во всей организации».
Компании часто опасаются раскрывать собственный код третьим лицам — например, в прошлом году Apple запретила сотрудникам использовать Copilot, ссылаясь на опасения по поводу утечки конфиденциальных данных. Чтобы развеять эти опасения, Codeium начала предлагать self-hosted вариант наряду со стандартным планом «программное обеспечение как услуга».
Теперь компании могут развернуть сервис Codeium на собственном оборудовании, если пожелают. Или же они могут использовать гибридную схему, храня свои данные на собственных устройствах и используя серверы Codeium для вычислительных нужд.
Передача данных в облако всегда сопряжена с определенным риском, но Мохан утверждает, что Codeium использует надежное шифрование. «Мы никогда не обучаем нашу собственную генеративную модель на данных пользователей, никогда не продаем данные и обеспечиваем шифрование всех передаваемых данных», — добавил он.
Компания также предприняла шаги по удалению «не разрешенного» лицензионного кода (например, кода, защищенного авторским правом) из наборов данных, которые она использовала для обучения своих моделей ИИ. Некоторые инструменты генерации кода, обученные с использованием кода с ограниченной лицензией или защищенного авторским правом, как было показано, выдают этот код при определенном запросе, что создает риск ответственности (т. е. разработчикам, использующим такой код, может быть предъявлен иск). По словам Мохана, с Codeium дело обстоит иначе, благодаря подходу к подготовке и фильтрации обучающих данных.
«Мы также удаляем все оставшиеся данные, похожие на код, который явно не лицензирован, на случай, если другие люди скопировали код без указания авторства и лицензирования», — добавил он. «Кроме того, у нас есть современная фильтрация и регистрация авторства после генерации в случае, если эти большие вероятностные модели выдают код, похожий на публичный код, как с разрешительной, так и с не разрешительной лицензией».
Но как насчет галлюцинаций? Большинство инструментов для ИИ-программирования печально известны тем, что выдумывают всякую ерунду, что может быть весьма разрушительным в корпоративной среде.
Анализ, проведенный стартапом GitClear, специализирующимся на инструментах для разработчиков, показал, что за последние несколько лет инструменты генеративного ИИ привели к появлению в кодовых базах большего количества ошибочного кода. А исследование Purdue показало, что более половины ответов на вопросы по программированию, которые дает ChatGPT от OpenAI, являются неверными. Исследователи безопасности предупреждают о том, что такие инструменты могут усилить существующие ошибки в программном обеспечении.
Недавний опрос, проведенный компанией Snyk, специализирующейся на кибербезопасности, показал, что девять из десяти разработчиков беспокоятся о более широких последствиях использования ИИ-платформ для кодирования с точки зрения обеспечения безопасности. Однако Мохан утверждает, что якобы превосходная технология Codeium с глубоким контекстным пониманием дает более надежные результаты, чем большинство других.
«Наш механизм осознания контекста способен обосновать результаты на том, что уже существует в кодовой базе пользователя, что приводит к предложениям с меньшим количеством галлюцинаций и большей приверженностью существующему синтаксису, семантике и стандартам», — сказал он.
Независимо от того, подтверждают ли это контрольные показатели или нет, похоже, что предложение Codeium находит отклик у нужных руководителей. В этом году выручка компании достигла восьмизначной цифры. По словам Мохана, компания, базирующаяся в Маунтин-Вью и насчитывающая 80 человек, планирует увеличить число сотрудников до 120 к 2025 году, стремясь занять более заметное место на рынке с такими грозными конкурентами, как Tabnine, Anysphere и Poolside.
Догнать Copilot, у которого по состоянию на апрель было более 1.8 миллиона платящих пользователей, Codeium, вероятно, не сможет — по крайней мере, в ближайшее время. Но это и не нужно. Как справедливо заметил Мохан, учитывая широкое распространение инструментов для ИИ-программирования среди разработчиков (несмотря на их оговорки), даже небольшой кусок зарождающегося сегмента может оказаться прибыльным.
По прогнозам Polaris Research, к 2032 году рынок инструментов для кодирования ИИ будет стоить 27.17 миллиарда долларов.
“Переизбыток шумихи — это проблема, с которой сталкивается отрасль», — говорит Мохан. «В результате каждой компании будет сложнее убедить конечных пользователей в том, что она находится на переднем крае возможностей. Но мы верим, что компании, стремящиеся к правде и реалистичному ИИ, такие как Codeium, в конечном итоге прорвутся сквозь этот шум”.с