В среду компания Google объявила о запуске Gemini 2.0 — самой передовой на сегодняшний день модели искусственного интеллекта. Это происходит в то время, как мировые технологические гиганты стремятся занять лидирующие позиции в этой быстроразвивающейся технологии.
Генеральный директор Сундар Пичаи заявил, что новая модель ознаменует собой то, что компания называет «новой агентской эрой» в разработке ИИ, когда модели ИИ будут разработаны для понимания и принятия решений относительно окружающего мира.
«Gemini 2.0 призвана сделать информацию гораздо более полезной», — сказал Пичаи в своем заявлении, подчеркнув улучшенную способность модели понимать контекст, думать на несколько шагов вперед и выполнять контролируемые действия от имени пользователей.
Google, OpenAI, производитель ChatGPT, Meta и Amazon активно предпринимают шаги по выпуску более мощных моделей искусственного интеллекта, несмотря на их огромную стоимость и некоторые вопросы относительно их непосредственной пользы для экономики в целом.
Агент ИИ, последний тренд Кремниевой долины, — это цифровой помощник, который должен воспринимать окружающую среду, принимать решения и совершать действия для достижения определенных целей.
Технологические гиганты обещают, что агенты станут следующим этапом революции искусственного интеллекта, которая началась с запуска ChatGPT в 2022 году, покорившего весь мир.
Первоначально Gemini 2.0 будет доступен разработчикам и доверенным тестировщикам, а в дальнейшем планируется более широкая интеграция с продуктами Google, особенно в Поиске и платформе Gemini.
Технология основана на аппаратном обеспечении TPU (Tensor Processing Unit) шестого поколения от Google, получившем название Trillium, которое компания теперь сделала общедоступным для клиентов.
Google подчеркнула, что процессоры Trillium использовались исключительно для обучения и запуска Gemini 2.0.
Большая часть обучения искусственного интеллекта была монополизирована гигантом в области чипов Nvidia, который благодаря взрывному развитию искусственного интеллекта превратился в одну из самых дорогих компаний в мире.
По данным Google, миллионы разработчиков уже создают приложения с использованием технологии Gemini, которая интегрирована в семь продуктов Google, каждый из которых обслуживает более двух миллиардов пользователей.
Более широкое внедрение расширенных возможностей поиска Gemini 2.0 запланировано на начало 2025 года, а в течение года планируется расширить возможности AI Overviews на дополнительные страны и языки.
Первой версией моделей семейства 2.0 станет Gemini 2.0 Flash, обеспечивающая более высокую производительность при обработке различных типов входных данных (текст, изображения, видео, аудио) и выходных данных (включая сгенерированные изображения и преобразование текста в речь).
Приложение Gemini получает глобальную интеграцию Flash 2.0, а в начале 2025 года планируется расширить его на большее количество продуктов Google.