OpenAI готовит функцию Live Video (Vision) в ChatGPT к широкому запуску

Краткая сводка

  • Компания OpenAI продемонстрировала возможности работы с камерой в расширенном голосом режиме (Advanced Voice Mode) ChatGPT, но не раскрыла сроки выхода из статуса альфа-версии.
  • Обнаружены строки кода, которые намекают, что функция, вероятно, будет называться «Живая камера» (Live camera) и вскоре станет доступна в бета-версии ChatGPT.

Многие пользователи активно используют ChatGPT в профессиональной и личной жизни. Расширенный голосовой режим добавляет дружественность к взаимодействию, но пользователи также ждут реализации визуальных возможностей. Похоже, что функция Live Video в ChatGPT готовится к широкому запуску

Когда OpenAI анонсировала GPT-4o в мае 2024 года, компания заявила о продвинутых функциях обработки видеопотока в расширенном голосовом режиме. На демонстрации показано, как новый режим распознает предметы в кадре, например, собаку, запоминает ее имя, определяет мяч и связывает эти элементы через действие, например игру в апорт.

Демонстрация впечатлила благодаря минимальной необходимости вручную вводить данные — ИИ быстро и точно реагировал на происходящее. Все это напоминает видеозвонок с реальным человеком.

Некоторые пользователи смогли попробовать функцию Live Video в альфа-версии и остались довольны. Теперь остается терпеливо ждать выхода функции из статуса альфа-тестирования. OpenAI пока не обозначила конкретных сроков.

Судя по косвенным признакам, компания готовится к бета-запуску: в последней версии ChatGPT v1.2024.317 beta обнаружены строки кода, связанные с новой функцией.

<string name="video_nux_beta_label">Beta<string name="video_nux_description">Tap the camera icon to let ChatGPT view and chat about your surroundings.<string name="video_nux_title">Live camera<string name="video_warning">Don't use for live navigation or decisions that may impact your health or safety.</code?

Эти строки предполагают, что функция может быть названа «Живая камера» (Live camera). Пользователям будут выводиться предупреждения, чтобы не применять функцию для навигации или решений, влияющих на здоровье и безопасность.

Поскольку эти строки появились в бета-версии приложения, это может означать, что компания готовит более широкий бета-запуск. Возможно, функция станет доступна для подписчиков ChatGPT Plus или других платных подписок.

© Comss.one. По материалам Android Authority

Данные о правообладателе фото и видеоматериалов взяты с сайта «Comss.ru», подробнее в Правилах сервиса
Анализ
×
OpenAI
Сфера деятельности:Связь и ИТ
69
Google Android
Производитель:Google
115
ChatGPT
Автор технологии:OpenAI, L.L.C.
25