OpenAI представила нейросеть, которая может скопировать голос человека, и озвучить с его помощью текст. Специалисты в этом видят возможность помочь людям потерявшим голос, а с другой стороны — угрозы безопасности при биометрической идентификации по голосу. Модель Voice Engine может скопировать голос, используя 15-секундный образец.
Работа над нейросетью началась в конце 2022 года. Для ее обучения использовали как открытые, так и лицензионные данные.
Пока не известно, будет ли OpenAI доступна для широкой публики. Однако уже понятно, что данная нейросеть изменит представление о возможности генерации речи с помощью ИИ. Вероятно, скоро появится множество служебных объявлений, которые озвучены нейросетью.
Категория информационной продукции 16+
Фото — pixabay.com