«Яндекс» сделал общедоступным внутренний документ, в котором описаны принципы компании при работе с технологией синтеза речи. Это нормы и правила, которые, на взгляд «Яндекса», позволяют сделать технологию комфортной и безопасной для всех, кто с ней так или иначе соприкасается.
Синтез речи — это технология, которая позволяет переводить текст в речь. С её помощью создают голосовых помощников, автоматизируют телефонные коммуникации, начитывают аудиокниги и не только.
У «Яндекса» есть собственная технология синтеза речи. Её применяют в «Алисе», «Браузере», «Картах», «Навигаторе» и других продуктах компании. Она лежит в основе приложения «Разговор», которое помогает людям с нарушениями слуха и речи общаться с окружающими; её использует виртуальный рассказчик в сервисе «Яндекс Книги».
В правилах «Яндекса» говорится, что речь людей не синтезируется без их разрешения, компания информирует дикторов о том, как будут использоваться их голоса, также «Яндекс» сохраняет за собой право ограничивать сценарии использования.
В документе также рассказывается, как «Яндекс» обрабатывает данные синтеза — они хранятся в дата-центрах компании, соответствующих индустриальным требованиям безопасности.
«Наши принципы будут полезны всем, кто имеет дело с синтезом речи: звукозаписывающим студиям, разработчикам технологии и компаниям, которые её у себя внедряют. Если наш подход разделят другие участники рынка, в будущем он сможет послужить основой для отраслевого стандарта», - считает директор по развитию технологий искусственного интеллекта Александр Крайнов.
Председатель Союза дикторов России Александр Лапшин считает, что формулирование этических норм при работе с синтезом речи — первый, но важный шаг по защите голосов дикторов и актёров. «Мы поддерживаем идею предложить им прозрачные условия работы — когда компания детально информирует их о том, как может быть использован голос. Пока законодательные меры ещё не приняты, поэтому Союз дикторов рекомендует дикторам и актёрам внимательно выбирать проекты для участия. В любом случае мы рады, что поднимается тема этики — это может стимулировать развитие качественного партнёрства разработчиков, студий и дикторов», — отметил Лапшин.
Этой осенью в Госдуму был внесен законопроект об охране голоса как объекта личных неимущественных прав. Авторы инициативы предложили дополнить Гражданский кодекс статьей, в соответствии с которой обнародование и дальнейшее использование записи голоса гражданина допускается только с его согласия. Речь идет в том числе о записях голоса, которые были созданы с использованием технологий синтеза речи, говорится в пояснении к законопроекту. При этом такое согласие не потребуется в случаях, если голос используется в государственных или общественных интересах, а также если его запись производилась за плату или в публичных местах, говорится в законопроекте.