20 000 профессионалов proAV > 1500 компаний > 570 городов > 6 стран ближнего зарубежья > 1 сообщество

Присоединяйтесь!

Подписка на дайджест
Рубрикатор новостей

Вам подтасовать или исправить? Сервис, говорящий вашим голосом

17 октября 2019
Вам подтасовать или исправить? Сервис, говорящий вашим голосом

Запущенный в прошлом году сервис Descript, предназначен для специалистов, работающих с речевым контентом: создателей подкастов и редакторов мультимедиа. Недавно производитель добавил в свой набор инструментов любопытную функцию Overdub, представляющую собой ни что иное, как синтезатор речи, который при помощи возможностей искусственного интеллекта способен генерировать фразы, точно имитируя голос конкретного человека.

Первоначально Descript разрабатывался для внутренних нужд проекта Detour, специализирующегося на создании мобильных аудиогидов, но затем был выделен в отдельный продукт, работу над которым продолжила одноименная компания. Descript Podcast Studio представляет собой простое и наглядное приложение для многодорожечной записи голоса и его дальнейшего редактирования, призванное упростить процесс производства подкастов. Основным его отличием от классических аудиоредакторов является функция автоматического анализа и транскрибации речи с последующим сопоставлением на временной шкале аудиофайла и текста. Таким образом, от пользователей не требуются углубленные знания в области аудиомонтажа. Они могут просто прочитать транскрибированный текст, выделить слово, фразу или предложение, которые необходимо удалить или переместить, и дать соответствующую команду приложению, которое, в свою очередь, произведет все необходимые манипуляции со звуком, аккуратно сопоставив части и добавив в нужных местах кроссфейды. Присутствует здесь и классический набор инструментов, характерный для любого аудиоредактора, с помощью которого можно производить ручное редактирование и осуществлять автоматизацию громкости. Кроме этого, доступна многопользовательская работа, экспорт готового таймлайна с привязанными аудиофайлами в Pro Tools, Reaper и Adobe Audition, а также работа с аудиодорожками видеофайлов с последующим экспортом итоговых результатов в Final Cut Pro и Adobe Premiere.

Ключевым этапом в дальнейшем развитии Descript стало недавнее приобретение канадского стартапа Lyrebird, основанного два года назад четырьмя аспирантами из Монреальского института изучения алгоритмов обучения. Он занимался разработкой синтезатора речи, способного с помощью искусственного интеллекта генерировать реалистичные человеческие голоса, и достиг в этом немалых успехов. Проанализировав аудиофрагмент с речью человека длительность в несколько минут, созданный Lyrebird алгоритм способен распознать так называемое ДНК голоса, на основании которого он впоследствии может формировать слова и фразы, очень точно имитирующие тембр и манеру разговора любого человека. Именно этот алгоритм и стал основой функции Overdub, которую Descript добавила в свое приложение Podcast Studio. Теперь пользователи могут не только удалять или менять местами слова и фразы, но и добавлять их, просто вводя необходимый текст в редакторе.

Естественно, помимо технической стороны вопроса существует и этическая, ведь получив в свои руки подобный инструмент, злоумышленники в различных сферах могут легко фальсифицировать аудиозаписи переговоров, выступлений и прочего. Но компания настроена оптимистично, заверяя, что функция Overdub может быть использована исключительно для имитации собственного голоса пользователя, о чем гласит заявление по этике, опубликованное на сайте разработчика:

Descript использует для распознавания речевой модели специальный алгоритм, который основан на речевой обратной связи, осуществляемой в реальном времени. Именно поэтому пользователи смогут создавать модели для преобразования текста в речь только для своего собственного голоса

Добавляет основатель Descript Эндрю Мейсон:

Мы создали функцию Overdub, чтобы сэкономить нашим пользователям время и усилия, которые они затрачивают на перезапись и последующую склейку аудиофайлов, а не как способ для создания подделок


Читайте АВ Клуб в Telegram

Источник: www.avclub.pro

DB query error.
Please try later.