Две лучшие нейросети для озвучки и не только

Две лучшие нейросети для озвучки и не только

Роботы опять эволюционировали. И теперь их речь уже звучит не странно, а страшно… Страшно похоже на настоящие человеческие голоса. Всего полгода назад мы могли запросто отличить цифрового ассистента Олега от Олега реального, но с недавними обновлениями все изменилось. Конечно, их все еще можно поймать на невероятной тупости, но надолго ли?

Пару недель назад известная нейронка от Eleven Labs получила крупномасштабное обновление, где, среди прочего, появилась возможность настраивать интонацию произношения машиной отдельных предложений. Причем делается это не кликом на ограниченный список эмоций в каком-нибудь выпадающем меню, а с помощью обыкновенных квадратных скобок, в которых вы сами прописываете все необходимое. Робота можно заставить смеяться, иронизировать, шептать, даже говорить с определенным акцентом. И, разумеется, я проверил, что будет, если написать в скобках [будто ударился мизинцем о тумбочку]. Получилось это самое. Вот пример диалога нейросеток, продемонстрированного самими разработчиками в превью.

А теперь представьте, какая паника сейчас происходит в рядах актеров озвучки. Интонации – это еще далеко не все, что умеет нейросеть. Она кричит, плачет, флиртует, робко вопрошает десятками разных голосов.

Вы скажете: «Десяток голосов не заменит тысячи профессиональных актеров». И будете правы. Но что, если робот украдет ваши интонации? Такое уже происходит. На том же Eleven Labs можно загрузить аудиофайл и клонировать любой человеческий голос. Очень похоже, в ближайшем будущем актеры озвучки станут одноразовыми. Посидел, наболтал пятнадцать минут бессвязного текста, и все: твой голос уже продает дешевые авиабилеты и призывает экономить электроэнергию.

Ладно, может, все не так и страшно. В конце концов можно сберечь свою уникальную речь копирайтом. А с развитием нейросетей законы об авторском праве должны рано или поздно адаптироваться. Протестировать же новое обновление можно по этой ссылке.

К слову, о клонировании. Вторая нейронка, которую хотелось вам показать, это — Dubbing AI. Помните, как люди раньше накладывали фильтры на свои голоса, чтобы выделиться в чатах? Это делалось с помощью незамысловатых программ, способных менять длину и частоту звуковой волны. Так, в диалоге с друзьями вы могли звучать как писклявый персонаж из фильма «Элвин и бурундуки» или как мертвый принц Артас из игры «World of Warcraft». Примерно такими же программами пользовались мошенники и просто анонимы, которые по какой-то причине не хотели, чтобы кто-то слышал их реальный голос.

Dubbing AI делает то же самое, только лучше. Вместо того, чтобы просто искажать звучание, она слушает сказанное, а затем повторяет всё голосом другого человека или персонажа. Задержка вывода результата меньше секунды, что позволяет использовать нейронку для озвучки, общения, стримов и бог знает для чего еще. Например, для того, чтобы позвонить и голосом вашей жены крикнуть: «Дорогой, я попала в аварию, срочно вышли мешок золота, чтобы отмазаться от ментов!». Программа подключается в качестве отдельного виртуального устройства, и это позволяет менять свою речь на любом сайте в любой программе, будь то голосовой чат (Discord, Teamspeak, Mumble), музыкальный секвенсор или мессенджер вроде Telegram или WhatsApp.

Сама прога бесплатная, однако каждые пару дней там меняется пул доступных персонажей. Чтобы навсегда купить себе голос Илона Маска или Халка придется заплатить. Ну, или выполнить ряд достижений типа «просиди с включенной программой 10 часов» или «поставь оценку приложению на таком-то сайте». Еще из интересного (особенно для стримеров) — в Dubbing AI есть встроенный саундпад. Хлопки, взрывы, фрагменты песен. Библиотека постоянно дополняется разработчиками и самими пользователями. Попробовать можно тут.

0 0 голоса
Rate this article
Подписаться
Уведомить о
guest
0 Comments
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Читайте также

0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x