Screenlife Тимура Бекмамбетова и разработчик робота-рекрутера «Вера» создали технологию синтеза голоса знаменитостей Статьи редакции

Партнёры планируют использовать искусственные голоса для озвучки книг, рекламы, игр и другого контента.

Screenlife Technologies Тимура Бекмамбетова и Stafory, разработчик HR-сервиса «Робот Вера» на основе искусственного интеллекта, запустили проект Vera Voice, который позволяет синтезировать голос знаменитостей на русском языке. Об этом vc.ru рассказали в Stafory.

Для развития проекта Screenlife Technologies и Stafory создадут совместное предприятие. Доли в нём распределятся поровну.

Пример работы Vera Voice

В основе Vera Voice лежит нейросеть, которая анализирует оригинальный голос и воспроизводит его цифровую копию. Партнёры планируют использовать копии голосов для озвучки рекламы, объявлений, книг, фильмов, музейных гидов, игр и так далее.

Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает. Аудиопоток и текст «выгружаются» в несколько нейронных сетей одновременно, одна — генерирует спектрограмму звука (его визуальное изображение), а вторая — непосредственно звук.

Пример голоса обладателя для нейросети — эталон, к которой она стремится. Копия голоса синтезируется с учётом специфического произношения слов, скорости речи, интонаций и тембра.

Владимир Свешников, сооснователь Stafory

Для работы партнёры планируют заключать договоры с обладателями голоса — Vera Voice станет агентом по синтезу его речи. Первый пилот должны запустить в течение месяца.

Компания уже подписала договор на легальное использование голоса сооснователя студии «Кубик в кубе» Руслана Габидуллина для записи аудиокниг, интерактивной рекламы, игр и голосовых открыток. Также Vera Voice ведёт переговоры об использовании её технологий с агентством аудио-коммуникаций Unisound, первые проекты могут появиться в начале 2020 года.

Ещё один инструмент Vera Voice — защита голоса от deep fake и определение факта синтеза голоса. Партнёры обещают защищать интересы обладателей голоса и отслеживать появление голосовых клонов.

Рано или поздно мы будем жить в мире наших цифровых копий и уже сейчас важно найти цивилизованные способы использования искусственного интеллекта. Отлавливать подделки и защищать известных людей от несанкционированного копирования их образов — одна из главных задач нашего проекта.

Тимур Бекмамбетов, основатель Screenlife Technologies

Stafory занимается разработками на базе искусственного интеллекта. в 2016 году компания представила сервис для подбора сотрудников с технологией распознавания речи «Робот Вера». Среди инвесторов Stafory — Фонд развития интернет-инициатив.

0
65 комментариев
Написать комментарий...
Андрей Андреев

Синтезируем голос ВВП, звоним Лукашенко и заказываем Трампу грузовой самолёт картошки.

Ответить
Развернуть ветку
Oleg Nazaruk

Уже жареной с помидорками маринованными 

Ответить
Развернуть ветку
1 комментарий
Denis Bystruev

Миллионы 40–50 летних мужчин, родившихся в Советском Союзе, ждут ремейк «Гостьи из будущего» и экранизации других приключений Алисы Селезнёвой, Крыса и Весельчака У.

С оригинальными актёрами, уже ушедшими от нас.

Ответить
Развернуть ветку
Sebastian Danilov

Поколение на 20 лет помладше тоже в ожидании, к слову

Ответить
Развернуть ветку
Владислав Егоров

Да хотя бы, например, вспомнить Варкрафт 3. Старая озвучка - классическая ("Я получил власть, которая и не снилась моему отцу"), но некоторые актеры уже умерли, в частности, Владимир Вихров, озвучивавший Артаса. Теперь при переиздании и добавлении нескольких фраз им пришлось переозвучивать все - и получилось существенно хуже.

Или фильмы, которые выходили в советские времена с отличным дубляжем, но которые были цензурированы, с какими-то вырезанными фрагментами. Их тоже нужно было переозвучивать целиком, теряя прекрасный советский дубляж.

Ответить
Развернуть ветку
какой-то иван

затея весьма забавная, особенно если она доведёт до "дубляжа" фильмов голосами самих актёров

Ответить
Развернуть ветку
Аня

Дублировать роль, например, Де Ниро, голосом самого Де Ниро, но по-русски и без акцента👍🏻 

Ответить
Развернуть ветку
1 комментарий
Алексей Козлов

Будет одна нейросеть генерировать видеоряд с нужным актером, а другая - соответствующий ему голос. Всё это будет интерактивно в реальном времени, сюжет сможет меняться в зависимости от сигналов от зрителей, третья нейросеть будет добавлять характерных деталей. А сам актер будет в это время выступать в подпольном театре, скрываясь от профсоюза нейросетей.

Ответить
Развернуть ветку
Алексей Шатаев

Так вот кто звонил моей родственнице пару лет назад и моим голосом выпросил у нее часть сбережений?

Ответить
Развернуть ветку
Коммунист

О, так вы знаменитость?

Ответить
Развернуть ветку
1 комментарий
Павел Гросс-Днепров

Спорная история с точки зрения авторских прав. Суд может запретить использовать голос, если кто-то из перечисленных в ролике или другие подадут в суд.

Ответить
Развернуть ветку
Aleksandr Uraksin

Павел, в настоящий момент в мировой практике не существует законов, которые регламентировали или как то ограничивали применение подобных технологий. Своим релизом мы как раз и обозначили направление нашей деятельности. Мы собираемся учитывать мнение обладателей голосов. Более того мы сами выступаем инициаторами подписания соглашений со знаменитостями на использование их синтезированных голосов и вместе с тем работаем над инициативой по созданию нормативной базы для защиты от DeepFake технологий в злонамеренных целях.

Ответить
Развернуть ветку
2 комментария
Рустам Фатов

хакеров как раз остановит запрет суда на использование чужих голосов

Ответить
Развернуть ветку
1 комментарий
Dmitry Martemyanov

В свете перехода на голосовую биометрию - можно будет на кого угодно кредиты брать? Круто.

Ответить
Развернуть ветку
Tirskih Elisaveta

Не хотелось бы расстраивать тех, кто так собирался делать, но именно по этой причине в открытом доступе сервиса не будет:) 

Ответить
Развернуть ветку
2 комментария
Semyon Krylov

Ещё несколько профессий на грани вымирания (чтение аудиокниг, дубляж фильмов, озвучка рекламы)

Ответить
Развернуть ветку
Георгий Марченков

Вангую кризис имен для роботов! Мне Олегов, Алис, Вер в жизни хватает. Неужели никто не хочет придумать че нить прикольное?

Ответить
Развернуть ветку
Slava Itprofi

Меня зовут Епихондрий. 
Если что-то пойдет не так,
скажите "Хватит" или "позови Олега"

Ответить
Развернуть ветку
Mike Kosulin

Марусю забыл.

Ответить
Развернуть ветку
Антон Херсун

Как вам имя Тадеуш? 

Ответить
Развернуть ветку
Звенислав Николаевич

Grzegorz Brzęczyszczykiewicz

Ответить
Развернуть ветку
Макс Мухарёв

Лучше всего - позволить задать имя самостоятельно

Ответить
Развернуть ветку
С Ром

Ребята круто позаимствовали и присвоили чужую опенсорс технологию. Пруф https://github.com/CorentinJ/Real-Time-Voice-Cloning. Смотрите дату создания репо и дату создания веры войс...

Ответить
Развернуть ветку
Алексис Второй

Да, интересно.

Ответить
Развернуть ветку
Андрей

Поддержу, пожалуй, гипотезу, что инфоповод на грани фейка. Очень уж похоже на очередной вирал, а с учётом упоминания Бекмамбетова, наверное, стоит ожидать кина на тему к новому году.
Сильно похоже не на синтез, а на микс из нарезанных семплов, перемежаемых начиткой с придыханием от Собчак.

Ответить
Развернуть ветку
Цой жив

Конечно. Если бы все работало, то сразу бы сделлаи web-версию. Вводишь любой текст и ВВП тебе его зачитывает. Как это было еще аж в 2010

Ответить
Развернуть ветку
Solomon Vagner

"В основе Vera Voice лежит нейросеть"
Если у гугла и яндекса за алгоритмами поиска и нейросетями стоят армии асессоров и прочих "чернорабочих", то тут несколько пародистов.

Ответить
Развернуть ветку
Slava Itprofi

Понятно, теперь с новым годом нас будет поздравлять Вера Дипфейковна.

Ответить
Развернуть ветку
Цой жив

Розыгрыши и игры, так себе польза от технологии. Помню, сотовые операторы такую услугу продавали - не зашло.

Ответить
Развернуть ветку
Tirskih Elisaveta

Да, мы тоже так думали, но потом, когда стали проводить фокус-группы, поняли, что это один из самых популярных запросов у широкой аудитории. Все хотят получить поздравление от звезды или президента:) При этом помимо этих кейсов существует еще множество бизнес применений: аудиокниги, озвучка фильмов, репортажей, интернет вещей и тд.

Ответить
Развернуть ветку
2 комментария
Олег Нечаев
Розыгрыши и игры, так себе польза от технологии. 

Ну так и я сначала на компьютере играл, а потом только стал играть в Basic, Asm, Pascal, C, PHP.

Помню, сотовые операторы такую услугу продавали - не зашло.

Вот друг вас пригласит в гости на пиво и предложит КУПИТЬ бутылочку пива у него, тоже, думаю, не зайдет.

Ответить
Развернуть ветку
Yury Bocharov

РекрутЁр?????? Что за отвратное издевательство над словом? Безграмотно! Минус 10 очков Гриффиндору!

Ответить
Развернуть ветку
Dmitriy Chernov

Уже исправили?))

Ответить
Развернуть ветку
1 комментарий
Mike Kosulin

Сколько розыгрышей от Грефа будет.

Ответить
Развернуть ветку
Денис Пихаров

Синтез речи по шаблону уже давно есть, не? Недавно даже редактор подкастов вышел, в котором голос можно через транскрипт редактировать.

Ответить
Развернуть ветку
Tirskih Elisaveta

Конечно, text-to-speech есть довольно давно. Но вот синтеза голосов знаменитостей на русском языке еще не было:) 

Ответить
Развернуть ветку
1 комментарий
Алексей Козлов

А можно, чтобы голос пел? Например, воссоздать творчество Цоя или Меркьюри?

Ответить
Развернуть ветку
Vadym Babaiev

Сайт, отстойненький, кстати. Есть над чем усердно потрудиться

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Джек Воробей

вобще не одно и то же

Ответить
Развернуть ветку
Диктор Павел Константиновский

Мне интересно, как разработчики планируют научить робота понимать текст? А подтекст?

Ответить
Развернуть ветку
Евгений Ефимов

А зачем его понимать? Речь просто об озвучивании чужим голосом готового текста.

Ответить
Развернуть ветку
3 комментария
Цой жив

Робота Веру можно выкинуть... а вот синтез голосов, это прикольно.

Ответить
Развернуть ветку
Сын Игоря Николаева

Попробовал использовать Yandex SpeechKit, нифига не похоже

Ответить
Развернуть ветку
Aeroradar

Использовать голос Пу в рекламе продукта - оттолкнуть сколько там процентов потенциальных клиентов? 

Ответить
Развернуть ветку
Tim А.

Мда, с интонациями пока беда.

Ответить
Развернуть ветку
Алексей Тарасов

Вот чей голос стоит "оцифровать" для озвучки книг.

Ответить
Развернуть ветку
Maxim Markov

Пелевин в "Generation П" предсказал, что вся политика будет в нейросетях происходить и стримиться в телевизоры

Ответить
Развернуть ветку
Цой жив

Чем хороша команда Stafory, это то что они умеют впаривать абсолютную хрень. Собственно, это и есть предпринимательство в действии.

Ответить
Развернуть ветку
Павел Шмель

трунька

Ответить
Развернуть ветку
62 комментария
Раскрывать всегда