ГлавнаяТелекомСобытияИскусственный интеллект IBM генерирует голос человека за 5 минут разговора

Искусственный интеллект IBM генерирует голос человека за 5 минут разговора

IBM

Компания IBM создала новый ИИ-алгоритм, который через пять минут после ознакомления с голосом собеседника, способен самостоятельно произносить любой текст его голосом.

По заверению компании, новый ИИ-алгоритм способен в режиме реального времени строить диалоги и адаптироваться к различным стилям разговора и тембрам голоса. Разработчики отмечают, что благодаря синтезу нейронной речи на основе модульной архитектуры им «удалось создать реалистичный компьютерный голос».

Система состоит из трех составных частей: предиктора функции просодии, предиктора акустических характеристик и нейронного вокодера. Совместно все три компонента позволяют максимально точно определить стиль говорящего, а также подстроить высоту и энергию подачи речи с учетом акустических искажений. По данным компании, для обучения нейросети достаточно лишь пяти минут прослушивания собеседника.

Ознакомиться с примерами звучания нового синтезатора речи можно на сайте сервиса IBM Watson.

HP обновила премиальный ноутбук-трансформер Spectre x360 13
Hyundai будет создавать летающие автомобили под руководством бывшего инженера по аэронавтике из NASA
Оформление подписки
Оформить подписку на журнал InfoCity вы можете заполнив приведенную
ниже форму. Стоимость одного выпуска — 2 маната.
Ваше имя
Адрес доставки журнала и номер телефона для контактов
Число месяцев подписки
Благодарим вас за подписку!