Google создала неотличимый от голоса человека генератор речи
Исследователи из компании Google в декабре опубликовали исследование, в котором они представили систему речевого воспроизведения текстов Tacotron 2, которая может полностью повторить голос человека. Об исследовании сообщает Quartz.
В основе технологии лежат две нейросети глубокого обучения. Первая преобразовывает текст в спектрограмму (изображает аудиочастоты в зависимости от времени). Затем спектрограмму отправляют в нейросеть WaveNet, которая и создает необходимые звуки.
Система способна обрабатывать сложные слова и имена, а также изменять интонацию в зависимости от пунктуации. Google встроила аудиозаписи с голосом системы на своем сайте. Система имеет и недостатки – пока она натренирована имитировать лишь женский голос. Для того, чтоб научить ее говорить мужским голосом, потребуется повторный цикл обучения.
Комментарии