Подразделение Google DeepMind, занимающееся разработками в области искусственного интеллекта, известило о достижении прорыва в программном синтезе человеческого голоса. Новая технология — WaveNet — приближает устную речь, сгенерированную компьютером, к естественному звучанию голоса человека.
Большая часть компьютерных синтезаторов, как правило, применяют заранее составленную базу данных коротких фрагментов речи, записанных человеком. Из отрывков составляются свежие слова — так работают, например, голосовые помощники Siri или Alexa. Недостаток этого метода заключается в том, что затем изменить звучание голоса весьма сложно. Другие синтезаторы применяют более гибкий подход, генерируя речь точно на компьютере, однако Всплавает ощущение, что текст произносит робот, а вовсе не человек.
WaveNet — это разработка совершенно иного типа. Она учится на отдельных звуковых волнах, что дает возможность ей имитировать голос на 50% лучше нынешних технологий. Как выразила согласие фокус-группа, синтезированная WaveNet речь на английском и китайском языках звучит естественнее, чем какая бы то ни было из существующих программ Google для преобразования текста в речь.
Речь становится все более важным методом взаимодействия человека с техникой: от смартфонов до машин. Как сказал на прошедшей неделе интернациональный директор магазина Google Play Марк Беннетт, 20% поисковых запросов к Google на мобильных устройствах делаются с помощью голоса, а вовсе не текста.
WaveNet — слишком молодая технология для коммерческого использования на Android-смартфонах, Т. К. Ей нужны огромные вычислительные ресурсы для синтеза речи. Так или иначе, за дальнейшей судьбой WaveNet наверняка будут пристально наблюдать Amazon (Alexa), Microsoft (Cortana), эппл (Siri) и другие разработчики голосовых ассистентов.
Британская DeepMind, которая была куплена интернет-поисковиком в 2014 году за $533 миллиона, стала широко известна весной после обыгрыша корейского чемпиона в го. Компьютерная программа AlphaGo, разработанная инженерами DeepMind, одолела профессионального игрока Ли Седоля в 4-х партиях из пяти.