Фирма Adobe на ежегодной конференции MAX представила экспериментальную технологию, которая дает возможность редактировать звук так же нетрудно, как обычный текст. С помощью нового приложения, VoCo, будет возможно не только менять слова местами, но и вставлять свежие фразы — даже те, что человек в действительности не произносил.
При этом пользоваться " фотошопом для речи" очень просто: достаточно ввести слова в текстовое поле. Главный недостаток аудиоредактора заключается в том, что для генерации звука ему требуется большой объем исходных голосовых данных, На данный момент времени — около 20 минут. Взятый за образец аудиофайл программа раскладывает на фонемы (отдельные звуки, из которых состоят слова), пытаясь воссоздать голосовую модель говорящего.
VoCo чем-то похожа на Content-Aware Fill (заливка с учетом содержимого) — некогда казавшийся инновационным инструмент в Photoshop, который тоже дает возможность " из ничего" пририсовывать к изображению " недостающие" фрагменты. Слова, сгенерированные VoCo с нуля, звучат весьма близко к оригиналу, но несколько искусственно. Так или иначе, в Adobe осознают потенциал новой разработки, и уже задумались о вставке в аудиопоток водяных знаков, чтобы предотвратить применение программы мошенниками.