Ученые из Монреальского института изучения алгоритмов (MILA) в Канаде показали технологию синтеза речи нового поколения, которая способна почти в точности скопировать голос человека. Прослушав всего минуту его речи, компьютер будет иметь возможность воспроизвести целые слова и фразы, чуть отличимые от оригинала.
Задействуя вычислительные кластеры на GPU-ускорителях, алгоритмы имеют возможность генерировать более тысячи предложений не более чем за полсекунды. Технология до сих пор далека от идеала, однако любой человек, услышав искусственный голос, будет иметь возможность сразу догадаться, кто произносит речь.
Канадские исследователи признают, что их разработка имеет возможность быть применена преступниками, чтобы ввести в заблуждение дипломатов и СМИ, а также помочь появлению новостей-фальшивок. Помимо этого, Lyrebird имеет возможность быть задействована мошенниками для кражи идентификационных данных. Из-за этого, подчеркивает PCMag, алгоритмы были выложены в открытый доступ — так, чтобы любой человек был информирован про то, что аудиозапись более не является надежным источником доказательств.