Автор: dr2chek Но я не понял, где вы его возьмете (паттерн), и как будете накладывать |
|
Паттерном может быть мой голос или какой-нибудь диктор с зараее известным ЧОТОМ. Короче суть в том, что кто-бы не говорил, программа должна на выходе произносить это слово, но стандартным голосом. Здесь еще нет никакого распознавания, это просто такое слжное преобразование.
Автор: dr2chek А вы возьмите женский голос. У него первая гармоника низкая. Или звук голоса с небольшого радиоприемника - те же проблемы. |
|
Да, сложностей и так миллион, Слава вон кларнет хочет распознать или скрипку Паганини.
Я описал идею, пока не сделал, и не представляю поможет это или нет.
Уместен вопрос а зачем. Мы делаем таким образом инвариантное преобразование. Всего инвариантов 3.
Высота тона, громкость и скорость произнесения фразы. Самый сложный по моему, как раз высота тона. Если это можно будет побороть, то дальше легче.