2kek
Возникла интересная мысль: голос довольно сложная конструкция... попробуйте распознать нечто более простое - морзянку!
Нашел пару программ под андроид...
https://play.google.com/store/apps/details?id=org.jfedor.morsecode&feature=related_apps#?t=W251bGwsMSwyLDEwOSwib3JnLmpmZWRvci5tb3JzZWNvZGUiXQ.. -> пример1
https://play.google.com/store/apps/details?id=com.wolphi.cw&feature=more_from_developer#?t=W251bGwsMSwyLDEwMiwiY29tLndvbHBoaS5jdyJd -> пример2
выглядит внушительно и кажется не таким простым... но ЯВНО ПРОЩЕ голоса.
Неплохой промежуточный этап - вполне можно написать ПРОСТОЙ генератор морзянки, пускать в канал анализа напрямую или записать в файлы, файлы проиграть на соседнем комьютере/мп3-плеере для создания нужного уровня шумов, динамически управлять "растянутостью" проигрывания...
Прикиньте результат - если бы ВЫ могли понимать на слух язык морзянки... Идете по улице и вместо привет слышите сигнал - и понимаете его... или гугл очки быстро печатают перед вами "вдруг" распознаный сигнал... не плохое начало! И всяких гадостей с уровнями, громкостями, растянутостью, смещением в частотах при разработке вам гарантированы! А от этого перейти к голосу будет намного проще!!!
Будет лишнее время - сам попробую...
p.s. думаю в инете можно найти реальные морзяночные сигналы или найти на любительских радио частотах...
p.s.s. есть много генераторов морзе-звука:
генератор1 генератор2