Автор: Tester64
Одну короткую фонему ухо почти не распознает. Возможно это нюанс человеческого уха - только в комплексе. Когда-то долго (часов 10) поигрался со своим голосом. МА в долю секунды ничем не отличается от МО и МУ. Попробуйте только фонему А или затянутую МА-А-А-А. Попробуйте написать НАДЕЖНЫЙ метод выявления одной фонемы А в бесконечном потоке.
|
|
Вот тут вы правы и неправы.
Что такое одна короткая фонема? Я подразумеваю взрывные.Полагаю что именно взрывные звуки эволюция научилась слышать в первую очередь
Это удар. Палкой о палку например.Что же касается МО МУ и МА - то тут действительно нет особой разницы.
Имеет значение только изменение параметров спектра во времени.
Но даже в этом случае в слитной речи я не часто слышу отличие
кОрова от кАрова.
Единственно где можно четко услышать гласную - это ударная гласная.
Ударная гласная характеризуется максимально мощностью и максимальным значением частоты основного тона. Ну например на других гласных 100гц, а на ударной - 150.
Попробуйте проговорить А-О-У. Происходит движение губ.
Они перетекают друг-в-друга плавно. Между ними нет строгой разницы.
Буквы Э-И-Ы - тоже один черт.
Если вы вырезаете кусочек 20 мс из фонемы МА,
вы не можете услышать что там было А или О.
Просто потому что в 20 мс на частоте 400 гц поместится всего 8 периодов.
А 600гц - 12 периодов.
А в более длинный кусочек, например 80мс поместится уже
32 периодов для 400 гц и
48 периода для 600 гц.
Разница становится более выразительной. Не меняется пропорция (в 1.5 раза), но меняется доверительная оценка для этого соотношения (ну точно в 1.5 раза!).
Это также как и преобразование фурье, чем больше точек фурье - тем лучше разрешающая способность по частоте.
Безусловно мысль о том что надо анализировать какие-то магические 40 мс или 20 или другие магические N мс - не очень верная.
Конечно лучше выделить фонему на протяжении всей своей длительности и анализировать ее спектральный отклик по всей длительности.
ВЫВОД: Нужен алгоритм - способный, не разбираясь в том, какая ИМЕННО звучит фонема провести разметку (фрагментацию) во времени, на предмет появления новых фонем.