Автор: PostScriptum
Я свое утверждение обосновываю (читайте ранее). А вы делаете голословные заявления.
|
|
Хорошо выделяются только простые звуки при низком уровне помех.
Простой звук это звук, в спектре которого мало частот, частоты легко разделяются и спектр не меняется со временем. DTFM это пример простого звука, поскольку это сумма двух синусоид. Все естественные звуки сложные. Все естественные характерные звуки, естественно, сложные тоже. Характерный звук это звук, образцы которого записаны в чистом виде (без помех). Вы понимаете задачу выделения характерного звука как выделение искусственного простого сигнала методом подавления шума (алгоритмического фильтрования). Можно и так понимать. В таком урезанном формате задача выделения характерного звука решается алгоритмически. Но это как раз пример ограниченности алгоритмического решения задач.
Человек как любое живое существо умеет выделять характерный звук среди других звуков. Алгоритм этого сделать не может принципиально. Поведение естественного звука в любой момент времени для алгоритма совершенно непредсказуемо, даже если алгоритм обладает знанием всех характеристик характерного звука по сколь угодно большому набору образцов. Дело в том, что, смешиваясь, естественные звуки мешают и все свои характеристики. Любой, сколь угодно сложный, алгоритмический анализ не может дать ответ, где в этой смеси чье, поскольку везде (в любой момент) в этой смеси все общее. Поэтому никакой сколь угодно сложный алгоритм не может “понять” что собственно нужно выделять и что фильтровать. Живые существа это умеют делать каким-то иным способом.
Каким способом я не знаю.
Мои цели скромные:
1. Обратить ваше внимание на ограниченность алгоритмического решения задач.
2. Найти людей, которые это понимают, чтобы вместе искать иной неалгоритмический подход к решению задач.
Мне удавалось подбирать параметры фильтров с интересными эффектами для некоторых фрагментов. Но искажения всегда были хорошими, а качество выделенного звука плохим. На других фрагментах этот эффект никогда не работал, даже с плохим качеством, т.е. с большим трудом подобранный набор параметров всегда был фрагментнозависим. И самое главное: параметры фильтра подбирал не алгоритм, а человек.
Алгоритм звук не распознает по простой причине – он его не слышит.
По-видимому, живое существо, воспринимает (слышит) характерный звук как цельность, не расчленяя звук на составные элементы и характеристики. Думаю естественно будет называть эту цельность “ощущение звука”. Для алгоритмической обработки звука необходим именно дискретный анализ, но при дискретном анализе звука, собственно звук исчезает. В этом разница.
Кажется, задача решается, алгоритмически. Но это только кажется нам. Это сегодня самый популярный наш самообман. Любая задача хорошо решается алгоритмически только для хорошоформализуемых образов и сред. Отсюда объективно существующий предел качества алгоритмического решения задач.