Автор: Андрей Вы копаете там, где уже тысячу раз копали и ничего не выкопали. |
|
Спектр - более компактная форма - это раз. Ухо с волосками - делает спектр - это два. Но двигаемся мы не туда - это три. Моделировать речевой аппарат однозначно полезно и нужно. Для замыкания петли обратной связи. Это отдельная работа.
Но я именно сейчас попробую высказать направление.
Проект называется XXX-Agent, а не XXX-Filter. Но мы упорно хотим делать фильтр. У агента должны быть "ручки" и "ножки", которые представляют из себя некие параметры, доступные программе.
Критерий движения вперед у агента - это критерий новизны. Но на данный момент новизны так много, кадры получаются все время разные, что непонятно, а когда же она, новизна, закончится, чтобы включить какие-то оптимизационные критерии. Я говорил, что кепстральные коэфы - дают ложное срабатывание. Корреляционный анализ, тоже можно настроить так, что будет много похожих кадров.
Так вот. Предположим, что мы бинаризируем картинку так, что паттерн и слово будут представлять из себя прямоугольники. Сравнивая, их система будет быстро получать похожесть. Новизна закончится, а где ее взять? А надо изменить уровень бинаризации в сторону повышения детализации. Это изменение - и есть "ручки" и "ножки" агента. Агент получит новизну от детализации, которая вскоре так же должна закончится.
Это просто метод, который должен самонастраивать (пардон, Андрей не любит "само") настраивать систему. Детали этой настройки - отдельный разговор, но я просто опять возвращаюсь к методам, которые не включают в себя готовые параметры распознавания, а приобретаются в процессе.