Усех с праздником... господа....!!!
Такое осчусчение, что Вы хотите из звукофф поступающих на сенсоры после комочка ваты (фильтров то бишь) получить допустим слова. Однако не пробовали ли Вы получить слова слушая китайскую к примеру речь. А Ваш мозг значительно совершеннее Ваших "фильтров" с кадрами и гармониками.....
Мне так кааажеца, что так или иначе Вам придется вводить в систему "эталоны"/слова/слоги/фонемы/и т.д. и т.п. (в виде звуков, кодов, букофф на экране или как-то иначе) и все же искать способы связывания/сравнения (алгоритмы может быть) их с входными сигналами. Другое дело будете Вы это делать ручками и скальпелем, или же это будет происходить автоматически (в соответствующим образом созданных системах) в процессе обучения без скальпеля.... Мне так кааажеца - дело не в универсальных понятиях "объекта", а в связях одного (входных сигналов) с другим (с тем что Вам нужно, с тем что Вы хотите обозвать "объектами")....
Ну.... истин не глаголю.... тем более после праздников.....
P.s. Про сенсоры и эффекторы надеюсь жевать не надо.... (в случае подхода автоматического самообучения без скальпеля)