GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.50 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Зри в корень!
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 14:44
Собственно получается количество коэффициентов фильтра или размер блочного фурье должен быть (частота дискретизации сигнала / частота дикретизации результата *3).
Для нечетного кол-ва коэффициентов (ЧДС/ЧДР)*3 +1.
Видать Хэмминг именно так и придумал свое окно ...
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 22:07
Цитата:
Автор: Артем
это на самом деле тоже самое что сделать преобразование фурье и проинтегрировать полосы...
Сколько полос в соответствие со шкалой Мел-а я хочу? Например 32. Но 32 это меньше чем 320 при частоте дискретизации 16000?

Что такое 320?
Количество частот разложения Фурье зависит от количества взятых для анализа отсчётов, а не от частоты дискретизации.
Возьмите для фурье 64 отсчёта и получите 32 значения спектра.
(Недостаток фурье только в равномерности. Для низких частот спектр желательно чаще чем для высоких).
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 23:53
Цитата:
Автор: Артем
Вот я и говорю нефиг брать фильтры с большим кол-вом коэффициентов!
Надо брать фильтры с правильным количеством коэффициентов!
И я это обосновал!

Абсолютно верно. 24 равномерно распределенные частоты в диапазоне от 120 до 3500 гц при обратном Фурье звучат довольно сносно. Я это делел не оптимально: брал 240 частот, а затем их преобразовывал к 24-рем. Но наверно можно сразу это получить из Фурье.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 14 авг 13 3:35
Цитата:
Автор: Анатоль

Что такое 320?
Количество частот разложения Фурье зависит от количества взятых для анализа отсчётов, а не от частоты дискретизации.
Возьмите для фурье 64 отсчёта и получите 32 значения спектра.
(Недостаток фурье только в равномерности. Для низких частот спектр желательно чаще чем для высоких).


да.320 - это кол-во отсчетов. допустим после фурье я получаю 320 комплексных значений. половину выкидываем в силу свойства симметрии спектра для чисто вещественных сигналов.
Остается 160 комплексных значений. Берем модуль комплексных чисел.
Получаем 160 вещественных значений.
Теперь можно проинтегрировать (просуммировать) по полосам. например сумма с 1-го по 5-ое значение - это полоса 1. со 6-го по 16-ое значение - полоса 2 ... с 101-го по 160-е - последняя полоса. Таким интегрированием мы можем выбрать полосы неравномерно. Например в соответствии со шкалой Мела или Kek-а.

Второй способ- обойтись без Фурье, с помощью комплексного фильтра.
Рассчитываем фильтр из 320-и коэффициентов, который пропускает одну полосу.
В эту полосу попадают сразу несколько частот, как если бы сделали интегрирование по спектру. Таким образом мне не нужно 160 фильтров, я сразу рассчитываю 32 фильтра.
Каждый фильтр имеет разную ширину полосы пропускания.
Как вы и сказали, в нижних частотах - поуже, в высоких - пошире. Например в соответствии со шкалой Мела или Kek-а.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 14 авг 13 3:53
Цитата:
Автор: Kek
Абсолютно верно. 24 равномерно распределенные частоты в диапазоне от 120 до 3500 гц при обратном Фурье звучат довольно сносно. Я это делел не оптимально: брал 240 частот, а затем их преобразовывал к 24-рем. Но наверно можно сразу это получить из Фурье.


Вот эти мои последние посты о том какого размера должен быть фурье - это с тем чтобы не потерять ни капли энергии исходного сигнала, и не умножить какую-то энергию.
Моя формула говорит что фурье надо брать с пересечением по времени - и вывод, размер фурье должен быть намного меньше. В тоже время результат можно интгерировать по времени.
Интегрирование - не теряет и не выкидывает энергию, оно энергию размазывает ...
Что допустимо ...
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 14 авг 13 3:56
Цитата:
Автор: Артем

Второй способ- обойтись без Фурье, с помощью комплексного фильтра.


Вообще-то, способов тьма
Мы вот, например, лет 10 назад исследовали возможности гребенчатых фильтров, ставя во главу угла разделение голосов, чтобы забыть про феномен застольной беседы
Но на полдороги вынуждены были это дело остановить, так как заказчик прекратил свое существование
И вообще, каждый метод анализа имеет свои плюсы и минусы, оценит ь которые можно, лишь глядя на все это сверху, а не снизу
Ну, а если просто хобби, то можно все
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 14 авг 13 4:04
Цитата:
Автор: Slava
Вообще-то, способов тьма


Мои два способа - это даже просто один способ, математически - это просто перестановка мест слагаемых, что дает многократный прирост в скорости.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 14 авг 13 4:21
Цитата:
Автор: Артем
Мои два способа - это даже просто один способ, математически - это просто перестановка мест слагаемых, что дает многократный прирост в скорости.


Ну и что из того, что скорость большая, если понадобиться по существу может нечто совсем иное
Нам там тоже скорости не хватало, но мы это оставили на потом, так как сначала нужно было понять, а достигается ли так вообще нужный эффект
Впрочем, у нас - своим привычки , у вас - свои
Все нормально

[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 14 авг 13 4:33
Цитата:
Автор: Slava
Ну и что из того, что скорость большая, если понадобиться по существу может нечто совсем иное


да нет же. размышления о размере фурье с тем чтобы не терять никапли энергии - это один тезис. Неимеющий отношения к скорости. Второй тезис что есть два способа. Оба они - идентичны. Но один из них быстрее.
[Ответ][Цитата]
victorst
Сообщений: 821
На: Проект Sound-Agent. Зри в корень!
Добавлено: 19 авг 13 3:17
Изменено: 28 окт 13 7:15, автор изменений: Kek
del
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 19 авг 13 5:31
Изменено: 28 окт 13 7:15
del
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 19 авг 13 6:27
Изменено: 28 окт 13 7:16, автор изменений: Kek
del
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 19 авг 13 6:28
Изменено: 28 окт 13 7:16
del
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 23 авг 13 21:54
На данный момент накоплено много материала по обработке звукового потока. Предстоит процесс систематизации и проверки. Но все это будет пока в рамках «классического» (см. начало) подхода. Однако на всей этой «куче» материала как гриб после хорошего дождя на удобренной почве «выросла» мысль: интеллект – это способность системы постоянно обучаться. До сих пор нет такой системы, реализующей два этих качества постоянно и обучаться.
Обучение, ограниченное рамками поставленной цели есть, хотя я примеров привести не смогу. Интерес представляет алгоритм не зависящий от конкретной цели, инвариантный относительно входного потока. Это хорошая самостоятельная задача, которую надо рассматривать и проверять на простых примерах.
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Зри в корень!
Добавлено: 25 авг 13 21:57
Цитата:
Однако на всей этой «куче» материала как гриб после хорошего дождя на удобренной почве «выросла» мысль: интеллект – это способность системы постоянно обучаться. До сих пор нет такой системы, реализующей два этих качества постоянно и обучаться.
Обучение, ограниченное рамками поставленной цели есть, хотя я примеров привести не смогу. Интерес представляет алгоритм не зависящий от конкретной цели, инвариантный относительно входного потока. Это хорошая самостоятельная задача, которую надо рассматривать и проверять на простых примерах.
Мысль хорошая, но не своевременная! Не стоит думать об универсальном и всемогущем "решателе", когда нужно просто забивать гвозди. Решите примитив. Добейтесь хотя-бы 40-50% узнаваемости ваших слов ПРОГРАММОЙ (а не Вашими ушами после обработок). Тогда уж стоит задуматься о повышении качества распознавания чем-нибудь еще, когда руками подправлять распознающие фильтры надоест...
[Ответ][Цитата]
 Стр.50 (78)1  ...  46  47  48  49  [50]  51  52  53  54  ...  78<< < Пред. | След. > >>