GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.49 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Зри в корень!
ЭСГТР
Сообщений: 8461
На: Проект Sound-Agent. Зри в корень!
Добавлено: 12 авг 13 21:24
Изменено: 28 окт 13 7:13, автор изменений: Kek
del
[Ответ][Цитата]
ЭСГТР
Сообщений: 8461
На: Проект Sound-Agent. Зри в корень!
Добавлено: 12 авг 13 21:27
Вот такая мысль...:

Цитата:
Моделирование процессов мозга
Модель процессов мозга: чувство, знание, сознание, мышление, разум (проект "Бион").

Сферическая мембрана (аналог коры мозга) состоит из колонок C-R-Cn, формирующих
специализированные слои: чувств, знаний, мыслей. Конденсатор (слои 1-6) и индуктор
(биполярный слой 4) образуют колебательный контур 10 Гц (маятник часов) и биоритм.
Рецепторы (конденсаторы энергии цвета и звука) формируют рецепторные потенциалы.
Колонки C-R-Cn (слои: 5-4-3), работая на частоте 20-120 Гц, ведут отбор энергоинфор-
мации: чувств (слой 2) и знаний (слой 5), формируя ансамбли импульсов (знаки слоя 3).
Знаки чувств и знаний существуют 0,05 секунд, а затем исчезают и формируются снова.
Маятник часов имеет два полупериода (отбор и сознание знаков) - 10 мыслей в секунду.
Индивидуальный биоритм (логика отбора знаков) формирует образы и понятия - мысли.
Отбор знаков, используя технологию пачек и строк, формирует импульсный язык мозга.

Мембрана (конденсатор) преобразует энергию электромагнитных волн в электрическую
энергию ощущения цвета и звука. Рецепторный слой, ощущая энергию (E = Pt) регули-
рует поток электронов в мембране (конденсатор), формируя рецепторные потенциалы с
частотой импульсов до 1000 Гц. Фильтры C-R-Cn, работая на частоте биоритмов 20-120
Гц, ведут дискретный отбор импульсов, формируя ансамбли (знаки). Элементы памяти
ведут отбор знаков на частоте 10 Гц, формируя потенциалы действия (знания и мысли).
[Ответ][Цитата]
гость
78.25.121.*
На: Проект Sound-Agent. Зри в корень!
Добавлено: 12 авг 13 21:34
Изменено: 28 окт 13 7:13, автор изменений: Kek
del
[Ответ][Цитата]
ЭСГТР
Сообщений: 8461
На: Проект Sound-Agent. Зри в корень!
Добавлено: 12 авг 13 21:48
Изменено: 28 окт 13 7:14, автор изменений: Kek
del
[Ответ][Цитата]
гость
78.25.121.*
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 0:51
Изменено: 28 окт 13 7:14, автор изменений: Kek
del
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 8:32
Цитата:
Автор: ЭГТР
Знаки чувств и знаний существуют 0,05 секунд, а затем исчезают и формируются снова.
Маятник часов имеет два полупериода (отбор и сознание знаков) - 10 мыслей в секунду.
Индивидуальный биоритм (логика отбора знаков) формирует образы и понятия - мысли.
Отбор знаков, используя технологию пачек и строк, формирует импульсный язык мозга.


Вот про импульсный язык мозга я уже слышал. Я тоже над этим думаю ...
А вот про пачки и строки я не понял. Нельзя ли еще раз пояснить?
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 8:36
Я вчера с Кек-ом разговаривал. Возникло желание добавить в визуализацию не только спектр по мелу, но и кэпстр по мелу. Возможно еще и кэпстр от кэпстра. Тоже по мелу.
В том смысле что кэпстр надо брать от обычного спектра, а потом уже приводить к шкале Мела.
И функцию Пирогова применять не к спектру, а к кэпстру.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 11:24
Эх, Артем... здесь нельзя произносить слово "MEL-шкала". Я вот обещал файлы, а вдохновение покинуло меня. Хотел сегодня записывать в память именно преобразованный буфер частот из 20 значений. Оказалось совсем другая математика, надо сочинять новый класс. Забавно должно получится. Раньше я записывал локальные максимумы без значения амплитуды, но их число было 240. Теперь после kek-преобразования частот всего 20, зато амплитуды типа integer. Надо все перестраивать...
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 12:25
Сегодня меня посетило озарение по почве чистой математики.

Что такое преобразование Фурье ? - это ортогональное преобразование.
Что значит ортогональное? это значит что частоты полученные из фурье некоррелируют во общем случае. Т.е. для всех видов звуков какие бывают.

Теперь далее. Мы берем фурье после умножения сигнала на окно хэмминга, и таким образом вносим коррелированность в соседние между собой частоты. Но несмотря на то, что окно хэмминга вносит корреляцию соседних частот - энергия спектральных компонент никуда не денется, она распределится между соседними частотами.

Допустим мы берьем фурье с окном хэмминга каждые 10 или 20 или 40 мс. Интуиция подсказывает что неплохо бы брать фурье с пересекающимися окнами.
Если мы берем фурье с непересекающимися окнами, то на стыке окон - мы просто теряем сигнал, теряем информацию, теряем энергию.

А каким должно быть пересечение?
вспомним формулу окна хэмминга. 0.54-0.46*cos(2*pi*j/(fftSize-1))
Косинус! нам нужно пересекать окна таким образом чтобы сумма кавдратов соседних окон хэмминга была равна 1-це. (или очень близко к 1-це)
Тогда мы можем быть уверены что не потеряли ни капли энергии исходного сингнала!


[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 12:43
Второе.
Я делал разложение в спектр с помощью комплексных фильтров.
Как я рассчитываю комплексный фильтр?
Рисую желаемую АЧХ - и делаю обратное преобразование фурье.
Желаемая АЧХ такова, что мнимая часть =0 а вещественная часть - симметрична относительно половины частоты дискретизации. И вещественная часть равна 1-ц где пропускаем сигнал и равна 0- где не пропускаем.
Результат обратного преобразования умножаем на окно хэмминга и нормируем чтобы сумма коэффициентов была равна 1-це.

Скажите, кто мешает мне взять в качестве желаемой АЧХ - 1 спектральный отсчет?
В этом случае мы получаем комплексный вэйвлет.
Но если я беру не 1 отсчет а несколько подряд идущих - то это уже приличный полосовой фильтр.

Профильтрованный сигнал - не теряет энергию во времени.
Т.е. это на самом деле тоже самое что сделать преобразование фурье и проинтегрировать полосы. Это АБСОЛЮТНО тоже самое, но перемена мест слагаемых.
И эта перемена увеличивает скорость в разы.
Сколько полос в соответствие со шкалой Мел-а я хочу? Например 32. Но 32 это меньше чем 320 при частоте дискретизации 16000?
А если я увеличу частоту дискретизации? А моих полос останется опять 32.
Вот она скорость!!! Тоже самое но гораздо быстрее!!!

ПЕРЕМЕНА МЕСТ СЛАГАЕМЫХ - НЕ МЕНЯЕТ РЕЗУЛЬТАТ, НО МЕНЯЕТ СКОРОСТЬ !!!

А я зачем-то делал фильтры с пересечением!!!? Т.е. здесь я не теряю энергию, а наоборот дублирую ее на стыке фильтров!!!
Фильтры надо делать не с пересечением, а стык-в стык. Тогда энергия не будет терятся.

Но опять же. Зачем фильтровать ВЕСЬ сигнал? достаточно отфильтровать 1 отсчет каждые ... Каждые сколько?
Вспоминаем формулу окна хэмминга: 0.54-0.46*cos(2*pi*j/(fftSize-1)), это значит что в зависимости от кол-ва коэффициентов фильтра, мне нужно делать шаг такой чтобы окна хэмминга необходимых для вычисления соседних отсчетов давали в сумме квадратов 1-цу.
Опять!

[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 12:53
Вот оно вдохновение!
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 13:45
Цитата:
Автор: Артем

А я зачем-то делал фильтры с пересечением!!!? Т.е. здесь я не теряю энергию, а наоборот дублирую ее на стыке фильтров!!!
Фильтры надо делать не с пересечением, а стык-в стык. Тогда энергия не будет терятся.


Фильтры звенят
И чем круче срез, тем больше звона
У меня такое ощущение, что вы теперь с удовольствием почитаете страую книжку А.А.Харкевича "Спектры и анализ"
Это классика, и ничего лучше вы вообще не найдете
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 14:23
ПАДАЖДИТЕ. Я еще не все.

Я представил себе что из формулы окна хэмминга я мог бы рассчитать каким должно быть пересечение блочных фурье.
Но я не доверяю себе. Я провел численный эксперимент.
Вот выводы:
https://securisync.intermedia.net/IMWeb/s/5twtrLBCKL0Qyx95f2k_hw

Выводы - ошеломили меня.
Если я строю отображалку на 1000 гц, то в соответствие с этой формулой мне нужно делать фурье всего на 49 отсчетов !!! Это почти что мои 32 шкалы по Мелу.
Не наступил ли я тут себе на пятку?

Для 200 гц надо брать фурье на 241 отсчет.
Для 100 гц надо брать фурье на 481 отсчет.
Что фурье-что фильтры - один фиг, поэтому мне нравятся нечетные коэффициенты.
(все эти числа рассчитаны для частоты дискретизации сигнала 16000гц)
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 14:27
таким образом не важно, делаю я 49 отсчетов с выходом 1000 гц или 481 отсчет с выходом 100 гц. Далее я могу делать с моей рельефной картинкой преобразования.
Фильтрацию картинки. А ведь это быстрее и понятней.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 13 авг 13 14:39
Цитата:
Автор: Slava
Фильтры звенят
И чем круче срез, тем больше звона


Вот я и говорю нефиг брать фильтры с большим кол-вом коэффициентов!
Надо брать фильтры с правильным количеством коэффициентов!
И я это обосновал!
[Ответ][Цитата]
 Стр.49 (78)1  ...  45  46  47  48  [49]  50  51  52  53  ...  78<< < Пред. | След. > >>