GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.36 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 23 июл 13 9:09
Цитата:
Автор: dr2chek


Слава, передаю бразды правления в ваши руки, я что-то устал от этих бойцов. Желаю вам терпения


Спасибо
Мне просто молодняк интересен
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 23 июл 13 11:23
Цитата:
Автор: Slava
Скажите, плз, а эти цифры по надежности на каком словаре были получены?
И еще - как осуществляется синхронизация паттернов и распознаваемого?

Произнесенное слово и паттерн имеют начало и конец. Это определяется по предварительно вычисленному уровню шума. Начало и конец паттерна и слова разные. Коэф. корреляции вычислялся 3 раза, каждый раз начало слова сдвигалось относительно паттерна на величину кадра. Про словарь нечего сказать.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 23 июл 13 11:36
Цитата:
Автор: Kek


Произнесенное слово и паттерн имеют начало и конец. Это определяется по предварительно вычисленному уровню шума. Начало и конец паттерна и слова разные. Коэф. корреляции вычислялся 3 раза, каждый раз начало слова сдвигалось относительно паттерна на величину кадра. Про словарь нечего сказать.


Про сдвиги - понятно
А почему проблемы со словарем? - сколько слов было в работе, чтобы определить качество распознавания
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 23 июл 13 21:51
Цитата:
Автор: Slava
Про сдвиги - понятно
А почему проблемы со словарем? - сколько слов было в работе, чтобы определить качество распознавания

Слава, я не предаю большого значения этому методу, как самостоятельной и окончательной работе. Для меня было понятно, что это в принципе работает. Задача моя, как исследователя была освоить много разных подходов. Что я и сделал. Сейчас стоит задача скомпановать все методы в кучу.
Представление данных:
спектр за 40 мс с диапазоном значений 0-255
Методы:
1. Корреляционный анализ кадров
2. Анализ локальных максимумов частот
3. Анализ поведения локального максимума спектра спектра
4. Анализ огибающей временного сигнала

Все это есть, но чего-то не хватает... Чую...
Например думаю про разбиение спектра на полосы и вычисление внутри полос энергетической характеристики.
Мои наблюдения говорят, что частоты выше 1200 гц имеют меньше информативности и достаточно просто знать, что эти частоты есть в спектре. Мел шкалу для этого я не использую по причине временных затрат на это преобразование.
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июл 13 2:17
Цитата:
Автор: Kek
но чего-то не хватает... Чую...

Знания предмета, понимания.
Да и вообще Вы скорее администратор, а не исследователь.
[Ответ][Цитата]
гость
78.25.122.*
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июл 13 2:45
> чего-то не хватает

ну, для нестационарных рядов пошукать что-то типа вайвлет-анализа.
А если есть интерес к спектрам спектров, то спектральной обработке
можно подвергнуть и вайвлетограмму (уже не одномерный, а двумерный
объект).
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июл 13 8:44
Цитата:
Автор: Анатоль


Знания предмета, понимания.
Да и вообще Вы скорее администратор, а не исследователь.

Я инженер.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июл 13 8:47
Цитата:
Автор: гость

> чего-то не хватает

ну, для нестационарных рядов пошукать что-то типа вайвлет-анализа.
А если есть интерес к спектрам спектров, то спектральной обработке
можно подвергнуть и вайвлетограмму (уже не одномерный, а двумерный
объект).

На практике вейвлет не использовал и не знаю на сколько это хорошо в данной предметной области. Полагаю, что не очень это поможет.
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июл 13 10:22
Цитата:
Автор: Kek
Я инженер.

Это внешнее, случайное. Я же про Ваши способности говорю.
Вы организатор, а не разработчик, тем более не исследователь.
У Вас нет чутья предмета, какие-то случайные барахтания..
А вот работа с людьми Вам лучше удаётся.
Меньше сами делайте и больше других привлекайте.
Будет больше толка.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июл 13 12:39
Цитата:
Автор: Kek
На практике вейвлет не использовал и не знаю на сколько это хорошо в данной предметной области. Полагаю, что не очень это поможет.


да это по-сути гребенка фильтров. так-же как и преобразование Фурье по-сути гребенка фильтров. Так что ничего принципиального не дает.

я как раз вейвлет Морле + нейросеть делал. Как-то работает, но это похоже на результат с наскока.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 30 июл 13 9:11
Посмотрим в корень, сиречь, вернемся к истокам.

Все методы опираются на частотное преобразование Фурье. Мел-ы, кепстры и т.д.
Ну, какие-то достижения имеются, я тоже был заморочен этим спектром.
И даже спектром спектра..., до тех пор пока не взял старую добрую программу под названием Sound Forge 4.5.
Записал слово и стал его разглядывать не в частотной, а во временной области.
Тут надо сказать, что Слава тоже кое-что рассказал именно про временную область и про метод,
который называется клипирование. Спасибо ему отдельно. Просто иногда из разрозненных фактов
собирается цепочка, которую я хочу озвучить.
И так смотрим на картину:
Слово "ЩЕКОЛДА"
Я без труда выделил характерные участки, соответствующие буквам.
Длительность этих участков разная, и это понятно. Чем плох частотный метод? А тем,
что прреобразование Фурье не привязано к длительности звучания вообще,
а шпарит себе асинхронно по 40 милисекунд. Из-за этого и возникают непонятные переходные процессы.
Здесь бы и сказать, что типа надо делать Фурье синхронно, предварительно выделив характерные участки.
Но. Если мы выделим эти характерные участки, а это сама по себе задачка.. то нафига нам тогда Фурье?
И вот тут я вспомнил про Славу и его метод клипирования.
Это, говоря языком схемотехника, коим я являюсь, процедура пропускания сигнала через компаратор, у которого есть порог срабатывания: выше порога - 1, ниже - 0. Значение порога = 0 АЦП.
Получаем набор ноликов и единичек. Дальше анализируем на всем участке фразы периоды чередования переходов из 0 в 1.
Наиболее часто встречаемые значения периода - и есть период частоты основного тона(ЧОТ). А, как вам?
Далее, чтобы выделить характерные участки можно провести клипирование не только на уровне нуля, но и взять еще пару - тройку уровней компарирования (см. синие горизонтальные полосы).
Эта информация что-то даст характерного для выделения участков.
Далее конечно надо сделать огибающую (см. зеленый цвет),
и на основании огибающей и выбирать дополнительные уровни компарирования (клипирования).
Все это в совокупности богатый материал, и что интересно мне кажется все эти методы побыстрей будут,
чем постройка спектра.
Это идея, кто со мной на штурм?
P.S. На нижней части картинки метод клипирования в действии. Амплитуд нету, они все под одну гребенку. Высокочастотные сигналы интерпретируются как залитые участки с большой интенсивностью.
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Зри в корень!
Добавлено: 30 июл 13 9:44
Все внимательно наблюдаем, как ЕИ пытается решить сложную задачу...
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 30 июл 13 9:52
Цитата:
Автор: Kek

И вот тут я вспомнил про Славу и его метод клипирования.


Спасибо, но метод - не мой
Кажется, он впервые возник еще в довоенное время
Почитайте книгу Цемеля - третий раз уже советую
Кстати, Цемель перед клиппированием подмешивал к сигналу выход с дифференцирующей цепочки - сильно улучшало результат
Ваша идея про клиппирование по разным уровням мне кажется потенциально интересной
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 30 июл 13 9:57
Еще одна лемма, требующая доказательства родилась из данного метода.
Берем временной сигнал, клипируем его сверху вниз N порогами. На каждом уровне считаем периоды перехода 0->1 Их набирается K значений. И вот вам представление в виде K периодов, которые легко перевести в частоты. Этот метод легко выполняется аппаратно без привлечения сложных вычислений, которые в современной электронике делаются DSP(Digital Signal Processor). Это полный аналог Фурье, только без фаз. Пардон, и без амплитуд спектральных частот.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 30 июл 13 10:02
Цитата:
Автор: Slava
Спасибо, но метод - не мой
Кажется, он впервые возник еще в довоенное время

Слава, я поэтому и обозвал заголовок как "Зри в корень". Все расслабились скоростными компами, а решение - то может быть весьма не затратным. Ведь в военное время не было компов, зато компараторы и счетчики импульсов на лампах были.
[Ответ][Цитата]
 Стр.36 (78)1  ...  32  33  34  35  [36]  37  38  39  40  ...  78<< < Пред. | След. > >>