GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.17 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июн 13 4:09
Возможно не все читающие этот трэд умеют рассчитывать фильтры с заранее заданным АЧХ.
Пример трансверсального (симметричного фильтра) с конечно импульсной характеристикой
x - вход, y-выход.
y(i) =
a(n)*x(i-n) + a(n-1)*x(i-n+1) + ... + a(2)*x(i-2) + a(1)*x(i-1) +
a(0)x(i) +
a(1)*x(i+1) + a(2)*x(i+2) + ... + a(n-1)*x(i+n-1) + a(n)*x(i+n);

Чтобы рассчитать коэффициенты фильтра надо нарисовать желаемый спектр и сделать обратное преобразование фурьей.
Фазы подобрать так чтобы фильтр получился симметричным.

Чтобы узнать АЧХ фильтра надо отфильтровать единичный импульс 100000000 и сделать
прямое преобразование Фурье. Плученный спектр - это АЧХ фильтра.

Не удивляйтесь если АЧХ фильтра будет не точно совпадать с желаемым.
Невозможно сделать слишком узкий фильтр при огранниченном количестве коэффициентов фильтра.

[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 24 июн 13 9:33
Цитата:
Я после 9 июля подключюсь, предлагаю по скайпу пообщаться.

Если честно, не особо люблю скайп... Предпочитаю переписку (приват или почту) - проще обдуманно и развернуто описать любую мысль или идею... А общение голосом - это нарушает илюзию анонимности...

Цитата:
Это зря. не будет повторяемости. Только на файлах надо обучать.

Одно другому не мешает... Мечтаю сделать так, чтобы комп узнавал в аудио потоке известные фонемы/буквы, сказанные любым голосов в любом качестве. Позднее обьединю эти фонемы в набор слов. В идеале при проигрывании интернет-радио будет ловится, например, слово "привет", "радио", "погода" или "слушаем". При удачном результате будет загораться окно-индикатор со словом. Отловленое слово будет записываться из буфера в файл для прослушивания оператором и подтверждения или опровержения с последующим анализом. Если оператор услышит слово не распознаное, то его можно тоже записать (есть буфер на несколько минут) и обработать во встроенном (или прилагающемся) аудио-редакторе-анализаторе для понимания "почему не поймалось".
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 25 июн 13 8:08
Цитата:
Автор: Tester64
Мечтаю сделать так, чтобы комп узнавал в аудио потоке известные фонемы/буквы, сказанные любым голосов в любом качестве.

Всем привет, вернулся из деревни, а тут... фильтры цифровые!
Мечта хорошая, но как, какие методы выделения фонем?
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 25 июн 13 22:20
Цитата:
Мечта хорошая, но как, какие методы выделения фонем?
Хороший вопрос! Но я пока до него не дорос! Даже еще не доросла моя программа для FFT преобразования моего кольцевого буфера... Как я и говорил, сначала нужно отобразить 3Д картинку, а там уже буду думать о распознании... Сильно подозреваю что все дело в частотной, возможно математематически обработанной/вывернуто матрице. Но это все ждет... Пока пусть график громкостей бегать начнет... А это еще один поток прикручивать и синхронизировать. И прикрутить наконец безопасно/надежно получение втуреннего звука компа (аудио-плееры, онлай-радио, онлай-телевидение, ютюб, входящий на колонки скайп)
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 25 июн 13 23:17
Цитата:
Автор: Tester64
Хороший вопрос! Но я пока до него не дорос!

Хорошая визуализация, а именно этим вы занимаетесь, однозначно даст много пищи для размышления относительно кластеризации потока, выделения чего-нибудь регулярного из него.
Я насмотрелся на свои картинки... И тут есть два пути, о которых я говорил в статье.
1-ый - это на основе визуализации и всяких закономерностей делать фильтры, опять смотреть, опять делать фильтры, и не только. Возможно надо делать алгоритмы выделения различных областей так, как это делают для 2D-графики. Т.е выделять графические примитивы.
2-ой - это наплевать на все фильтры и вейвлеты... И все запоминать. А когда "запоминалка" разбухнет, то что-то делать с массивом данных. Мне ближе второй путь.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 25 июн 13 23:51
Цитата:
Автор: Kek
2-ой - это наплевать на все фильтры и вейвлеты... И все запоминать. А когда "запоминалка" разбухнет, то что-то делать с массивом данных. Мне ближе второй путь.

А система построенная на пакете категорий предлагаемых мной в Солянке примерно по типу Нечто-когнитрона, не будет запоминать, при необходимости "разбухать", и одновременно что-то делать с массивом данных?
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 0:23
Цитата:
Я насмотрелся на свои картинки...

о-о-о... Вы еще ничего не видели (если вы о Вашей программе, которую выкладывали)...

Цитата:
И тут есть два пути, о которых я говорил в статье.
1-ый - это на основе визуализации и всяких закономерностей делать фильтры, опять смотреть, опять делать фильтры, и не только. Возможно надо делать алгоритмы выделения различных областей так, как это делают для 2D-графики. Т.е выделять графические примитивы.
2-ой - это наплевать на все фильтры и вейвлеты... И все запоминать. А когда "запоминалка" разбухнет, то что-то делать с массивом данных. Мне ближе второй путь.

А мне явно ближе первый путь... Он надежнее. Хочу положить Ваше "А" и мое "А" рядом и визуально найти нечто схожее. Что-бы знать на что натравливать сравнение. Причем не уверен что прямой FFT даст искомое. Скорее прийдется придумать еще и формулу для преобразования этого FFT. Например производное. Есть еще мысль искать взаиморасположение пиков/спадов на графике... Короче аналог рапознания отпечатков пальцев. И потом, если Ваше и мое "А" вдруг не будет похоже на (например) женское "А", то сравнить еще и с ним, подправить схему поиска и переобучить поиск. Или, если окажется СОВСЕМ другим, то создать поиск "А2" специально для женских типов.

Ваше же №2 - надежда что распознавалка сама придумает что делать с гиганским буфером и успешно будет распознавать и женские и мужские фонем, да еще и не путать А и О.

А пока, увы, у меня закончилось свободное время, которое я выделил в этой неделе/месяце на распознавалку... Она у меня скромно сидит в часах, в режиме "отложено на 4 дня" и надеется что через 4 дня найду время для продолжения или отложу снова...

В идеале мне нужно еще (из глобального):
1) Доработать смену качества (битность+значений в секунду) буферов на лету
2) Правильно высчитывать громкость в зависимости от качества буфера для отображения в графиках
3) Рандом генератор заменить реальным аудио потоком (внутренним И внешним)
4) Вывести громкость в графики с учетом ускорености и замедлености (отдельная тема для разговора)
5) Отдохнуть и насладиться графиками при просмотре телека, прослушивании аудокниг и музыки... Возможно исправить мелкие глюки. Возможно доработать дизайн до красивого и удобного. Длительные тесты на надежность, переполнения памяти, глючные "вылетания программы".

5) Записывать буфер в аудиофайл на лету, через меню или по горячей кнопке. Разной длины или только уже накопленое.
6) Проиграть накопленый буфер в колонки. Возмжность подгружать в буфер звук из файла вместо аудио-потоков.
7) Заняться FFT - подозреваю что это самое сложное!!! Тестом будет обратное превращение и сравнение на слух и по графикам с оригиналом. Должно идеально или почти идеально совпадать.
8) Вывести 3Д график на основе FFT. Использовать OpenGL. Возможно на этом этапе будет подтормаживать, поэтому не уверен что суперкачество можно будет рисовать с аудио-потока, а не из файлов. Сделать упрощенное качество для постоянной прокрутки "вживую".
9) Возможно сделать автокорректировку громкости, чистку шумов.
10) Сделать парочку готовых преобразовани 3Д-графиков. Производные, и все что вспомню из мат-анализа.
11) Отдохнуть, насладиться 3Д-графиком на аудиокниги, фильмы, музыку. Привыкнуть к вечно-бегущему графику без отвлеканий на него. Начать глазами замечать различия в графиках на разные слова-звуки. Длительные тесты на надежность, переполнения памяти, глючные "вылетания программы".

12) Сделать полноценный редактор звука - усиление, преобразования, отрисовка, наложение 2х и более 3Д-графиков, вырезание фонем для коллекций.
13) И вот только ТУТ начинается автоматичекое распознание/сравнение фонем, выделение закономеностей, живой поиск в аудио-потоке.... Признаюсь что все эти нейронности для меня новинка(ни разу не использовал), поэтому возможно вот здесь прийдется выучить новый раздел программирования...
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 1:18
Цитата:
Автор: Tester64

о-о-о... Вы еще ничего не видели (если вы о Вашей программе, которую выкладывали)...


Ну, дык дайте нам посмотреть через ваши "призмы".
Планов грамадьё... желаю вдохновения!
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 1:26
Цитата:
Автор: rrr3
А система построенная на пакете категорий предлагаемых мной в Солянке примерно по типу Нечто-когнитрона, не будет запоминать, при необходимости "разбухать", и одновременно что-то делать с массивом данных?


Посмотрел мельком.
"Отбор идет в сторону образования устойчивых ансамблей элементов ("микроалгоритмы" плюсь разветвленная структура-связи). А вот устойчивость (напомню множества вариантов одновременно) ансамлей возможна тогда, когда Сочетания потсупающих в них сигналов каким-то образом Взаимосвязаны (коррелируют), а не разнообразно Хаотичны!"
С этим трудно не согласится. Моя работа, если ее оценивать поэтапно, пока не дошла до корреляции ансамблей. Я на этапе как раз формирования этих ансамблей. И, поверьте, это не просто.

Что же касается вот этого:
"Это я делаю для того, чтобы подчеркнуть, что "цель" (в традиционном понимании) - побочный продукт работы когнитрона, и появляется после преобретения системой некоторого опыта".

...то это концептуальная штука. И я буду отстаивать свою концепцию "первородности" цели перед всем остальным. Другой вопрос, что цель может неосознаваться системой, когда система слишком проста, но об этом рано говорить. Что же касается существование некой цели на самом нижнем уровне, то это уже звучало из моих "пальцев" неоднократно. Поиск новизны - эта цель алгоритмизируема на самых ранних стадиях функционирования системы.
Верно это или нет, на это ответит только эксперимент.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 1:35
Цитата:
Автор: Kek
... Я на этапе как раз формирования этих ансамблей. И, поверьте, это не просто.
...
... Поиск новизны - эта цель алгоритмизируема на самых ранних стадиях функционирования системы.
Верно это или нет, на это ответит только эксперимент.

1. Мы видимо не понимаем друг друга. Формирование ансамблей в моем случае это функция не программиста/аналитика, а смой адаптивной системы.
2. Цель какая-то отдельно взятая конечно же в принципе алгоритмизуема, но в процессе идет как правило, "рождение" "подцелей", что должна делать адаптивная система сама. Иначе все решение вопроса будет за Вами и система (СИИ) Вам просто не нужна.
3. Конечно же в конечном итоге без экспериментов - никуда.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 1:54
Цитата:
Автор: rrr3
1. Мы видимо не понимаем друг друга. Формирование ансамблей в моем случае это функция не программиста/аналитика, а смой адаптивной системы.

Я это и имел в виду, но выражаться понятно это трудно. Конечно система! Но. До этого надо дойти. Надо программисту что-то сделать, заложить первооснову. И важно то, что понятие "ансамбль" вырастает из более мелких "деталюшек". Вот, что я имел в виду. Я пока с деталюшками колупаюсь. Иерархия деталюшек даст ансамбль в процессе реализации целевой функции. А как эта иерархия будет развиваться, как она устроена - это дело программиста.


Цитата:
Автор: rrr3
2. Цель какая-то отдельно взятая конечно же в принципе алгоритмизуема, но в процессе идет как правило, "рождение" "подцелей", что должна делать адаптивная система сама. Иначе все решение вопроса будет за Вами и система (СИИ) Вам просто не нужна.

Тут тоже все в терминологию упирается. "Цель", "подцель" - эти слова отражают иерархию системы. Чем ниже слой - тем меньше "свободы". Тем более четко цель является законом для элементов слоя.
Верхние слои более свободны в выборе действия. И эта свобода и организует понятие "подцель". И это есть результат выбора системы, а не программиста. Но до этого так еще далеко...
Повторяю - в малом закладывается большое. Целевая функция - основной закон, основной алгоритм нижних слоев.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 2:03
Цитата:
Автор: Kek
...Я пока с деталюшками колупаюсь. Иерархия деталюшек даст ансамбль в процессе реализации целевой функции. А как эта иерархия будет развиваться, как она устроена - это дело программиста.

...Целевая функция - основной закон, основной алгоритм нижних слоев.

1. ..."дело программиста"!!!
2. Вы так ВСЕ будете делать САМИ и при этом даже если дойдет дело до СИИ, Вы сильно ограничите его в возможностях, своей предварительной иерархией и ее структурой. (Истин не глаголю).
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 2:14
Цитата:
Автор: rrr3
2. Вы так ВСЕ будете делать САМИ


У вас есть стороники вот здесь:
http://aideus.ru/
Их подход мне напоминает эксперимент академика Опарина, который к празднику великого октября хотел получить жизнь в аквариуме. А, чо! Засыпал в воду аминокислот, дал разряд в 14000 вольт и вся недолга... Авось ансамбли сорганизуются.
Подход в Aideus такой же, только вместо аквариума они хотят "встряхивать" процессорные коды.
Эти пути имеют право на существование, но, заметьте, исследователь или программист даже в этом случае что-то ДОЛЖЕН СДЕЛАТЬ САМ. В одном случае подключить 14000 вольт, а в другом - взять коды.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 2:18
Цитата:
Автор: Kek
У вас есть стороники вот здесь:
http://aideus.ru/
Их подход мне напоминает эксперимент академика Опарина, который к празднику великого октября хотел получить жизнь в аквариуме. А, чо! Засыпал в воду аминокислот, дал разряд в 14000 вольт и вся недолга... Авось ансамбли сорганизуются.

Когда-то я с этим знакомился вроде. Это не то. Вы слишком упрощенно поняли выражаемые мной идей. Ну да ладно, проехали.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 26 июн 13 11:54
Цитата:
Автор: rrr3
Когда-то я с этим знакомился вроде. Это не то. Вы слишком упрощенно поняли выражаемые мной идей. Ну да ладно, проехали.

На самом деле все полезно и проехать можно самую главную станцию. Другое дело, если мы с вами не очень понимам друг друга. Это сполошь и рядом на форумах. И в этом я не вижу большой проблемы. На то и есть клавиатура и пальцы. Вам для понимания меня надо опуститься в низы. В низы конкретики, о которой я говорю и, с удовольствием делюсь ею. Вы пребываете в верхах. Эта область мне тоже знакома я долго в ней пребывал. Но попробуйте для своей идеи когнитрона сформулировать конкретные действия на уровне ТЗ. Это полезно для корректировки верхов. Вдруг, окажется, что супер-нано-пико-транзисторы для реализации ИИ Ньюпоиска еще не существуют. И вряд ли будут когда существовать. Вдруг окажется, что сверх-супер-параллельные вычислители тоже дело пустое и не осуществимое.
Я призываю исходить из того, что есть. И, это мое мнение, всего этого достаточно для создания ИИ. Нет главного - плодотворной дебютной идеи, как говорил Великий Комбинатор.
А откуда она возьмется? Из сплава, из сочетания низов(практических методов) и верхов(векторов движения, выбора дороги, которых уже конечный и достаточный набор).
Так что надо почувствовать этот сплав низов и верхов, вершков и корешков.
В существующей тенденции форума я вижу перебор вершков.
[Ответ][Цитата]
 Стр.17 (78)1  ...  13  14  15  16  [17]  18  19  20  21  ...  78<< < Пред. | След. > >>