GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.52 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Зри в корень!
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Зри в корень!
Добавлено: 26 авг 13 4:52
Цитата:
Автор: Анатоль
Одну команду можно подать ЛЮБЫМ звуком (хлопком в ладони).
Но и тут без сравнения не обойтись.
Ведь сравнивать нужно по уровню, (есть звук-нет звука).
Т.е. и тут выбор ОДНОЙ ИЗ ДВУХ команд.

Да... уж. Самое главное настоять на своем. Сделайте любой АЦП. И воспринимайте только одно сочетание цифр. Чувствительность и дискретность АЦП будет Вашим самым простым фильтром. Сравнивать нужно для естественного ЕИ например, когда Вы хотите узнать что такое слон из притчи....
Но я во всем с Вами согласен. Это так просто написал - то что сверху...
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Зри в корень!
Добавлено: 26 авг 13 5:15
Цитата:
Автор: rrr3
Сделайте любой АЦП. И воспринимайте только одно сочетание цифр.

К счастью АЦП теперь делать не нужно. Оно (он) есть в любой звуковой карте в любом компутере.
А что с него воспринимать("только одно сочетание цифр")я не понял.
Но объяснить и не прошу. Это ведь Тестера интересует.
[Ответ][Цитата]
antol
Сообщений: 370
На: Проект Sound-Agent. Зри в корень!
Добавлено: 14 сен 13 8:26
Цитата:
Автор: Kek

На уровне концепций - не всё, но многое понятно. А вот на уровне реализации этих концепций я и угораю...
Из концептуальных вопросов - вот такой.
Вариант №1 - система, которая из потока выделяет кластеры без обучения, без обратной связи.
Вариант №2 - система, которая из потока выделяет кластеры с обучением.
Вот надо оценить, понять... как эти варианты сходятся для задачи распознавания. Используются ли они оба, т.е на каком то этапе №1 - работает, потом без №2 не обойтись. Меня подмывает на данный момент использовать только вариант №1. И кое-что получается.

И еще. Мат методы используются самые разные и тебе корреляционный анализ и тебе измерение расстояний между эдементами множества. Но вопрос... Наш ЕИ ничего не знает о методе Монте-Карло, тем не менее у него кластеризация получается. Отсюда вопрос - можно ли создать методы кластеризации без сложных статистических функций? И каков этот набор? Какими элементарными операциями надо пользоваться?

Быть может следует посмотреть на "проблему" с другой, с противоположной стороны.
Т.е. взять задачу где все это уже есть: есть текущая оцифровка системы, известны кластеры, есть возможность обучаться, есть обратная связь, но наличествует цель и система должна осуществить переход в новое состояние соотвествуещее оцифровке с лучшими (энергетическими) параметрами. (?)

В качестве примера такой задачи чудесно подходит игра Х-О - для этого следует только представлять текущую позицию игры в виде частотной выборки, что совсем не сложно при условии конечности размера игрового поля. (?)
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Проект Sound-Agent. Зри в корень!
Добавлено: 15 сен 13 4:45
Цитата:
Автор: antol
Быть может следует посмотреть на "проблему" с другой, с противоположной стороны.
Т.е. взять задачу где все это уже есть: есть текущая оцифровка системы, известны кластеры, есть возможность обучаться, есть обратная связь, но наличествует цель и система должна осуществить переход в новое состояние соотвествуещее оцифровке с лучшими (энергетическими) параметрами. (?)

В качестве примера такой задачи чудесно подходит игра Х-О

Да и без Х-0 полно кошек, на которых можно тренироваться.
Например, "ирисы Фишера" - небольшая выборка данных, один из "стандартных" тестов для разных методов статистики и машинного обучения. 4мерное пространство, 3 класса, образующие 3 кластера. Пусть система/программа перейдёт от одного кластера к двум, потом к трём - и на этом остановится (нет, она и дальше может идти - но это уже будет квантование данных, не соответствующее кластерной структуре). Можно как обучение/кластеризацию без учителя (без известных меток классов) использовать, так и обучение/кластеризацию с учителем.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 15 сен 13 5:09
Цитата:
Автор: Victor G. Tsaregorodtsev


Да и без Х-0 полно кошек, на которых можно тренироваться.
Например, "ирисы Фишера" - небольшая выборка данных, один из "стандартных" тестов для разных методов статистики и машинного обучения.


Хорошие, кстати, данные
Мы часто их используем как демонстрационные
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 15 сен 13 22:30
Цитата:
Автор: antol
Быть может следует посмотреть на "проблему" с другой, с противоположной стороны.

Опишу, что есть на данный момент.
1. При произнесении слова в памяти формируются буферы. Параметры элемента буфера: 20 равномерно разнесенных частотных полос. Диапазон перекрытия 150 - 3000 Гц.
2. Применены следующие процедуры сжатия без потери информативности:
- амплитудная нормализация - сужает динамический диапазон
- процедура, похожая на формирование MEL-частот, только с равномерной шкалой. В результате имеется некий инвариант относительно тона говорящего.
- корреляционная предобработка кадра (длительность кадра - 20 мс)
3. Новизна потока кадров определяется корреляциолнным методом. Похожесть оценивается априорным пока значением К=0.9. В дальнейшем изменение коэффициента корреляции будет отдано на откуп процессу.
4. Существует 4 уровня памяти:

0 - кадр как он есть (массив из 20 чисел)
1 - сочетание двух кадров. (массив из 2-х чисел, каждое число - индекс предыдущего массива)
2 - сочетание 4-х кадров.(массив из 2-х чисел, каждое число - индекс предыдущего массива)
3 - сочетание 8-ми кадров.(массив из 2-х чисел, каждое число - индекс предыдущего массива)

Если произносить слова достаточно долго, то в памяти, которая отражает сочетание из 8 кадров формируются часто произносимые фрагменты. При обратном проигрывании эти фрагменты воспринимаются на слух, как фонемы. Есть четко выраженные ("ма"), есть раздробленные ("ама"). Не оценивал пока на других словах, кроме "маманя". Что значит "достаточно долго"? А все зависит от априори выбранного коэффициента корреляции. При К=0.7 фрагменты появляются через 10-15 повторов, их качество так же зависит от этого коэфа.

Выводы: данные фрагменты есть кластеры потока, которые формируются по статистическому принципу. Не знаю к какому классу этот принцип отнести "с учителем" или "без учителя". Обратной связи пока нет, кроме прослушивания данных фрагментов.
Манипуляция коэффициентом корреляции напоминает мне следующую аналогию. Скажите ребенку 3-х лет:" Скажи слово "кластеризация". Он повторит что-то вроде "а-ци". Я это проделывал с внучкой. Просто ее коэф корреляции 0.7. Малый коэф сглаживает неоднородности. И похоже, что манипуляция этим коэфом должна быть адаптивной. Все это можно наблюдать в программе.

Дальнейшее: фрмирование абстрактного уровня, оторванного от сенсорики на основе кластеризации. Принцип построения памяти - такой же, как и предыдущие, только элемент памяти - объект. На данный момент есть понимание того, что объект должен описываться по онтологическому принципу. Детали обдумываются...и обсуждаются...
Кому интересно, могу выслать прогу. На данный момент реализована запись и чтение из WAV - файла.

[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 16 сен 13 0:08
Статистически - это однозначно без учителя.
Извините что отошел от дела. Учебный год у детей начался и я еще не устаканил свое расписание жизни.
Вернусь попозже ... Но обязательно вернусь !
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 16 сен 13 1:00
А нельзя ли поподробней про игру X-O ? (вообще ненагуглил)
И про Ирисы Фишера? (в википедии слабая статья, вижу ассоциации с моим любимым алгоритмом Random Forest)
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 16 сен 13 2:56
Цитата:
Автор: Артем

Статистически - это однозначно без учителя.
Извините что отошел от дела. Учебный год у детей начался и я еще не устаканил свое расписание жизни.
Вернусь попозже ... Но обязательно вернусь !


Неверно - учитель задает критерии оценки-отбора и т.п.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 16 сен 13 3:01
Цитата:
Автор: Артем

А нельзя ли поподробней про игру X-O ? (вообще ненагуглил)
И про Ирисы Фишера? (в википедии слабая статья, вижу ассоциации с моим любимым алгоритмом Random Forest)


игра X-O - это, как я понимаю, любимые здесь "крестики-нолики"

что касается Фишера, то в данном случае это - предложенный им тест из трех групп по 50 образцов разных сортов ирисов, описываемых всего четырьмя параметрами, характеризующими вид цветка, если не ошибаюсь, - длина и ширина лепестков и пестиков
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent.
Добавлено: 16 сен 13 4:55
2Kek
На какой стадии разработка? Хоть что-нибудь получается? Отложили проект на потом? Занялись только теорией? Очень хочется увидеть хоть какой-нибудь результат!
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent.
Добавлено: 16 сен 13 7:04
Цитата:
Автор: Tester64
Очень хочется увидеть хоть какой-нибудь результат!

http://www.keklab.ru/buf/ai/Sound_Agent 3.1.4.zip -> EXE-шник. Описание писать лень, но если интересно, то могу в приватном режиме про кнопки рассказать. В статье в самом начале есть какое-то описание.
[Ответ][Цитата]
antol
Сообщений: 370
На: Проект Sound-Agent. Зри в корень!
Добавлено: 16 сен 13 10:52
Цитата:
Автор: Kek

есть на данный момент ....
Выводы: ...
Дальнейшее: ....
Вобщем, все у вас чудесно. И нет никакого кризиса.
Хотя я ни как не могу понять что вы ловите.

Значит в "крестики-нолики" вы играть не хотите - программы вашей мне не надо, а вот научиться у вас выполнять БПФ было бы здорово .
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 16 сен 13 11:05
Цитата:
Автор: antol

Вобщем, все у вас чудесно. И нет никакого кризиса.
Хотя я ни как не могу понять что вы ловите.

Значит в "крестики-нолики" вы играть не хотите - программы вашей мне не надо, а вот научиться у вас выполнять БПФ было бы здорово .

Кризис - есть всегда, Antol, - это движитель!
Для того чтоб понять что я ловлю, надо все таки прогу запустить, и если она работает, то тогда я бы рассказал и показал...
Объясню почему в крестики нолики не хочу играть. Это концептуальный момент. Поток, если он не белый шум - формирует субъект. В данном случае субъект - программа. Конечно у субъекта должно быть масса всего. Но если мы будем ориентироваться на "простой" поток, коим является ХО, то субъект будет простым. Слово "простой" надо расшифровывать, например так - ограниченный. Сравните поток от ХО и звуковой поток от человека. Они оба бесконечны, но ХО - более ограничен. Есть в теории множеств понятие - мощность множества. Вот это что-то из той оперы.
Если Вы программируете на Delphi7, то проблем нет. В начале поста я выложил все исходники и тексты. Нюансы могу рассказать, но должна быть единая среда программирования.
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent.
Добавлено: 16 сен 13 11:08
Цитата:
могу в приватном режиме про кнопки рассказать
Ответил на почту.
[Ответ][Цитата]
 Стр.52 (78)1  ...  48  49  50  51  [52]  53  54  55  56  ...  78<< < Пред. | След. > >>