GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.13 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Vpolevoj
Сообщений: 1408
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 май 13 23:42
Цитата:
Автор: Андрей
Так называемые "генетические" алгоритмы работают только потому, что это в сущности другое название переборных алгоритмов. Перебирать в задаче распознавания голоса нечего, т.к. нет заранее заданного эталона, которому что-то нужно подобрать в соответствие.

Андрей, простите, но Вы не правы (хоть Вы и не Борис).

Да, генетические алгоритмы, это в некотором роде переборные алгоритмы, и в принципе, можно воспользоваться простейшим перебором - результат будет один и тот же.
Преимущества генетических алгоритмов относительно примитивных переборных заключаются в том, что перебираются не все возможные варианты, а происходят итерации - последовательные приближения от хорошего к еще более лучшему. И, главное, оценка делается по соответствию заданной целевой функции. То есть, даже если с помощью этих алгоритмов в итоге не было найдено оптимальное (самое лучшее из всех возможных) решение (предполагается, что оно существует), то все равно, полученный результат будет нас вполне удовлетворять, так как отбор велся по целевой функции, и следовательно, он заведомо не хуже, чем мы запрашивали - а что еще нужно?

А не прав ты, Андрей, в том, что (цитирую): "Перебирать в задаче распознавания голоса нечего, т.к. нет заранее заданного эталона, которому что-то нужно подобрать в соответствие."

Как раз, таки, текущее положение дел именно в том и заключается, что параметры, какие только возможно, из потока извлекать научились, а вот правильно подобрать порядок их применения, значащие коэффициенты (весовые функции), и даже их необходимое количество - не могут.
Что делать?
Заниматься подбором параметров вслепую, методом тыка? Так оно и получается.
Руководствоваться некими соображениями, интуицией, здравым смыслом?
А чем это отличается от метода тыка?

Сложность данной ситуации заключается, на мой взгляд, в слишком большом количестве возможных параметров, которые в общем-то уже определены, но не ясно пока, какие из них нужно поставить на первое место, какие на второе и т.д. Кто может рассудить?
Будем спорить друг с другом до посинения?
А критерий истины где, я вас спрашиваю? Как всегда, в практике!
Вот то-то и оно!

Покажите мне систему, которая бы всегда (ну, пусть не всегда, пусть в 90% случаев) распознавала бы хотя бы одно слово. И покажите, какие она использует параметры, и какие у них весовые коэффициенты. И я тогда скажу - это уже критерий. Критерий истины.

Разве не так?
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Совместить с генетическими алгоритмами
Добавлено: 21 май 13 23:46
Цитата:
Автор: Vpolevoj
При нахождении решения с помощью генетических алгоритмов, мы можем подсмотреть как за процессом поиска, так и воспользоваться уже найденным "бактериями" решением - конкретным подбором параметров, которыми они пользуются для распознавания в итоге!

Посмотреть на готовый набор параметров для одного слова, для другого, для двух слов, для трех и т.д.

И может быть, может быть... тогда мы и сами что-то поймём. Как же все-таки происходит распознавание. Какие именно параметры и в каком порядке наиболее значимы при распознавании. Сами мы, я так понимаю, будем перебирать эти параметры до бесконечности, причем, всегда с одним и тем же результатом.

Мое мнение следующее.
1. У нас есть расхождения в понимании, что такое генетический алгоритм. Дело в том, что генетика подразумевает "наследование". Оно не всегда необходимо. Не всегда нужна масса "отдельных" "бактерий". И т.д. и т.п. "Адаптивность" может развиваться и на других "материалах". Но сейчас это не суть важно.
2. При нахождении решения с помощью, пусть пока называется генетическим алгоритмом, мы не "вытащим" процесс поиска или распознавания (детерминированный алгоритм поиска, т.к. он стохастийный, имеет пусть даже псевдо, но случайность и перебор).
3. Параметры и порядок значимости их распознавания может быть очень разнообразным в разных удачных решениях (бактериях). Но вот конкретные удачные решения ("внутренности" бактерий) мы сможем вытащить и без проблем перенести на любой другой материал (размножить). Но это в принципе. Реально же, у нас нет таких профессиональных программистов способных все это реализовать (на форуме).
[Ответ][Цитата]
Vpolevoj
Сообщений: 1408
На: Совместить с генетическими алгоритмами
Добавлено: 22 май 13 0:28
Цитата:
Автор: rrr3
1. У нас есть расхождения в понимании, что такое генетический алгоритм.

Нашел ссылку на статью, размещенную на этом ресурсе:
Генетические алгоритмы

Кроме того, рекомендую еще раз пересмотреть ролик: Слепой часовщик на предмет возможности подсматривания за процессом поиска решения.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Совместить с генетическими алгоритмами
Добавлено: 22 май 13 1:24
Цитата:
Автор: Vpolevoj
параметры, какие только возможно, из потока извлекать научились, а вот правильно подобрать порядок их применения, значащие коэффициенты (весовые функции), и даже их необходимое количество - не могут.
Что делать?
А делать вот что.
1. Не абсолютизировать существующие подходы. Далеко не все возможные представления звука испробованы. Берутся те параметры, что лежат под руками и хорошо известны. Нужно искать новые пути. Некоторые из них я уже предлагал. Когда закончу с распознаванием графических образов, обязательно займусь звуками. Моя рабочая гипотеза состоит в том, что звуки сначала преобразуются в графические образы и распознаются далее так же, как графические (геометрические) образы.
2. Чтобы перебирать и выбирать всё лучший и лучший вариант, нужно знать критерий этого "лучшего" варианта. Этого критерия нет. Поэтому Вы никогда не узнаете, насколько хорошо программа различила звуки и сможет ли она их различить в других условиях так же качественно как человек.
3. Перебирать надо обязательно. Но не тупым перебором вариантов в машине, а умным перебором аналогий в голове, пользуясь эвристиками, сужающими поиск. Вам не удастся заставить машину творить чудеса, занимаясь полным перебором. Хотя попробуйте....
4. Завязывайте со своим "Слепым часовщиком". Вы исходники программы видели? С автором знакомы? Нет. Так не надо никого впечатлять сказками и заводить в блуд. Я, например, в эволюцию больше не верю. Потому что всё проверяю.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Совместить с генетическими алгоритмами
Добавлено: 22 май 13 1:38
Цитата:
Автор: Vpolevoj
Нашел ссылку на статью, ...
Кроме того, рекомендую еще раз пересмотреть ролик: Слепой часовщик на предмет возможности подсматривания за процессом поиска решения.

1. Я вообще-то генетик по образованию. Так называемые "общепринятые" понятия часто понимаются разными людьми по разному. Мой вопрос ранее был именно о Вашем понимании. В общем не суть, проехали...
2. Я имел ввиду другое "подсматривание". Ну и да Бог с ним, тоже не вопрос.
[Ответ][Цитата]
covax
Сообщений: 1609
На: Совместить с генетическими алгоритмами
Добавлено: 22 май 13 1:46
Цитата:
Автор: Андрей
Я, например, в эволюцию больше не верю. Потому что всё проверяю.


Значит в бога верите. И уже проверяли?
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Совместить с генетическими алгоритмами
Добавлено: 22 май 13 1:50
Цитата:
Автор: Андрей

1. Распознавание зависит от "контекста". Предварительная фильтрация (представления) ограничивают контекст. Контекстов может быть много, а соответственно "алгоритмов" конкретного распознавания.
2. Выбирается не лучший по механизмам исполнения (которых мы не знаем, тем более такого "эталона" "внутренних" механизмов нет), а по результатам (хотя бы статистике) исполнения - "эталон" от внешней среды. Даже человек не во всех ситуациях одинаково хорошо распознает звуки.
3. Бог в помощь умному перебору.
4. А при чем здесь "Слепой часовщик"? Если Вы все проверяете, то давно бы поверили в эволюцию (в самом широком смысле этого слова).
[Ответ][Цитата]
Vpolevoj
Сообщений: 1408
Гармоничные колебания
Добавлено: 22 май 13 3:58
Вот какие замысловатые фигуры способны порождать независимые вроде бы колебания несвязанных между собой шариков.

Гармоничные колебания

Не такие ли картины возникают и у нас в мозгу, когда мы слушаем, к примеру, красивую музыку?
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Гармоничные колебания
Добавлено: 22 май 13 4:21
Цитата:
Автор: Vpolevoj
Вот какие замысловатые фигуры способны порождать независимые вроде бы колебания несвязанных между собой шариков.
Гармоничные колебания
Не такие ли картины возникают и у нас в мозгу, когда мы слушаем, к примеру, красивую музыку?

Ключевое слово полагаю "вроде бы". Так как шарики развешены не хаотически и запущены одним движением доски. А при чем здесь распознавание звука. К сожалению, красивую музыку я слышу, но картинок не вижу...

Что-то тема ветки как-то гуляет не гармонично...

[Ответ][Цитата]
Vpolevoj
Сообщений: 1408
На: Гармоничные колебания
Добавлено: 22 май 13 4:26
Цитата:
Автор: rrr3
Что-то тема ветки как-то гуляет не гармонично...

Пусть автор ветки сам выскажет своё мнение, или поудаляет лишнее.

На мой взгляд, всё взаимосвязанно.

Так и в "Гармоничных колебаниях". Выделить тот или иной паттерн много проще, чем анализировать фазы и периоды колебания каждого шарика. Есть паттерн - есть распознавание! Нет - значит, колебания хаотические.

[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 май 13 4:31
Цитата:
Автор: Tester64

Откуда такие сведения. Я не смог найти на просторах интернета ни одной программы (даже скриншота), которая показывает голос так как мне хочется. Наоборот насколько я помню, ухо человека устроено так, что оно разлагает звук на частоты физически перед тем как передать результат в нейронную сеть. Т.е. мозг получает непрерывную "ленту" частотной матрицы, которую как-то преобразует, обрабатывает и ищет на ней "сходство" с ранее услышаным. А про "точность" глаза - у меня глаза это САМЫЙ точный инструмент. Как (помню из физиологии) и у большинства людей. Может не хватить скорости (24 кадра), может не хватить инструментария (биения глазами не увидишь без фильтров), но лучше пока природа не придумала.

Поясните, что значит "которая показывает голос так как мне хочется". Какие именно параметры голоса она должна показывать, или может быть что-то ещё? Может, я вам предоставлю скриншоты.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Гармоничные колебания
Добавлено: 22 май 13 4:34
Цитата:
Автор: Vpolevoj
Пусть автор ветки сам выскажет своё мнение, или поудаляет лишнее.
На мой взгляд, всё взаимосвязанно.
Так и в "Гармоничных колебаниях". Выделить тот или иной паттерн много проще, чем анализировать фазы и периоды колебания каждого шарика. Есть паттерн - есть распознавание! Нет - значит, колебания хаотические.

Это было не о содержании, а о названии темы.
А вот про паттерны-распознавание кажется понял, спасибо.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Гармоничные колебания
Добавлено: 22 май 13 9:32
Позвольте, коллеги, обобщить наши взгляды.
1. Нам интересен ИИ, а не звук и даже не изображение. Я намеренно спустился с «высот» каких-то проектов и философских размышлялок в конкретику. Причина – найти общие подходы в решении задачи кластеризации потоков вообще. Sound – просто мне ближе.

2. Что есть. И это разделяют многие. Есть способ компактного представления потока. Пусть это звук или изображение. Есть способ сведения этих потоков в единый трехмерный массив (см. сонарные картины). Есть понимание того, что какая – либо форма этого потока (варианты разные, но не это принципиально) есть необходимое и достаточное множество для распознавания, или отражения проекции действительности.

3. В чем различие взглядов. В способе манипуляций с этим множеством. Одни говорят – что ничего нового уже не придумать. Другие предлагают генетические алгоритмы или нейронные обучающие сети. Кто-то будет строить невероятной сложности сверх-супер-файн- цифровой фильтр и преуспеет в этом на какое-то время. Третьи, Виктор Казаринов, с которым я имел плодотворную скайп-беседу, предлагает онтологический принцип распространить на абстрактные множества, коими захваченный системой мгновенный звуковой или световой поток являются.

4. Для многих становится очевидным понимание того, что манипуляции над множеством должны содержать минимальный необходимый и достаточный набор методов, которые отражают иерархическую структуру потока. Усложнение памяти модели или возможность детализации и более тонкого распознавания потока – есть не априорное создание структуры системы, а разворачивающийся во времени процесс функционирования модели. Я опускаю в своем объяснении очевидные вещи в виде обратной связи, органов действия и целевой функции. Сейчас важно понять, и пусть это будет звук, с чего, с какого минимального множества нужно начать системе развиваться. И в каком направлении, с точки зрения преобразования этого множества.

5. У меня сейчас есть четкое понимание того, что есть аналогия между двумя совершенно разными иерархическими потоками:
- буква – слог – слово – фраза - предложение – понятие – знания. Это первый поток, над иерархической структурой которого никто спорить наверно не будет. Его предательски простая для понимания формула сбивает исследователя с мысли: «А чего тут распознавать? Складывай себе в определенные контейнеры объекты и устанавливай связи» Уж, больно объекты простые, легко и однозначно вычленяемые из потока. Но в этом и есть заблуждение и тормоз. Система должна развиваться сначала. А что есть начальная, самая простая стадия Char-потока?
А просто кусок потока из десяти букв: «мамамылара» , или «абырвалгаб», или «семенычсем». Кусок, размер которого априори определен. Факт появления просто куска потока с одной единственной характеристикой - размером и возможное его детектирование системой – есть первичный метод. И больше ничего. Запоминание 10-буквенного потока другой метод. Далее, не вдаваясь в подробности, система должна иметь возможность и критерии детализации этого 10-буквенного куска. Для этого требуется иная память.

А теперь давайте посмотрим на звук. Мы не можем найти два одинаковых объекта. Но мы можем, как в случае с 10-буквенным куском char-потока определить буфер, размер которого таков, что просто позволит системе реагировать на факт появления звуковой волны. Пусть это будет массив из 5-ти первых гармоник на протяжении 5-ти кадров. С этого все начнется. Аналогия, о которой я сказал выше заключается в том, что распознавание такого элементарного кластера будет происходить 100-процентно. Это не будет ни словом ни речью, ни фонемой, это будет просто кусок потока. Ассоциация таких кусков с одной стороны и детализация буфера с другой – процесс, методы которого и есть предмет исследования.
Вот что я хотел сказать и направить поиски в этом русле. Методы должны быть одинаковыми для любого потока. Пусть даже это абстрактные множества к сенсорике вообще отношения не имеющие. Тогда распознавание в этом случае будет всего навсего узким функционалом. Я не знаю есть ли вообще такого рода обобщающие методы, но на мой взгляд для их создания препятствий... я не вижу.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Гармоничные колебания
Добавлено: 22 май 13 21:16
Цитата:
Автор: Kek

Если нужен не звук, а интеллект, то все изыски с иерархиями и фильтрациями тем более должен сделать сам ИИ... А распознавание звука может служить лишь модельной ситуацией для оценки того какая ИИ (на каких принципах работающая) сделает это достаточно хорошо и по возможности быстро. Т.е. модельная ситуация для изучения ИИ. А в данном случае пока Вы ставите себя на место ИИ (правда пока слабо получается, так как мешает "логика" - как результат предшествовавшей во время обучения работы когнитивной части ЕИ, как выработанные им "большие" алгоритмы, но "заточенные" совсем для другого и в других условиях.)

[Ответ][Цитата]
Kek
Сообщений: 1133
На: Гармоничные колебания
Добавлено: 22 май 13 23:00
Цитата:
Автор: rrr3
А в данном случае пока Вы ставите себя на место ИИ (правда пока слабо получается,

Рефлексия - другого способа мне неизвестно...
[Ответ][Цитата]
 Стр.13 (78)1  ...  9  10  11  12  [13]  14  15  16  17  ...  78<< < Пред. | След. > >>