GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.25 (27)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Рефлекс
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 10 сен 14 13:11
Изменено: 10 сен 14 13:39
Надеюсь, также, что все понимают, что в рефлексах типа "увидел продавца - заплатил деньги - получил батон" различная природа воздействия, реакции и подкрепления сводится к энергии через физику, экономику и химию.
Ну, и что арбитр с учителем тоже имеют рефлекторную структуру.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Рефлекс
Добавлено: 10 сен 14 21:56
Цитата:
Автор: kondrat
... А мы ещё не трогали как следует динамику: инерцию и эволюцию рефлекса...

Не мне конечно судить, но можно построить все что угодно, например, торможение/активация, которые подразумевают оценку (!) эффективности (чего ?), но все это будет мартышкин труд, если в конечном итоге не "трогать" "эволюцию рефлекса", а точнее не суметь "растрогать". Потому вопрос с чего начинать и стоит ли так углубляться в то, что может и не понадобится, если не "растрогать" "эволюцию рефлекса" становится риторическим.
[Ответ][Цитата]
Vpolevoj
Сообщений: 1408
На: Рефлекс
Добавлено: 10 сен 14 22:30
Цитата:
Автор: kondrat

Перед погружением в глубокий самоликбез, хочу, все-таки, рассказать миру про рефлекторную петлю.
Она простая.

Помимо игрока в неё входят арбитр и учитель. Это условное разделение критика. Арбитр отвечает за соблюдение правил игры, а учитель - за быстрое посвящение в них игрока.
Петлю я предпочитаю разбивать на ещё две, т.е. подавать поощрение и наказание по отдельному от провокаторов ребру.
Арбитр только наказывает за неправильные ходы и дает бонус в случае победы. Поощрение - это долгожданное добавление энергии (жизненной силы) игроку. Наказание - это насильственный слив энергии. Бездействие, по чуть-чуть, наказывается арбитром. Именно этот факт лежит в природе тормозящих рефлексов: лучше потерять немного на бездействии, чем жахнуть все на неоправданное действие. Т.е. возбуждающие рефлексы по чуть-чуть питают клетку, а тормозящие питаются от неё.

kondrat, а можно нарисовать простенькую схемку? Для наглядности. Так, мне кажется, было бы понятнее. А то на словах не очень понятно, о чем в каждом конкретном случае идет речь. Получается, что ты сам с собой разговариваешь: тебе-то самому все, что ты сам же и говоришь, понятно, а нам - нет.
Нарисуй.
[Ответ][Цитата]
гость
78.25.123.*
На: Рефлекс
Добавлено: 13 сен 14 4:50
по теме А-нейронов см. Ем-Яр, Шамиса, Самарина и др.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 25 сен 14 3:14
Цитата:
Автор: Vpolevoj
kondrat, а можно нарисовать простенькую схемку? Для наглядности. Так, мне кажется, было бы понятнее. А то на словах не очень понятно, о чем в каждом конкретном случае идет речь. Получается, что ты сам с собой разговариваешь: тебе-то самому все, что ты сам же и говоришь, понятно, а нам - нет.
Нарисуй.

Но это же надо рисовать, публиковать, ссылаться...(
Лучше, так расскажу.
Верхний овал на картинке называется Игрок. Ниже него расположен Критик. Принимается, что вращает колесо событий Критик. Исходя из этого и принята терминология.
Справа от Игрока к Критику идет стрелка Реакции (их можно понимать и как провоцирующее Критика воздействие).
Слева от Критика к Игроку идет стрелка под названием Провокаторы.
В центре от Критика к Игроку идет стрелка Награда/Наказание. Эта стрелка вместе с Реакциями замыкает основную энергетическую петлю, т.е. их надо рисовать толстыми.
Внутри Критика можно нарисовать ещё один овал под названием Арбитр. Оставшаяся часть Критика будет Учителем. Учитель работает, даже когда Арбитр молчит, а также он может смягчать наказания и усиливать награды. В общем случае он должен разделять с учеником и то и другое.
Внутри Игрока тоже можно нарисовать Мотивационное ядро с центрами удовольствия и боли. Тому, что остается вокруг я не придумал названия лучше, чем Переферийные рефлексы.
Похожие картинки рисовали все, кому не лень. Мне стало лень )))
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 25 сен 14 3:14
Изменено: 30 сен 14 3:34
Наказание (антицель) и поощрение (цель) более-менее однозначны (если не рассматривать их достаточности для чего-нибудь), чего не скажешь о провокаторах.
Грубо их можно разделить на предвещающие поощрение, наказание и отсутствие чего-либо.
Далее, путем комбинирования этих трех типов с результатами срабатывания рефлекса можно получить ещё более тонкую классификацию. И т.п.
Частенько провокаторы можно достоверно отличить друг от друга только добавив к ним предысторию или дополнительные признаки.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 25 сен 14 5:34
Изменено: 30 сен 14 3:39
Нарисованное выше колечко - это не только отношение Игрока к внешнему миру.
Это ещё и отношение рефлексов между собой внутри Игрока. Как бы, отражение, реплика значимых внешних закономерностей. В принципе, для рефлексов мир внутри игрока довольно добрый: подкармливающий, редко убивающий. Это позволяет предположить, что Учитель - более общая, надмировая сущность, чем Арбитр.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 25 сен 14 5:34
Изменено: 06 окт 14 0:16
Механизмы торможения и возбуждения можно интерпретировать как основу механизма переключения внимания, который почти не отличается от распознования образов. Просто, думая о распознавании образов, мы представляем пространственные изображения, меняющиеся во времени, незначительные элементы которых подавляются тормозящими рефлексами. А управлению вниманием всё равно что подавлять, - пространственные или временные реакции. Это нужно для экономии ресурсов на обработку постоянно присутствующих, но не значимых в данный момент элементов провокаторов.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 06 окт 14 1:10
Выше я писал, что структура множества провокаторов, вообще говоря не важна, однако по устоявшимся реакциям рефлекса можно строить отношения между провокаторами. Эквивалентность, например. Или порядок.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 06 окт 14 1:10
Изменено: 06 окт 14 6:53
Возьмем, к примеру, двумерный рефлекс (время и одно пространство). Пространство можно разбить на два класса для использования двоичной системы счисления. Если рефлекс хоть раз сработает, можно считать текущий провокатор единицей. Если никаких рабочих переходов больше никогда не будет (а их, на самом деле, больше двух), то останется только смертельный (убиваем рефлекс за ненадобностью). Решение о смерти вполне автоматически может быть принято на других уровнях иерархии.
Одной из проблем, не вполне понятной для меня является выбор кластеров времени, чтобы не вычислять лишнего на последовательных считалках. Может быть, Котельников когда-нибудь поможет. Этот вопрос является элементом классической триады (цена, срок, качество).
Далее в рассуждениях следуют смешные маленькие хитрости, которые я либо уже подраскрыл, либо не раскрою до реализации.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 06 окт 14 6:48
Изменено: 08 окт 14 8:35
Процесс коловращения этой картинки можно обозвать и процессом передачи информации со сжатием. И процессом рождения комплимента Критика в протокомпоте.
Все начинается сугубо локально (или в бесконечном микро), а пределы можно постоянно расширять, так что у этой структуры всегда найдется, что ответить на любое мыслимое макроокружение.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 06 окт 14 6:49
Изменено: 07 окт 14 23:29
Вышеописанный бинарный рефлекс вполне достаточен (и минимально необходим в зашумленном мире) как для имитациии и эволюции передаточной характеристики самого псевдоузла (клетки), так и его переферийных рефлексов (синапсов). Просто, для описания Игрока такими элементами понадобится ну очень большая сеть. В нейронных сетях используется линейная аппроксимация ПХ синапса и пороговая для тела нейрона, что позволяет эффективно пользоваться возможностями современных процессоров и существенно сократить размеры необходимых сетей.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 08 окт 14 0:37
Изменено: 08 окт 14 1:14
Естественно, что кластеров для сортировки провокаторов можно заготовить побольше (это же рефлекторный граф!) и задать их первоначальное распределение (форму ПХ) и закон изменения (эволюция ПХ). Это и есть та самая эвристика (нижняя заглушка в РГ), которая может сократить вычисления, максимально используя возможности оборудования.
Между прочим, мы сейчас занимаемся условными рефлексами, но можно конструировать и безусловные, запрещая изменение порогов рефлекса при разработке. Это имеет смысл делать с теми рефлексами, изменение которых автоматически означает кранты системе.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 08 окт 14 0:37
Изменено: 08 окт 14 1:20
Кстати, безусловные рефлексы может выявить и эволюция Игрока в условиях конкурентного, убивающего мира.
Т.о. мы подобрались к заглушкам/эвристикам верхнего уровня. Основной, конечно, является размер сети для конкретной задачи и конкретных эвристик нижнего уровня. Я пока не смог найти методику оценки.
Как верно заметил Хмур к заглушкам верхнего уровня относится и организация Турнира.
[Ответ][Цитата]
kondrat
Сообщений: 4026
На: Рефлекс
Добавлено: 08 окт 14 8:33
Безусловные рефлексы позволят, также обеспечивать некоторый уровень безопасности со стороны Игрока по отношению к Творцу (высшему из учителей).
[Ответ][Цитата]
 Стр.25 (27)1  ...  21  22  23  24  [25]  26  27<< < Пред. | След. > >>