GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.11 (26)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Русский раздел Викиверситета приглашает специалистов
Андрей
Сообщений: 3944
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:45
[Ответ][Цитата]
tac
Сообщений: 2601
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:46
Я повторяю свой вопрос: По сути есть что сказать ?
[Ответ][Цитата]
Андрей
Сообщений: 3944
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:48
[Ответ][Цитата]
tac
Сообщений: 2601
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:51
[Ответ][Цитата]
tac
Сообщений: 2601
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:55
[Ответ][Цитата]
гость
217.199.228.*
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 8:05
[Ответ][Цитата]
Oldfella Walk
Сообщений: 316
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 11:47
[QUOTE]Автор: Андрей

2. Собственно заявленного "управления" я у вас не увидел. Какое-то нагромождение разных мыслей из разных сфер - ИНС, агенты, ГА, награды. В этой суматохе важные идеи умирают тихой печалью:
- управлять можно только тем, что движется. Где у вас движение, пространство? Физически!
- управлять можно только с целью (к цели). Где у вас цель?
- управлять можно только дискретно, квантами. Где у вас кванты?
- почему награда (как прообраз кванта) парадоксально появляется после движения, а не до? ...QUOTE]

Уважаемый Андрей, вы здесь не во всём правы. Конкретно:
- моделирование движения. Да, в классической науке, например - в небесной механике, движение моделируется двумя качественно разными моделями: движущегося тела и пространства. Самое простенькое: декартовы координаты и материальная точка.
А в неклассических науках - статистической механике, динамических системах - можно обойтись одной моделью движения: фазового пространства, пространства состояний.
- цель управления. Да, при моделировании системы, обладающей памятью и потому способной к мотивации и прогнозу, цель предшествует управлению. Но для моделирования цели как таковой такая развитая модель не обязательна - цель можно смоделировать динамически, моделированием активности системы в среде,т.е. моделированием поведения.
Приспособительное, адаптивное поведение моделируется просто, мудрить систему с памятью не надо. В этом случае цель возникает, конечно, после управления и вследствие управления.
- Управлять дискретно - означает программное управление. Вполне возможно управлять и аналогово, и программа как таковая для этого не обязательна, достанет генерирования случайностей и обратной связи. Другое дело, что при управлении - в системе управления обязательно и неизбежно будет проявляться и развиваться дискретность.
- "Награда"... Тут посложнее... Определённо можно сказать, что о простой модели - адаптации, приспособления - речь уже не идёт. Несомненно, это более сложная модель - с памятью, т.о. мотивированная и прогнозирующая. Речь идёт о моделировании игры, соответственно и выиграша (если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!). Тут такая сложность: в моделировании игр более простых, чем игры людей, игр с Природой, вообще говоря, "выиграшем" является продолжение игры. Жизнь. "Проиграшем" - прекращение игры, т.е., срабатывание механизма отбора. Гимовер - кирдык. То есть реален только "проигрыш". "Выигрыш" всегда - только "призовая игра", забрать ставку невозможно, можно только - на время, по обстоятельствам! - прервать игру, то есть временно прекратить борьбу за существование и поадаптироваться, поприспосабливаться.

Идея "смешанного" моделирования - и сетей, и геналгоритмов - мне лично очень нравится и обещает радужные перспективы. По-крупному это будет означать соединение в одной модели - двух: организма и его нервной системы. Объединённая модель объекта управления и системы управления.
[Ответ][Цитата]
tac
Сообщений: 2601
Управление агентами
Добавлено: 08 окт 09 14:46
Oldfella Walk, спасибо, что пояснили безсвязную речь Андрея ...

Стало немного яснее ... конечно, это простейшая модель ... и я совсем не описывал ее как биологически правдоподобную ... более того только рассуждая о таких моделях, и не делая такие простенькие невозможно ВООБЩЕ ничего создать ... конечно многое еще впереди, но главное мы перешли от болтовни в стиле Андрея к реальным моделям, которые можно тестировать ...

По сути я скажу немного позже ...

1. "цель управления. Да, при моделировании системы, обладающей памятью и потому способной к мотивации и прогнозу, цель предшествует управлению. Но для моделирования цели как таковой такая развитая модель не обязательна - цель можно смоделировать динамически, моделированием активности системы в среде,т.е. моделированием поведения.
Приспособительное, адаптивное поведение моделируется просто, мудрить систему с памятью не надо. В этом случае цель возникает, конечно, после управления и вследствие управления."

Данная система обладает памятью, но она изначально пуста. Поэтому в любом случае невозможно, чтобы она выработала бы цель не предприняв ни каких действий. Как только она некоторое время действует в среде - она вполне сносно определяет для себя цель. Поэтому в данном пункте возражения мне совершенно не понятны.

2. "если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!"

Да, это именно так.
[Ответ][Цитата]
Oldfella Walk
Сообщений: 316
На: Управление агентами
Добавлено: 08 окт 09 20:04
Цитата:
Автор: tac
2. "если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!"

Да, это именно так.


Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 08 окт 09 21:21
Цитата:
Автор: Oldfella Walk



Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?


Прямой такой цели нет ... но это вполне можно так интерпретировать ...
[Ответ][Цитата]
daner
Сообщений: 4633
На: Управление агентами
Добавлено: 09 окт 09 13:49
Цитата:
Автор: Oldfella Walk
Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?


Зачем все постоянно переводить на уровень биологии-физиологии?
Агент изучает функцию "восприятие-действие" следуя которой он соберет макс.кол-во подкреплений. Это похоже на рефлексы Павлова? ДА -- похоже. А когда обучение НЕ похоже на рефлексы? ИМХО, принципиальная разница только тогда, когда обучение сводиться к простому собирательству фактов, без подкрепления. Все остальное, по существу, отличается только длинной последовательности пар "восприятие-действие" до получения подкрепления (т.е. когда подкрепление следует не сразу, а через какое-то время). Как вырабатывается подкрепление (средой или самостоятельно, т.е. эмоциями) в данном контексте большой роли не играет. Так что, выигрыши в играх (о которых вы говорили), ИМХО, ничем не отличаются от подкреплений за выбранную стратегию (или за стратегию выбора стратегии, тут уж как хотите).
[Ответ][Цитата]
Oldfella Walk
Сообщений: 316
На: Управление агентами
Добавлено: 09 окт 09 19:57
Цитата:
Автор: daner
Зачем все постоянно переводить на уровень биологии-физиологии?
Агент изучает функцию "восприятие-действие" следуя которой он соберет макс.кол-во подкреплений. Это похоже на рефлексы Павлова? ДА -- похоже. А когда обучение НЕ похоже на рефлексы? ИМХО, принципиальная разница только тогда, когда обучение сводиться к простому собирательству фактов, без подкрепления. Все остальное, по существу, отличается только длинной последовательности пар "восприятие-действие" до получения подкрепления (т.е. когда подкрепление следует не сразу, а через какое-то время). Как вырабатывается подкрепление (средой или самостоятельно, т.е. эмоциями) в данном контексте большой роли не играет. Так что, выигрыши в играх (о которых вы говорили), ИМХО, ничем не отличаются от подкреплений за выбранную стратегию (или за стратегию выбора стратегии, тут уж как хотите).


Много Вы доводов изложили в одном абзаце... Щас попытаюсь распутать...
В целом "переводить на уровень..." в принципе не обязательно - но может быть полезно. Полезно потому, что удобно. Связывая агента со средой, получаем возможность определить характер этих связей и уровень их развития. А по характеру и уровню развития связей совершенно объективно - по среде - узнаём, что же именно мы напрограммировали...
Вот вы в одной фразе соединяете "подкрепление" и "стратегию"... Для меня они как-то не очень вяжутся.
Раз агент выбирает стратегию, значит, он играет. Само собой, для того, чтобы играть, он должен вообще быть к этому способен - то есть, способен к прогнозу и мотивации. Такую способность агент может обрести только с памятью. Агент с памятью способен бороться за существование. Цели себе он способен ставить сам - это значит, что эти его цели существуют, сами по себе существуют, объективно. Материально существуют, возможно - структурно. Достижение цели агентом отмечается им самим - приносит ему удовлетворение, радость. В общем, позитив...
И как же Вы собираетесь моделировать позитивный критерий?
[Ответ][Цитата]
Oldfella Walk
Сообщений: 316
На: Управление агентами
Добавлено: 09 окт 09 21:18
Подкрепление... Если это подкрепление условного рефлекса, то это моделирование простой О.С.,, т.е. приспособления. Цель в этом случае существует динамически, в активности агента в среде. Чтобы подкреплять её достижение, нужен кто-то, для кого эта цель существует отдельно от активности агента в среде. Агент высшего ранга - с памятью, или человек - программист...
Насчёт выигрыша... Игрок должен понимать, что выигрыш - это выигрышь, иначе это не выигрышь... И как же Вы будете моделировать понимание?
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 09 окт 09 23:32
Цитата:
Автор: Oldfella Walk
И как же Вы будете моделировать понимание?


И вот тут ваша словесная софистика дает четко понять - лучше опустить руки и с умным видом рассуждать о том, о чем понятия собственно нет ! Вначале вам нужно понять одно - на данный поставленный вопрос можно ответить ТОЛЬКО ТОГДА когда ИИ уже будет ГОТОВ, а не перед тем как мы только начинаем что-то делать ... как только выберетесь из парадоксального круга: когда нужно понять, что такое понимание перед тем как начать моделировать - сообщите !

Попроще: понять что есть понимание - это цель любого моделирования ИИ. Поэтому вопрос как моделировать понимание - это все равно что спросить "что есть Бог" !
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 09 окт 09 23:37
Знаете что самое главное в исскустве (именно в исскустве) программирования ? Хороший программист всегда отличается тем, что умеет разделить задачу на подзадачи и решать их от меньшего к большему. Как я со временем начинаю понимать - это большой талант (раньше это мне казалось само сабой разумеющимся, но видя постоянно как люди в этом тупят - хочешь не хочешь прейдешь к мысли, что это данно не многим).
[Ответ][Цитата]
 Стр.11 (26)1  ...  7  8  9  10  [11]  12  13  14  15  ...  26<< < Пред. | След. > >>