GotAI.NET - Форум - Искусственный интеллект

Все темы | Новая тема

Стр.11 (26)

<< < Пред. | След. > >>

Поиск:

Автор

Тема: На: Русский раздел Викиверситета приглашает специалистов

Андрей
Сообщений: 3944

На: Русский раздел Викиверситета приглашает специалистов

Добавлено: 08 окт 09 0:45

[Ответ][Цитата]

tac
Сообщений: 2601

На: Русский раздел Викиверситета приглашает специалистов

Добавлено: 08 окт 09 0:46

Я повторяю свой вопрос: По сути есть что сказать ?

[Ответ][Цитата]

Андрей
Сообщений: 3944

На: Русский раздел Викиверситета приглашает специалистов

Добавлено: 08 окт 09 0:48

[Ответ][Цитата]

tac
Сообщений: 2601

На: Русский раздел Викиверситета приглашает специалистов

Добавлено: 08 окт 09 0:51

[Ответ][Цитата]

tac
Сообщений: 2601

На: Русский раздел Викиверситета приглашает специалистов

Добавлено: 08 окт 09 0:55

[Ответ][Цитата]

гость
217.199.228.*

На: Русский раздел Викиверситета приглашает специалистов

Добавлено: 08 окт 09 8:05

[Ответ][Цитата]

Oldfella Walk
Сообщений: 316

На: Русский раздел Викиверситета приглашает специалистов

Добавлено: 08 окт 09 11:47

[QUOTE]Автор: Андрей

2. Собственно заявленного "управления" я у вас не увидел. Какое-то нагромождение разных мыслей из разных сфер - ИНС, агенты, ГА, награды. В этой суматохе важные идеи умирают тихой печалью:
- управлять можно только тем, что движется. Где у вас движение, пространство? Физически!
- управлять можно только с целью (к цели). Где у вас цель?
- управлять можно только дискретно, квантами. Где у вас кванты?
- почему награда (как прообраз кванта) парадоксально появляется после движения, а не до? ...QUOTE]

Уважаемый Андрей, вы здесь не во всём правы. Конкретно:
- моделирование движения. Да, в классической науке, например - в небесной механике, движение моделируется двумя качественно разными моделями: движущегося тела и пространства. Самое простенькое: декартовы координаты и материальная точка.
А в неклассических науках - статистической механике, динамических системах - можно обойтись одной моделью движения: фазового пространства, пространства состояний.
- цель управления. Да, при моделировании системы, обладающей памятью и потому способной к мотивации и прогнозу, цель предшествует управлению. Но для моделирования цели как таковой такая развитая модель не обязательна - цель можно смоделировать динамически, моделированием активности системы в среде,т.е. моделированием поведения.
Приспособительное, адаптивное поведение моделируется просто, мудрить систему с памятью не надо. В этом случае цель возникает, конечно, после управления и вследствие управления.
- Управлять дискретно - означает программное управление. Вполне возможно управлять и аналогово, и программа как таковая для этого не обязательна, достанет генерирования случайностей и обратной связи. Другое дело, что при управлении - в системе управления обязательно и неизбежно будет проявляться и развиваться дискретность.
- "Награда"... Тут посложнее... Определённо можно сказать, что о простой модели - адаптации, приспособления - речь уже не идёт. Несомненно, это более сложная модель - с памятью, т.о. мотивированная и прогнозирующая. Речь идёт о моделировании игры, соответственно и выиграша (если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!). Тут такая сложность: в моделировании игр более простых, чем игры людей, игр с Природой, вообще говоря, "выиграшем" является продолжение игры. Жизнь. "Проиграшем" - прекращение игры, т.е., срабатывание механизма отбора. Гимовер - кирдык. То есть реален только "проигрыш". "Выигрыш" всегда - только "призовая игра", забрать ставку невозможно, можно только - на время, по обстоятельствам! - прервать игру, то есть временно прекратить борьбу за существование и поадаптироваться, поприспосабливаться.

Идея "смешанного" моделирования - и сетей, и геналгоритмов - мне лично очень нравится и обещает радужные перспективы. По-крупному это будет означать соединение в одной модели - двух: организма и его нервной системы. Объединённая модель объекта управления и системы управления.

[Ответ][Цитата]

tac
Сообщений: 2601

Управление агентами

Добавлено: 08 окт 09 14:46

Oldfella Walk, спасибо, что пояснили безсвязную речь Андрея ...

Стало немного яснее ... конечно, это простейшая модель ... и я совсем не описывал ее как биологически правдоподобную ... более того только рассуждая о таких моделях, и не делая такие простенькие невозможно ВООБЩЕ ничего создать ... конечно многое еще впереди, но главное мы перешли от болтовни в стиле Андрея к реальным моделям, которые можно тестировать ...

По сути я скажу немного позже ...

1. "цель управления. Да, при моделировании системы, обладающей памятью и потому способной к мотивации и прогнозу, цель предшествует управлению. Но для моделирования цели как таковой такая развитая модель не обязательна - цель можно смоделировать динамически, моделированием активности системы в среде,т.е. моделированием поведения.
Приспособительное, адаптивное поведение моделируется просто, мудрить систему с памятью не надо. В этом случае цель возникает, конечно, после управления и вследствие управления."

Данная система обладает памятью, но она изначально пуста. Поэтому в любом случае невозможно, чтобы она выработала бы цель не предприняв ни каких действий. Как только она некоторое время действует в среде - она вполне сносно определяет для себя цель. Поэтому в данном пункте возражения мне совершенно не понятны.

2. "если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!"

Да, это именно так.

[Ответ][Цитата]

Oldfella Walk
Сообщений: 316

На: Управление агентами

Добавлено: 08 окт 09 20:04

Цитата:

Автор: tac
2. "если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!"

Да, это именно так.

Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?

[Ответ][Цитата]

tac
Сообщений: 2601

На: Управление агентами

Добавлено: 08 окт 09 21:21

Цитата:

Автор: Oldfella Walk

Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?

Прямой такой цели нет ... но это вполне можно так интерпретировать ...

[Ответ][Цитата]

daner
Сообщений: 4633

На: Управление агентами

Добавлено: 09 окт 09 13:49

Цитата:

Автор: Oldfella Walk
Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?

Зачем все постоянно переводить на уровень биологии-физиологии?
Агент изучает функцию "восприятие-действие" следуя которой он соберет макс.кол-во подкреплений. Это похоже на рефлексы Павлова? ДА -- похоже. А когда обучение НЕ похоже на рефлексы? ИМХО, принципиальная разница только тогда, когда обучение сводиться к простому собирательству фактов, без подкрепления. Все остальное, по существу, отличается только длинной последовательности пар "восприятие-действие" до получения подкрепления (т.е. когда подкрепление следует не сразу, а через какое-то время). Как вырабатывается подкрепление (средой или самостоятельно, т.е. эмоциями) в данном контексте большой роли не играет. Так что, выигрыши в играх (о которых вы говорили), ИМХО, ничем не отличаются от подкреплений за выбранную стратегию (или за стратегию выбора стратегии, тут уж как хотите).

[Ответ][Цитата]

Oldfella Walk
Сообщений: 316

На: Управление агентами

Добавлено: 09 окт 09 19:57

Цитата:

Автор: daner
Зачем все постоянно переводить на уровень биологии-физиологии?
Агент изучает функцию "восприятие-действие" следуя которой он соберет макс.кол-во подкреплений. Это похоже на рефлексы Павлова? ДА -- похоже. А когда обучение НЕ похоже на рефлексы? ИМХО, принципиальная разница только тогда, когда обучение сводиться к простому собирательству фактов, без подкрепления. Все остальное, по существу, отличается только длинной последовательности пар "восприятие-действие" до получения подкрепления (т.е. когда подкрепление следует не сразу, а через какое-то время). Как вырабатывается подкрепление (средой или самостоятельно, т.е. эмоциями) в данном контексте большой роли не играет. Так что, выигрыши в играх (о которых вы говорили), ИМХО, ничем не отличаются от подкреплений за выбранную стратегию (или за стратегию выбора стратегии, тут уж как хотите).

Много Вы доводов изложили в одном абзаце... Щас попытаюсь распутать...
В целом "переводить на уровень..." в принципе не обязательно - но может быть полезно. Полезно потому, что удобно. Связывая агента со средой, получаем возможность определить характер этих связей и уровень их развития. А по характеру и уровню развития связей совершенно объективно - по среде - узнаём, что же именно мы напрограммировали...
Вот вы в одной фразе соединяете "подкрепление" и "стратегию"... Для меня они как-то не очень вяжутся.
Раз агент выбирает стратегию, значит, он играет. Само собой, для того, чтобы играть, он должен вообще быть к этому способен - то есть, способен к прогнозу и мотивации. Такую способность агент может обрести только с памятью. Агент с памятью способен бороться за существование. Цели себе он способен ставить сам - это значит, что эти его цели существуют, сами по себе существуют, объективно. Материально существуют, возможно - структурно. Достижение цели агентом отмечается им самим - приносит ему удовлетворение, радость. В общем, позитив...
И как же Вы собираетесь моделировать позитивный критерий?

[Ответ][Цитата]

Oldfella Walk
Сообщений: 316

На: Управление агентами

Добавлено: 09 окт 09 21:18

Подкрепление... Если это подкрепление условного рефлекса, то это моделирование простой О.С.,, т.е. приспособления. Цель в этом случае существует динамически, в активности агента в среде. Чтобы подкреплять её достижение, нужен кто-то, для кого эта цель существует отдельно от активности агента в среде. Агент высшего ранга - с памятью, или человек - программист...
Насчёт выигрыша... Игрок должен понимать, что выигрыш - это выигрышь, иначе это не выигрышь... И как же Вы будете моделировать понимание?

[Ответ][Цитата]

tac
Сообщений: 2601

На: Управление агентами

Добавлено: 09 окт 09 23:32

Цитата:

Автор: Oldfella Walk
И как же Вы будете моделировать понимание?

И вот тут ваша словесная софистика дает четко понять - лучше опустить руки и с умным видом рассуждать о том, о чем понятия собственно нет ! Вначале вам нужно понять одно - на данный поставленный вопрос можно ответить ТОЛЬКО ТОГДА когда ИИ уже будет ГОТОВ, а не перед тем как мы только начинаем что-то делать ... как только выберетесь из парадоксального круга: когда нужно понять, что такое понимание перед тем как начать моделировать - сообщите !

Попроще: понять что есть понимание - это цель любого моделирования ИИ. Поэтому вопрос как моделировать понимание - это все равно что спросить "что есть Бог" !

[Ответ][Цитата]

tac
Сообщений: 2601

На: Управление агентами

Добавлено: 09 окт 09 23:37

Знаете что самое главное в исскустве (именно в исскустве) программирования ? Хороший программист всегда отличается тем, что умеет разделить задачу на подзадачи и решать их от меньшего к большему. Как я со временем начинаю понимать - это большой талант (раньше это мне казалось само сабой разумеющимся, но видя постоянно как люди в этом тупят - хочешь не хочешь прейдешь к мысли, что это данно не многим).

[Ответ][Цитата]

Стр.11 (26): 1 ... 7 8 9 10 [11] 12 13 14 15 ... 26

<< < Пред. | След. > >>

Форум: Проблемы искусственного интеллекта