GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.11 (26)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Русский раздел Викиверситета приглашает специалистов
Андрей
Сообщений: 3944
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:45
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:46
Я повторяю свой вопрос: По сути есть что сказать ?
[
Ответ
][
Цитата
]
Андрей
Сообщений: 3944
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:48
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:51
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 0:55
[
Ответ
][
Цитата
]
гость
217.199.228.*
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 8:05
[
Ответ
][
Цитата
]
Oldfella Walk
Сообщений: 316
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 08 окт 09 11:47
[QUOTE]Автор: Андрей
2. Собственно заявленного "управления" я у вас не увидел. Какое-то нагромождение разных мыслей из разных сфер - ИНС, агенты, ГА, награды. В этой суматохе важные идеи умирают тихой печалью:
- управлять можно только тем, что движется. Где у вас движение, пространство? Физически!
- управлять можно только с целью (к цели). Где у вас цель?
- управлять можно только дискретно, квантами. Где у вас кванты?
- почему награда (как прообраз кванта) парадоксально появляется
после
движения, а не
до
? ...QUOTE]
Уважаемый Андрей, вы здесь не во всём правы. Конкретно:
- моделирование движения. Да, в классической науке, например - в небесной механике, движение моделируется двумя качественно разными моделями: движущегося тела и пространства. Самое простенькое: декартовы координаты и материальная точка.
А в неклассических науках - статистической механике, динамических системах - можно обойтись одной моделью движения: фазового пространства, пространства состояний.
- цель управления. Да, при моделировании системы, обладающей памятью и потому способной к мотивации и прогнозу, цель предшествует управлению. Но для моделирования цели как таковой такая развитая модель не обязательна - цель можно смоделировать динамически, моделированием активности системы в среде,т.е. моделированием поведения.
Приспособительное, адаптивное поведение моделируется просто, мудрить систему с памятью не надо. В этом случае цель возникает, конечно, после управления и вследствие управления.
- Управлять дискретно - означает программное управление. Вполне возможно управлять и аналогово, и программа как таковая для этого не обязательна, достанет генерирования случайностей и обратной связи. Другое дело, что при управлении - в системе управления обязательно и неизбежно будет проявляться и развиваться дискретность.
- "Награда"... Тут посложнее... Определённо можно сказать, что о простой модели - адаптации, приспособления - речь уже не идёт. Несомненно, это более сложная модель - с памятью, т.о. мотивированная и прогнозирующая. Речь идёт о моделировании игры, соответственно и выиграша (если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!). Тут такая сложность: в моделировании игр более простых, чем игры людей, игр с Природой, вообще говоря, "выиграшем" является продолжение игры. Жизнь. "Проиграшем" - прекращение игры, т.е., срабатывание механизма отбора. Гимовер - кирдык. То есть реален только "проигрыш". "Выигрыш" всегда - только "призовая игра", забрать ставку невозможно, можно только - на время, по обстоятельствам! - прервать игру, то есть временно прекратить борьбу за существование и поадаптироваться, поприспосабливаться.
Идея "смешанного" моделирования - и сетей, и геналгоритмов - мне лично очень нравится и обещает радужные перспективы. По-крупному это будет означать соединение в одной модели - двух: организма и его нервной системы. Объединённая модель объекта управления и системы управления.
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
Управление агентами
Добавлено: 08 окт 09 14:46
Oldfella Walk, спасибо, что пояснили безсвязную речь Андрея ...
Стало немного яснее ... конечно, это простейшая модель ... и я совсем не описывал ее как биологически правдоподобную ... более того только рассуждая о таких моделях, и не делая такие простенькие невозможно ВООБЩЕ ничего создать ... конечно многое еще впереди, но главное мы перешли от болтовни в стиле Андрея к реальным моделям, которые можно тестировать ...
По сути я скажу немного позже ...
1. "цель управления. Да, при моделировании системы, обладающей памятью и потому способной к мотивации и прогнозу, цель предшествует управлению. Но для моделирования цели как таковой такая развитая модель не обязательна - цель можно смоделировать динамически, моделированием активности системы в среде,т.е. моделированием поведения.
Приспособительное, адаптивное поведение моделируется просто, мудрить систему с памятью не надо. В этом случае цель возникает, конечно, после управления и вследствие управления."
Данная система обладает памятью, но она изначально пуста. Поэтому в любом случае невозможно, чтобы она выработала бы цель не предприняв ни каких действий. Как только она некоторое время действует в среде - она вполне сносно определяет для себя цель. Поэтому в данном пункте возражения мне совершенно не понятны.
2. "если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!"
Да, это именно так.
[
Ответ
][
Цитата
]
Oldfella Walk
Сообщений: 316
На: Управление агентами
Добавлено: 08 окт 09 20:04
Цитата:
Автор: tac
2. "если только то, что здесь называется "наградой", не является на самом деле подкреплением при вырабатывании условного рефлекса!"
Да, это именно так.
Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 08 окт 09 21:21
Цитата:
Автор: Oldfella Walk
Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?
Прямой такой цели нет ... но это вполне можно так интерпретировать ...
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Управление агентами
Добавлено: 09 окт 09 13:49
Цитата:
Автор: Oldfella Walk
Я недопонял: так Вы моделируете вырабатывание "павловских" условных рефлексов? Речь идёт именно о подкреплении?
Зачем все постоянно переводить на уровень биологии-физиологии?
Агент изучает функцию "восприятие-действие" следуя которой он соберет макс.кол-во подкреплений. Это похоже на рефлексы Павлова? ДА -- похоже. А когда обучение НЕ похоже на рефлексы? ИМХО, принципиальная разница только тогда, когда обучение сводиться к простому собирательству фактов, без подкрепления. Все остальное, по существу, отличается только длинной последовательности пар "восприятие-действие" до получения подкрепления (т.е. когда подкрепление следует не сразу, а через какое-то время). Как вырабатывается подкрепление (средой или самостоятельно, т.е. эмоциями) в данном контексте большой роли не играет. Так что, выигрыши в играх (о которых вы говорили), ИМХО, ничем не отличаются от подкреплений за выбранную стратегию (или за стратегию выбора стратегии, тут уж как хотите).
[
Ответ
][
Цитата
]
Oldfella Walk
Сообщений: 316
На: Управление агентами
Добавлено: 09 окт 09 19:57
Цитата:
Автор: daner
Зачем все постоянно переводить на уровень биологии-физиологии?
Агент изучает функцию "восприятие-действие" следуя которой он соберет макс.кол-во подкреплений. Это похоже на рефлексы Павлова? ДА -- похоже. А когда обучение НЕ похоже на рефлексы? ИМХО, принципиальная разница только тогда, когда обучение сводиться к простому собирательству фактов, без подкрепления. Все остальное, по существу, отличается только длинной последовательности пар "восприятие-действие" до получения подкрепления (т.е. когда подкрепление следует не сразу, а через какое-то время). Как вырабатывается подкрепление (средой или самостоятельно, т.е. эмоциями) в данном контексте большой роли не играет. Так что, выигрыши в играх (о которых вы говорили), ИМХО, ничем не отличаются от подкреплений за выбранную стратегию (или за стратегию выбора стратегии, тут уж как хотите).
Много Вы доводов изложили в одном абзаце... Щас попытаюсь распутать...
В целом "переводить на уровень..." в принципе не обязательно - но может быть полезно. Полезно потому, что удобно. Связывая агента со средой, получаем возможность определить характер этих связей и уровень их развития. А по характеру и уровню развития связей совершенно объективно - по среде - узнаём, что же именно мы напрограммировали...
Вот вы в одной фразе соединяете "подкрепление" и "стратегию"... Для меня они как-то не очень вяжутся.
Раз агент выбирает стратегию, значит, он играет. Само собой, для того, чтобы играть, он должен вообще быть к этому способен - то есть, способен к прогнозу и мотивации. Такую способность агент может обрести только с памятью. Агент с памятью способен бороться за существование. Цели себе он способен ставить сам - это значит, что эти его цели существуют, сами по себе существуют, объективно. Материально существуют, возможно - структурно. Достижение цели агентом отмечается им самим - приносит ему удовлетворение, радость. В общем, позитив...
И как же Вы собираетесь моделировать позитивный критерий?
[
Ответ
][
Цитата
]
Oldfella Walk
Сообщений: 316
На: Управление агентами
Добавлено: 09 окт 09 21:18
Подкрепление... Если это подкрепление условного рефлекса, то это моделирование простой О.С.,, т.е. приспособления. Цель в этом случае существует динамически, в активности агента в среде. Чтобы подкреплять её достижение, нужен кто-то, для кого эта цель существует отдельно от активности агента в среде. Агент высшего ранга - с памятью, или человек - программист...
Насчёт выигрыша... Игрок должен понимать, что выигрыш - это выигрышь, иначе это не выигрышь... И как же Вы будете моделировать понимание?
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 09 окт 09 23:32
Цитата:
Автор: Oldfella Walk
И как же Вы будете моделировать понимание?
И вот тут ваша словесная софистика дает четко понять - лучше опустить руки и с умным видом рассуждать о том, о чем понятия собственно нет ! Вначале вам нужно понять одно - на данный поставленный вопрос можно ответить ТОЛЬКО ТОГДА когда ИИ уже будет ГОТОВ, а не перед тем как мы только начинаем что-то делать ... как только выберетесь из парадоксального круга: когда нужно понять, что такое понимание перед тем как начать моделировать - сообщите !
Попроще: понять что есть понимание - это цель любого моделирования ИИ. Поэтому вопрос как моделировать понимание - это все равно что спросить "что есть Бог" !
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 09 окт 09 23:37
Знаете что самое главное в исскустве (именно в исскустве) программирования ? Хороший программист всегда отличается тем, что умеет разделить задачу на подзадачи и решать их от меньшего к большему. Как я со временем начинаю понимать - это большой талант (раньше это мне казалось само сабой разумеющимся, но видя постоянно как люди в этом тупят - хочешь не хочешь прейдешь к мысли, что это данно не многим).
[
Ответ
][
Цитата
]
Стр.11 (26)
:
1
...
7
8
9
10
[11]
12
13
14
15
...
26
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net