GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.25 (26)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Управление агентами
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 23 окт 09 0:58
Цитата:
Автор: daner

Фигней занимаетесь вместо того что бы идти к поставленной цели. Придумали какой-то алгоритм который совершенно незачем. Потом вам с чего-то пришло в голову, что среда должна быть обязательно детерминированная, теперь награды обязательно должны быть положительными. Какой смысл в этой демагогии?



Каждый идет своим путем к поставленной цели ! И цель одна ... я вот не понимаю, чего вы "выходите из себя" ... начинаете решать что фигня, а что нет ... при этом слабо понимая для как и для чего я сделал этот алгоритм ... Начинайте параллельно обсуждать свой путь - в чем проблема ? Только зачем чужой "мешать с гавном" и утверждать что это тут не причем ...

нравится/не нравится - мне не условия, а их интерпретация ... именно поэтому у меня предпочтение к детерминированной задаче и входам стимулам без выделения наград, или с разделением наград и наказаний ... я обсуждаю, ищу границы МДП, QL, постановки задачи ... некоторые из них я первоначально не знал (как например с отрицательностью) ... смысл этого прощупать все это, чтобы можно было писать общий алгоритм, да проверяя его в этой задаче, но чтобы реально была надежда на другие условия постановки задачи ... почему это для вас демагогия ?
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 23 окт 09 1:04
Цитата:
Автор: daner


что значит не нужно? это вы так решили на звезды посмотрев? ВСЕ константы о которых я упоминал у вас, зависят от среды. Просто прикиньте, если награды будут в диапазоне (0,1), т.е. не целые. У вас уже куча констант измениться. А если вы возможный диапазон еще и не знаете?
Кстати, есть алгоритмы которые автоматически настраивают константы QЛ.


То и значит .. ну поменяю я тип с int на double ... и что, сильно запарюсь думаете ? И знать мне диапазон не зачем -бесконечность + бесконечность ... остальное настроиться автоматически ... ну, заведу пропорцию от полученной награды ... какие проблемы ?

(хотя по мне - это условия задачи нужно преобразовывать в целые числа - и весь вопрос)
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 23 окт 09 1:06
Цитата:
Автор: daner


Я не чего (пока) менять не хочу (в этом весь смысл). Я хочу внешний алгоритм, который повысить производительность QL алгоритма. Кстати, упомянутый бустинг именно такой алгоритм. Он использует (в стандарте) деревья решений (может и перцептрон, может и любой другой алгоритм), не меняя их, а используя.


Можете этот бустинг написать в виде псевдо алгоритма не смешивая с QL ?
[Ответ][Цитата]
daner
Сообщений: 4633
На: Управление агентами
Добавлено: 23 окт 09 1:10
Цитата:
Автор: tac
Причем тут рациональность ? Меня не устраивает, что вы ограничиваетесь постановкой задачи где нужно найти суммарный максимум !!!

так суммарный максимум -- это и есть определение рациональности стратегии. Это из теории принятия решений и экономики. Не вижу вообще никакого смысла это менять.
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 23 окт 09 1:12
Цитата:
Автор: daner


так суммарный максимум -- это и есть определение рациональности стратегии. Это из теории принятия решений и экономики. Не вижу вообще никакого смысла это менять.


Вам не в лом кинуть сюда это определение - я над ним помедитирую ... (просто боюсь, что тогда мы стоит уж совсем на шадкой почве - в болоте т.е. )
[Ответ][Цитата]
daner
Сообщений: 4633
На: Управление агентами
Добавлено: 23 окт 09 1:21
QUOTE's Автор: tac
Цитата:
Каждый идет своим путем к поставленной цели ! И цель одна ... я вот не понимаю, чего вы "выходите из себя" ... начинаете решать что фигня, а что нет ... при этом слабо понимая для как и для чего я сделал этот алгоритм ... Начинайте параллельно обсуждать свой путь - в чем проблема ? Только зачем чужой "мешать с гавном" и утверждать что это тут не причем ...

никто ничего не мешает. фигня НЕ сам алгоритм (алгоритм очень даже не плохой), а то что мы вообще, его уже который день обсуждаем. И да, я совсем (а не слабо) не понимаю, зачем вы его сделали.

Цитата:
нравится/не нравится - мне не условия, а их интерпретация ... именно поэтому у меня предпочтение к детерминированной задаче и входам стимулам без выделения наград, или с разделением наград и наказаний ... я обсуждаю, ищу границы МДП, QL, постановки задачи ... некоторые из них я первоначально не знал (как например с отрицательностью) ... смысл этого прощупать все это, чтобы можно было писать общий алгоритм, да проверяя его в этой задаче, но чтобы реально была надежда на другие условия постановки задачи ... почему это для вас демагогия ?

Зачем их искать? они уже найдены. Поэтому и демагогия.
Так общий алгоритм -- не входит в задачи данного проекта, который мы с вами начали.
Если бы вы сразу поставили вопрос, что хотите написать общий алгоритм -- я бы сразу открестился.

[Ответ][Цитата]
daner
Сообщений: 4633
На: Управление агентами
Добавлено: 23 окт 09 1:24
Цитата:
Автор: tac
То и значит .. ну поменяю я тип с int на double ... и что, сильно запарюсь думаете ? И знать мне диапазон не зачем -бесконечность + бесконечность ... остальное настроиться автоматически ... ну, заведу пропорцию от полученной награды ... какие проблемы ?

(хотя по мне - это условия задачи нужно преобразовывать в целые числа - и весь вопрос)

да нет, изменения будут посерьезнее. А добавить самонастройку конечно можно (она и для QЛ тоже есть, если уж на то пошло). Ну не будет у вас констант. Что это меняет? Ничего.
[Ответ][Цитата]
daner
Сообщений: 4633
На: Управление агентами
Добавлено: 23 окт 09 1:25
Цитата:
Автор: tac
Можете этот бустинг написать в виде псевдо алгоритма не смешивая с QL ?

а он и не должен смешиваться. вот только я пока не знаю как бустинг для РЛ сделать.
знал бы, проект был бы на 90% уже сделан.
[Ответ][Цитата]
daner
Сообщений: 4633
На: Управление агентами
Добавлено: 23 окт 09 1:34
Цитата:
Автор: tac
Вам не в лом кинуть сюда это определение - я над ним помедитирую ... (просто боюсь, что тогда мы стоит уж совсем на шадкой почве - в болоте т.е. )

понятия не имею где его взять.
Но тут особенно медитировать ненадчем. Так как в рамках этого проекта менять теорию принятия решений и всю экономику, желания у меня совершенно нет.
Единственное, с чем я еще могу согласиться, это (опять таки с экономической точки зрения) с дисконтированием (т.е. когда награда сейчас важнее чем награда которая будет, когда-то там...). т.е. Соглашусь, что возможно 0+0+0+0+0+0+0+...+0+10000 стратегия хуже чем 10+10+10 (особенно, если среда меняется со временем). В прочем на эти тему есть куча материала по экономики в раздели инвестирования, и это пять таки не та тема, которой мне бы хотелось заниматься сейчас. Фокусируйтесь на проблеме.
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 23 окт 09 1:54
Цитата:
Автор: daner
Фокусируйтесь на проблеме.


Тогда обозначьте ее наиболее ЯВНО и ЧЕТКО. Похоже у нас все-таки разные проблемы , и ваша кажется есть лишь мала часть моей (отсюда я закидываю удочку дальше вас по стратегии 1+1+1+1+1+1+1+...+1+10000, вместо вашей 10+10+ стоп.)
[Ответ][Цитата]
tac
Сообщений: 2601
На: Управление агентами
Добавлено: 23 окт 09 1:57
Цитата:
Автор: daner


а он и не должен смешиваться. вот только я пока не знаю как бустинг для РЛ сделать.


Да, поясните мне что вы уже знаете ... для чего его делают и как ... читать это на английском - это мне очень трудно, все равно прочитаю не то, и пойму не то
[Ответ][Цитата]
гость
89.208.11.*
На: Управление агентами
Добавлено: 03 ноя 09 21:36
[Ответ][Цитата]
tac
Сообщений: 2601
РУ Викиверситет
Добавлено: 17 ноя 09 22:16
Начал работать русский викиверситет http://ru.wikiversity.org

В частности

Факультет искусственного интеллекта
[Ответ][Цитата]
GRINPIS
Сообщений: 2
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 22 ноя 09 7:06
а почему это проблема давоьно ни чего мне нравится
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Русский раздел Викиверситета приглашает специалистов
Добавлено: 09 янв 10 20:58
там почему-то аватар Шуклина на логотипе
[Ответ][Цитата]
 Стр.25 (26)1  ...  21  22  23  24  [25]  26<< < Пред. | След. > >>