GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.13 (37)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Конкурс по написанию эволюционной программы.
kondrat
Сообщений: 4026
На: Конкурс по написанию эволюционной программы.
Добавлено: 11 апр 13 10:55
Мне кажется, что я знаю как прокачать чемпиона. Но выпускать его неподготовленным не охота. Да и срок жосский.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкурс по написанию эволюционной программы.
Добавлено: 11 апр 13 14:25
Цитата:
Автор: Slava
знакомы ли вы с работами Вайнцвайга?
Знаком в объёмах, не превышающих, к сожалению, эту статью. О чём мы с Вами даже когда-то давно вели беседу.

Цитата:
Автор: Анатоль
Сообщите скачивается ли?
Скачивается. Но без исходников запускать стрёмно...

Цитата:
Автор: Luarvik_Luarvik
Этот "супервизор" считается частью обучающейся программы, или внешним "учителем" ?
А в чём разница?
Смысл обучения программы состоит в том, чтобы пополнить свод своих правил (жизненных ценностей, правильностей). Природа и формат этих вновь открытых правил ничем не должны отличаться от природы и формата изначальных правил игры. Я просто пытаюсь мягко намекнуть на правильный ход мыслей. Что вся суть обучения состоит только в составлении списка того, что есть "правильно". Что по иному мыслить программу вообще-то некорректно. Иначе будет как с той обезьяной, которая отличала воду в баке от воды в озере (правила игры изначальные от правил игры, найденных в процессе обучения).
[Ответ][Цитата]
Nuarez
Сообщений: 107
На: Конкурс по написанию эволюционной программы.
Добавлено: 11 апр 13 21:38
Интересная тема. Сам много размышлял о создании чего то мыслящего, но всегда упирался в одно и то же-ощушения. Вот вам и "учитель", мотиватор и побудитель к действиям. Как заставите прогу ощущать? Что у вас будет кнут и пряник. Вот я задену оголенные провода и на всю жизнь это запомню. Вот попробуйте заставить свой ИИ что то чувствовать при неправильном ходе, чтоб он больше так не делал, а то "бо-бо". А иначе какая ему разница, выиграет он или проиграет. И какая ждет его конфета за победу?
[Ответ][Цитата]
Fractaler
Сообщений: 2490
На: Конкурс по написанию эволюционной программы.
Добавлено: 11 апр 13 23:11
Цитата:
Автор: Андрей
Скачивается. Но без исходников запускать стрёмно...

Да, я тоже слышал про такое. Один вот тоже, запустил нечто подобное (видимо, действительно эволюционирующую, но, в которой, конечно, креатор всё заранее предусмотрел), безкодообразное (правда, в сеть, да какая при теперешней частоте их мутаций, разница) и забыл про неё. А через какое то время ему позвонили. Это была ОНА (правда, здорово мутировавшая).
[Ответ][Цитата]
Fractaler
Сообщений: 2490
На: Конкурс по написанию эволюционной программы.
Добавлено: 11 апр 13 23:16
Цитата:
Автор: Nuarez

Какая разница, как будет сформирована модель мира (веса рёбер графа)? Через "эмоции", научным тыком или их сразу запишет программер? Вопрос в том (как правильно заметили ранее) - "а толку то?". Что потом с этой моделью (совокупностью весов) делать? Куда пристаканить?
[Ответ][Цитата]
Luarvik.
Сообщений: 17287
На: Конкурс по написанию эволюционной программы.
Добавлено: 12 апр 13 4:44
Цитата:
Автор: Андрей
А в чём разница?

Посмотрите свои "постуляты" - там все написано...
(Начальный, исходный уровень - ???)
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Конкурс по написанию эволюционной программы.
Добавлено: 12 апр 13 8:42
Программа сделала эволюционный прыжок.
Теперь может работать в трёх режимах (переключается):
Чел - Прога
Прога - Прога
Чел - Чел
Для режима Прога - Прога есть регулятор скорости,(чтобы можно было наблюдать последовательность ходов).
Поскольку при работе на максимальной скорости видно только результирующее состояние.
Экзешник KrestNol3.zip в архиве по ссылке http://qclk.ru/ky/YTec
[Ответ][Цитата]
гость
178.212.80.*
На: Конкурс по написанию эволюционной программы.
Добавлено: 12 апр 13 11:49
Цитата:
Автор: Nuarez

Интересная тема. Сам много размышлял о создании чего то мыслящего, но всегда упирался в одно и то же-ощушения. Вот вам и "учитель", мотиватор и побудитель к действиям. Как заставите прогу ощущать? Что у вас будет кнут и пряник. Вот я задену оголенные провода и на всю жизнь это запомню. Вот попробуйте заставить свой ИИ что то чувствовать при неправильном ходе, чтоб он больше так не делал, а то "бо-бо". А иначе какая ему разница, выиграет он или проиграет. И какая ждет его конфета за победу?

Адаптивная часть такого существа должна быть нацелена на достижение максимального значения показателя удовлетворённости, вычисляемого врождённым (заранее запрограммированным) аппаратом эмоций. В результате, адаптивная часть будет более избирательна (чувствительна) к отрицательному и положительному опыту.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкурс по написанию эволюционной программы.
Добавлено: 12 апр 13 12:16
Цитата:
Автор: Андрей

Знаком в объёмах, не превышающих, к сожалению, эту статью. О чём мы с Вами даже когда-то давно вели беседу.


Ну и память у вас! - завидую по-хорошему
Удачи
[Ответ][Цитата]
Toxygen
Сообщений: 521
На: Конкурс по написанию эволюционной программы.
Добавлено: 12 апр 13 21:50
Цитата:
Автор: Анатоль
Программа сделала эволюционный прыжок...
Экзешник KrestNol3.zip в архиве по ссылке http://qclk.ru/ky/YTec

А на исходники можно глянуть?
Еще вопрос: в каком виде ваш агент хранит приобретенный опыт, как его интерпретирует, каким способом он выбирает способ интерпретации?

Вообще расскажите про основной принцип работы программы.
Если честно, сомневаюсь, что программа делает что, толковое: файлы она никакие не пишет, количество съедаемой оперативы не увеличивается, следовательно, и опыт не увеличивается.
Вот ошибочку нашел кстати:
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Конкурс по написанию эволюционной программы.
Добавлено: 13 апр 13 4:10
Эвристики.
Итак, программа умеет ходить не нарушая правил, может опредялять ситуацию достижения цели (вииграш или проиграш).
Самое время поговорить об эвристиках.
Т.е. алгоритмах эффективного движения к цели.

Программа должна сама эволюционным путём вырабатывать специальные эвристики.
Но.
Универсальные эвристики допускается заложить в неё изначально.
Универсальные эвристики - это такие, которые могут работать на самых различных играх.
Например метод обратного распостранения цели (регрессия цели).

В чём суть метода?
Зная цель (целевое состояние) и допустимые ходы, можно определить предцели - состояния, из которых цель достигается за один ход (предцели первого порядка).
Продолжая движение назад получаем множество предцелей второго порядка и т.д.

Например для случая крестиков-ноликов целью является 5 крестиков подряд.
Из такой цели обратным ходом (стиранием крестика) можем получить несколько предцелей первого порядка (ряд из 4 крестиков с дыркой скраю или внутри).
Теперь, если программа обнаружит одну из таких предцелей, то она уже за один ход может достигнуть цели (поставить крестик в дырку).

Из предцелей первого порядка можно обратным ходом (стиранием крестика) получить предцели второго порядка из которых одним ходом достигается предцель первого порядка.
И т.д.

Эвристика обратного распостранения цели универсальна и поэтому может применяться.
Но она должна быть записана в виде не привязанном к конкретной игре.
Конкретизируют её только правила игры (допустимые ходы и цель).

[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Конкурс по написанию эволюционной программы.
Добавлено: 13 апр 13 4:18
Цитата:
Автор: Toxygen
А на исходники можно глянуть?

Можно, но там ещё нет никаких алгоритмов.
Программа ходит рандомом (в окрестности последнего хода соперника).

Цитата:
Еще вопрос: в каком виде ваш агент хранит приобретенный опыт, как его интерпретирует, каким способом он выбирает способ интерпретации?


Пока никак. Только ходит рандомом. Чисто оболочка. Пока.

Цитата:
Вообще расскажите про основной принцип работы программы.

Уже рассказал.
Цитата:
Если честно, сомневаюсь, что программа делает что, толковое: файлы она никакие не пишет, количество съедаемой оперативы не увеличивается, следовательно, и опыт не увеличивается.

Всё правильно Вы говорите. Это только оболочка.

Цитата:
Вот ошибочку нашел кстати:

Это не ошибка. Программа не пропустила пяти ноликов.
Шесть получилось из объединения двух групп (поставила нолик в пустую клетку между группой из 3 и 2 ноликов, например).
Вот если бы кроме отмеченой цветом целевой группы Вы обнаружили другую группу из 5(или больше) крестиков или ноликов, то это была бы ошибка.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкурс по написанию эволюционной программы.
Добавлено: 13 апр 13 7:42
Цитата:
Автор: Анатоль
Можно, но там ещё нет никаких алгоритмов.
Исходники нужны не для того, чтобы воровать Ваши супер-алгоритмы, а чтобы не получилось как в том анекдоте:
- Папа, а что значит "Format C: complete"?
- Это значит что ты сейчас умрёшь...

Цитата:
Автор: Анатоль
Обучать программу правилам игры с помощью учителя вполне возможно, но

Программа должна сама эволюционным путём вырабатывать специальные эвристики.
Но
Но, похоже, пока вместо само-эволюционирующей и само-обучающейся программы, у Вас получается только Анатоле-креационирующая программа...
[Ответ][Цитата]
Toxygen
Сообщений: 521
На: Конкурс по написанию эволюционной программы.
Добавлено: 14 апр 13 12:00
Анатоль, а не водите ли вы нас за нос? В начале топика вы предлагали написать программу, которая будет принимать условия и правила игры, и затем пытаться играть в эту игру оптимальным образом.

Через десяток страниц вы в итоге выкладываете некую программу, которая ни принимает входные условия (правила игры), ни пытается обучаться.

Давайте по порядку: попрошу вас формализовать "правила задания правил программе". Каким способом ей задаются условия? Размерность поля, возможные ходы, очередность, условия победы? Т.е. конкретно, как на олимпиадных задачах по программированию: какие данные мы имеем на входе, какие данные должны быть на выходе..

И затем по этим законам напишите, например, как вы зададите игре правила игры в крестики-нолики (3х3), шахматы...

PS: да, с "ошибкой" я оказался не прав, приношу извинения
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Конкурс по написанию эволюционной программы.
Добавлено: 14 апр 13 20:20
Цитата:
Автор: Toxygen
В начале топика вы предлагали написать программу, которая будет принимать условия и правила игры, и затем пытаться играть в эту игру оптимальным образом.

Про оптимальную игру речь не идёт.
Но программа, получив правила игры, должна самостоятельно научиться хорошо играть.

Цитата:
Через десяток страниц вы в итоге выкладываете некую программу, которая ни принимает входные условия (правила игры), ни пытается обучаться.

Почему "в итоге"? Задача на три месяца. Итоги рано подводить.
Будем двигаться к цели эволюционно.

Цитата:
Давайте по порядку: попрошу вас формализовать "правила задания правил программе". Каким способом ей задаются условия? Размерность поля, возможные ходы, очередность, условия победы?

Об этом уже говорилось.
Кроме того это сама по себе творческая задача.
Пока нет формализации каждый решает её как может.

А до конца апреля промежуточная задача - самообучающаяся программа игре крестики-нолики на бесконечном поле (минимум 20*20, или 32*32).
[Ответ][Цитата]
 Стр.13 (37)1  ...  9  10  11  12  [13]  14  15  16  17  ...  37<< < Пред. | След. > >>