GotAI.NET - Форум - Искусственный интеллект

Все темы | Новая тема

Стр.64 (112)

<< < Пред. | След. > >>

Поиск:

Автор

Тема: На: Об одном подходе к решению задачи создания СИИ

Траян
Сообщений: 1063

На: Об одном подходе к решению задачи создания СИИ

Добавлено: 07 июн 18 1:40

Изменено: 07 июн 18 1:56

Т.> вот совсем уж конкретно. ВЫ апеллировали к технике RL.
============
Аппелировал. Дабы показать, что максуд даже в его примитивнейшей реализации (на таблицах Q-learning иди алгоритмах SARSA) УЖЕ дает неплохие результаты (см. проект AlphaZero).
Это - медицинский факт.
Т.е. даже если ИС агента строит модели мира на уровне планарий с их одношаговыми условными рефлексами, это оказывается достаточно для реализации примитивных форм адаптивного поведения.

В СИИ, есссно, качество, сложность и совершенство используемых моделей действительности в миллиарды (?) раз превосходят модели задаваемыми таблицами RL/
Вообще-то, это качественно разные вещи, совершенно несопоставимые между собой..

>Если среда становится отличной от той, в которой происходило обучение, то агент, продолжая обучаться, обязан совершать действия не по максимому ценностей, чтобы Успевать
адаптировать систему ценностей к изменяющейся среде.
===========
Даже на Q-learning агент способен переучиваться (как и планарии, морские зайцы и прочие)
при изменении среды. Есссно, с некоторым запозданием.
Юзающая более совершенные модели СИИ будет способна заранее предвидеть возникновение или изменение закономерностей мира.

>Это все об одном и том же - принцип максимума удовольсвий ограничен принципом реальности. ОДно дело формальный агент и другое - естественный.
============
Плоские черви и брюхоногие моллюски реальны?

>еще раз - сам принцип максуд это только технический прием и/или нормативная идея, - критикуется мысль что организм (его система управления - тут ваш маневр с их разведением неуместен)
=================
Это не мой маневр, это природа почему-то выбрала для конструкций живых существ именно такое базовое решение . Далеко не идеальное. Для отдельных особей зачастую приводящее к фатальным ошибкам.
Но реально работающее при его массовом использовании.

>Идея что максуд 'на самом деле все-таки работает' неверифицируема и нефальсифицируема,
================
Эксперимент с крысой железно доказывает, что стремление к получению пол. подкреплений является главенствующим. Перебивающим все.

>тогда она просто догматика-схоластика, - всегда можно сказать, что каждый выбор максимизирует некую величину (назвать ее удовольствием)
============
Верно.

> - вопрос только в том, что эти 'удовольствия' будут фиктивны и не соответствовать реальным удовольствиям (которые не максимизируются, а цикличны, не скалярны, а качественно различаются, не суммируются, а имеет место коррекция оценок важностей (сила и специфика удовольствия регулируются динамически и ситуационно)
=============
Если бы эти удовольствия не были скалярны, т.е. не обладали свойствами аддитивности и транзитивности, то невозможно было бы многошаговое планирование включающее в себя разнородные этапы деятельности. Типа выбора плана действий на неделю. Сегодня вечером пойти в клуб, пьянка и секс, завтра сесть за диссер, в среду посидеть с детьми, в четверг залезть на Эверест, в пятницу начать изучать Саттона/Барто). Или наоборот: в понедельник с детьми, а в пятницу в клуб.

>, проявляются ситуационно, локально
=============
Верно.

> - это не значит что этот эпизод встраивается в глобальную жизненную цепочку доставляющую максимум суммы удовольствий в виде постоянного горолазания)).
==================
Верно. Об этом уже раза три упоминалось. Между воздейстием среды и получаемым R нет однозначного соответствия (поскольку R генерится опосредованно, в ЭС). Это только в нынешнем RL при прогнозировании R напрямую связывается с состоянием среды S.

>Введение 'удовольствия' как такого
потенциала это ошибочная идея (в самом принципе найти такой потенциал, максимизации которого достаточно для описания поведения сложной системы).
============
Никто не говорит что максуд - это идеальное решение. Но в отличие от сферических коней в вакууме - это реально существующее и работающее решение.

>модель приятностей должна адекватно апроксимировать объективные полезности - а именно это никак не гарантированно
================
Именно так. Никаких гарантий нет (и быть не может).
Вот так и живем.
А что, Вам кто-то гарантировал, скажем, правильность той модели мира, что Вы используете?
Нет ведь?
Но все мы живем и действуем так, как если бы мы были уверены в абсолютной правильности и незыблемости своих представлений о действительности (в том числе, самого этого представления о его негарантированности).

(продолжение следует)

Форум: Проблемы искусственного интеллекта