GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.60 (74)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Об одном подходе к решению задачи создания СИИ
Траян
Сообщений: 651
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 20 май 18 4:13
Изменено: 20 май 18 4:26
Цитата:
Автор: гость
... агент это сущее на перекрестке противоречивых требований, а значит 'универсальным' будет только метапринцип поиска ситуационного баланса противоречивых требований, балансирования в паретовых условиях многокритериальной оптимизации (условные субоптимизации и локальные улучшения рулез).


Я все же предпочитаю исходить из принципа одно-критериальной оптимизации. Можно долго спорить о том, что это за критерий - увеличение ли шансов выживания вида, как говорят биологи; увеличение ли вероятности на передачу ядра генома, как нас учат генетики; или повышение степени одухотворенности мира, как учат некоторые просветленные гуру - это все пока вторично.

Я помню Ваше тотальное неприятие идеи одно-критериальной оптимизации, хотя и в толк не возьму, почему Вы отстаиваете именно эту точку зрения. Ведь доказать сводимость многокритериальной к одно- можно даже с помощью сравнительно простых мат. построений.

(Вот даже в приводимом Вами примере: "... если сильна угроза существованию, то незачем экономить ресурсы - при том, что не экономя ресурсы больше шансов поставить себя под угрозу существованию" подспудно подразумевается, что критерий один - выживание.)

Да и из общих соображения ясно, что для того, чтобы агент не мог попасть в неопределенные ситуации, не "зависал" намертво (из-за конфликта интересов разных модулей и процессов), критерий должен быть один. Причем, на всем протяжении всей его жизни.

PS Кстати, спс, за этот пример, я его неоднократно использую в своих построениях, поскольку он помогает наглядно объяснить суть сознания - как его когнитивный функционал, так и его внутренне устройство/архитектуру.

PPS Говоря о выживании вида как о критерии, по которому агент выбирает свои действия следует иметь в виду, что этот критерий не обязательно должен задаваться в явном декларативном виде. Можно просто встроить систему поощрений-наказаний а-ля RL, отслеживающую состояния агента.

Цитата:
Автор: гость
... просто вы ранее выступили с объявлением что обнаружили нечто 'cущественно разрешающее вопрос о сознании', более определенного раскрытия чего от вас и ждали (и ждут) - с полным пониманием что вы могли просто ошибиться в оценке масштаба своих озаризмов (о чем говорили и в отношении бмп).


Согласно предлагаемой теории, сознание возникло как инструмент оптимизации одновременно нескольких, в чем-то противоречивых процессов, таких, например, как внутренняя ментальная деятельность (обучение/построение моделей мира); обеспечение оперативности и адекватности реакций при возникновении новых, неожиданных изменений обстановки и т.д.

Сознание возникает в попытке нахождения такого хитрого решения которое могло бы разрешить одновременно (!!!) целый ряд (не менее трех, имхо) совершенно различных по своему содержанию задач оптимизации.

Найти баланс между специализацией и универсальностью, между оперативностью реагирования и "обдуманностью" принимаемых решений.

Можно и так сказать, что сознание - это инструмент выбора того объема знаний, который используется при решении тех или иных проблем.

А можно и так: сознание - это организатор, "вдохновитель" и контроллер, способный сформировать и запустить различные узко-специализированные процессы, способные самостоятельно (и очень экономично - за счет своей специализации) справиться с рутинными задачами (лежащими в одной проблемно-предметной области), когда при решении очередной проблемы нет необходимости каждый раз начинать рассуждения с самых общих соображений, ab ovo. И способный созерцать, отслеживать, причем в высокоуровневой модальности как состояние этих процессов по отдельности (а таких, параллельно протекающих процессов может быть много), так и всю свою деятельность в целом.

PPPS Побочным результатом этой теории является полное обнуление столь любимого Чалмерсом аргумента зомби. Ясно, что в рамках своего мысленного эксперимента он подспудно снимает ограничения-требования на когнитивную архитектуру этого создания, принимая что выч. ресурсы которыми тот располагает - бесконечны, а такого в реальном мире не бывает.
Потому-то и зомби-подобные разумные, но бессознательные существа возможны лишь в воображаемых мирах, либо в специально организованных, виртуально-модельных средах.
[Ответ][Цитата]
гость
188.170.81.*
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 22 май 18 3:35
Т.> что критерий один - выживание

ну, эдак вы несколько смещаете вопрос - конечно, выживание, выживаемость, это как бы необходимое условие, имманентность, собственный императив этого предприятия, котрое называется существованием живой материи, раз устойчивость существования материи в такой форме столь проблематично и обусловлено многим. Вспомним, как, cкажем, шамис рассуждал про этот критерий maхТ. Но при малейшей конкретизации вопроса сразу появляются трудности - выживание индивида, группы, вида, таксона etc - как-то нужно согласовывать эти 'выживаемости', или, cкажем, выживать можно по-разному (разные стратегии выживания) - кто автотроф, кто гетеротроф, кто фотосинтезирует, кто хищничает - 'cамо по себе и из себя' живое вещество не может же предусмотреть все варианты будущего чтобы реально стаивть задачу на махТ - ставится более реалистическая задача - повышение (насколько возможно) выживаемости за счет адаптивности, увеличение ОБЩЕЙ адаптабельности - как бы поддерживается динамическое равновесие - кто впадает в специализацию и глубокую адлаптацию к нише - выигрывает в чем-то, но что-то и теряет (в глобальном смысле устойчивость ниши не гарантируется тем, что вид может отчасти стабилизировать свою нишу), cтановясь зависимой от нее, кто-то пребывает в пограничном состоянии и не падает в воронку глубокой специализации - тоже что-то теряя, но что-то и приобретая - перманентные экологические пертурбации поддерживают баланс между стратегиями.

как бы общий метапринцип что нужно выживать реализуется через динамическое, подвижное положение балансирующей точки (системного состояния) на противоречивых требованиях.

многокритериальное рассмотрение (векторный критерий) можно упростить при скаляризации критерия - но (а) в вообще говоря такое переопределение не тождественно, (б) скаляризовать можно по-разному и эти способы не эквивалентны (или сужать область парето можно по-разному) и (в) скаляризационная редукция это лишь искусственный прием.

наверное вы все это понимаете, но еще плохо осознаете - ведь вы ставите вопрос так -

> самостоятельного разделения агентом всей области его функционирования на отдельные
> участки/виды, каждый из которых требует своей специфической организации ментальной/
> вычислительной деятельности

> такое деление делается для оптимизации, экономии вычислительных ресурсов,

т.е. подразумеваете именно эту ситуацию сочетания общего императива и РЕАЛЬНОЙ постоянной ситуации балансирования противоречивых требований - 'один критерий' (идеал) типо чтобы не зависало в деструктивном конфликте субкритериев - и реальность поиска удовлетворения противоречивым требованиям.
как бы идеал обеспечивается (причем не гарантировано) реальными комромиссами. Не так, что можно выявить 'формулу гарантированного успеха', а что нужно поддерживать популяцию КАНДИДАТОВ в формулу успеха, механизм их генерации (эвристика, генетическая ассимиляция, индукция etc). Как бы императивная тенденция к выживаемости обеспечивается реальным коллективом динамических адаптивных компромиссов. Они изначально запустили процесс самоподдерживающейся эволюционной устойчивости и пока преуспели.

и получается, что 'агентивность' идет сразу по многим путям - агенты ПО-РАЗНОМУ производят разделение на функциональные домены - кто отращивает крылья, а кто второсигнальную систему. И внутри макростратегии также происходит диверсификация на субстратегии - кто отращивает контекстуализацию объектов, кто изолирующие исчисления объектов.. и никуда не уйти от того, что спектр возможностей для маневра максимизируется если сочетать экономию при специализации с избыточностью на поддержание неспециализированных (полипотентных) 'заповедников'.
[Ответ][Цитата]
Траян
Сообщений: 651
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 май 18 6:33
Изменено: 23 май 18 6:50
Цитата:
Автор: гость
... конечно, выживание, выживаемость, это как бы необходимое условие, имманентность, ... Но при малейшей конкретизации вопроса сразу появляются трудности - выживание индивида, группы, вида, таксона etc - как-то нужно согласовывать эти 'выживаемости', или, cкажем, выживать можно по-разному (разные стратегии выживания) - кто автотроф, кто гетеротроф, кто фотосинтезирует, кто хищничает - 'cамо по себе и из себя' живое вещество не может же предусмотреть все варианты будущего чтобы реально стаивть задачу на махТ - ставится более реалистическая задача - повышение (насколько возможно) выживаемости за счет адаптивности, увеличение ОБЩЕЙ адаптабельности


Все это, конечно, правильно, если ставить задачу выживания вида в явном и непосредственном виде - тогда действительно появляется целая куча трудноразрешимых глобальных проблем связанных, в конечном счете, наиболее глубокими "вечными" философскими вопросами. И, в том числе, с необходимостью формализации базовых понятий-категорий ("Что есть жизнь?" "Что такое существование?").

Но дело в том, что в живых существах и единственном известном нам разумном существе задача выживания ставится в неявном и опосредованном виде , а именно, как задача максимизации разницы между суммами получаемых на протяжении жизни положительных и отрицательных подкреплений (удовольствия и боли).

В том, что это действительно так, следует из того, что все проявления активности достаточно развитых живых существ находят свое полное объяснение в рамках именно такой общей парадигмы. Более того, многие маргинальные вещи, которые в принципе невозможно объяснить в рамках иных концепций (например, суицид) легко объясняются в ее рамках.

(Особо упертые противники этой идеи могут попробовать вживить себе электроды в центры удовольствия и боли и на личном опыте убедиться в абсолютном главенстве данной поведенческой мотивации. )

Поставщиками сигналов о боли и удовольствии является физ. тело, сома. Которая устроена (естественный отбор постарался)так, что при переходе в благоприятные для задачи выживания вида состояния организма генерируются чувства удовольствия и пр., и наоборот.

Справедливости ради нужно сказать, что у высших животных источниками пол. или отр. ощущений могут быть и психические процессы, но на данном этапе рассуждений это пока неважно.

Ясное дело, что такая - завязанная на материальное тело - система генерации поощрений и наказаний является чрезвычайно косной и инертной. При радикальной смене среды обитания эта система может давать серьезные сбои. Так, переход существ с системой заточенной на выживание за счет первобытного собирательства/охоты в условия постиндустриального развитого общества система поощрений за потребление жирной, сладкой и соленой пищи может приводить к нежелательным последствиям. Да и чрезмерная боязнь высоты жителям нынешних небоскребов ни к чему.

Короче говоря, вся эта система далека до идеала, до такой степени совершенства, когда ее применение гарантировало бы 100% успех во всех ситуациях. Это - паллиатив и компромисс.
Минусов у нее куча.
Но! Но это пусть и худо-бедно но действительно работающая в условиях реального мира система - при всех ее недостатках и издержках - именно за счет своей материальности, т.е. своей неразрывной связи с действительностью. Способная дать ответ при попадании организма почти в любые (исключающие его полное разрушение) ситуации. Пусть это будут самые невообразимые, самые не представимые, самые неожиданные и нестандартные ситуации - внутренняя физическая система генерации поощрений/наказаний все равно даст четкий и однозначный ответ - пусть порой и ошибочный, но имея его на руках интеллекту уже есть с чем работать.

Что хорошо - создавая СИИ мы вовсе не обязаны создавать для него спецом и сому с встроенной системой поощрений/наказаний. Роль такой сомы может выполнять и взаимодействующий с ней человек-оператор (двух-уровневая система).

PS Про все это я уже много раз писал, но Вы что-то не хотите вникнуть в суть такого подхода.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 май 18 7:07
Цитата:
Автор: Траян
Пусть это будут самые невообразимые, самые не представимые, самые неожиданные и нестандартные ситуации

А чего это вдруг озабоченный выживанием организм попадет в такие ситуации? Он же умный, всё обдумает и заляжет под землей в деревянном ящике, чтобы всякие неожиданные и нестандартные ситуации его не убили.
[Ответ][Цитата]
Траян
Сообщений: 651
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 май 18 7:23
Изменено: 23 май 18 7:24
Цитата:
Автор: гость
.... идеал обеспечивается (причем не гарантировано) реальными комромиссами. Не так, что можно выявить 'формулу гарантированного успеха', а что нужно поддерживать популяцию КАНДИДАТОВ в формулу успеха, механизм их генерации (эвристика, генетическая ассимиляция, индукция etc). Как бы императивная тенденция к выживаемости обеспечивается реальным коллективом динамических адаптивных компромиссов.

Еще раз скажу - ЕИ/разум решает проблему выживания опосредованно, вовсе не желая этого и не стремясь к этому. Его цель - max(суммы пол. - суммы отр.)/

Именно это является той морковкой, стремясь к получению которой интеллект обеспечивает выживание своего носителя/организма.

Поэтому рассуждая о СИИ, о путях его построения, следует говорить не о стратегиях выживания, а о стратегиях способных максимизировать эту сумму разностей.

О том, какие для этого у СИИ есть возможности ресурсы, в каком виде ему дается инфа необходимая для его работы.

Ну и о том, каким образом он может оптимизировать свою работу. А конструкция эффекторов-рецепторов, все эти детали его физической адаптации - это все не про СИИ.
[Ответ][Цитата]
Траян
Сообщений: 651
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 май 18 7:40
Изменено: 23 май 18 7:45
Цитата:
Автор: NO.
А чего это вдруг озабоченный выживанием организм попадет в такие ситуации? Он же умный, всё обдумает и заляжет под землей в деревянном ящике, чтобы всякие неожиданные и нестандартные ситуации его не убили.

Это по обстоятельствам. Смотря какой образ действий будет более выгодным - в плане максимизации суммы разностей удовольствий и боли.

Кстати говоря, Вы никогда не задумывались над тем, почему необходимые как минимум две эти модальности - и боль и удовольствие?

Почему нельзя обойтись только болью или только удовольствием? Ведь на первый взгляд кажется возможным, что для того, чтобы заставить живое существо действовать нужным нам образом достаточно только одного стимула - только кнута или только пряника.

Я в свое время (очень давно!) пробовал моделировать и таких агентов, было такое. И в реальных машинных экспериментах убедился в том, что без двух разных модальностей не обойтись.

И вот почему. Один агент, обреченный на получение лишь только кнута (в разных степенях воздействия) предпочитал забиваться куда-нибудь в угол и не отсвечивать. Трясясь от страха и вздрагивая от каждого шороха. Вот уж для кого воистину было "жизнь - это боль"
Никакой инициативы, поисковой активности от него было не дождаться.

Второй агент, живший в мире лишь пряников, был слишком уж безбашенным. Похожим на людей с пониженным болевым порогом (забыл как такой синдром называется). Не мог обучаться самым простым и нужным вещам, не говоря уж про оптимизацию своей деятельности. найдя раз действие приводящее к прянику он повторял его до бесконечности.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 май 18 22:05
Интересные эксперименты.

Про боль-удовольствие я думаю просто Вы уверенно овладели секретом сложения и умножения положительных и отрицательных величин и теперь хотите эти могущественные знания с блеском применить.
[Ответ][Цитата]
гость
188.170.75.*
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 май 18 1:42

Т.> задача выживания ставится в неявном и опосредованном виде , а именно, как задача максимизации разницы между суммами получаемых на протяжении жизни положительных и отрицательных подкреплений (удовольствия и боли).

> не хотите вникнуть в суть такого подхода.

подход этот очевиден, общепонятен и банален. Но нужно понимать и то, что это опять смещение исходного вопроса. Что непосредственно до этой темы, то поскольку 'регистры подкреплений' встроены в систему потребностей (и мотиваций), то общая логика вовсе не Pos-Neg->maх, а снижение потребностного напряжения, нормализации (с учетом фактора времени). Внешнее и внутреннее подкрепление участвует в общесистемных регуляциях, но сводить системную логику к упомянутой формуле это слишком прямолинейно. Одно дело когда система подкрепления вырастает изнутри системной логики при эволюции системы и другое - когда мы принудительно навешиваем на агента некую логику подкрепления которая мнится нам 'очевидной'.

до этого вопрос был об одномерной оптимизации (что тоже было смещением относительно первоначального вопроса о драйвере расщепления на функционально-структурные домены). Мне кажется, что в 'глобальном смысле' речь должна идти не о задаче оптимизации, а о задаче удовлетворения ограничениям - чтобы что-то 'оптимизировать' что-то должно сначала более-менее устойчиво существовать - если условия существования заметно переменны, то вся тяжесть проблемы ложится на задачу удовлетворения ограничениям, а до задачи оптимизации (поиска экстремума некоего критерия оптимальности) 'дело может не доходить', собственно оптимизация может быть не актуальной. В этом смысле организм ориентирован изначально на Pos-Neg->Norm. Как бы метакритерий выживаемости и критерий
махR не находятся в отношении простой связи. Задача maxТ это как бы внешняя задача (когда есть внешний наблюдатель-селекционер), задача на махP (вероятность продолжения) тоже не может быть поставлена корректно из-за переменности генеральной совокупности возможных состояний).

кроме того, при определенной постановке задачи на оптимизацию (экстремизацию) сразу возникает вопрос об издержках (общесистемных) на оптимизацию и их учете - задача на оптимизацию как бы из себя расширяется за свои границы, что говорит о том, что она 'не главное'.

еще одно простое соображение это что поиск лучшего ('оптимизация') на основе эволюционно-генетических эвристик и при 'трудном' пространстве поиска требует одновременно и поддержания генетичечкого разнообразия - т.е. в действитьельности ищется не лучшее, а некий набор вариантов, которые способны переориентировать поиск при смене внешних требований. Что так же и при размытости критерия поиска.
как бы НА САМОМ ДЕЛЕ мы не знаем что лучшее в достаточно общих постановках (когда сочетаются факторы запаса свободной энергии, наличной информации, cтепени организованности информации в знания, возможности трансформации информации в функциональные структуры etc). МахR может оказаться неадекватным критерием если неадекватной окажется подсистема подкрепления - адекватность которой обеспечивается именно встроенностью ее в общесистемную логику, которая подчинена императиву выживания
(или адаптабельности).

> Именно это является той морковкой, стремясь к получению которой интеллект обеспечивает выживание своего носителя/организма.

речь о том, что вы путаете причину и следствие - это из выживаемости вырастает система подкрепления - ПРИЧЕМ КАК ЭВРИСТИКА - отчего в общей постановке она не должна быть фиксированной, априорной и подчинять системную динамику своей логике. Известны постановки в области 'общего интеллекта' на максимизацию суммы прогнозных оценок подкреплений на дальнем горизонте - вопрос только в том что при этом получается интеллект по преследованию этого критерия, а не действительно 'интеллект'.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 май 18 2:18
А мне представляется какая-то дама-с-собачкой, где собачка главная, а дама только применяет знания чтобы капризной собачке было хорошо.
Все гораздо лучше объясняется тем, что Траян математику считает единственным источником решений и все задачи хочет свести к вычислительным. Это очень распространено, машобученцы все такие. У меня почему-то о математике сложилось мнение, что там занимаются доказательствами и построением формальных систем. Уж точно ничего там не решается голосованием или взвешиванием. Это только арифметика. И не такого, что дошкольник интеллекта не имеет, а закончив первый класс становится интеллектуалом.
В общем очень старо и скучно, будто ещё не появился Лисп и ещё не возникало задачи ИИ, и из компьютеров пока есть только арифмометр. Зачем арифмометру выживание?
[Ответ][Цитата]
гость
188.170.83.*
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 май 18 2:48

потом, кажется некоторой подтасовской переход от констатации роли подкреплений и наказаний при обучении и охранной функции боли к категорической констатации критерия Роs-Neg->мах. Тут помимо того что все Роsi и Negj cвернуты в два главных компонента, но и уж слишком безапелляционно проведена линейная скаляризация - когда не менее очевидна и возможность некоей логики на векторе (Рos,Neg). Агент вполне может предпочитать более (10,5) чем (5,0).
[Ответ][Цитата]
Траян
Сообщений: 651
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 май 18 23:35
Изменено: 25 май 18 0:53
Цитата:
Автор: гость
подход этот очевиден, общепонятен и банален.


Что не удивительно - поскольку подход этот прост, ясен и естественен. Тысячи, миллионы фактов и фактиков, результатов экспериментов и наблюдений биологов, нейрофизиологов и психологов ежесекундно и ежеминутно подтверждают данную концепцию. На сегодняшний день не обнаружено ни одного (!) проявления человеческой деятельности, поведенческой активности которое бы не укладывалось в канву maxR.

Представление о том, что основой мотивации системы управления поведением homo sapiens (т.е. его аппарата мышления/психики/ЕИ/разума) является максимизация, стремление к получению максимума положительных ощущений и минимума неприятных позволяет объяснить даже самые странные на первый взгляд, нелепые и саморазрушительные проявления человеческой деятельности, подоплеку их поступков и решений - которые совсем непросто, а порой и просто невозможно бывает объяснить в рамках иных подходов.

Цитата:
Автор: гостькроме того, при определенной постановке задачи на оптимизацию (экстремизацию) сразу возникает вопрос об издержках (общесистемных) на оптимизацию и их учете - задача на оптимизацию как бы из себя расширяется за свои границы, что говорит о том, что она 'не главное'.


Издержки прекрасно перекладываются на язык подкреплений.

Цитата:
Автор: гость
...
как бы НА САМОМ ДЕЛЕ мы не знаем что лучшее в достаточно общих постановках (когда сочетаются факторы запаса свободной энергии, наличной информации, cтепени организованности информации в знания, возможности трансформации информации в функциональные структуры etc).
...
МахR может оказаться неадекватным критерием если неадекватной окажется подсистема подкрепления - адекватность которой обеспечивается именно встроенностью ее в общесистемную логику, которая подчинена императиву выживания
(или адаптабельности).

Задача создания СИИ - не есть задача моделирования филогенеза, процесса адаптации в широком смысле. Т.е. задача создания СИИ мало связана с направлением исследований
"Адаптивное Поведение" (т.н. Анимат-подход к ИИ).

Это даже не задача моделирования когнитивной эволюции самой по себе.

Задача создания СИИ - это задача воспроизведения того набора ментальных качеств (интеллектуальных способностей) наличествующих у прототипа благодаря наличию которых тот считается разумным существом. Если нам известно, что поведение человека полностью определяется maxR (нет ни одного (!) примера опровергающего данное утверждение), то зачем огород городить?

(Вопрос о том как, почему и для чего у человеков (и высших животных) возникла именно такая мотивационная система - ясно, что для решения вопроса выживания вида , но как именно это все сооргнизовалось в каком порядке и последовательности - конечно же жутко интересен сам по себе, но к решению задачи построения СИИ он не имеет непосредственного отношения).

Цитата:
Автор: гость Известны постановки в области 'общего интеллекта' на максимизацию суммы прогнозных оценок подкреплений на дальнем горизонте - вопрос только в том что при этом получается интеллект по преследованию этого критерия, а не действительно 'интеллект'.


Ну, это смотря как преследовать. Если агент стремясь к получению maxR проявляет чудеса смекалки и изобретательности, оказывается способен рачительно использовать накопленный опыт и применять его в самых разных областях деятельности, демонстрировать способность находить оригинальные, свежие решения нестандартных задач - т.е. показывать свою интеллектуальную состоятельность: т.е. эффективность, автономность и универсальность сопоставимые с ЕИ - то разве он не будет признан полноценным СИИ?

PS Если даже нынешние, пока еще очень тупые и ограниченные агенты с мотивацией maxR - реализованной в виде RL обучения, способны демонстрировать весьма впечатляющие результаты - возьмите ту же AlphaZero - то что можно ожидать при несравненно более глубоком, тонком и адекватном внедрении этой мотивации?
[Ответ][Цитата]
Траян
Сообщений: 651
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 май 18 23:42
Цитата:
Автор: NO.
Интересные эксперименты.


Их может повторить любой желающий. Для этого вовсе не обязательно использовать спец. прогу как делал я. Можно взять ту же СПИ и пытаться обучить агента давая ему только лишь кнут или только лишь пряники - и убедиться в справедливости приведенных мной утверждений.

Имхо, детские психологи говоря о правильных принципах воспитания говорят то же самое. Нельзя только кнутом или только пряником воспитать гармонично развитую личность. Нужен баланс.
[Ответ][Цитата]
СГТР http://egtd.ru
Сообщений: 7739
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 май 18 0:32
Изменено: 25 май 18 0:34
Цитата:
Автор: Траян





Но дело в том, что в живых существах и единственном известном нам разумном существе задача выживания ставится в неявном и опосредованном виде , а именно, как задача максимизации разницы между суммами получаемых на протяжении жизни положительных и отрицательных подкреплений (удовольствия и боли).


Вы упускаете разницу между физическим и интеллектуальным удовольствием.
В СГТР то вопрос решён. В НС хранятся эмоции (связки: эмоция + образ = знание) которые могут подтверждаться или отрицаться. Первые усиливает функцию организма контролируемую этой эмоцией, вторые - ослабляют. При таком подходе понятно что НС становится всё равно с какими эмоциями она работает - внешними (Разума) или внутренними (Физиологии). В случаи с интеллектом - избирательным (регенеративном, человеческом) характере обработки эмоций возможен и суицид.
[Ответ][Цитата]
гость
188.170.74.*
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 май 18 1:32
Т.> подтверждают данную концепцию

нет, ваша интонация сродни истерике догматика вы выдаете примитивную НОРМАТИВНУЮ модель рационального агента ('рационального' типа поведения) за модель 'исчерпывающую', 'истинную', 'cущностную'. Естественная агентивность с необходимостью ОГРАНИЧЕННО рациональна (а человек вообще неадекватно рационализирует свое поведение часто постфактум). Критерий махSumR это нормативный идеал, требование, принимаемое в довольно узкой теории, построенной на сильных идеализациях.

агенту не известно его будующее и объективные ситуационные расклады и поэтому агент не ориентируется в текущих выборах на объективную линию махSumR - он не рассматривает все возможности и использует грубые оценки (еще и пересматриваемые на разных основниях), он может вообще не рассматривать далекий горизонт. Критерии локального выбора не гарантируют удовлетворения глобального нормативного критерия. НЕ может быть чтобы все было так просто.

агент локально выбирает 'что получше и что поменьше обременено', но и локальные выборы построены на ПРЕДПОЧТЕНИЯХ (т.е. это паретовы выборы), на векторах (Posi,Negj), а не на примитивной арифметике выбора большего скаляра. Удовлетворяются потребности и разрешаются так или иначе мотивационные конфликты, а не калькулируется нормативная 'экономика' пользы-удовольствия - потребности порождают систему подкрепления, а не нормативный идеал гибкую систему мотивации.

даже если не рассматривать высокую человеческую жертвенность, то жертвенное поведение животных никак не укладывается в модель максимизации разницы позитивного и негативного на протяжении жизни - зачем рисковать жизнью если всегда есть возможность перекрыть текщий ущерб будущими гешефтами? зачем защищать птенцов в безнадежной ситуации с избыточным риском? Это как раз тот случай когда глобальный критерий никак не корреспондирует с локальным (на индивидуальном уровне). В локальные критерии индивида встроены глобальные критерии уровня группы, отчего индивидуальное поведление может быть нерациональным с уровня индивидуальной т.зр. В человека встроены нерациональные эмоции-регуляторы, которые можно рационализовать с коллективного уровня, но не с уровня индивидного maxR. Зачем втягиваться в спираль кровной мести, зачем отвергать выгодные, но несправедливые предложения, зачем испытывать стыд (и ему подчиняться когда выгода от бесстыдства реальна, а издержки большей частью виртуальны)?

> Задача создания СИИ

как понимать эту задачу - одно дело проводить грубую идеализацию (нормативность), другое - ориентироваться на реальные механизмы порождения выборов, построения поведения и адаптации системы на коллективном уровне к ограниченной рациональности на индивидуальном (- получая в итоге как бы расширенную рациональность). Что правильнее - жесткий максимизатор (в итоге может получиться египетская пирамида накопленных польз с неконтролируемыми большими издержками (но не фиксириумыми в модели подкрепления)) или адаптивная система норм и ценностей, гибко и ситуационно чувствительно выстраивающая жизненный цикл агента? Коллектив фанатичных максимизаторов или сообщество субрациональных агентов разных степеней эгоистичности-рациональности?

> поведение человека полностью определяется maxR

конечно нет - из того что человек локально выбирает лучшее (и не жадно) вовсе не следует что человек подчинен глобальному критерию maxR - грубо говоря из этого критерия НЕ СИНТЕЗИРОВАТЬ все богатство регуляции поведения 'cильным интеллектом'.

когда творческая личность испытывает муки творчества она не максимизирует в том смысле что в итоге радость творческих удач перекроет предшествующий негатив - а творец может и не дождаться воздаяния даже самим собою себе самому (творческая неудовлетворенность) - его поведение таково оттого что он не может быть иным (выбор не быть поэтом а быть бухгалтером с большим накоплением подкреплений может даже не рассматриваться) - реальные механизмы порождения поведения это не примитивное подчинение императиву maxR или порождение им.

еще раз - НЕ ДОКАЗАНО что гибкое порождение и гибкая регуляция поведения вырастает из принципа maxSumR (что естественные агенты моделируются на этой основе ВНЕМИРОВЫМ движком) - поведение складывается из ЛОКАЛЬНЫХ актов выбора 'лучшего', но это вовсе не означает что оно жестко подчинено некоему глобальному императиву получить максимум вознаграждений за вычетом издержек.

> что можно ожидать при несравненно более глубоком, тонком и адекватном внедрении этой мотивации?

ну, 'эта мотивация' должна быть адекватной, а не примитивом накопления RL-оценок в ОГРАНИЧЕННОМ мире формальной игры - при синтезе мотивационной системы в мире многих игр 'в жизнь', причем НЕДООПРЕДЕЛЕННЫХ по правилам и вознаграждениям-наказаниям от иллюзии 'очевидности' maxR не останется и следа - грубо говоря глобальный принцип рассыпется в систему локальных эвристик, конфигурируемую ситуационно (когда нужно перебирать альтернативы, когда хвататься за первую приемлемую, когда подчиняться правилу (против желания), а не расчету/желанию, когда нужно рисковать, а когда избегать риска, когда задействовать ресурсы волевой регуляции etc).
[Ответ][Цитата]
гость
188.170.74.*
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 май 18 1:55
еще раз - в основе НОРМАЛИЗАЦИЯ ощущений (снизить ощущение голода и боли, разрядить напряжение творческого духа, а не максимизировать мифические аккумуляторы приведенных позитивных ощущений, которые есть артефакт наивной нормативной теории).
[Ответ][Цитата]
 Стр.60 (74)1  ...  56  57  58  59  [60]  61  62  63  64  ...  74<< < Пред. | След. > >>