GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.50 (112)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Об одном подходе к решению задачи создания СИИ
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 фев 18 0:36
Изменено: 23 фев 18 0:37
Главный постулат БМП гласящий, что при изучении возможных вариантов развития той или иной ситуации (исхода испытания) должны рассматриваться сразу две, взаимоисключающие друг друга модели, приобретает довольно интересные формы в тех случаях, когда количество признаков характеризующих ситуации невелико.

В предельном случае, если признак всего лишь один, то БМП вырождается в уже известные постулаты теорвера. Поскольку в этом случае, на этом фактическом материале, разные модели явления построить становится невозможно. Это будут две абсолютно одинаковые модели, все параметры которых делятся пополам.

Намного интереснее все становится если для описания ситуации/испытания возможно использование уже двух разных признаков/условий испытания. Причем, для построения моделей могут они быть использованы лишь по одиночке. Ясно, что все множество возможных моделей в этом случае ограничивается лишь двумя - одна строится с использованием одного признака, а вторая - другого.

Приведу примеры таких искусственных, специально сконструированных ситуаций.
I Вот некий коп/гаишник разместил свой пост на участке прямого шоссе. Туман/темнота и потому он вылавливает пьяных водителей руководствуясь лишь такими двумя призаками:
1. скоростью движения подозреваемой машины;
2. амплитудой вихляний ее движения.
За годы службы у копа набралась статистика, связывающая величины зарегистрированной скорости с последующей поимкой нетрезвого водителя. Аналогично - с вихляниями.
Но что важно, в этой статистике напрочь отсутствует информация о том, как работало наличие сразу двух признаков.

II Снимая девушку в клубе (более приличный вариант - приглашая ее на танец) Вы руководствуетесь следующими двумя признаками (ну привыкли Вы именно по ним ориентироваться, так уж сложилось) цвет волос и размер бюста.
За годы практики у Вас набралась статистика отказов/согласий в зависимости от того какому месту в спектре соответствует ее прическа (и объемному показателю бюст).
Но опять же наличествует придуманное нами условие - в статистике признаки работают лишь по отдельности.

Возьмем теперь еще один, гораздо более формализованный, корректный и легко проверяемый пример.

[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 фев 18 0:55
Изменено: 23 фев 18 1:15
III Есть на свете такая игра (только что придумал) для домашнего времяпрепровождения - Угадай Букву. Для игры Вы берете любой осмысленный текст, который вначале полностью закрыт. Затем с помощью специально вырезанного трафарета в произвольном месте текста открываете две рядом стоящие буКВы. Ваша цель - суметь правильно предсказать букву, сразу следующую за этими двумя.

В приведенном выше абзаце с помощью трафарета в последнем слове третьего предложения были открыты буквы К и В. И надо было угадать, что за ними последует буква "ы".

Естественно, у опытных игроков постепенно набирается статистика, связывающая признак "ближняя к определяемой буква" с вероятностью последующего появления той или иной буквы алфавита (в нашем случае это "к"). .
Аналогично, вырабатывается статистика и для признака признака "дальняя к определяемой буква" (в нашем случае это "б").

Опять же введем свое условие - статистики в которой используются сразу (т.е. одновременно) оба эти два признака у нас нет.

Тогда у нас остается лишь следующие способы применения имеющейся в нашем распоряжении статистического материала.
1. Мы можем работать лишь со связкой "ближний признак - определяемое".
2. Лишь со связкой "дальний признак - определяемое".
3. Попробовать еще как-нибудь изгалиться и силком выжать еще полезной инфы из той куцей статистики. Но как это сделать?

В связи с этим вопрос: какую стратегию поведения в данной игре выбрали бы лично Вы?
[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 фев 18 1:09
Цитата:
Автор: Траян
В связи с этим вопрос: какую стратегию поведения в данной игре выбрали бы лично Вы?


Я выше писал о том, что хорошая теория отличается тем, что она способна предсказать (и объяснить) некий новый экспериментальный результат.

Так вот, похоже БМП дает четкий, однозначный и что немаловажно - проверяемый экспериментально! - ответ на поставленный вопрос - какой стратегии следует придерживаться и как правильно использовать имеющуюся информацию.

Что важно, этот ответ любой желающий может проверить проведя простенькие опыты, что называется, не отходя от кассы.

Конечно, возможно что я упускаю из вида какие-то совершенно очевидные вещи, какие-то всем известные выводы теорвера, вполне допускаю такое. Всякое бывает, и такая "всем очевидная слепота автора" - совсем не редкость.

Вот для выяснения этого я и выкладываю данный материал пока на готайке.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 фев 18 1:17
Просто собираем две статистики и потом в конкретном случае выбираем в которой больше информации, то есть она лучше предсказывает. Вроде бы ничего другого и нельзя. Или вопрос какую выбрать стратегию выбора места куда ставить трафарет? Можно случайно или последовательно. Может быть там не текст, а есть области где зависимости определеннее и есть где мусор.
[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 фев 18 1:21
Цитата:
Автор: NO.

Просто собираем две статистики и потом в конкретном случае выбираем в которой больше информации, то есть она лучше предсказывает. Вроде бы ничего другого и нельзя.


Хороший ответ. Очень по делу, спасибо.

Цитата:
Автор: NO.
Или вопрос какую выбрать стратегию выбора места куда ставить трафарет?


Нет, трафарет ставим не мы. Его ставит крупье. Некоторые крупье любят ставить случайно, некоторые последовательно.

[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 фев 18 1:32
Изменено: 24 фев 18 1:47
Цитата:
Автор: NO.
Просто собираем две статистики и потом в конкретном случае выбираем в которой больше информации, то есть она лучше предсказывает.


Если мы попробуем проанализировать несколько реально существующих текстов (написанные на русском языке), то достаточно скоро убедимся в том, что более значимым является "ближний" признак.
Если при прогнозировании отталкиваться от буквы непосредственно предшествующей неизвестной, то правильность наших прогнозов будет на 5-15%% выше, нежели было бы при использовании "дальнего признака".

В общем-то, предположить подобный результат можно было бы и заранее, исходя из самых общих соображений.

Казалось бы, ничего лучшего, чем пользоваться стратегией использования ближнего признака придумать нельзя и классический теорвер (насколько мне известно) тоже не предлагает каких либо иных решений.

А вот если исходить из БМП, то мы можем поступить следующим образом - произвести сравнение между собой средних вероятностей (средних между вероятностями предлагаемыми ближним и дальним признаком) - и найти среди этих средних максимальную. По ней и ориентируемся выбирая букву для своего прогноза.

Как показывают эксперименты проведенные с парой десятков текстов (книги и статьи по ИИ тематике) точность наших прогнозов при такой стратегии повышается еще на 1-5%% по сравнению с применением только ближнего признака.

Что примечательно, выигрыш в правильности прогнозов получается только на осмысленных/структурированных текстах. Если мы попробуем поиграться с текстом сгенерированным чисто случайно, то никакого выигрыша мы не получим.

Можно предположить, что данная стратегия прогнозирования может рассматриваться как способ нахождения ответа на вопрос: является ли данный текст содержательным или же он представляет собой случайный набор букв.

(По понятным причинам этот метод будет работать только на достаточно объемных текстах.)
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 фев 18 2:27
В сочетании ЧА более значим дальний.
[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 фев 18 3:51
Цитата:
Автор: NO.
В сочетании ЧА более значим дальний.


Речь идет о статистическом преобладании, т.е. о том, что случаев когда это правило работает больше.
[Ответ][Цитата]
гость
188.170.83.*
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 фев 18 1:11

что-то я не понял.. использование для прогноза средней тут это то же что использовать просто сумму - просто более полный учет вероятностной структуры объекта (текстовой строки), можно учесть и роль третьей буквы - по-моему это cлабая иллюстрация идеи бмп. Один источник говорит что событие определенной буквы имеет такую-то вероятность, другой - такую-то - и мы без взвешивания просто суммируем шансы/голоса.. (и это число уже не будет собственно вероятностной оценкой). типо мы не заворачиваемся на условные вероятности для биграмм, байес etc.

потом, если вероятностный прогноз работает, то это означает только что объект организован в вероятностном смысле - и бессмысленный объект может быть организованным (иметь чисто структурное содержание).
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 фев 18 1:56
Изменено: 25 фев 18 2:00
По обычному теорверу вероятности нужно умножать. Но Траян наверно опять хочет чтобы событие ещё не наблюдалось, а вероятность его уже была не нулевая. Поэтому среднее более перспективно
[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 фев 18 2:08
Изменено: 25 фев 18 4:23
Цитата:
Автор: гость
что-то я не понял.. использование для прогноза средней тут это то же что использовать просто сумму

Нет, не сумму. А среднюю величину различных прогнозов.

Цитата:
Автор: гость
- просто более полный учет вероятностной структуры объекта (текстовой строки), можно учесть и роль третьей буквы

Можно. Но идея использовать дополнительные источники проистекает лишь из нашего здравого смысла/(common sense) - т.е. она носит абсолютно эвристичный характер, в аксиоматиках теорверов (спецом беру здесь множественное число, т.к. подразумевается аксиоматика самых разных интерпретаций понятия вероятности) ничего такого нет. Нет никаких указаний на то, как нам следует работать с условиями испытаний, что их добавление помогает улучшить точность. (nb: насколько я могу судить, я далеко не профи в математике)

Цитата:
Автор: гость
- просто более полный учет вероятностной структуры объекта (текстовой строки), можно учесть и роль третьей буквы - по-моему это cлабая иллюстрация идеи бмп. Один источник говорит что событие определенной буквы имеет такую-то вероятность, другой - такую-то - и мы без взвешивания просто суммируем шансы/голоса.. (и это число уже не будет собственно вероятностной оценкой).


Здесь Вы правы, приведенный пример показывает лишь то, что бмп внутренне непротиворечива и действительно работает в полном согласии со здравым смыслом и реально проведенными экспериментами. Но идея усреднения (а в бмп усреднение довольно специфное - не по всем источникам, а лишь по двум самым радикальным, по экстремумам) - это лишь одно из трех основных положений, на коих он покоится.

Цитата:
Автор: гость
типо мы не заворачиваемся на условные вероятности для биграмм, байес etc.


При большой статистике, при большом кол-ве испытаний заморачиваться с байесом действительно не с руки. Но он становится абсолютно незаменимым в тех случаях, когда число испытаний невелико, а то и вовсе... когда мы имеем дело с уникальными единичными событиями. А это как раз прерогатива человеческого разума: умение работать со штучными явлениями (анализируя их) и понятиями (создавая их и используя по мере надобности).

Но и спецом организованный байес - это лишь второе положение БМП.

Там есть и третье - работа с количествами. Его смысл тоже надо будет пояснить на отдельном примере.

Цитата:
Автор: гость
потом, если вероятностный прогноз работает, то это означает только что объект организован в вероятностном смысле - и бессмысленный объект может быть организованным (иметь чисто структурное содержание).

Ессно, Вы правы. Это была попытка пошутить. Осмысленность так не выловишь, максимум что можно выловить - явные регулярности, закономерности, но их лучше, дешевле и проще вылавливать спецом заточенными приемами.

Осмысленность без построения сложных прагматических моделей мира невозможна. Вот если б агент построил по тексту Анны Карениной модель мира - включающую в себя помимо всего прочего (быта российской империи, великосветской жизни, устройства железной дороги, конных скачек и т.д. и т.п.) модель автора этого произведения, тех мотивов коими он руководствовался и возможностями, что были в его распоряжении... и использовать полученную модель для написания оригинального продолжения романа (которое пользовалось бы таким же успехом/или скажем, при принятии решений в различных жизненных коллизиях руководствовался бы идеями почерпнутыми из) - можно было бы говорить о осмысленности и понимании.

Вообще похоже на то, что понимание очень тесно связано с прагматикой, с умением извлекать для себя пользу из получаемой информации.

PS А одно из достоинств БМП как раз и состоит в том, что предлагаемые в нем решения могут быть использованы при построении таких моделей. В частности - при вскрытии тех тайных причин, скрытых пружин, что движут событиями.
Для выявлении не наблюдаемых явно объектов, что стоят за кулисами событий.

Проще говоря, для реверс-инжиниринга явлений и процессов нашего мира (здесь этот термин понимается предельно широко, не только как восстановление исходного алгоритма программы, имея на руках ее исполнимый файл).
[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 фев 18 2:34
Изменено: 25 фев 18 2:45
>Но идея использовать дополнительные источники проистекает лишь из нашего здравого смысла/(common sense) - т.е. она носит абсолютно эвристичный характер
============

На феноменологическом уровне этот эффект, в частности, описан Шуровьевски в его "Мудрости толпы".

Ютуб забит роликами демонстрирующими его проявления (при определении количества конфет в банке, веса быка, температуры в аудитории etc/

Вставлю здесь ссылку на самый первый попавшийся




[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 фев 18 3:18
Изменено: 25 фев 18 3:20
Еще одна ссылка с ютуба, смотреть с 5 минуты.



[Ответ][Цитата]
Траян
Сообщений: 1063
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 фев 18 3:38
Кстати говоря, в ИИ метод усреднения по моделям используется очень давно - и не без успеха.
Но используется именно как эвристика, как ad hoc прием, взятый с потолка непонятно почему работающий в этих данных конкретных условиях.
Имхо.
[Ответ][Цитата]
гость
188.170.81.*
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 25 фев 18 4:29

Т.> мудрость толпы

это да, но только если распределение симметрично и смещение нулевое - если участники систематически занижают или существенно занижающих больше, то статистическая эвристика не работает. Легко предложить задачу где почти все будут сильно занижать оценку - на сколько отделится от земли лента, опоясывающая планету, если длину ее увеличить на метр?. Или когда нет ориентира - стоит ли cпрашивать папуасов сколько атомов в литре воздуха?

в случае бальшого шара с жевачками то легко можно было сделать прикидочный расчет - радиус шара около 8 жевачек, значит всего около 4*8^3=2000.. Возможно, что подсознательно выполняются подобные расчеты при оценках на глазок.

а мышь гольдберг тоже не поймал - она убежит из-за шума его машины..
[Ответ][Цитата]
 Стр.50 (112)1  ...  46  47  48  49  [50]  51  52  53  54  ...  112<< < Пред. | След. > >>