GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.1 (14)След. > >>   Поиск:  
 Автор Тема: Даю справку Два
Эгг
Сообщений: 10145
Даю справку Два
Добавлено: 25 окт 18 10:59
Изменено: 30 окт 18 12:34


Это продолжение легендарной темы "Даю справку".

Здесь мы неспеша и аргументированно обсуждаем Сильный ИИ, природу и механизмы мышления, суть и проявления интеллекта и прочие вопросы, ответы на которые в другом месте получить или трудно или никак. Формат обсуждений прежний - научный, согласно современной научной картины мира. Полет фантазии и смелость суждений приветствуется, но, чем смелее суждение, тем большую аргументацию хочется услышать. Мы рождены в этот мир, чтобы радоваться и учиться, так давайте учиться друг у друга, вместе это делать эффективнее и веселее.

Модерация темы высокая: проявления грубости, идиотизма, царегородцевщины и прочего интеллектуального и генетического вырождения удаляется без комментариев и предупреждений.


[Ответ][Цитата]
mss
Сообщений: 669
На: Даю справку Два
Добавлено: 26 окт 18 13:52
Нужна справка!

Как записывают отношения (relations) при анализе текстов - унарно, бинарно, тернарно и тд или же есть способ обойти эту сложность типа универсальным(и) шаблоном(и) или супер-полисемичным псевдоязыком или ещё как?

PS Полисимия - это наши русские маты во всей своей многозначности.
[Ответ][Цитата]
Кусаюсь
Сообщений: 439
На: Даю справку Два
Добавлено: 26 окт 18 15:07
Никак. 50 лет борьбы с многозначностью значения слов должны были чему-то научить. Основной источник многозначности слов не их многозначность в полном корпусе языка а смысловые смещения накопленные в предшествующем тексте. В {он, она, оно, ...} можно закачать практически любое значение. Соответственно и связи устанавливать нет никакого смысла.
[Ответ][Цитата]
Эгг
Сообщений: 10145
На: Даю справку Два
Добавлено: 26 окт 18 15:36
Изменено: 26 окт 18 15:57
Цитата:
Автор: mss
Как записывают отношения (relations) при анализе текстов - унарно, бинарно, тернарно и тд или же есть способ обойти эту сложность типа универсальным(и) шаблоном(и) или супер-полисемичным псевдоязыком или ещё как?

Это довольно широкий вопрос, на него годами можно отвечать. Я накидаю ключей, а Вы уже или сами разбирайтесь, или задавайте уточняющие вопросы.

1. Начнем с того, что под отношениями можно понимать совершенно различные вещи. Например, в классическом ужо Word2vec (я рекомендую ознакомится с этим подходом) под отношением понимается "семантическая близость (расстояние)", то есть использование слов в одном контексте. На основании корпуса строится вектор каждому слову, а потом происходит вторподбор и строятся различные отношения. Погуглите дистрибутивную семантику.

2. Под отношениями можно понимать грамматические отношения, как-то выделение частей речи и согласование словоформ в предложениях. Это уже отсылка к генеративной (порождающей) грамматике и многочисленным парсингам-парсерам. Тут повалялся Чомски, он до сих пор остается одним из самых цитируемых авторов.

3. Под отношениями можно понимать семантические значения. Тут вилочка, с одной стороны уход в онтологические представления и попытки построить словари "смысл-текст" как у Мельчука или Тузова. С другой стороны, попытка описать смысл семантическими примитивами, тут можно отослать к Вежбицкой, не могу сказать, что она основательно порылась, но тетка зело умная, читать ее интересно и поучительно.

4. Отдельно стоит обозначить семиотические подходы, когда словоформы представляют адресацией пространства феноменов на пространство понятий. Этот подход слабо реализован в nlp, он остается пока уделом философствующих позитивистов. Здесь надо начинать с Фреге, его работе более ста лет, но она актуальности не потеряла.

Выбор какой-то конкретной модели сильно зависит от задачи. В реальных системах используется лютый комплекс всех подходов, поскольку народ не очень хорошо понимает, что такое смысл и что такое мышление, поэтому и пользуется всем сразу.

Ваша-то задача какая?
[Ответ][Цитата]
mss
Сообщений: 669
На: Даю справку Два
Добавлено: 26 окт 18 15:39
Изменено: 26 окт 18 16:51
Во первых спасиба. Буду искать те образовываться.

Да всё для того же - для моделирования той части ЕИ которую я упорно называю вербальным мышлением.

Вы и сами положили - все модели это тексты. С чем я примного согласен и к чему и сам почти дошел самостоятельно. Но не так точно и ясно как это сформулировали вы. Риспэкт и копирайты - всё Вам!

Так вот по той же схеме как и в ЕИ: тексты -> смыслы+понятия ->знания, мыслится и ИИ модель:

- множество (база) знаний моделируются отношениями между словами. Сами отношения маркируются словами.

- понятия моделируются как не противоречивое подмножество отношений из базы знаний. Опять же маркируются словами.

- сами слова-маркеры формируют модель следующего уровня в рамках всё той же базы знаний. Модель понятно чего - модель смысла - точнее смысла текста - ещё точнее как модель всех моделей.

Я определяю понятия и смыслы одинаково - не противоречивое подмножество отношений. На этом уровне работают логики. Т.е. понятия и смыслы должны укладываться в логику предикатов любого порядка. На то и смысл здравый.

Сама база отношений - свалка. Там вся сила преодоления теорем Гёделя.

Во всём этом балете главный гвоздь в моделировании отношений. Их много и разных. Уверен что можно уйти от их прямого перечисления и записать ...

Конечно в виде текстов. Но не естественного языка, а скажем так глубоко полисемичного


[Ответ][Цитата]
Кусаюсь
Сообщений: 439
На: Даю справку Два
Добавлено: 26 окт 18 17:03
Цитата:
Автор: Эгг

1. Начнем с того, что под отношениями можно понимать совершенно различные вещи. Например, в классическом ужо Word2vec (я рекомендую ознакомится с этим подходом) под отношением понимается "семантическая близость (расстояние)", то есть использование слов в одном контексте. На основании корпуса строится вектор каждому слову, а потом происходит вторподбор и строятся различные отношения. Погуглите дистрибутивную семантику.

Шило на мыло. Как ты горемычный собираешься определять эти самые локальные контексты? Разложишь на них полный корпус языка? Куллеры не спалишь? )))



[Ответ][Цитата]
Кусаюсь
Сообщений: 439
На: Даю справку Два
Добавлено: 26 окт 18 17:10
Изменено: 26 окт 18 17:12
Цитата:
Автор: mss

- понятия моделируются как не противоречивое подмножество отношений из базы знаний. Опять же маркируются словами.


АОТ усеяно костями ваятелей непротиворечивых онтологий. ABBYY на этом деле даже бюджет пильнул ... а воз и ныне там.

Цитата:
- сами слова-маркеры формируют модель следующего уровня в рамках всё той же базы знаний. Модель понятно чего - модель смысла - точнее смысла текста - ещё точнее как модель всех моделей.

Я определяю понятия и смыслы одинаково - не противоречивое подмножество отношений. На этом уровне работают логики. Т.е. понятия и смыслы должны укладываться в логику предикатов любого порядка. На то и смысл здравый.

слова-маркеры ))) т.е. ключевые слова уже стыдно писать )))))

Цитата:
Сама база отношений - свалка. Там вся сила преодоления теорем Гёделя.

Жжете!
[Ответ][Цитата]
mss
Сообщений: 669
На: Даю справку Два
Добавлено: 26 окт 18 17:16
Я не первый.

В начале было слово...

Слова слова слова...
[Ответ][Цитата]
Эгг
Сообщений: 10145
На: Даю справку Два
Добавлено: 26 окт 18 17:25
Изменено: 26 окт 18 17:28
mss, я не люблю спагетти цитат, поэтому буду отвечать на Ваше сообщение просто своим сообщением. Если что-то упущу, мы можем всегда вернуться. Тем более, что в такой теме невозможно не упустить нюансов. Главное, чтобы они не были как в анекдоте про Чапаева/Петьку.

Я очень рад, что мы с Вами находимся на одной странице, предполагая, что мышление - это моделирование, а модели - это тексты. Но интереснее (кмк) разобраться в чем мы отличаемся, чтобы создать некоторый потенциал полемики, оставаясь при этом в едином контексте.

Во-первых, я не согласен с "вербальностью" мышления. Мышление, безусловно, не вербально, мы можем говорить только о вербализации мыслей. Да и то с этим именно та самая проблема, которую мы сейчас с Вами обсуждаем. То есть процесс моделирования не обязательно является процессом текстогенерации, она возникает как заключительный этап. В связи с применением моделей в социальной координации.

Отсюда сразу понятно, что в моделях содержится только "половина" смысла. Посмотрите какую-нибудь статейку про шифрование с открытым ключом, она является любопытной иллюстрацией обработки смысла на уровне субъекта. Поэтому бесполезно строить мета-описания, для каждого мета-описания потребуется метамета-описание, которому будет нужно метаметамета-описание. И там нет конца. Модель моделей всех моделей. Путь абсолютно тупиковый. На мой вкус. Это левая граница "смысла".

Правой границей "смысла" будет исчисление. Предикаты, тьюринговые и постовские ленты, генеративные алгоритмы, подстановки и всяческие лямбда редукции - да - это годится для частного вывода и на этом можно построить внятную продукцию (inference), но это никакого отношения к мышлению не имеет. Нет в предикатах смысла. Это просто перестановка. Начальных определений.

Поэтому (на мой вкус) не получится у Вас написать исчерпывающий язык отношений, с помощью которого Вы сможете перевести любой текст на язык каких-то смыслов, оперирование которыми и будет мышлением. Просто напИшите еще один язык программирования.
[Ответ][Цитата]
Luarvik.
Сообщений: 13745
На: Даю справку Два
Добавлено: 26 окт 18 18:03
Цитата:
Автор: Эгг
... я не согласен с "вербальностью" мышления. Мышление, безусловно, не вербально, мы можем говорить только о вербализации мыслей.

Это стоит отметить как, пожалуй, единственную точку пересечения...
Цитата:
Автор: Эгг
То есть процесс моделирования не обязательно является процессом текстогенерации, она возникает как заключительный этап. В связи с применением моделей в социальной координации.

- что вполне может звучать несколько иначе: ... процесс моделирования не обязательно является процессом БРЕДОгенерации, она возникает как заключительный этап.
[Ответ][Цитата]
mss
Сообщений: 669
На: Даю справку Два
Добавлено: 26 окт 18 20:33
Изменено: 26 окт 18 21:22
Вербальное мышление это скорее моя метафора. И довольно об этом наговорено.

Разница в подходах штука тонкая. Я и свой то подход не ясно представляю. Ваш же - за семью неразгласимыми печатями. Меня вполне устраивает нынешний неспешный формат.

Я так понял что вторую половину смысла вы поместили в мозг или как там его в интеллект, память в общем в базу знаний-отношений как бы она там не была устроена естественным или искуственным образом.

И скорее всего вы правы что язык построения отношений окажется ещё одним языком программирования.

В связи с этим вопрос - вам знакомы такие языки? Может не тратя по пусту времени взять самый самый и что называется воспользоваться?

Я пробовал пролог - не то. Естественного интеллекта не хватает для складывания и десятка отношений в рамках одного предложения.

Нужен другой. Действительно реляционно-декларативный. Как сиквэл. Но с одной существенной разницей - все эти сэлэкты, инсёрты и делиты выполнять не над конкретной таблицей но над базой при прочем равном синтаксисе. Указал базу, а оно там само разбирается в структуре таблиц и реляционных отношений между ними. Да хоть всё кладёт в одну таблицу. Да хоть рефакторит после каждого инсёрта.

А то и возвращает иксэпшин - дескать не могу добавить это отношение... - создавай новую базу со всеми вытекающими.

Так что за язык записи отношений зараннее благодарен.

Есть полезность от пролога не смотря на то что выводы можно принять за факты и наоборот. Дело не в перестановке оных но в сокращении текста. Вместо перечисления сотни фактов можно использовать одно правило и десяток подходящих фактов. Остальные 90 будут вычеслены в процессе резолюции высказывания да не абы как а с фильтрами. Это плюс плюс.

И никакого исчерпывающего языка отношений мне не надо. Как на счёт 80% покрытия вики?

Как там складывать из смыслов мышление мне то же не ясно. Да и к самим смыслам как к подмножеству отношений - вилами писано.

Я больше скажу. По моему опыту спрограммировать задачу по предварительному плану - пустая затея. Если речь идёт не о факториале или другой какой формализованой до мат. высказывания штуки. Причина простая - невозможно составить план. От сюда все эти эджайлы, экстримы и прочие методы проэктирлвания по ходу итеративного программирования. Вот и к ИИ нужно приступать по такой методе.



PS На счёт шифрования не понял? По моему для текстов нет ключа дешифрации смысла и быть не может. И дело не в открытости ключа и не в 'асиметричности' шифрования. Первая половина смысла текста дешифруется второй половиной смысла в базе знаний. И далеко не во всякой голове
[Ответ][Цитата]
Эгг
Сообщений: 10145
На: Даю справку Два
Добавлено: 26 окт 18 21:07
Изменено: 26 окт 18 21:28
mss, давайте, мы про языки поговорим потом, я пользуюсь сями, шарпом и пайтоном, а вот внутренние языке в нашей системы мы сами себе писали, но обсуждать мы их не будем. Хотя подходы и концепции обсудить можно, это всегда обсуждаемо.

А хотел бы я обратить Ваше внимание на то, что Карпатый (это Тесла ИИ) назвал нейросети - программированием 2.0. Почему? Давайте возьмем любую пользовательскую задачу, которая сводится к тому, что какая-то интеракция А должна вызывать реакцию R, то есть F(A) = R. Программирование 1.0 заключается в том, что мы задаем ПРЕОБРАЗОВАНИЕ входного потока А в выходной R, в явном виде, используя механизм импликации и алгебры применяемого исчисления. Для машинного обучения программирование функции F будет совсем другим. Мы зададим модель, возьмем размеченные данные, проведем кросс-валидацию, найдем фильтры предобработки и условия оверфиттинга и обучим модель - то есть найдем какие-то коэффициенты и конфигурации. То есть мы не программируем F, она программируется "сама". Это опасное месте, в этом месте может появиться ув. Андрей и закричать: она не сама это делает, это ты так запрограммировал ее. Но печалька в том, что она это _в самом деле_ делает сама, логика преобразования потока остается черным ящиком для сложных данных. Исключения составляют только решающие деревья и методы, на них основанные. Но и они, прозрачные для интерпретаций, будут себя "координировать" сами, на основе размеченных данных.

Обработка смысла - это программирование 3.0.

Вот поэтому нет смысла искать _самый правильный язык программирования_ среди императивных, функциональных и декларативных. Это 1.0, устарело на два поколения. Лучше попробовать задуматься, как может выглядеть новый уровень обобщения структурирования потоков данных. Я называю это "управлением сложностью".

ЗЫ. Вот, кстати, статья Карпатого на русском: https://dev.by/news/programmnoe-obespechenie-2-0
ЗЗЫ. Про шифрование не волнуйтесь, это была иллюстрация, поймете связь - станет ясно, не поймете - многого не потеряете...
[Ответ][Цитата]
Кусаюсь
Сообщений: 439
На: Даю справку Два
Добавлено: 26 окт 18 21:17
Цитата:
Автор: mss

Я пробовал пролог - не то. Естественного интеллекта не хватает для складывания и десятка отношений в рамках одного предложения.

Нужен другой. Действительно реляционно-декларативный. Как сиквэл.


Пролог? )) Так он канул в бозе еще в 80е. На сегодня логика предикатов N-го порядка наиболее полно воплощена в XSLT. Вход туда конечно самый дорогой, но и возможности самые большие.

Цитата:
И никакого исчерпывающего языка отношений мне не надо. Как на счёт 80% покрытия вики?

Какие сложности с покрытием вики могут быть? Там все открыто.
[Ответ][Цитата]
mss
Сообщений: 669
На: Даю справку Два
Добавлено: 26 окт 18 22:20
Статья классная. Много прояснила.

Сетки это многозначная рэгрэссия. Ну и многомерная конечно. Короче на номер #2 тянет за не имением лучшего по причине ослабления ЕИ в 21 веке. См. недостатки.

Я так думаю.

#3 Оперирование смыслами? Кхэ! Это скорее шкура не убитого лингвиста.

Следующий уровень управления данными - управление знаниями.

Наверно я опять затупил беседу. Работаю над просветлением.
[Ответ][Цитата]
mss
Сообщений: 669
На: Даю справку Два
Добавлено: 26 окт 18 22:31
Изменено: 26 окт 18 22:37
Эгг. По моему вы чем то увлечены больше того, что объявили в теме - отвечаю на вопросы.

Вопрос в языке отношений.

А вы увлечены новым уровенем обобщения структурирования потоков данных.

Хотя бы намекните в чём по вашему сложности управления сложностью ?
[Ответ][Цитата]
 Стр.1 (14): [1]  2  3  4  5  ...  14След. > >>