GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.2 (6)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: ТЗ на мыслящего бота
Кусаюсь
Сообщений: 974
На: ТЗ на мыслящего бота
Добавлено: 14 дек 18 22:06
Такие затеи надо начинать с создания полновесной теории. Без нее у вас даже тени на отблеск надежды нет. Это то место свойственной для ИТ чисто инженерное развите уже не работает.
[Ответ][Цитата]
Михайло
Сообщений: 2366
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 1:31
Изменено: 15 дек 18 1:43
Все уже давно разработано, смотрите технику "мешок слов" и TF-IDF. Прочитав эту элементарщину, вы сможете улучшить свое "техзадание".

Фактически нужно не техзадание, а мозги свои прочистить.

Что касается мышления на основе синтаксиса - это гиблое дело, даже Эгг это понимает. Мышление человека основано, в первую очередь, на тактильной, зрительной и слуховой информации, а не на синтаксической.

Так что бросайте свою очередную идею-фикс. Это херня.
[Ответ][Цитата]
гость
188.170.83.*
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 1:32
нельзя не согласиться с кусем, что использование слова 'мыслящего' очень обязывает (если оно использовано не для красного словца как замануха).

если обработчик теста действительно 'мысляший', то он ведь выработает представление о содержании текста "В ящик* лежат дв* яблока" без уточнения конкретной морфологии слов с неоопределенностью * - ведь грамматические указатели в когнитивном отношении существенно избыточны.
Даже если локативный падеж дважды 'замаскирован' типо "* ящик* лежат..", то все равно 'мыслительно' выстраивается содержание текста - если 'лежат', то активируется когнитивная модель ВМЕСТИЛИЩЕ, в которой роль контейнера может играть именно упомянутый ящик. И уже НЕ ВАЖНО в ящике лежат яблоки или использована субнормальная форма "ящиком лежат яблоки".

мыслящая система обрабатывает текст 'нелинейно' - не обязательно выстраиванию прагмасемантического представления (в какой-то части) предшествует грамматический/cинтаксический анализ в развернутой форме.

как формируются эффективные когнитивные модели? как работает грамматический модуль в 'разведочном' (облегченном) режиме? - вот вопросы для проработки.

все упирается в вопрос как именно рецептирует текст мыслящая система (только начавшая мыслить или мыслящая с большим опытом) - мыслящая опытная система просто сканирует текст на предмет опорных слов, дающих наибольшее приращение возможного смыслозначения и с опорой на когнитивные модели выстраивает представление его содержания - грамматика, ее маркеры используются не в полном объеме, а лишь для разрешения затруднений. Речь не о том, что грамматический анализ может быть 'быстрым и незаметным' с уровня 'мышления о мышлении', а что его ДЕЙСТВИТЕЛЬНО может не быть в мыслящей системе (по кр. мере в развернутой форме)..

кажется, что с самого начала предложенный подход к процессингу текста оказывается слишком специфическим, ограничивающим, малоинтересным, малоперспективным..

бессмысленные варианты как-то отсекаются на самых ранних этапах анализа - но способ через 'все варианты линий примитивов' кажется каким-то неестественным и сомнительным..
[Ответ][Цитата]
Михайло
Сообщений: 2366
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 1:41
Цитата:
Автор: Кусаюсь

Это то место свойственной для ИТ чисто инженерное развите уже не работает.

Самое плохое в этом поведении, что инженер считает себя умнее других и что мол даже техзадание может написать. А предметную область не знает, но думает, что ему по силам. Зовет на помощь таких же дураков и вместе они будут смотреть на техзадание, обливаясь слюнями. А если ученому это техзадание показать, то он скажет свое "фу!".

Нужно вправить самооценку. Неуч. Неуч!
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 9:20
Заявленное написание ТЗ выражает стремление к практическому подходу. Писать отдельный философский трактат о теории мышления будет излишне.

Отвечая на критику связанную с использованием грамматических признаков при обработке текстов. Они, безусловно, должна учитываться. Я удивлен, как можно утверждать обратное. В большинстве случаев учет этих признаков значительно сужает число вариантов связывания и обозначения слов. Это же вопрос качества языкового интерфейса и рационального использования вычислительных ресурсов, особенно при работе в реальном времени. Регулируя пороговое значение учета грамматических признаков можно получить разные результаты при обработке:
100% - любая грамматическая ошибка недопустима;
90% - допустимы опечатки и описки (ошибочный ввод буквы, перепутан падеж);
0% - грамматика вообще не учитывается.
Очевидно, что в реальной жизни использовать низкий процент, как и максимальный, нет необходимости. Мыслящая система не обязана разбираться со всем входным потоком подряд. Если текст содержит признаки бреда (бессвязный набор слов), то незачем ей тратить время на попытки понять что в нем могло бы быть заложено. Однако, возможна ситуация, когда у собеседника можно уточнить, сколько ему лет, или другие аспекты. Если возраст собеседника 7 лет, тогда можно персонально снизить пороговое значение, например до 50% и даже ниже.
[Ответ][Цитата]
Кусаюсь
Сообщений: 974
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 9:26
Изменено: 15 дек 18 9:29
Цитата:
Заявленное написание ТЗ выражает стремление к практическому подходу. Писать отдельный философский трактат о теории мышления будет излишне.



[Ответ][Цитата]
rrr3
Сообщений: 11857
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 10:39
Изменено: 15 дек 18 10:41
Много раз пройденное другими, шишики набитые другими порой ничему не учат, пока человек не набьёт собственные шишки, сколь его ни предупреждай показывая необходимый обход. Наверное им кажется, что если они пойдут как-то не как все, а например, вприпрышку, то не нарвутся на древние грабли....

Есть такая поговорка, что умный в гору не пойдёт, а обойдёт... но так это ведь про умных...
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 11:57
Продолжение темы:

umnibot-2.pdf (первые наброски)
[Ответ][Цитата]
Вольфрамовый клaпaн
Сообщений: 13070
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 13:28
Изменено: 15 дек 18 13:32
Если оставить за скобками то, что твой подход не даст нужного результата и приведет в классический для nlp систем тупик, то я (в рамках твоей схемы) рекомендововал бы тебе следующее:

1. Добавить блок Морфология (по минимуму - приставки, корни, суффиксы, окончания, итд), поскольку русский язык очень флективный, а смыловые согласования реализуются именно за счет изменения флективных элементов.
2. Добавить блок Грамматики (по минимому - подлежащие, сказуемые, дополнения, обстоятельства, итд), поскольку члены предложения как правило имеют довольно узкие семантические значения, будет легче соотносить "смысловые примитивы".
3. Добавить блок Парсинга, поскольку выделять словоформы лучше в едином процессе, сразу занимаясь вопросом взаимного согласования токенов.
4. Выделить отдельно блок Разговора из "примитивов", поскольку он имеет иную природу и обработку.
5. Выделить отдельно блок Толкования из "примитивов", поскольку этот процесс вообще будет иначе реализован даже в такой забавной схеме как у тебя.
6. Поработать над "примитивами" хотя бы с теми же примитивами Вежбицкой и семантическими ролями предикатов, сейчас эта куча совершенно неосмысленная.
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 14:02
Цитата:
Автор: Эгг

Если оставить за скобками то, что твой подход не даст нужного результата и приведет в классический для nlp систем тупик, то я (в рамках твоей схемы) рекомендововал бы тебе следующее:

1. Добавить блок Морфология (по минимуму - приставки, корни, суффиксы, окончания, итд), поскольку русский язык очень флективный, а смыловые согласования реализуются именно за счет изменения флективных элементов.
2. Добавить блок Грамматики (по минимому - подлежащие, сказуемые, дополнения, обстоятельства, итд), поскольку члены предложения как правило имеют довольно узкие семантические значения, будет легче соотносить "смысловые примитивы".
3. Добавить блок Парсинга, поскольку выделять словоформы лучше в едином процессе, сразу занимаясь вопросом взаимного согласования токенов.
4. Выделить отдельно блок Разговора из "примитивов", поскольку он имеет иную природу и обработку.
5. Выделить отдельно блок Толкования из "примитивов", поскольку этот процесс вообще будет иначе реализован даже в такой забавной схеме как у тебя.
6. Поработать над "примитивами" хотя бы с теми же примитивами Вежбицкой и семантическими ролями предикатов, сейчас эта куча совершенно неосмысленная.


По-порядку.

1. Какого назначение блока Морфология? Это просто функция, которой на вход подаешь неизвестное слово и получаешь состав слова? Или нечто большее?
[Ответ][Цитата]
Вольфрамовый клaпaн
Сообщений: 13070
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 14:15
Изменено: 15 дек 18 14:16
Цитата:
Автор: eto_ya
По-порядку.

Мы проще поступим; слова, которые я использовал, вполне себе научные термины, которые гуглятся в миллионах ссылок. Есть два варианта: ты будешь изобретать велосипед и все равно придешь к тому разделению, на которое я намекнул, поскольку природа первична и 2) ты попробуешь разобраться сам с помощью интернета.

Что касается "неизвестных слов" тут тоже два варианта: иметь словари (так делают 0.99999 nlp систем, посольку это проще) или будешь писать какой-то алгоритм выделения флексов в слове, по родам, по типам, по формам. В общем случае это работать не будет из-за прагматики, язык - это совокупность устоявщихся форм, а не логических правил.

Если ты не понимаешь, зачем тебе нужны согласования, нужно разобраться сначала с этим.
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 14:43
Цитата:
Автор: Эгг

Мы проще поступим; слова, которые я использовал, вполне себе научные термины, которые гуглятся в миллионах ссылок. Есть два варианта: ты будешь изобретать велосипед и все равно придешь к тому разделению, на которое я намекнул, поскольку природа первична и 2) ты попробуешь разобраться сам с помощью интернета.

Что касается "неизвестных слов" тут тоже два варианта: иметь словари (так делают 0.99999 nlp систем, посольку это проще) или будешь писать какой-то алгоритм выделения флексов в слове, по родам, по типам, по формам. В общем случае это работать не будет из-за прагматики, язык - это совокупность устоявщихся форм, а не логических правил.

Если ты не понимаешь, зачем тебе нужны согласования, нужно разобраться сначала с этим.

Пусть будет велосипед, если угодно. Но велосипед подразумевает, что имеется уже множество решений, а ответ уже свершившийся факт. Но я не слышал ни об одном готовом решении. Я полагаю вопрос открыт. Естественно, я говорю про систему хоть как-то оперирующую подобием "смысловых примитивов", с логическим вычислением, с ведением диалога и т.п. Хотелось бы систему никак не с меньшим функционалом, чем я уже успел набросать в своем случае, и это только самое начало, я даже ни слова не сказал о вычислительном блоке (решателе), который вступает уже после распознавания и толкования текста.
[Ответ][Цитата]
Вольфрамовый клaпaн
Сообщений: 13070
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 14:49
Цитата:
Автор: eto_ya
Но я не слышал ни об одном готовом решении.

Siri, Alexa, Google Assistant, Алиса, итд.
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 14:59
Цитата:
Автор: Эгг

Siri, Alexa, Google Assistant, Алиса, итд.

Ты это серьезно?
[Ответ][Цитата]
Вольфрамовый клaпaн
Сообщений: 13070
На: ТЗ на мыслящего бота
Добавлено: 15 дек 18 15:00
Цитата:
Автор: eto_ya
Ты это серьезно?

На lstm + rnn большего не добиться, а эта технология покруче твоего байеса будет...
[Ответ][Цитата]
 Стр.2 (6)1  [2]  3  4  5  6<< < Пред. | След. > >>