На форуме и за его пределами усилия многих энтузиастов направлены на создание вычислительных систем для работы с текстами. Работы со "смыслом", извлечения "знаний" и прочая подобная алхимия. Исходя из общих и интуитивных соображений мне всегда это казалось диким и неуместным. Этот топик посвящён максимально детальному и формальному описанию того, как работает человеческая речь. Холивары и полярность мнений приветствуются. Начнём.
1. Как работает человеческое восприятие вообще?Восприятие человека можно представить как набор фильтров для выделения сигналов разной
модальности. Сеченов, например, выделял 21 категорию признаков, перечислим:
для зрения семь категорий признаков:
1. цвет2. плоскостная форма (контур)3. величина4. удаление5. направление6. телесность (объём)7. движениедля осязания девять категорий признаков
8. теплота9. плоскостная форма10. величина11. удаление12. направление13. телесность14. сдавливаемость15. вес16. движениедля слуха три категории признаков
17. протяжность во времени18. высота19. тембрв обонянии и вкусе по одному признаку
20. запах21. вкусДля дальнейших рассуждений нам этого достаточно (хотя сюда следовало бы добавить внутренние ощущения типа голода и разместить их в каком-то осмысленном порядке).
По ходу жизни ребёнок подвергается воздействию сигналов всех этих модальностей одновременно. В зависимости от сенсорной сцены интенсивность каждой модальности разная. В каких-то сценах преобладает вкусовое ощущение, в каких-то цветовое, в каких-то звуковое и так далее. Даже если у человека нет никаких врождённых предвзятостей, то в силу преобладания определённых сигналов, через некоторое время, статистически, в этом 21-мерном пространстве начнут выделяться кластеры. Например, вкус разделиться на солёный, сладкий и кислый. Цвет на синий, красный, зелёный. Т.е. в зависимости от частоты и разнообразия сигналов каждой модальности будет происходит дивергенция этого единого пространства признаков и в нём будут выделяться узлы, к которым восприятие будет тяготеть. Пространство восприятия из беспорядочного приобретёт какие-то опорные точки. С этим оно, конечно, утратит универсальность и приобретёт определённую специализацию, но главное, оно обретёт способность к конвергенции.
Имея опорные узлы в таком пространстве, каждая сцена восприятия сможет характеризоваться конкретным набором признаков. Появляется возможность создавать
объекты. Например при частом предъявлении металлического шарика
в пространстве восприятия может (должен) сформироваться такой объект:
Ясно, что этот объект существует для наблюдателя как таковой только и исключительно как совокупность своих признаков. Если нет признаков, нет и объекта. Ни о каком ином способе "существования" мы помыслить не можем. Ясно, что в самом начале у любого объекта не может быть более 21 признака.
Ключевой момент всего повествования! Attention! Алярм!Объекты создаются и существуют как некие опорные узлы в некотором пространстве памяти, но для того, чтобы объект активировался не обязательно чтобы активными были все его признаки одновременно. Достаточно достаточного количества признаков. Если в данной сцене нет иных холодных объектов, то любой холодный объект сразу будет опознан как металлический шарик. Что значит "опознан"? Это значит что при восприятии одного
достаточного признака, все остальные признаки данного объекта ассоциативно активируются. Один достаточный признак, через объект,
обозначил все остальные признаки. Опознание это как-бы такая особая слабая форма галлюцинации.
Каждый объект, в свою очередь, может стать признаком другого объекта:
(кто подумал о подшипнике, когда выше увидел фото шарика?)
2. Что такое слово?Слово - это заурядный объект, продукт человеческих локомоций, признаками которого, обычно, могут быть буквы (для начертанного слова) либо звуки (для произнесённого слова). Человеческое восприятие(!) создаёт такие объекты как слова в силу проживания в культурной среде людей, которые постоянно воспроизводят похожие экземпляры слов. Чтобы слово (как объект само по себе) начало что-то обозначать, оно должно стать признаком какого-то объекта. Для этого есть только один способ - часто повторять слово одновременно с другими признаками некоторого объекта. Таким образом, слово станет неотъемлемым признаком некоторого объекта, станет его именем, и при восприятии слова у наблюдателя будут активироваться все остальные признаки данного объекта. Слова характеризуются тем, что обычно является характерным и уникальным признаком объекта и его одного достаточно для идентификации объекта, т.е.
активации всех остальных его признаков.
Подведём промежуточный итог.
1. Благодаря наличию 21(+/-) мерного пространства признаков человеческое восприятие способно создавать базовые опорные признаки для различения всего.
2. Благодаря объединению опорных признаков в объекты появляется возможность опознания и обозначения - т.е. воспроизведения полного набора признаков объекта по частичному достаточному набору признаков.
3. Слова как уникальные признаки очень удобны для обозначения. По этому назначению обычно и применяются.
4. Обозначать объект может любой достаточный признак. Этот достаточный признак активирует в восприятии все остальные признаки объекта, в том числе и имя (если оно у него есть). Т.е. имя, как достаточный признак, обозначает все остальные признаки объекта, точно так же, как любой другой достаточный признак обозначает остальные признаки, в их числе и имя.
Теперь вернёмся к исходному вопросу. Что и как будет обрабатывать текстовая система? Что может обозначит слово, какие признаки активировать, если кроме слов в текстовой системе ничего нет? Void.