GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.23 (23)<< < Пред.   Поиск:  
 Автор Тема: На: Распознавание рукописного текста
Kek
Сообщений: 1115
На: Распознавание рукописного текста
Добавлено: 27 май 13 22:54
Цитата:
Автор: rrr3
А "не рефлексируемое", или не известное...

Было бы гораздо полезней для форума объяснить что эти слова означают. И это не ирония. Именно для проблемы ИИ это полезно.
[Ответ][Цитата]
rrr3
Сообщений: 10670
На: Распознавание рукописного текста
Добавлено: 27 май 13 23:03
Цитата:
Автор: Kek
Было бы гораздо полезней для форума объяснить что эти слова означают. И это не ирония. Именно для проблемы ИИ это полезно.

Согласен, было бы полезно, но:
Просто, в общепринятых словах объяснять не интересно, Вы это можете выяснить и сами поисковиками, википедией и прочее...
А в рамках моих представлений, то 1.- пока очень рано, не понято даже то, что гораздо проще, а рефлексия, сознание, "осознаваемые" цели и т.п. просто еще больше запутают оппонентов, 2. - ну просто лень пока, думаю пока достаточно просто обратить внимание на не очевидность того, что мы видим наблюдая за своими мыслями.

p.s. Я было как-то попробовал, не помню в какой ветке, и сразу попал в разряд ... ну не будем показывать пальцем... , и понял (вроде), что не надо пока, бесполезно и даже вредно.
[Ответ][Цитата]
Kek
Сообщений: 1115
На: Распознавание рукописного текста
Добавлено: 27 май 13 23:58
Цитата:
Автор: rrr3
p.s. Я было как-то попробовал, не помню в какой ветке, и сразу попал в разряд ... ну не будем показывать пальцем... , и понял (вроде), что не надо пока, бесполезно и даже вредно.

Да, почему же. Есть рубрика с зоопарком, там уместно говорить об этих вещах.
[Ответ][Цитата]
rrr3
Сообщений: 10670
На: Распознавание рукописного текста
Добавлено: 28 май 13 0:07
Цитата:
Автор: Kek
Да, почему же. Есть рубрика с зоопарком, там уместно говорить об этих вещах.

Ну вроде я объяснял - при наличии недопонимания предшествовашего, рассказ о последующем - только наслаивание/усиление непонимания (вредно пока). В двух словах могу сказать, только то, что все это (осознаваемые "цели", рефлексия и т.п.) по идее должно возникнуть (при соответствующей "величине" системы) автоматически (само собой).

Зоопарк он не для того, чтобы всякую всячину нести, а для того, чтобы НЕ спеша, разбираться, без давления ДОГМ (на мой взгляд).
[Ответ][Цитата]
Kek
Сообщений: 1115
На: Распознавание рукописного текста
Добавлено: 28 май 13 1:41
Цитата:
Автор: rrr3
что все это (осознаваемые "цели", рефлексия и т.п.) по идее должно возникнуть (при соответствующей "величине" системы) автоматически (само собой).

Это совершенно правильные мысли. Вернее в русле темы ИИ. Только слово "само" Андрей не любит, но это все дефиниции.
А я добавлю, что цели всегда иерархичны, и формируются на каждом уровне. Под уровнем я понимаю абстрактную систему - агента. А в рамках темы по распознаванию чего-ни попадя, такожде добавлю, что неосознанного в принципе нет. На нижних уровнях всегда есть распознавания сложного объекта, который проецируется на этот уровень своими простыми свойствами. Неопознанное или нераспознанное возникает на самых верхних уровнях. Например: "квадратный круг" - объект распознается, как множество буков, как множество слов и даже слова все в отдельности распознаются. Сочетание слов, как характеристика некоего объкта не распознается.
[Ответ][Цитата]
rrr3
Сообщений: 10670
На: Распознавание рукописного текста
Добавлено: 28 май 13 2:13
Цитата:
Автор: Kek
Это совершенно правильные мысли. ...

Я не знаю какие мысли "совершенно правильные", а какие - нет. Я Вам говорил свое мнение (истин не глаголю) из своих "умозрительных" "наблюдений" не за своими и чужими мыслями, а за тем как работает (образно говоря, в моих мыслях, в моем воображении, в мысленных экспериментах) некая система строящаяся на пакете категорий о которых не раз говорил. Никаких "материальных" экспериментов и исследований не проводилось.
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3111
На: Распознавание рукописного текста
Добавлено: 28 май 13 5:10
Цитата:
Автор: Андрей
Я, в свою очередь, не понимаю упования на нейросети и вышеперечисленное Вами. Ведь сразу становятся очевидны ограничения этих методов и непохожесть их работы на работу перцептивного аппарата человека. Почему 5*5, откуда это?

5*5 - это, например, оптимум, найдённый при переборе разных вариантов размеров рецептивных полей нейронов. Размер, естественно, растёт из особенностей решаемых на компе задач (т.е. тут - да, завязка на какие-то пусть и реальные, но модельные (поскольку образуют одну чётко поставленную прикладную задачу) данные).

А насчёт непохожести... Вы ошибаетесь. Там в существенном виде воспроизводятся элементы или блоки зрительной коры (их структурная и функциональная организация). Берём, например, прошлогоднюю статейку ЛеКуна "Learning Invariant Feature Hierarchies" и читаем в нёй про предлагаемую структуру сети: The architecture shown in figure 2 has a structure reminiscent of the LGN-V1-V2-V4-IT hierarchy in the ventral pathway of the visual cortex.

Перевожу: LGN (локальная нормализация), V1, V2, V4, IT - это блоки зрительной коры. В статье идут, например, такие ссылки. По поводу V1 - на Hubel D.H., Wiesel T.N. Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex / J. Physiol. 160, 106–154 (1962). По поводу V2 и V4 - ссылается на Hansen K.A., Kay K.N., Gallant J.L. Topographic organization in and near human visual area / Journal of Neuroscience 27, v4. pp.11896–11911 (2007) (т.е. если Хьюбел-Визель резали кошек - то это уже ссылка на свежак из нейрофизиологии ЧЕЛОВЕЧЕСКОЙ зрительной системы (соответствующее слово в названии выделил жирным))
[Ответ][Цитата]
Андрей
Сообщений: 3419
На: Распознавание рукописного текста
Добавлено: 28 май 13 7:04
2 Victor G. Tsaregorodtsev

Для корректности:
Статья Хьюбела и Визеля от 1979 года (стр. 129 - 155).
Статья ЛеКуна.
Статья Хансена.
Статья про Predictive Sparse Decomposition, на котором ЛеКун основывает свой алгоритм.

Да, эти люди говорят, что вдохновлялись исследованиями нейрофизиологов, но:
1. Сами эти исследования носят приблизительный характер и сделанные выводы, на мой взгляд, неоднозначны для того, чтобы сесть и что-то внятное программировать.
2. После вдохновления нейрофизиологией инженеры возвращаются к своим привычным игрушкам - начинают комбинировать известные им алгоритмы.
3. Общая идеология распознавания остаётся прежней - как-то извлечь признаки и распознать какой-то один объект. На мой взгляд акцент должен быть переведён с опознавания - как именования-классификации, на опознание - как позиционирование. Потому что всегда надо помнить, что распознавание производится не для того чтобы зарабатывать деньги, а для того чтобы координировать тело в пространстве.

Я для себя ставлю задачу иначе и, на мой взгляд, более конкретно - каждый чётко-позиционированный минимальный элемент изображения должен быть непротиворечиво соотнесён с максимальным количеством объектов (признаков, features).
Наверное кому-то читать такие статьи интересно, но у меня полезных мыслей возникает больше, когда я просто выглядываю в окно.

Закончить диспут стоит словами из приведённой Вами статьи ЛеКуна: "One must ask whether there exist a simple learning “algorithm” used by the cortex, or if there is a simple principle on which such an algorithm could be based. It is certainly worth looking for such a principle."
[Ответ][Цитата]
rrr3
Сообщений: 10670
На: Распознавание рукописного текста
Добавлено: 28 май 13 21:14
Цитата:
Автор: Андрей
"... if there is a simple principle on which such an algorithm could be based..."

Yes...
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3111
На: Распознавание рукописного текста
Добавлено: 29 май 13 6:11
Цитата:
Автор: Андрей
Общая идеология распознавания остаётся прежней - как-то извлечь признаки и распознать какой-то один объект. На мой взгляд акцент должен быть переведён с опознавания - как именования-классификации, на опознание - как позиционирование.

Правильно, но это давно уже многие понимают. Вернее, формулируют это как проблему наличия малой доли "помеченных" (labeled) данных, что автоматически делает такую задачу задачей самообучения (обучения без учителя, а не обучения с учителем).

Цитата:
Автор: Андрей
Сами эти исследования носят приблизительный характер и сделанные выводы, на мой взгляд, неоднозначны для того, чтобы сесть и что-то внятное программировать.

Зато сколько возможностей открывается у ИНЖЕНЕРОВ-последователей по созданию/оперированию феноменологическими моделями, приближениями, упрощениями, эвристическими моделями или аналогиями.
Не в плане науки ради науки (т.е. делания чего-то, лишь частично привязанного к реальности) - а в плане отсутствия ограничений при создании ТЕХНИЧЕСКОЙ системы (которая потом БЫСТРО проверяется на практике, а не существует в виде сферических ИТИИ/ЭГТР в вакууме).

Цитата:
Автор: Андрей
Закончить диспут стоит словами из приведённой Вами статьи ЛеКуна: "One must ask whether there exist a simple learning “algorithm” used by the cortex, or if there is a simple principle on which such an algorithm could be based. It is certainly worth looking for such a principle."

Извините, здесь ненаучные вещи получились. Почему бОльшая субъективная привлекательность одного из двух возможных результатов влияет на наше суждение о сравнительной ценности путей достижения этих результатов? Ведь нигде и никем не доказано, что обязательно будет simple. И никто не пытался оценить весь спектр побочных результатов для каждого из двух путей. Получается простое субъективное предпочтение "принципа" перед "алгоритмом" при отсутствии знаний о том, насколько "принцип" окажется "шире" "алгоритма" (т.е. сколько ещё алгоритмов он способен породить).
[Ответ][Цитата]
гость
50.7.143.*
На: Распознавание рукописного текста
Добавлено: 18 июл 15 9:54
глубоко копаете да. но как по мне для капч такое не совсем то
[Ответ][Цитата]
Андрей
Сообщений: 3419
На: Распознавание рукописного текста
Добавлено: 18 июл 15 12:24
Контур - самый информативный признак для бинаризированного изображения. Если капчу можно бинаризировать (привести к чёрно-белой маске) то контурного анализа вполне достаточно для большинства случаев. Если картинка динамическая или контур сильно искажён - нужно искать другие признаки для разделения объектов.

Если вернуться к тематике топика, то сейчас я экспериментирую над кластеризацией цветных изображений через эмуляцию притяжения. Узлы выборки (цветные точки изображения) буквально двигаясь и притягиваясь друг к другу в пространстве признаков своим скоплением определяют центр образа. Не границы или разделяющие плоскости, а именно центр. Пока неплохо получается.

Ещё интересная тема - распознавание размытых изображений. Я пришёл к выводу, что анализ деталей для распознавания образов - в корне ложный подход. Во всяком случае, для эмуляции человеческого восприятия. Человек легко распознаёт визуальные сцены даже если усилием глазных мышц "размывает" картинку. Это значит, что детали являются не признаками объекта, а дополнительными самостоятельными объектами, которые приаттачиваются восприятием к объекту уже после распознавания. Человеческий распознаватель именно потому такой быстрый, что распознаёт картинку исходя из самых общих, самых смутных но достаточных признаков. В этом смысле интересно было бы узнать у Kek'a не проводил ли он эксперименты с "размытием" звука, превращением его в "бубнение" и какие методы для этого эффективнее использовать.
[Ответ][Цитата]
гость
50.7.143.*
На: Распознавание рукописного текста
Добавлено: 18 июл 15 15:56
Цитата:
Автор: Андрей

Контур - самый информативный признак для бинаризированного изображения. Если капчу можно бинаризировать (привести к чёрно-белой маске) то контурного анализа вполне достаточно для большинства случаев. Если картинка динамическая или контур сильно искажён - нужно искать другие признаки для разделения объектов.

Если вернуться к тематике топика, то сейчас я экспериментирую над кластеризацией цветных изображений через эмуляцию притяжения. Узлы выборки (цветные точки изображения) буквально двигаясь и притягиваясь друг к другу в пространстве признаков своим скоплением определяют центр образа. Не границы или разделяющие плоскости, а именно центр. Пока неплохо получается.

Ещё интересная тема - распознавание размытых изображений. Я пришёл к выводу, что анализ деталей для распознавания образов - в корне ложный подход. Во всяком случае, для эмуляции человеческого восприятия. Человек легко распознаёт визуальные сцены даже если усилием глазных мышц "размывает" картинку. Это значит, что детали являются не признаками объекта, а дополнительными самостоятельными объектами, которые приаттачиваются восприятием к объекту уже после распознавания. Человеческий распознаватель именно потому такой быстрый, что распознаёт картинку исходя из самых общих, самых смутных но достаточных признаков. В этом смысле интересно было бы узнать у Kek'a не проводил ли он эксперименты с "размытием" звука, превращением его в "бубнение" и какие методы для этого эффективнее использовать.
Ну контур важен только потому что есть связь резких перепадов света и реальных значимых границ объектов в физическом мире, но есть полно исключений. В контексте знаков контуры как раз не тек важны, куда важней “вторые производные” то есть “ завороты” которые часто являются основной характеристикой знака. Вообще желательно “векторизовать” объект, получить линию из точек и касательных, это совсем круто, такой вектор маленький и весьма точный.
[Ответ][Цитата]
 Стр.23 (23)1  ...  19  20  21  22  [23]<< < Пред.