GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.8 (22)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Распознавание рукописных символов
ИЦ
Сообщений: 3747
На: Распознавание рукописных символов
Добавлено: 24 авг 09 14:20
Цитата:
Автор: гость

"А мы не произношение, а про начертание."

то же верно и для начертания...

С точки зрения логики, китайский один из самых совершенных языков.


К тому же начертание явно не случайно аналогично тому как мы делаем разные бытовые предметы, типа холодильника, ножниц и тп.Они такие потому что сделаны для людей.Они не километр в высоту и тп например.Так же и буквы никто не делает такими чтобы их надо было годами рисовать, все сделано так чтобы было удобно.
[Ответ][Цитата]
NewPoisk
Сообщений: 3745
На: Распознавание рукописных символов
Добавлено: 24 авг 09 14:26
Цитата:
Автор: Андрей
1. Для такой программы-отличалки всё будет разное, нужна очень огромная память и масса времени, чтобы хранить и сравнивать все возможные изображеня в поисках нужного.

Стоп, стоп. Кроме X и Y ничего нет!

Цитата:
Автор: Андрей
2. Одни и те же формы букв, но разного размера, расположенные под разными углами или в разных местах - будут признаны разными.

Так мы про отличалку или все-таки про распознавалку?
[Ответ][Цитата]
гость
77.221.129.*
На: Распознавание рукописных символов
Добавлено: 24 авг 09 14:30
"Для того чтобы уйти от пикселей нам необходимо перевести изображения в какое-то другое пространство признаков"

не надо уходить от пикселей, чтобы перевести изображение в другое измерение.

образ шаблона нужно делать на ОСНОВАНИИ пикселей.
Просто те же пиксели будут иметь другой вид и все.

Общие признаки начертания исходят из ПРИНЦИПОВ, по которым чертиться смысл начертания.

Т.е. смысл нарисованного и есть то самое измерение, которое вы ищите. И его нужно привязывать к пикселам, точнее, к модели из них. Она и будет служить каркасом (образом) символа.
[Ответ][Цитата]
Андрей
Сообщений: 3942
На: Распознавание рукописных символов
Добавлено: 24 авг 09 14:44
Цитата:
Автор: NewPoisk
стоп. Кроме X и Y ничего нет!
Хорошо, пусть для начала будет так. Но даже с учётом такого упрощения иксы могут быть разными, и при этом всё равно оставаться иксами. Например палочки разной длины, толщины и кривизны могут скрещиваться под разными углами - но это всё равно останется буква Х.
В более сложной задаче (к которой мы идём), отличатель заранее не должен знать, что именно ему надо будет отличать. Он должен сам обнаружить достаточные признаки для отличения чего угодно от чего угодно.

Цитата:
Автор: NewPoisk
мы про отличалку или все-таки про распознавалку?
Я не вижу разницы между ними. И Вы тоже не увидите, если углубитесь в это дело. Но чтобы пока было проще думать, то мы сейчас про отличалку.

Цитата:
Автор: гость 77.221.129.*
образ шаблона нужно делать на ОСНОВАНИИ пикселей
С этим спору нет. В базе всегда пиксели.

Цитата:
Автор: гость 77.221.129.*
Общие признаки начертания исходят из ПРИНЦИПОВ, по которым чертиться смысл начертания
Если Вы говорите о том, что буквы оличаются последовательностью действий, необходимых для их написания, то мне нравится направление Ваших мыслей. Продолжайте
[Ответ][Цитата]
гость
77.221.129.*
На: Распознавание рукописных символов
Добавлено: 24 авг 09 17:40
я имел в виду другое.

последовательность написания мало отражает смысл написанного, а вот смысл пишущегося сильно влияет на степени свобод для искажений при самом написании. Поэтому общие графические признаки есть проекция смыслового образа содержимого.

Так что, как всегда, вы думаете не в ту сторону.
Тарасов.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Распознавание рукописных символов
Добавлено: 24 авг 09 17:57
гость 24 авг 09 17:40
[...последовательность написания мало отражает смысл написанного, а вот смысл пишущегося сильно влияет на степени свобод для искажений при самом написании. Поэтому общие графические признаки есть проекция смыслового образа содержимого...]

Разумно - я бы сказал
[Ответ][Цитата]
NewPoisk
Сообщений: 3745
На: Распознавание рукописных символов
Добавлено: 25 авг 09 9:34
Цитата:
Автор: Андрей
Хорошо, пусть для начала будет так. Но даже с учётом такого упрощения иксы могут быть разными, и при этом всё равно оставаться иксами. Например палочки разной длины, толщины и кривизны могут скрещиваться под разными углами - но это всё равно останется буква Х.

Для распознавалки - да, для отличалки - нет.

Цитата:
Автор: гость
Поэтому общие графические признаки есть проекция смыслового образа содержимого.

Не смыслового, но эмоционального.
[Ответ][Цитата]
гость
188.162.61.*
На: Распознавание рукописных символов
Добавлено: 25 авг 09 13:05
а эмоция по вашему бессмысленна да?

мой вам совет. не понимаете что такое эмоция, не стройте с этим словом предложения.
[Ответ][Цитата]
NewPoisk
Сообщений: 3745
На: Распознавание рукописных символов
Добавлено: 25 авг 09 14:58
Цитата:
Автор: гость

а эмоция по вашему бессмысленна да?

мой вам совет. не понимаете что такое эмоция, не стройте с этим словом предложения.


Пока нет определений, каждый понимает как ему хочется. Или... давайте определения понятиям смысл и эмоция.
[Ответ][Цитата]
гость
188.162.61.*
На: Распознавание рукописных символов
Добавлено: 25 авг 09 18:09
эмоция=аналитический рассчет. длиться пока этот рассчет не закончен.
смысл=содержание в структуре (БД)
[Ответ][Цитата]
NewPoisk
Сообщений: 3745
На: Распознавание рукописных символов
Добавлено: 26 авг 09 7:53
Цитата:
Автор: гость

эмоция=аналитический рассчет. длиться пока этот рассчет не закончен.
смысл=содержание в структуре (БД)

В таком случае эмоция бессмысленна, поскольку "аналитический расчет"<>"содержание в структуре (БД)", т.к. формула по которой производится расчет (y=x+1; y=x^2 и т.д.) не зависит от значений переменных (x, y и др. данных БД).
[Ответ][Цитата]
Андрей
Сообщений: 3942
На: Распознавание рукописных символов
Добавлено: 02 сен 09 1:12
Не удержался, прочитал всё-таки книжку Бонгарда. Кто не знает, это книга, в основном, про распознавание, но и про сильный ИИ, в частности. Книжка мне понравилась (особенно первая половина), рекомендую к обязательному прочтению!

Приведу несколько важных, на мой взгляд, идей из книги.

На примере описания судебного заседания и работы паровой машины Бонгард пишет:
Цитата:
"Проблема узнавания", стр. 74
"Существует ли единый язык, на котором можно описать оба круга явлений? Вероятно, да, но он настолько далёк от наших обычных представлений, что его трудно даже вообразить. Может быть, описание на таком универсальном языке будет содержать сведения о координатах всех элементарных частиц, входящих в систему (суд или паровая машина), за всё рассматриваемое время."
Бонгард интуитивно понимает, что универсальность заключена в геометрическом определении системы взаимодействий. Но по инерции продолжает дальше двигаться по привычным "накатанным рельсам" математики и физики. Человеческий интеллект явно не описывает траектории всех атомов и, тем не менее, успешно справляется с задачей единого описания этих двух процессов (суд и машина). Успех этот обусловлен, на мой взгляд, применением принципов элементарных взаимодействий для описания взаимодействий абстрактных "укрупнёных" сущностей. Взаимодействий, буквально, в физическом смысле.
Бонгард, конечно, понимал этот принцип:
Цитата:
"Проблема узнавания", стр. 9
"Именно умение думать "не атомами, а крупными блоками" и дало возможность людям создать достаточно сложные устройства."
но в дальнейшем, к сожалению, не пытается больше "копать" в этом направлении.

Две яркие небанальные полезные мысли:
Цитата:
"Проблема узнавания", стр. 39
"[...] основная задача узнающей системы [...] вовсе не в сохранении всей информации, а в максимальном сокращении несущественной информации о каждом объекте"
Цитата:
"Проблема узнавания", стр. 101
"[...] никакого самообучения быть не может. Разговоры об "обучении без учителя" являются недоразумением. Оно вызвано тем, что бывают случаи, когда для достижения некоторой цели от учителя требуется лишь информация о принадлежности объекта "не к мусору".

Далее следует, имхо, главная ошибка Бонгарда в архитектуре ИИ.
Цитата:
"Проблема узнавания", стр. 18
"Разделим [...] мысленно процесс преобразования совокупности входных сигналов в целесообразное действие [...] на два этапа. Первый этап - разбиение ситуаций на классы, требующие одинакового [...] действия. Второй этап - выбор (синтез) действия, целесообразного для всей группы ситуаций.
Первый этап принято называть узнаванием. Этому крупному блоку, входящему в состав мышления, и посвящена наша книга.
Второй этап (синтез действия) изучен гораздо меньше."
Бонгард явно сознательно противопоставляет процессы распознавания (узнавания, различения, восприятия) и действия мышцами (эффекта). И это, на мой взгляд, - большая ошибка. Рассматривание процессов распознавания без уточнения цели этого распознавания, неизбежно приведёт к взрыву вариантов на этапе сочленения блока узнавания с блоком синтеза действия. Бонград не раз (смущённо...) приходит в книжке к выводам о слишком большом числе вариантов, для того, чтобы тот или иной алгоритм выделения признаков работал эффективно. И вместо того, чтобы обратиться к истокам в поиске ошибки он только наращивает сложность своих алгоритмов. А всё от того, что он не ставит вопрос о том, можно ли состав признаков выявить (ограничить) в соответствии с конечной целью, ради которой, собственно, и производится классификация. Бонгард, по ходу изложения, всегда рассматривает задачу узнавания ровно до того момента, как где-то в памяти машины входной объект попадает в некий статичный класс, а дальше? А дальше идёт координация тела! Об этом в книжке ни слова. Единственный, на мой взгляд, способ уйти от всех этих проблем - не разделять узнавание и эффект на два блока.

Книжка, ошибка Бонгарда и подключение Эгга (со своими классификаторами) к форумному эгрегору и коллективному бессознательному, сподвигло меня на написание статьи о классификации. Это моя очередная попытка синтезировать архитектуру сильного ИИ.
Предупреждаю сразу, слово "классификация" применяется не всегда в привычном смысле.
Прошу бить. Можно сильно
[Ответ][Цитата]
гость
188.162.60.*
На: Распознавание рукописных символов
Добавлено: 02 сен 09 10:30
эмоция=аналитический рассчет. длиться пока этот рассчет не закончен.
смысл=содержание в структуре (БД)


В таком случае эмоция бессмысленна, поскольку "аналитический расчет"<>"содержание в структуре (БД)", т.к. формула по которой производится расчет (y=x+1; y=x^2 и т.д.) не зависит от значений переменных (x, y и др. данных БД).

вместо у и х стоят реальные объекты, имеющие свое место в структуре и наделенные в ней таким образом смыслом.

рассчет, сам по себе, тоже является объектом, просто другого уровня иерархии.

вы против таких объектов в БД или просто мало понимаете в структурах БД?
Вон, у Шуклина спросите про многоуровневость и иерархичность систем.
[Ответ][Цитата]
Андрей
Сообщений: 3942
На: Распознавание рукописных символов
Добавлено: 03 сен 09 15:37
Разбивать буквы об стены мне пока надоело, поэтому в соответствии с идеологией, изложенной в статье, продолжаю эксперименты с "другой стороны" - со стороны эффекторов. Для этого написан простейший макет - двумерная модель человеческой руки c фломастером.
У руки 3 шарнирных сегмента. Первый сегмент (длиной 45 точек) одним концом закреплён в центре квадрата (151х151), вторым концом - с началом второго сегмента (34 точки). Второй сегмент - соединён с третьим (11 точек). На конце третьего сегмента - красный фломастер, обозначенный красным кружком. Места шарнирных соединений обозначены жёлтыми кружками. Все сегменты свободно вращаются вокруг шарниров на 360°.

Базовыми классами для такого эффектора должны быть:
1. нажатие фломастера (класс либо актуализирован либо нет)
2. угол поворота для каждого сегмента относительно шарнира

Со вторым набором классов есть варианты. Поскольку классы не имеют никаких градаций по степени актуализации, необходимо предусмотреть достаточное количество базовых классов для создания потенциальной возможности такому манипулятору нарисовать точку в любом месте окружности с радиусом 90 точек (суммарная длина сегментов). Если взять 360 дискретных углов, 2 варинта прироста угла (+/-) и 3 сегмента, то получаем: 360 * 2 * 3 = 2160 классов.

Это слишком много для экспериментов "вручную". Поэтому без потери полноты возможностей можно задать для каждого сегмента только по одному базовому классу на 1°, 2 поворота (по часовой стрелке / против часовой стрелки): получаем 1 * 2 * 3 = 6 классов.
Из этих классов можно синтезировать путём каскадирования любые последовательности движений! (Можно ещё упростить и поворочавить сегменты только по часовой "стрелке", тогда получится 3 класса, но это, имхо, совсем неудобно).

Здесь есть нюанс. Если из этих базовых элементарных классов синтезировать надклассы, то манипулятор никогда не сможет сделать за 1 такт моделирования шаг больше 1°, а это ограничивает скорость перемещения манипулятора. Поэтому стоит подумать о введении дополнительных базовых классов для быстрых "прыжков" манипулятора.

Цель макета - научиться синтезировать надклассы для реализации комплексных действий эффектора (пока без контроля со стороны рецепторной части).

Макет по вышеуказанной ссылке инициализируется рандомом, просто для иллюстрации. Маркер постоянно "нажат", поэтому все конвульсионные движения манипулятора отрисовываются. Принимаются любые соображения по сути модели.
[Ответ][Цитата]
NewPoisk
Сообщений: 3745
На: Распознавание рукописных символов
Добавлено: 03 сен 09 16:07
Цитата:
Автор: гость
вместо у и х стоят реальные объекты, имеющие свое место в структуре и наделенные в ней таким образом смыслом.

"реальные"? Не надо лишних терминов

Цитата:
Автор: гость
рассчет, сам по себе, тоже является объектом, просто другого уровня иерархии.


Ах, вон оно уже чего. Пошли уточнения. Ок. Приведите простой практический пример БД, в которой аналитический расчет есть часть ее же структуры.

Замечание. Аналитический расчет - это процесс (школьник пишет у доски), а не запись о том (учебник по математике), как этот самый расчет следует делать. Так что примеры БД типа MS Access, где в одном файле хранится все и вся, просьба не приводить. Нужно четко отделять понятие действия и инструкции к действию.
[Ответ][Цитата]
 Стр.8 (22)1  ...  4  5  6  7  [8]  9  10  11  12  ...  22<< < Пред. | След. > >>