GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.3 (22)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Конкуренция
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 14 авг 09 20:52
Цитата:
Автор: Slava
старые идеи меитода потенциалов и, в частности, распознавания изображений после их расфокусировки имеют ли к этому отношение, или мне это только показалось?
В основном показалось.
1. Здесь нет пока никакого распознавания. Единственное сходство между методами - использование физической аналогии. Но если в методе потенциалов это аналогия статических зарядов и она используется для определения сходства образа с эталоном, то здесь - это аналогия гравитации (вообще - взаимодействия) и она используется для разделения объекта на признаки, которые удобно кластеризировать.
Впрочем, в дальнейших планах есть развитие идеологии взаимодействий и для непосредственно распознавания.
2. Вместо расфокусировки в ближайших планах выделение крупных чётких однородных прямоугольников. Единственная расфокусировка, которая применяется - это усреднение всех цветов, но (здесь) это несущественный элемент процесса распознавания. В перспективе расфокусировка - очень интересное направление - выявление абстракций.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 15 авг 09 0:27
Экспериментируем дальше.

Предыдущий макет практически может быть применим для работы как с единичными буквами, так и с текстом в целом (например для выделения отдельных слов - как целостностей). Но с учётом того, что он работает с отдельными точками изображения, скорость вычислений на обычных десктопах недопустимо мала. Следующий макет показывает, как можно уменьшить общее число отдельных однородностей изображения.

Элементарной однородностью растрового изображения является точка - квадратик. Было бы очень удобно, если бы изображение представляло собой что-то вроде плотно упакованных кружков в сотовые структуры. Таких графических форматов и мониторов, к сожалению не производят, но ничто не мешает работать с более крупными однородными прямоугольными областями, вместо отдельных точек.

После открытия изображения и нажатия на кнопку "Test" макет выполняет следующий рекурсивный алгоритм для разбиения изображения на прямоугольники:
1. На вход рекурсивной процедуры подаются координаты прямоугольника (при инициализации подаются координаты прямоугольника всего изображения с уже разделёнными цветами на строго чёрный и белый (см. предыдущий макет)).
2. Вычисляется средний цвет для этого прямоугольника.
3. Если средний цвет белый - выходим из процедуры.
4. Если средний цвет черный - прямоугольник закрашивается случайным цветом (для наглядного теста) и выходим из процедуры.
5. Если средний цвет не чёрный и не белый, то делим прямоугольник пополам и каждую половину отправляем на рекурсию т.е. на шаг №1 (нечётные шаги рекурсии разбивают входной прямоугольник пополам по вертикали, чётные - по горизонтали).

В результате крупные однородные участки изображения (в частности буквы) выделяются в отдельные большие прямоугольники, изгибы и точки - апроксимируются более мелкими прямоугольниками. Особенно хорошо это видно на огромных изображениях. После выполнения алгоритма в заголовке окна высвечивается 3 числа: количество точек - количество прямоугольников - количество прямоугольников с площадью 1 пиксел. Выигрыш в количестве отдельных однородностей, в сравнении с точечным представлением, приблизительно 1 порядок.

В качестве дальнейшего экперимента планирую совместить макет 1 и макет 2, чтобы взаимодействовали не отдельные точки, а отдельные прямоугольники.

Предыдущий макет показал занятный способ избавления от шума. Мелкие точки - "лёгкие", поэтому "прилипают" к массивной букве. Второй макет даёт возможность другим способом избавиться от шума. На каждом изображении после применения приведённого алгоритма получается разброс между размерами самого крупного и самого мелкого прямоугольника. Если пронормировать размер прямоугольников по самому крупному, то можно просто игнорировать прямоугольники, размер которых меньше некоторого порогового значения.

P.S. В первом макете случайно забыл вытереть остатки некоторых экспериментов, поэтому каждая точка при запуске модели инициализировалась небольшим случайным ускорением, поэтому абсолютно симметричные изображения разлетались чуть не симметрично (уже всё поправил). В целом на результаты работы модели эта помарка существенно не влияет.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 15 авг 09 12:50
В основном показалось.
1. Здесь нет пока никакого распознавания. Единственное сходство между методами - использование физической аналогии. Но если в методе потенциалов это аналогия статических зарядов и она используется для определения сходства образа с эталоном, то здесь - это аналогия гравитации (вообще - взаимодействия) и она используется для разделения объекта на признаки, которые удобно кластеризировать.
Впрочем, в дальнейших планах есть развитие идеологии взаимодействий и для непосредственно распознавания.

А известны ли вам очень старые работы Ильи Мучника на эту тему?
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 15 авг 09 13:05
2 Slava

К сожалению, первый раз слышу. Гугл сходу ничего интересного не дал. Буду благодарен если дадите ссылки или какие-либо материалы.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 15 авг 09 13:10
поищу. постараюсь не забыть
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 15 авг 09 13:29
A.V.Genkin,... Automatic Reading of Handwritten Characters: A Review. Pattern Recognition and Image Analysis, v.5, #3, 1995, pp. 417-466.

Пока нашел только это. Сорри. Там внутри нужное есть
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Конкуренция
Добавлено: 15 авг 09 18:09
Цитата:
Автор: Slava :: А известны ли вам очень старые работы Ильи Мучника на эту тему?
2 Андрей-ПроСолвер.. Это намного более судьбоносный вопрос чем это может показаться -искать на обоих языках и Rutgers University, NJ, USA
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 15 авг 09 23:44
Цитата:
Автор: Slava
Пока нашел только это
Благодарю. По мере возможностей посмотрю.

Следующий макет является суперпозицией двух предыдущих макетов со следующими отличиями.
1. Взаимодействие по типу "гравитации" осуществляется между крупными элементами буквы, а не между отдельными точками, как это было в первом макете. Крупные элементы буквы выделяются одним из двух рекурсивных алгоритмов, на выбор. Если галочка "Square" отмечена, то рекурсивный алгоритм разбивает букву строго на квадраты, если галочка снята - на прямоугольники.
Квадраты хороши тем, что они симметричны (но их всегда получается больше, чем прямоугольников). Прямоугольники хороши тем, что их всегда получается меньше, чем квадратов (но они не симметричны). Принципиальной разницы в динамике для обоих вариантов разбиения не обнаружено, кроме того, что модель работает, конечно, значительно быстрее, чем раньше и позволяет обрабатывать крупные буквы.
2. После запуска модели кнопкой "Do it" в заголовке окна отображается общее количество выделенных (и взаимодействующих) элементов буквы.
3. Каждый выделенный прямоугольный элемент буквы имеет свой случайный цвет - так легче наблюдать.
4. Взаимодействия со стенками выключено.
5. Кнопка "Reload" позволяет перезагрузить выбранный рисунок без вызова диалога открытия файла (просто для удобства).

Любопытно. Если нажать кнопку "Do it" и позволить модели развиться, потом нажать кнопку "Stop", а далее опять нажать кнопку "Do it", то алгоритм начнёт обрабатывать существующее на экране изображение, как исходное. Таким образом сама плоскость изображения задаёт (и отображает) входные данные для итерационного алгоритма и их результат. Т.е. иллюстрирует своего рода рекуррентный метаалгоритм.

Эти три макета призваны показать принцип. Свою задачу они, на мой взгляд, выполнили. Хотелось бы обсудить и перейти к чему-то более интересному и конкретному.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 16 авг 09 1:26
В дополнение. По рекомендации NO, версия макета, в котором левой кнопкой мыши можно рисовать, а правой - таскать изображение.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 16 авг 09 12:03
Немного подправил предыдущий макет. Добавил галочки для включения/выключения цвета, стенок и притяжения. Если галочка "Gravity" отмечена - элементы изображения притягиваются, если снята - отталкиваются.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 17 авг 09 16:27
Андрей 16 авг 09 12:03
[...Немного подправил предыдущий...]

Хотел поглядеть, но так и не понял, откуда взять картинку, так что дальше исходной панели дело не продвинулось. сорри
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 17 авг 09 17:05
Картинки были в архиве с первым макетом. За неимением можно брать любую картинку, желательно буквы. Можно сделать пустое изображение, загрузить и рисовать прямо на нём мышкой. Я играюсь вот с этим набором.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 17 авг 09 17:29
Андрей 17 авг 09 17:05
[...Картинки были в архиве с первым макетом. За неимением можно брать любую картинку, желательно буквы. Можно сделать пустое изображение, загрузить и рисовать прямо на нём мышкой. Я играюсь вот с этим набором...]

Спасибо. Погляжу. А можно ли те картинки тоже править?
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 17 авг 09 17:34
Да, красота неописуемая.
И что делать с этим дальше?
А для скриин-сейвера прекрасно подошло бы
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Конкуренция
Добавлено: 17 авг 09 19:38
Смотреть нет сил..
===> не тот ли Андрей чел.. К-го искал Старик-Державин?!?
[Ответ][Цитата]
 Стр.3 (22)1  2  [3]  4  5  6  7  ...  22<< < Пред. | След. > >>