GotAI.NET - Форум - Искусственный интеллект

Все темы | Новая тема

Стр.1 (1)

Поиск:

Автор

Тема: Умное обобщение входного образа, на предмет наличия другого образа.

Дубов Денис
Сообщений: 1

Умное обобщение входного образа, на предмет наличия другого образа.

Добавлено: 03 янв 08 11:36

Всех с Новым Годом!

Допустим у меня есть нейронная сеть, воспринимающая черно-белый образ 100x100. Я обучил её воспринимать квадратик 10х10, где-то там в середине образа. Как только я этот квадратик сдвину, да хоть на пиксел в любую сторону, восприятие данного образа сразу снижается чутьли не на половину.. Как можно обучить сеть так, чтобы если я этот квадрат сдвину хоть в самый край образа 100х100(в пределах образа), она мне выдаст на выходе что в этом образе есть квадрат? Какими методами это можно достичь?

[Ответ][Цитата]

Следопыт
Сообщений: 35

На: Умное обобщение входного образа, на предмет наличия другого образа.

Добавлено: 03 янв 08 14:47

Штука в том, что образ с квадратиком в одной части и образ со смещенным квадратиком - это уже разные образы. Это для людей все просто: глаза переместил в нужную точку, мозг откинул информацию об изменения координат, и все) образ распознан.
В алгоритмах распознования с использованием НС делают тоже самое:
1. выделить все объекты на изображении. (Например по границам по отношению к фону)
2. Подать каждый объект на входы НС предварительно отцентровав, отмаштабировав, и выровнять по углу вращения.
3. Получить результат

Вообще мне нынешние НС напоминают анекдот, про то как применять травку против тараканов. Ловишь таракана и травкой по морде его, по морде!

[Ответ][Цитата]

daner
Сообщений: 4593

На: Умное обобщение входного образа, на предмет наличия другого образа.

Добавлено: 03 янв 08 14:48

Цитата:

Автор: Дубов Денис
Всех с Новым Годом!

Да, это один из известных минусов сети. Проблема в том, что образы при сдвиге квадрата становятся очень разными с точки зрения расстояния хаминга (т.е. битов разных много).
Как чисто с сетями эту проблему решить понятия не имею (может В.Царегородцев знает).

Ну самое тривиальное (по идеи, но не по воплощению) это в начале картинку обработать, т.е. подвинуть квадрат туда куда надо, увеличить, уменьшить и все такое. Кстати, для этой операции, тоже можно попробовать какую будь другую ИНС приспособить...

Другой способ обучать сеть на более мелкий квадрат, чем входной образ. скажем квадратики 10х10... ну и при диагностики проверять все такие квадраты во входном образе. Если какой-то квадрат соответствует, значит -- ура, нашли. Ну конечно, можно проверять не все, а в начале искать какую нибудь исходную точку, скажем угол, или еще, что-то в этом роде, и уже от этой точки проверять все под-образы.

Еще один способ, в голову приходит (не знаю на сколько он осуществим...). Можно попробовать поменять пространства образа. Ну например, не пиксели на в ход пускать, а что-то другое. Ну типа каждый вход соответствует каждому пикселю, но представляет из себя не цвет, а кол-во соседей чёрного цвета. Причем сам входной вектор, отсортирован по возрастанию. Ну я не сказал, что это супер какая хорошая и универсальная трансформация, но смысл в том, что она уменьшит расстояния хеминга, для похожих образов.

[Ответ][Цитата]

Victor G. Tsaregorodtsev
Сообщений: 3187

На: Умное обобщение входного образа, на предмет наличия другого образа.

Добавлено: 03 янв 08 16:20

Знаю

Варианты:
1. Предобработка картинок. Есть разложения/трансформации образов, инвариантные к тем или иным группам преобразований. В каждой второй книжке по распознаванию образов это должно описываться. Например, на базе двумерного Фурье-разложения можно добиться инвариантности к сдвигам и поворотам картинки на углы, кратные 90 градусам. Обучение сетки идет на базе трансформированных образов.
2. Спецнейросетки, где работа идет не со всем "рецепторным" полем картинки, а с его отдельными фрагментами. Например, сверточная нейросеть Яна ЛеКуна с соавторами, реализующая механизм "скользящего окна" и за счет этого повышающая инвариантность распознавания к сдвигам объектов на изображении
3. Иной критерий точности и алгоритм обучения (например, метод tangent prop того же ЛеКуна), "зашумление" обучающей выборки искаженными образами (например, картинками со смещенным объектом).

По п.2,3 можно посмотреть на yann.lecun.com работу Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner, "Gradient-Based Learning Applied to Document Recognition," Proc. IEEE, 1998. vol.86, no.11, pp.2278-2324.
и что-нибудь из свежих тамошних работ по распознаванию трехмерных объектов.
По п.3 см. еще и P.Y. Simard, D. Steinkraus, J. Platt, "Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis", Proc. Int. Conf. on Document Analysis and Recognition (ICDAR), IEEE Computer Society, 2003. pp.958-962. Лежит тут: http://research.microsoft.com/~patrice/PDF/fugu9.pdf

----------------
нейронные сети, анализ данных, прогнозирование

[Ответ][Цитата]

Эгг (остерегайтесь подделок, у меня > 5907 сообщений)
Сообщений: 508

На: Умное обобщение входного образа, на предмет наличия другого образа.

Добавлено: 24 янв 15 7:30

LL>

а иногда и не-деяние требует усилия..
факт солидарности vs качество союза..

[Ответ][Цитата]

Стр.1 (1)

Форум: Проблемы искусственного интеллекта