GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.2 (18)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Распознование текста
beliy
Сообщений: 20
На: Распознование текста
Добавлено: 06 янв 08 20:38
Ну тогда просветите пожалуйста.
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 06 янв 08 21:26
Цитата:
Автор: beliy
Ну тогда просветите пожалуйста.

Ну а что тут просвещать? К каждой задачи свой подход.
В конце концов, все эти картинки, тоже программа генерирует.
Возможно у букв нет пересечения печатной области... тогда вообще все решается тривиально: отсчитал n-ое количество пикселей с краю.Отреал букву. отсчитал еще. отрезал вторую.

Я понимаю, что таких примитивов почти нет (кстати не факт), но я привожу это как пример, когда разделить на буквы, можно и без лишних потугов.

Тоже и с размерами и углами. Если скажем вы видите, что все шрифты длинные (т.е. высота больше ширины), то вам достаточно развернуть картинку так, что бы по высоте она заняла максимальное расстояние... ну что-то типа этого. И контур здесь не нужен, нужно просто цвет буквы определить, а это тем более не сложно.
Ну и т.д.

Короче, все это не должно быть супер точным. Главное сделать это более менее похожим на "стандарт" для вашей ИНС. А от фона, шумов и прочего... это она сама очистит.
[Ответ][Цитата]
beliy
Сообщений: 20
На: Распознование текста
Добавлено: 06 янв 08 21:38
Тут что, файло прикреплять нельзя?

Ну возьмем тогда объект ввиде капчи по ссылке на первой странице темы. Там где буквы перечёркнуты, или такие же буквы, только более зашёмленные(шум представлен не одной линией, а двумя или больши моличеством коротких перечеркивабщих в хаотичном[как кажется с первого взляда, но это не так] порядке буквы)
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 06 янв 08 23:07
Цитата:
Автор: beliy
Тут что, файло прикреплять нельзя?
Ну возьмем тогда объект ввиде капчи по ссылке на первой странице темы.

про какую ссылку вы говорите?
[Ответ][Цитата]
beliy
Сообщений: 20
На: Распознование текста
Добавлено: 06 янв 08 23:13
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 06 янв 08 23:19
ну отличная статья. что вам еще собственно надо?
[Ответ][Цитата]
beliy
Сообщений: 20
На: Распознование текста
Добавлено: 06 янв 08 23:21
Цитата:
Автор: daner

ну отличная статья. что вам еще собственно надо?


"Такой текст возможно распознать только путем векторизации изображения и выявлением признаков, позволяющих идентифицировать символы".
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 07 янв 08 2:14
Цитата:
Автор: beliy
"Такой текст возможно распознать только путем векторизации изображения и выявлением признаков, позволяющих идентифицировать символы".

это откуда цитата?
[Ответ][Цитата]
beliy
Сообщений: 20
На: Распознование текста
Добавлено: 07 янв 08 2:18
из той статьи, которую указал выше.
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 07 янв 08 2:51
Цитата:
Автор: beliy
из той статьи, которую указал выше.

Ну статья хорошая, а цитата плохая
И вообще, не верьте категорическим заявлениям, без формального доказательства
Кстати, я не утверждаю, что ИНС будет удобнее для вашей затеи, чем векторизация или что-то иное. Вообще, удобство --- вещь относительная и жутко субъективная.
[Ответ][Цитата]
Corwin
Сообщений: 1324
На: Распознование текста
Добавлено: 08 янв 08 3:13
Вообще мне кажеться что векторизация символа и нейронные сети между собой несколько несовместимы. Вы не сможете точно предвидеть из скольких векторов будет состоять символ - это может зависить от шрифта, уровня зашумлености, искривлености и размера символа, также от алгоритма векторизации. Вы даже не сможете в некоторых символах предвидеть точно типы ключевых точек. ИМХО это довольно усложняет распознавание через НС. Если уже решили переводить символ в векторную/математическую форму то нужно выбирать также соответственные методы распознавания.
Да и не совсем понятно на какой уровень распознавания Вы надеетесь. Реализация качественного алгоритма векторизации тоже далеко не самая простая задачка. Хотя учитывая что распознаваемые символы будут в общем иметь одну и туже форму, просто иметь разные искажения, то вероятно векторный подход будет наиболее эффективный. Конечно если Вам удастся хорошо отчистить символ и провести правильную сегментацию.
Где-то у меня была тема на этом форуме по реализации программы распознавания символов на основе векторизации - можете посмотреть там на примерные результаты такого распознавания.
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 08 янв 08 9:26
для новичков, я только хотел бы заметить, что Corwin в плотную занимался алгоритмом векторизации.
[Ответ][Цитата]
beliy
Сообщений: 20
На: Распознование текста
Добавлено: 08 янв 08 14:19
Нда, обидно, как оказалось сразу подался в тупиковую ветвь. Вот только не до конца понятен алгоритм работы SymvecView. В моём случаи программа точно постороила скелетный образ буквы "D", но сравнивала с БД ли её часть(вертикальный вектор) и, соответственно, определяла её как "I". Да и вообще мне бы эта программа полностью подошла. Жаль что она выхватывает мелкий шум, длинна вектоа которого стремится к нулю и не имеет никаких узловых точек. К тому же мне надо решить проблему разорванности букв.
Вот еще статья http://www.gonka.ru/nick/glaz/
[Ответ][Цитата]
Corwin
Сообщений: 1324
На: Распознование текста
Добавлено: 08 янв 08 17:41
>Нда, обидно, как оказалось сразу подался в тупиковую ветвь.

Ну тупиковость ветви определяется ее целями Для распознания ваших капчи векторизация вполне может подойти.

Вот посмотрел и кажеться что в БД SymvecView вообще нету символа "D" (d большое). Да и символ это довольно специфический. Если учитывать что программа должна распознавать символы разной степени деформации, то разницы между скелетизированой "D" и "О" почти никакой нет.
Если не ошибаюсь то на символ "О" в SymvecView сделан обход - "О" это любой контур без ключевых точек но с одним замкнутым контуром. Как видите "D" тоже туда попадает. Почему у Вас "I" получилось непонятно. Нужно смотреть на сам символ. Возможно там разрыв где-то есть.
Впрочем сами разрывы склеить не так уж сложно. Гораздо сложнее будет добиться чтобы не склеивались правильные части символа и сами символы между собой
По поводу векторов шумов - так это надо картинку предварительно фильтровать для снятия шума. Сделать обход подобных векторов при распознании далеко не простая задача. Лучше чтобы шум вообще не векторизировался
[Ответ][Цитата]
beliy
Сообщений: 20
На: Распознование текста
Добавлено: 08 янв 08 18:20
Что бы не быть голословным капча имеет в основном такой вид http://webfile.ru/1672412
[Ответ][Цитата]
 Стр.2 (18)1  [2]  3  4  5  6  ...  18<< < Пред. | След. > >>