GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.5 (18)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Распознование текста
гость
89.208.11.*
На: Распознование текста
Добавлено: 15 янв 08 18:23
чайник ты и есть чайник, что с тебя взять...
[Ответ][Цитата]
гость
195.200.94.*
На: Распознование текста
Добавлено: 15 янв 08 18:27
"(я так понимаю 79-80%%?)
Да что вы говорите? И что же это если не секрет? Т.е. какой алгоритм."
Это так же векторизация, только алгоритм шумостойкий, который мелкий мусор (который пересекает символы) не учитывает; непосредственно классификация происходит таким же образом - сравнением полученного векторного образа с базой шаблонов. То, что сказал Тарасов, я очень активно использую в своей реализации, а именно приведение каждого векторного образа к "цифровому шрифту" (здесь и далее применяю этот термин, который как мне кажется лучше описывает модель, своего названия я не придумал).

"Алгоритм который Тарасов написал, слишком общий. Проблема распознавания, обычно глохнет в деталях. Да это на самом деле почти к любой ИИ проблеме относится. В общих чертах все супер -- а в деталях "дьявол"."
Скорее всего он не занимался непосредственно проблемой этой и других капч, посему глубокого знания возможных алгоритмов и не имеет. Я немножечко другое имел в виду - максимальное упрощение векторного образа (приведение к так называемой "цифровой форме"), позволяет добиться очень хороших результатов распознавания, на конкретном типе капч. Насчёт деталей полностью с вами согласен, именно поэтому процент выше 80 поднять существенно уже который месяц не получается.

"Неееее. Не в коем случае. Трасов занимается демагогией, болтологией и прочим. У него ни одного реального результата нет (даже в перспективе). Одни теории, в воздухе.
Это ни наука и ни исследование -- это алхимия и самовлюбленность, просто граничащая с псих.заболеванием."
Бог ему судья

"Так что, пусти, знаете ли, тоже играют роль.
Еще раз говорю. Считаете для себя его посты полезными... на здоровье. Мое мнение, что прислушиваясь к тому бреду, который он несет (а он еще ни одной интересной и умной мысли за все прибывание на сайте не сказал. Как Шуклин заметил: "все что правильно не нова, что нова -- то не правильно") Вы больше вредите самому себе.
Это совет. хотите прислушайтесь, не хотите -- пропустите мимо ушей. NO PROBLEMS."
Спасибо за совет, но впрочем, я к его словам и не прислушивался, я лишь согласился с частью его примеров упрощения векторного образа для конкретного примера капчи и подтвердил реальность этой технологии. Впрочем мало что чьи-либо слова могут изменить - у меня несколько своеобразный подход к распознаванию, который будет мало понятен образованным людям (в том смысле, что делаю, как могу, а не как знаю ).

"И вам того же."
Спасибо
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 15 янв 08 19:32
"Алгоритм который Тарасов написал, слишком общий. Проблема распознавания, обычно глохнет в деталях. Да это на самом деле почти к любой ИИ проблеме относится. В общих чертах все супер -- а в деталях "дьявол"."

золотые слова стопьсяттысяччертей каналья(с) Боярский


"Скорее всего он не занимался непосредственно проблемой этой и других капч, посему глубокого знания возможных алгоритмов и не имеет."


я вам больше скажу, я вообще эту проблему увидел первый раз за 5 минут до написания ответа, распознаванием образов никогда не занимался, сказал первое, что пришло в голову. Что такое капч я вообще не знаю, но судя по контексту-это специальная прога для генерации картинки (наверно это какая то стандартная прога буржуйского образца, поставляемая в комплекте к программным средствам веб программирования, и скорее всего именно поэтому картинок с русскими символами я не встречал, хотя и никогда не задумывался на эту ему).


"Я немножечко другое имел в виду - максимальное упрощение векторного образа (приведение к так называемой "цифровой форме"), позволяет добиться очень хороших результатов распознавания, на конкретном типе капч."

Всякое приведение к общему дает такие результаты. Это же дедуктивный метод, а он лежит в основе алгоритма самообучения. Так что я просто применил общую методику дав этот совет.

" Насчёт деталей полностью с вами согласен, именно поэтому процент выше 80 поднять существенно уже который месяц не получается."

возможно, я могу вам помочь в этом вопросе, если посчитаю интересным и своевременным для себя потратить на это время.

Объект нужно крутить, из этого можно очень много пользы поиметь, этим вы увеличите базу шаблонов к применению, что даст дополнительную достоверность.
Создавать нужно свои шаблоны.


например буквы, которые проблемные, дадут в результате разных ракурсов совершенно четкую отличительную картинку, по которой их можно идентифицировать.

например буква D очень похожа на О. Если ось вращения определить по прямой линии, то D будет крутиться а О из фильтра выпадет.


[Ответ][Цитата]
гость
195.200.94.*
На: Распознование текста
Добавлено: 15 янв 08 21:52
Спасибо конечно, но это всё было испробовано полгода назад, теперь же распознавалка инвариантна к поворотам и неочень сильным искажениям. Шаблоны я всегда применял свои, да и не знаю где и кто может мне дать чужие, да ещё и бесплатно . Здесь уже скалдывается ситуация, когда 80% получаешь за месяц, 81% за два, 81,5 за три... И т.д. Я считаю, что выход из ситуации возможен при двух-трёх разных распознающих "ядрах" и системы "голосования". Чем в данный момент и занимаюсь.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 15 янв 08 22:07
если делать будет нечего-подумаю
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 15 янв 08 22:27
"И т.д. Я считаю, что выход из ситуации возможен при двух-трёх разных распознающих "ядрах" и системы "голосования". Чем в данный момент и занимаюсь."

правильно считаете. Похоже, из существующих классов вы уже все полезные сливки собрали.

Следует придумывать новые классы, но это должны быть не подклассы того же множества, а их производные. Вам следует делать преобразование существующих классов и далее искать общее между их производными.

создание цифрового шрифта, это как раз создание такого класса, которого раньше не было.

сколько процентов к положительному результату дало это обобщение? 25 не меньше?
вы называете это ядром. неправильный термин.
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 15 янв 08 22:42
Цитата:
Автор: Тарасов
я вам больше скажу, я вообще эту проблему увидел первый раз за 5 минут до написания ответа

Ну и ответ вы дали такой, какой дал бы любой увидев эту задачу за 5 минут до!

-Как написать книгу "Война и Мир"?
-Это элементарно. Надо написать про войну и про мир!!!
-Но это же банальный ответ.
-Но я же всего 5 минут над ним думал, и смотри те как гениально ответил! А вы тупица, даже до такого не додумались, если вообще вопрос задали.
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 15 янв 08 22:44
Цитата:
Автор: гость
считаю, что выход из ситуации возможен при двух-трёх разных распознающих "ядрах" и системы "голосования". Чем в данный момент и занимаюсь.

Еще раз говорю, почитайте boosting и strapping, сохраните кучу времени.
[Ответ][Цитата]
Corwin
Сообщений: 1324
На: Распознование текста
Добавлено: 15 янв 08 23:12
daner> Ну и ответ вы дали такой, какой дал бы любой увидев эту задачу за 5 минут до!
-Как написать книгу "Война и Мир"?
....

А мне больше ракетостроительство напоминает:
- "Как построить ракету?"
- "Да элементарно. Берем корпус цепляем к нему баки с топливом и реактивный двигатель."
- "Но ведь будет много проблем...!"
- "Это уже детали. Кроме того я в этом не вижу ничего проблемного." - И это от человека который даже ни одного болтика в жизни не закрутил.

Тарасов пишет что хорошо разбирается в алгоритмах, хотя не смог даже разобраться в элементарном алгоритме возведения в степень. И этот человек заявляет что задача распознавания символов тривиальна. Было бы смешно если бы не так печально.


гость> И хотя реализация Corwin для этого дела хренова-то подходит (все же шум очень мешает нормальной векторизации)

Моя реализация вообще на шум никак не рассчитана SymVecView по большему счету просто показательный стенд, чтобы продемонстрировать общие шаги распознания символов, о чем можно судить еще с названия программы

гость> Это так же векторизация, только алгоритм шумостойкий, который мелкий мусор (который пересекает символы) не учитывает;

Можно поинтересоваться какой алгоритм векторизации применяете?

гость> на среднезашумленных капчах порядка 79-80

А на чистых капчах (без шума) у Вас 100% получается?
[Ответ][Цитата]
гость
208.72.168.*
На: Распознование текста
Добавлено: 16 янв 08 0:50
2daner Спасибо, изучу подробненько

2Corwin
"Моя реализация вообще на шум никак не рассчитана SymVecView по большему счету просто показательный стенд, чтобы продемонстрировать общие шаги распознания символов, о чем можно судить еще с названия программы "
Я понимаю Это была небольшая помощь автору темы, на случай, если он захочет применить ваш алгоритм, в чистом виде. Кстати, хорошая работа в целом, некоторые моменты были мне в августе очень полезны, при перестройке структуры системы.

"Можно поинтересоваться какой алгоритм векторизации применяете?"
Не совсем это желательно, но, думаю, конкуренты не настолько прозорливы, чтобы сразу всё понять.. Названия алгоритма я не знаю, да и о нём нигде не читал, как-то само получилось. Я векторизую границы каждой структуры на картинке, после чего строю систему векторов в центре объекта (вот эта часть визуально во многом похожа на вашу векторную картинку, но в конечном итоге анализируется именно расположение векторов, а не точек). Векторная картина границ очень важна для поиска мусора в символах. На сложных капчах (что на https://accountservices.passport.net/) из 100 картинок порядка 40 после обработки полностью очищены от мусора. Скорость полной обработки капчи (предобработка-векторизация-анализ-распознавание) в среднем получается порядка 500 мс.

"А на чистых капчах (без шума) у Вас 100% получается?"
Чистых я в природе не видел А самому перерисовывать как-то в голову не приходило. Могу сказать только по тем, что с низким уровнем шума - процент получается 96-97, выше поднять не получилось, да, думаю, и не нужно это моим клиентам.
[Ответ][Цитата]
гость
208.72.168.*
На: Распознование текста
Добавлено: 16 янв 08 0:56
"Следует придумывать новые классы, но это должны быть не подклассы того же множества, а их производные. Вам следует делать преобразование существующих классов и далее искать общее между их производными. создание цифрового шрифта, это как раз создание такого класса, которого раньше не было."
Я не совсем вас понял.

"сколько процентов к положительному результату дало это обобщение? 25 не меньше?"
Уже не помню

"вы называете это ядром. неправильный термин."
Ядром я назвал систему векторизации. А по поводу терминов - я в этом абсолютно не силён, как видите своей реализации я даже названия придумать не смог, в посте своём ваше (цифровой шрифт) позаимствовал. Мне кажется, главное, не как называют программу, а как она работает. Впрочем, сколько людей, столько и мнений
[Ответ][Цитата]
daner
Сообщений: 4593
На: Распознование текста
Добавлено: 16 янв 08 2:55
Блин, на когда же "гости" поймут, что так просто не удобно тему читать!
Вообще, не понятно кто что пишет. Неужели такая проблема включить кукис и один раз залогениться????

Цитата:
Автор: гость
Мне кажется, главное, не как называют программу, а как она работает. Впрочем, сколько людей, столько и мнений

Названия алгоритмов нужны для того, что бы чётко понять о чем речь! Если каждый будет говорить на своём языке, то 90% времени будет уходить на то, что бы понять о чем идет речь.
Представьте, что каждый второй будет заново объяснять алгоритм обратного распространения ошибки в нейронных сетях. Причем, каждый будет это делать по своему!!!! Да не дай бог с ошибками! Это же задолбаться можно.
Заметьте, я не стал здесь описывать ни boosting, ни strapping, так как вам самому достаточно легко найти их описание (десятки описаний) в интернет, и прочитать о них нааамного глубже, чем я смогу вспомнить.
Конечно, не возможно знать все алгоритму на свете (особенно по именам), но чем больше знаешь, тем проще рассказывать свой. Так как обычно, алгоритмы состоят и частей похожих или вообще включают в себя какие-то другие известные алгоритмы.

Corwin
Верно, с ракетой аналогия даже ближе!
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 9:07
я решил проблему. причем в общем виде. она касается распознавания всех образов вообще.

нужно структурировать шаблоны образов в дерево шаблонов. Наподобие семантического дерева, только в отличии от семантических координат, в этой древовидной структуре должны стоять не понятия с тегами связок с другими понятиями, а графические векторные объекты с графическими тегами, связующие графические понятия между собой.
Графический тег-вот оно!
Этот принцип позволяет не только со 100% вероятностью идентифицировать уже известные объекты (цифры, буквы, лица), но и создавать в автоматическом режиме самообучающегося алгоритма новые графические образы.

Общее время, которое мне понадобилось для этого 1 ч.

Конечно "дьяволов в мелочах" вагон, но вектор движения найден.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 9:16
Данер, Корвин.
можете не прислушиваться к моему мнению. Скромно назову этот метод революционным в распознавании образов.
Впрочем, это всего лишь дальнейшее логическое развитие предыдущего моего решения в семантике и алгоритма записи текстовых мыслеформ в виде стековой последовательности координат понятий в семантической древовидной структуре, все вместе образует навигационную систему поиска понятий. На эту технологию я потратил месяц...
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 9:34
графические теги-это векторы-отрезки, имеющие координату начала, направление, и координату конца в графической матрице пикселов. Для работы с ними нужен макрос сканера по типу телевизионной построчной развертки.

Теги-основа связок между пикселами и могут в идеале дать 100% идентификацию любого графического образа, но в случае с макрообъектами (буквами), делать теги попиксельно не нужно, можно загрубить векторный анализ и работать с квадратными (или кубическими) кластерами, разрешение можно настроить автоматически в зависимости от разрешения исходной картинки и соотношения пикселов, несущих полезный сигнал к шуму.


могут быть и трехмерные теги (для распознавания трехмерных объектов), для них есть свой трехмерный сканер, алгоритм сканера есть и работает (он придуман мной около 2-х лет назад).
[Ответ][Цитата]
 Стр.5 (18)1  2  3  4  [5]  6  7  8  9  ...  18<< < Пред. | След. > >>