GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.1 (7)След. > >>   Поиск:  
 Автор Тема: распознавание кптчи Яндекса
гость
94.25.183.*
распознавание кптчи Яндекса
Добавлено: 12 май 09 12:33
Итак, есть реальная коммерческая задача: распознать каптчу Яндекса с вероятностью 98%

Поскольку я не программист и не имею возможности детализировать ТЗ до степени его понимания кодером, а лишь могу построить методику решения данной задачи, то прошу не требовать от меня выполнения НЕ моей работы.

Методика в общем виде такова:

1) скан попиксельно области распознавания
2) выделение гипотетических объектов
3) сравнение объектов с шаблонами.

с первым этапом все ясно, я надеюсь.

2.1

Окончательное выделение объекта по времени совпадает с его полным распознаванием.
Прошу воспринимать сие утверждение как часть методики, определяющую вектор общего алгоритма и ограничивающую ветви решения.
По мере выполнения алгоритма распознавания, вероятность правильного определения границ объектОВ увеличивается. Эта вероятность используется в качестве аргумента функции подбора шаблонов для распознавания каждого из объектОВ, а результат сравнения шаблонов с этими объектами (вероятность правильно распознанного каждого объектА), является аргументом функции для выборки шаблонов для определения границ объектОВ.

2.2
Максимальное количество объектов, могущих находиться в матрице, задается изначально условием задачи по распознаванию, вместе с классом точности распознавания.
В случае с каптчей Яндекса, задача упрощается, поскольку число объектов известно.

В общем случае задачи распознавания образов, когда количество объектов в матрице не известно (но ограничено условиями задачи, вместе с предельными размерами объектов), количество потенциальных объектов в начале выполнения алгоритма=мах.
Прошу воспринимать сие утверждение как часть методики, определяющую вектор общего алгоритма и ограничивающую ветви решения.

По мере распознавания, число потенциальных объектов корректируется исходя из сходимости 2-х вероятностей:
вероятность правильного определения границ объектОВ
вероятность правильного определения самих объектов.

Прошу воспринимать сие утверждение как часть методики, определяющую вектор общего алгоритма и ограничивающую ветви решения.


Функция распознавания конкретного объекта-это функция выборки наиболее подходящего шаблона, и по мере увеличения вероятности определения правильной границы объекта, настраивается фильтр выборки шаблонов, увеличивая тем самым скорость обработки.

Функция разделения границ объекта-это функция сужения областей вероятного перекрытия объектов, после каждой итерации сравнения с шаблонами.
Функция определения границ объекта-это функция удаления из объекта пикселов, с минимальным количеством совпадений, обнаруженных в сравнении с шаблонами после каждой итерации.

После каждой итерации, количество задействованных шаблонов для обработки снижается.

3.1

Шаблоны для попиксельного сравнения делятся на статические и динамические.
Статические-это те, которые хранятся в БД (в данном случае шрифты).
Динамические шаблоны, это масштабируемые и измененные по наклону до 45 град в обе стороны. Эти шаблоны, с требуемыми характеристиками, формируются по запросу алгоритма подстановки шаблонов.
Статические шаблоны (для каптчи) структурированы в БД по признакам:
шрифт, жирность, наклон, Буквы, цифры.

3.2

Алгоритм формирования динамических шаблонов основан на результатах границ объектов и их количестве, полученных после использования статических шаблонов.

По мере выделения параметров границ объектов, объекты разбиваются на мах кол-во кластеров (мах задается условием качества распознавания) и к этим кластерам применяются соответствующие кластеры шаблонов (либо статические, либо динамические).

Подобно алгоритму определения кол-ва объектов, по сходимости (для каждого объекта в отдельности) определяется уровень кластеризации, тем самым, отсекается значительная часть шаблонов, годных к применению. Т.е. устанавливаются фильтры для генерации динамических шаблонов по заданным параметрам.


зы.

Распознавание каптчи Яндекса с точ6ностью 98% может требовать обработки до миллиона сгенерированных шаблонов.
[Ответ][Цитата]
гость
217.199.228.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 13:31
Цитата:
Автор: гость

Поскольку я не программист и не имею возможности детализировать ТЗ до степени его понимания кодером, а лишь могу построить методику решения данной задачи, то прошу не требовать от меня выполнения НЕ моей работы.

Кто не умеет делать, тот учит, как надо делать.
[Ответ][Цитата]
shuklin
Сообщений: 2053
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 13:40
Цитата:
Автор: гость

Итак, есть реальная коммерческая задача: распознать каптчу Яндекса с вероятностью 98%




1. Обращайтесь в лаборатории, занимающиеся проблемами машинного зрения. В нашем ВУЗ-е понятное дело тоже есть, как раз мои соседи по этажу )))

2. Обратите внимание на работы самого Бонгарда и на работы его школы, продолжающие это направление

3. лично мне импонирует направление по структурному расспознаванию. Смотрите "структурное распознование образов"

ПыСы: методики твои лажа. их не то что в виде ТЗ кодеру не отдашь, даже архитектору в виде ФТ показывать стыдно )))
[Ответ][Цитата]
гость
94.25.183.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 13:44
Кто не умеет делать, тот учит, как надо делать.

я учу делать то, что вы НЕ умеете. вы не видите ПУТИ.

методика-это ПУТЬ!!!

с вашей программерской позиции пути не видно.
[Ответ][Цитата]
гость
94.25.183.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 13:45
"По мере выполнения алгоритма распознавания, вероятность правильного определения границ объектОВ увеличивается. Эта вероятность используется в качестве аргумента функции подбора шаблонов для распознавания каждого из объектОВ, а результат сравнения шаблонов с этими объектами (вероятность правильно распознанного каждого объектА), является аргументом функции для выборки шаблонов для определения границ объектОВ."

вот то, что вам не видно.
[Ответ][Цитата]
гость
94.25.183.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 13:46
"методики твои лажа."

это твои лажа.


" их не то что в виде ТЗ кодеру не отдашь, даже архитектору в виде ФТ показывать стыдно )))"

зато ты по своим методикам сделал то, что никому до сих пор не нужно.
[Ответ][Цитата]
гость
94.25.183.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 13:48
я и не говорю шуклин, что это методика для кодера. Кодер не работает с методиками. Кодер работает с ТЗ.
Кодер-бот. ему не надо думать, что делать.

кодеров полно.
данер корвин, их десятки тысяч...
[Ответ][Цитата]
Corwin
Сообщений: 1324
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 14:28
>кодеров полно, их десятки тысяч...

Ну в таком случае у вас не составит никакого труда найти кодера который на вас поработает.
[Ответ][Цитата]
гость
94.25.183.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 14:32
кодер не работает с методиками. он слишком туп для этого. на то он и кодер.
[Ответ][Цитата]
daner
Сообщений: 4593
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 14:42
Цитата:
Автор: гость
кодер не работает с методиками. он слишком туп для этого. на то он и кодер.

а кто работает с методиками?

П.С.
тарасов, ты же даже не знаешь что такое "вероятность" (вспомни свой позорный слив по теме управление вероятностью) как ты умудряешься еще и методики с ее применением писать. Впрочем, то что ты напИсал, методикой не назовешь.
[Ответ][Цитата]
гость
94.25.183.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 15:00
"а кто работает с методиками?"

те, кто хочет в ней разбираться (и может).


"вспомни свой позорный слив по теме управление вероятностью"

зачем называть сливом эксперимент?
эксперимент принес свои плоды, как и положено.

[Ответ][Цитата]
daner
Сообщений: 4593
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 15:19
только дибил типа тебя может ставить эксперименты на уровне:
"А вот если мы возьмем два яблока, и положим в корзину где есть еще одно яблоко -- это будет 10 яблок или 12 яблок?"

Цитата:
"а кто работает с методиками?"
те, кто хочет в ней разбираться (и может).

Ну вот и разобрались: методика твоя -- бредятина.
[Ответ][Цитата]
гость
94.25.191.*
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 16:07
у тебя вообще нет ни одной, молчал бы.
[Ответ][Цитата]
Павел Фоменко
Сообщений: 1081
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 16:07
Цитата:
Автор: Тарасов

По мере выполнения алгоритма распознавания, вероятность правильного определения границ объектОВ увеличивается.

Допустим.

Цитата:
Автор: Тарасов
Эта вероятность используется в качестве аргумента функции подбора шаблонов для распознавания каждого из объектОВ,...

И кто (что) же определит эту вероятность??? Кто/что будет сравнивать?
То есть, "по мере выполнения алгоритма" мы должны получать числовое значение вероятности, которое (значение) будем использовать как аргумент "функции подбора шаблонов..."
Ты понимаешь, что это бред сивой кобылы?
Пусть даже каким-то образом эта вероятность и определяется (подозреваю, что ты её предложишь определять площадью совпадения шаблона и элемента капчи - твой любимый XOR).
Вот есть вероятность 87% и 87,1% - она тебе укажет на то какой шаблон сейчас надо выбрать?
[Ответ][Цитата]
Corwin
Сообщений: 1324
На: распознавание кптчи Яндекса
Добавлено: 12 май 09 16:10
>те, кто хочет в ней разбираться (и может).

Ждемс готовых результатов Или больной как всегда сольет заявляя что получил то что хотел

>у тебя вообще нет ни одной, молчал бы.

Дайте угадаю. Больной, как всегда, под словом "методика" понимает что-то свое. И эта его "методика" для нормальных людей означает очередной бредопонос
[Ответ][Цитата]
 Стр.1 (7): [1]  2  3  4  5  ...  7След. > >>