GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.5 (22)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Конкуренция
Capt.Drew
Сообщений: 4179
На: Конкуренция
Добавлено: 18 авг 09 23:34
2 EGTP :: умудрились ли вы сохранить ваш мозг..?
или Бета-излучение навечно зачислило вас
в ряды Ветта-тестировщиков?
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 19 авг 09 1:53
Цитата:
Автор: Capt.Drew
Был у нас кыевлянин Александр Тумак (на Мембране)
Тумик и на Образце бывал. Интересный собеседник, но сильно занятой.

Цитата:
Автор: Павел Фоменко
этот способ исходит из АНАЛИЗА пикселов
Синтезировать совсем без анализа никак нельзя. Любой рецептор состоит из дискретных элементов, из которых мозг синтезирует некий пространственно детерминированный образ. Не говоря уже о знаниях. Прежде чем синтезировать новое знание нужно иметь набор дифференцированных знаний.

Цитата:
Автор: Павел Фоменко
пикселам изображения вы пытаетесь назначить некие взаимоотношения (почему-то связывая их закономерностью 1/R^2)
Взаимодействие очень простое. В линейной зависимости от расстояния точки пересылают друг другу "кванты движения".

Цитата:
Автор: Павел Фоменко
в расспознавании есть смысл перейти к другим взаимоотношениям и, соответственно, к другим пространствам

символ - это процесс создания символа

из способа "линия" мы можем перейти к способу "угол" или "дуга"
Уверен, что это самый правильный путь! Символ должен представляться в виде последовательности действий, необходимых и достаточных для его создания. Я планирую выявлять эту последовательность через выяснение связей, которые удерживают символ в целостности при внешних возмущающих воздействиях.
В сущности, восприятие - это тот же эффектор и не будь он способен координироваться с другими эффекторами он был бы не нужен.
Вспомнилось как дети рисуют букву "Е". В самом начале все дети рисуют много горизонтальных палочек, видимо потому что в "подпрограмме" (ритуале) для рисования этой бквы у них появляется действие - "рисуй палочки", но ещё не появляется действия - "прекращай рисовать палочки". В активации и торможении действий собственно и заключается вся координация, всё наше знание.

Цитата:
Автор: Slava
конфигурация это - не только структура
Структура - это следствие конфигурации. А конфигурация - это адресность взаимодействий и кванты взаимодействий. В этом смысле очень понравилась книжка Клименко А.В. "Рекуррентная теория самоорганизации".

Цитата:
Автор: Slava
подмена термина ничего в данном случае не дает
Если подмена термина позволяет понять, что восприятие - это эффектор - то даёт.

Цитата:
Автор: Slava
К сожалению, все - то же, но теперь с твердым знаком
Ладно, не мучайтесь
Да уж, хорош подарочек.. Но дело принципа! Там действительно была ошибка, даже не знаю как оно у меня работало. Если в этот раз не получится - спишем на мистику

Цитата:
Автор: Slava
Подозреваю, что чрезмерное упрощение задачи может вас сильно увести в сторону от желаемого
Я рассматриваю этот распознаватель просто как подготовку к чему-то более серьёзному и адекватному.

Собственно мой первый распознаватель рукописных печатных символов! За качество распознавания прошу сильно не бить, это всего-лишь игрушка.

Как работает программа.
При запуске открывается окно с белым квадратом - на нём можно рисовать. Можно загрузить символ из файла (кнопка "Open picture"). Кнопка "Reload" перезагружает файл или стирает картинку если файл изначально не был загружен.
После нажатия на кнопку "Do it" выполняется следующий алгоритм.
1. "Включается" взаимодействие между всеми точками буквы по типу притяжения.
2. Программа отслеживает момент скелетизации буквы и останавливает притяжение.
Типичная картина изменения плотности изображения буквы при притяжении выглядит так:

Первый существенный минимум - это скелетизация. Второй минимум - это сжатие в точку. Неудивительно, что буква сжимается в точку за два этапа. Интенсивность взаимодействия между более близкими точками больше, чем между более дальними. Поэтому процессы локального сжатия опережают процессы глобального сжатия.
Программа ищет минимум в диапазоне 6 последовательных замеров плотности. Справа в окошке можно видеть как меняется плоность буквы (первое число) и разность между текущей и предыдущей плотностью (второе число).
Конечно, есть более быстрые алгоритмы скелетизации, но здесь важно соблюсти чистоту идеологии - всё должно быть построено на едином принципе - взаимодействие, связь, движение.
3. Максимально скелетизированная буква отрисовывается и все её точки подвергаются взаимодействию типа "отталкивание".
4. Отталкиванию препятствует окружность, которая проведена из центра масс буквы до самого дальнего пиксела буквы. Можно видеть как точки "оседают" на этой окружности.
5. После того как остановится последняя точка, программа делит окружность на 100 секторов и подсчитывает число точек попавших в каждый сектор.
6. После этого программа последовательно сравнивает данное распределение плотности по окружности с 33 эталонами, поворачивая его вокруг центра масс с шагом 3,6°. Для каждого эталона запоминается минимальное отличие и угол, при котором оно было обнаружено.
Эталоны были созданы по такому же принципу - просто однократным применением алгоритма к символам, которые лично я посчитал идеальными
7. В окошке справа выводятся отсортированные сверху-вниз результаты распознавания. После буквы следует мера похожести (чем число меньше, тем больше буквы похожи) и угол на котором был получен минимум отличия.

Выводы.
1. Качество распознавания слабенькое из-за того, что скелетированная буква при разлёте испытывает накапливающееся влияние неоднородностей, что вызывает "эффект бабочки".
2. Использование эталонов - это не совсем честный приём. Желательно, чтобы программа сама строила классы изображений. Но для этого, имхо, нужно чтобы она делала это в процессе обучения, а не пытаясь разделить на классы полученное множество признаков. В идеале я вижу это так:
- есть некий базовый класс
- есть мера допустимого различия между классами
- есть первый образ. Первый образ всегда относится к первому классу.
- другие классы для поступающих образов создаются при превышении допустимого различия между ними и первым классом. Такой мерой может быть что-то вроде устойчивости класса.
3. Данный тип распознавания - это своего рода сравнение значений хэш-функций. Многие изображения могут давать одинаковую плотность распределения на окружности, но для некоторых букв оно даёт достаточную меру различия. Если посмотреть как сортируются буквы при распознавании, видно что они сортируются, в общем-то, по похожести между собой.
4. Замечено, что если буква распознана неправильно, то угол, определённый для верной буквы, обычно соответствует нарисованному. Это можно использовать для улучшения качества, если допустить, что правильно ориентированные буквы более вероятны.
[Ответ][Цитата]
Что-то разумное, типа чувака
Сообщений: 297
На: Конкуренция
Добавлено: 19 авг 09 5:31
Цитата:
Автор: Андрей

Выводы.
1. Качество распознавания слабенькое из-за того, что скелетированная буква при разлёте испытывает накапливающееся влияние неоднородностей, что вызывает "эффект бабочки".
2. Использование эталонов - это не совсем честный приём. Желательно, чтобы программа сама строила классы изображений. Но для этого, имхо, нужно чтобы она делала это в процессе обучения, а не пытаясь разделить на классы полученное множество признаков. В идеале я вижу это так:
- есть некий базовый класс
- есть мера допустимого различия между классами
- есть первый образ. Первый образ всегда относится к первому классу.
- другие классы для поступающих образов создаются при превышении допустимого различия между ними и первым классом. Такой мерой может быть что-то вроде устойчивости класса.
3. Данный тип распознавания - это своего рода сравнение значений хэш-функций. Многие изображения могут давать одинаковую плотность распределения на окружности, но для некоторых букв оно даёт достаточную меру различия. Если посмотреть как сортируются буквы при распознавании, видно что они сортируются, в общем-то, по похожести между собой.
4. Замечено, что если буква распознана неправильно, то угол, определённый для верной буквы, обычно соответствует нарисованному. Это можно использовать для улучшения качества, если допустить, что правильно ориентированные буквы более вероятны.


1. Я не пойму, а зачем вводить понятие "скелет буквы", вы сами написали что "слабое" распознавание, но аргументация, почему? очень расплывчатая.

2. Без эталонов ни туды, и ни сюды, это факт. НО как нужно строить эталоны?, и другой вопрос: эталоны чего нужно строить? Данные вопросы считаю важнейшими для первичного рассмотрения задачи.
Про классы изображений, обучение и т.д. слишком расплывчато.......
Че-нить по проще...

3. "окружности", вы правы идеале да окружность, но а если учитывать деформацию этой окружности?, что на самом деле необходимо.. Тут "не детская" математика намечается.

4. Угол?, неясно.... угол чего?: поворота, наклона, уточните..
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Конкуренция
Добавлено: 19 авг 09 6:30
2 Chuv..... Не хочетcя отсылать Андрея к Шамесу.. в середине духовного слияния со Славой.. Особенно пребывая в сомнениях в его познаниях в Теории Графов с 3-го курса тех-института!
[Ответ][Цитата]
ЭСГТР
Сообщений: 8451
На: Конкуренция
Добавлено: 19 авг 09 8:10
Цитата:
Автор: Capt.Drew

2 EGTP :: умудрились ли вы сохранить ваш мозг..?
или Бета-излучение навечно зачислило вас
в ряды Ветта-тестировщиков?

Канечно мой молодой и наивный друг....(дальше сами вставите что по душе, а то знаете ли....надо беричь ещё не устойчивую психику)
Когда я занимался автоматическим распознованием....Вы ещё пешком под стол ходили...
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Конкуренция
Добавлено: 19 авг 09 8:21
2 EGTP :: Уж не ровестник ли вы Первого Спутника ? ? ?
Но вы правы.. я с молоду был молод
- и первые 400 стр Ф.Розенблатта одолел к 7 ноября 1969г..
===> будучи практически грудным ии-младенцем
[Ответ][Цитата]
ЭСГТР
Сообщений: 8451
На: Конкуренция
Добавлено: 19 авг 09 8:34
Цитата:
Автор: Capt.Drew

2 EGTP :: Уж не ровестник ли вы Первого Спутника ? ? ?
Но вы правы.. я с молоду был молод
- и первые 400 стр Ф.Розенблатта одолел к 7 ноября 1969г..
===> будучи практически грудным ии-младенцем
Бедный Ф.Розенблатт, когда вы его одолевали ему наверно было туго.... ребёнок же.... Наверно он как и я, вынужден был Вас оберегать... Всякий серьёзный борец за истину обязан предвидеть что с ним в поединок может вступить ещё неокрепший практически грудной младенец.... и соответственно сделать в своём труде "островки безопасности..." Дабы неокрепший разум мог там отдохнуть.... Я Вам советую ещё пару раз почитать как подрастёте, найдёте для себя много нового.
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Конкуренция
Добавлено: 19 авг 09 8:47
2 EGTP :: Я вез эту черную книгу в эмиграцию..
но враги выкрали один из 10 чемоданов с книгами..
Так я лишился Френки.. Нет ли в рунете этого Текста?
[Ответ][Цитата]
ЭСГТР
Сообщений: 8451
На: Конкуренция
Добавлено: 19 авг 09 9:14
Есть такой Бот "Солеваров" на Айкоме он же 2w_ink
на ДхДу. Если на него правильно надавить...он что хочешь найдёт.... (Полезная штучка....)
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Конкуренция
Добавлено: 19 авг 09 9:38
Стыдно за Солеварова
- но я на Айкоме забанен по IP
- даже читать не могу ! ! ! ! !
[Ответ][Цитата]
ЭСГТР
Сообщений: 8451
На: Конкуренция
Добавлено: 19 авг 09 10:10
А чего стыдитесь? Нормальный ход...Боты вещь нужная и полезная.... Вы не смотрите что человекообразен... он находится в клетке своего IP, а потому не опасен (правда вирус по моему IP на сайт форума подцепил, если администратор узнает Боту не поздоровится мне то что, я технологию работы поменял и всё .... )...В инете от него пользы болье чем вреда. Пока действуют законы демократического общества всё хорошо, как только возникнет дектатура тогда плохо (а это проблема хозяев форума).... Но Интернету это я думаю не гразит...а всё остальное мелочи жизни........
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 19 авг 09 12:54
Цитата:
Автор: Что-то разумное, типа чувака
1. Я не пойму, а зачем вводить понятие "скелет буквы", вы сами написали что "слабое" распознавание, но аргументация, почему? очень расплывчатая.
1. Распознавание слабое потому, что деформация (которая приводит к инвариантному представлению) буквы представляет собой нелинейный процесс, на итоги которого (распределение плотности по окружности) сильно влияют начальные условия (кривизна буквы, отличие в углах и т.д.). Я написал "эффект бабочки", думал что этого достаточно.
2. Скелетирование я специально не вводил, просто наблюдал за тем, как деформируются буквы и заметил, что в момент скелетирования (слово такое есть) неоднородности по толщине линий исчезают по всей площади буквы одновременно. Этим и воспользовался для приведения толшины линий всех букв к более-менее единому значению.

Цитата:
Автор: Что-то разумное, типа чувака
2. Без эталонов ни туды, и ни сюды, это факт. НО как нужно строить эталоны?, и другой вопрос: эталоны чего нужно строить? Данные вопросы считаю важнейшими для первичного рассмотрения задачи.
В данном топике главной целью является построение не просто самого лучшего распознавателя, а идеологически самого верного распознавателя. Т.е. такого, который будет работать по принципам, близким к тем, которые используются человеком. С этой точки зрения у человека нет графических эталонов букв, у него есть (вероятнее всего) эталоны создания букв, эталоны "технологических" процессов. Вот эти эталоны было бы интересно обсудить.

Цитата:
Автор: Что-то разумное, типа чувака
Про классы изображений, обучение и т.д. слишком расплывчато.......
Че-нить по проще...
Ну это вообще универсальный подход, просто описал его не детально, а в двух словах. Класс - это абстракция, некое подмножество, заданное своими границами или другим способом, позволяющим отнести объект к классу. Любой объект может попадать либо в один, либо в другой класс либо в n-ый класс. Я предложил генерировать эти классы по ходу обучения, так, чтобы, например, впервые встретив образ "+" программа отвела для него отдельный ("далёкий") класс и при распознавании буквы, например, "О" выдавала для "+" очень низкую вероятность сходства.
В приведённом макете классами являются фактически уровни плотности точек на окружности. И эти "классы" создавались "топорно", без учёта уже созданных классов.

Цитата:
Автор: Что-то разумное, типа чувака
3. "окружности", вы правы идеале да окружность, но а если учитывать деформацию этой окружности?, что на самом деле необходимо.. Тут "не детская" математика намечается.
Зачем окружность деформировать? В этом макете (может быть даже всегда) она единственный оплот инвариантности. Если заметили, распознавание инвариантно к месторасположению, повороту и размеру именно благодря окружности.

Цитата:
Автор: Что-то разумное, типа чувака
4. Угол?, неясно.... угол чего?: поворота, наклона, уточните..
Угол поворота относительно центра масс.

Цитата:
Автор: Capt.Drew
я на Айкоме забанен по IP
- даже читать не могу !!!!!
Попробуйте удалить Айкомовские куки, может поможет

Цитата:
Автор: ЭГТР
как только возникнет дектатура тогда плохо
Уважаемые участники, прошу сильно не флудить и не оффтопить. Совсем не хочется быть диктатором, но в топиках хочется видеть сообщения хоть сколько-нибудь коррелирующие с их названием. Спасибо.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 19 авг 09 13:00
ЭГТР 18 авг 09 22:02
[...В годы моей молодости на обслуживаемом мною читающем автомате "Рута 701"...]

Оооо, какие слова я слышу!!!
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Конкуренция
Добавлено: 19 авг 09 13:27
Андрей 19 авг 09 1:53
[...Структура - это следствие конфигурации. А конфигурация - это адресность взаимодействий и кванты взаимодействий. В этом смысле очень понравилась книжка Клименко А.В. "Рекуррентная теория самоорганизации"...]

ОК, если это поможет. Книжку не видел. Погляжу, если есть в сети. Спасибо

[...Если подмена термина позволяет понять, что восприятие - это эффектор - то даёт...]

Активное восприятие - действительно главное. Ведет ли ваша интуиция к этому, пока неясно. Но интересно

[...Да уж, хорош подарочек.. Но дело принципа! Там действительно была ошибка, даже не знаю как оно у меня работало. Если в этот раз не получится - спишем на мистику...]

Мистика - это нормально. Позже погляжу. Спасибо

[...Я рассматриваю этот распознаватель просто как подготовку к чему-то более серьёзному и адекватному...]

Смущает меня несколько первый шаг. Был такой Файн. Пока не стоит смотреть. Но он тоже строил распознавание на оценке сложности преобразований

[...Собственно мой первый распознаватель рукописных печатных символов! За качество распознавания прошу сильно не бить, это всего-лишь игрушка...]

От души рад за вас. По-моему, ничего более увлекательного, чем изобретение распознавалок попросту не существует. Разве что - изобретение вечного двигателя

[...1. "Включается" взаимодействие между всеми точками буквы по типу притяжения.
2. Программа отслеживает момент скелетизации буквы и останавливает притяжение...]

Хорошая идея. А как, по-вашему, насколько интересна для распознавания получаемая так кривая

[...Первый существенный минимум - это скелетизация. Второй минимум - это сжатие в точку. Неудивительно, что буква сжимается в точку за два этапа. Интенсивность взаимодействия между более близкими точками больше, чем между более дальними. Поэтому процессы локального сжатия опережают процессы глобального сжатия.
[...Конечно, есть более быстрые алгоритмы скелетизации, но здесь важно соблюсти чистоту идеологии - всё должно быть построено на едином принципе - взаимодействие, связь, движение...]

А как же разница между близким и далеким? - стоит ли столь строго придерживаться неясной идеи

[...3. Максимально скелетизированная буква отрисовывается и все её точки подвергаются взаимодействию типа "отталкивание".
4. Отталкиванию препятствует окружность, которая проведена из центра масс буквы до самого дальнего пиксела буквы. Можно видеть как точки "оседают" на этой окружности...]

Очень вырожденное отображение. Еще натерпитесь

[...5. После того как остановится последняя точка, программа делит окружность на 100 секторов и подсчитывает число точек попавших в каждый сектор.
6. После этого программа последовательно сравнивает данное распределение плотности по окружности с 33 эталонами, поворачивая его на 3,6°. Для каждого эталона запоминается минимальное отличие и угол, при котором оно было обнаружено.
Эталоны были созданы по такому же принципу - просто однократным применением алгоритма к символам, которые лично я посчитал идеальными
7. В окошке справа выводятся отсортированные сверху-вниз результаты распознавания. После буквы следует мера похожести (чем число меньше, тем больше буквы похожи) и угол на котором был получен минимум отличия...]

Если и здесь вы тоже позволите себе поизобретать, то тоже много раз порадуетесь. Рад за вас

[...1. Качество распознавания слабенькое из-за того, что скелетированная буква при разлёте испытывает накапливающееся влияние неоднородностей, что вызывает "эффект бабочки"...]

Проецирование - сильная вещь. Наплачетесь, но и вызовинтеллекту тоже замечательный

[...2. Использование эталонов - это не совсем честный приём. Желательно, чтобы программа сама строила классы изображений. Но для этого, имхо, нужно чтобы она делала это в процессе обучения, а не пытаясь разделить на классы полученное множество признаков. В идеале я вижу это так:
- есть некий базовый класс
- есть мера допустимого различия между классами
- есть первый образ. Первый образ всегда относится к первому классу.
- другие классы для поступающих образов создаются при превышении допустимого различия между ними и первым классом. Такой мерой может быть что-то вроде устойчивости класса...]

Тут куча возможностей для саморазвития. Искренне рад за вас. Удачи

[...3. Данный тип распознавания - это своего рода сравнение значений хэш-функций. Многие изображения могут давать одинаковую плотность распределения на окружности, но для некоторых букв оно даёт достаточную меру различия. Если посмотреть как сортируются буквы при распознавании, видно что они сортируются, в общем-то, по похожести между собой...]

Ключеове слово - похожесть!

[...4. Замечено, что если буква распознана неправильно, то угол, определённый для верной буквы, обычно соответствует нарисованному. Это можно использовать для улучшения качества, если допустить, что правильно ориентированные буквы более вероятны...]

Ага...
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Конкуренция
Добавлено: 19 авг 09 14:10
Цитата:
Автор: Slava
Активное восприятие - действительно главное
+10!

Цитата:
Автор: Slava
как, по-вашему, насколько интересна для распознавания получаемая так кривая
Интересна. Но проверить в коде все идеи просто не хватит времени, поэтому отбираю только самые перспективные. Я хочу, чтобы распознаватель давал очень большой рзброс по похожести. Например, "Е" похожа н "Ш" - 60%, а на "О" - 5%. Приведённая кривая такого разброса не даст.

Цитата:
Автор: Slava
А как же разница между близким и далеким?
Здесь - самая обычная - в Эвклидовом пространстве. Более близкие точки притягиваются сильнее.

Цитата:
Автор: Slava
Очень вырожденное отображение. Еще натерпитесь
Проецирование - сильная вещь. Наплачетесь
Развития у этого распознавателя не предполагается. Исходные коды в архиве, кому интересно - можно продолжить. Там ещё явно есть резервы для эволюции, просто они не укладываюстя в мою идеологию.

Цитата:
Автор: Slava
Ключеове слово - похожесть!
Надеюсь продолжение получит идея Павла, в части определения похожести, как похожести действий по написанию букв.
[Ответ][Цитата]
 Стр.5 (22)1  2  3  4  [5]  6  7  8  9  ...  22<< < Пред. | След. > >>