GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.3 (10)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Вот вам над чем подумать, реализован концепт новой технологии
dr_dax
Сообщений: 44
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 13:12
При перестановке слов, хешь будет отличен, просто изменится рейтинг. Отличие нашего с позволения сказать Хеша от математического в том, что при схожести текстов, эта величина меняется незначительно. Технически, у разных по смыслу текстов из-за многомерности связей, Хеши совпасть не могут в принципе.
Связей немало, при тысячах текстов, их миллионы. Но чем больше мы читаем. тем меньше образуется новых связей и образов.
по поводу перевода всяких выражений: Они уникальны в каждом языке, и являются целыми понятиями. Но наша программа в будущем, уверен сможет найти схожее понятие и выдать его в качестве перевода. Терпение, вероятно перевод, будет следующим этапом, и через пару месяцев все получат возможность потестировать и это.
[
Ответ
][
Цитата
]
гость
94.25.182.*
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 15:42
"я утверждал, что нет необходимости связыывать синонимы. В итоге мы их не связываем между собой, но тем не менее, благодаря особой структуре хранения и взаимосвязей они остаются синонимами и словами близкими по значению и смыслу."
синоним, это объект стоящий просто в другой ветви видового классификатора. А связывать их на данном этапе разработки нецелесообразно. Просто такая система не сможет делать аналогий и идентифицировать их, вот и все.
"Повторюсь, природа информации такова, что можно анализировать все что угодно - слова, звуки, иероглифы, на любом языке и увязывать их в смысл."
природа информации (смысла) такова, что это и есть координата в БД.
[
Ответ
][
Цитата
]
гость
94.25.182.*
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 16:03
"Формируем образы этих символов если их до этого небыло, одновременно с эти формируем образы слов, словосочитаний, иногда предложений. Все это делается по определенному алгоритму - это ноу хау."
не образы, а сходимости, и рассматриваете множество этих сходимостей, которые потом и скармливаете эталонным текстам. В случае мах совпадений идентифицируете смысл с некоторой вероятностью, обратно пропорциональной сходимости.
читаем далее
"4. в результате прочтения получаем некий набор информационных единиц, которые были активированы при прочтении этого текста их может быть и мало и немного, но они уникальны."
угу
"Каждому тексту соответствует последовательность этих информационных единиц"
имеющих четкие координаты в видовом классификаторе. Собсно, это и есть ЛГ.
", мы их между собой обзываем нейронами. Это что то вроде ХЕШа текста" это называется СМЫСЛ для данной системы.
Такой же алгоритм хранения мыслеформ и я предлагал, но данер и корвин в нем ничего нового не обнаружили. бгааааа.
", его мы сопоставляем сименем файла."
это называется индексацией.
"Причем уникальность его в том, что прочтя этот текст из синонимов (при хорошем предшествующем обучении)мы получим тот же ХЕШ."
не тот же, а сходный по сходимостям и имеющий совершенно другие координаты.
"как сделан поиск тоже сказать не могу, т.к. задача сравнения этих Хешей - образов текстов очень хитрая."
ничего хитрого. фотометод. сравниваются координаты на перцептроне. Зоны совпадения выделяются и сравниваются в следующей итерации.
"перевод с русского на англ.: Грузим словарь, при этом прога создает образы и соответствующие русским и английским словам и соответствующие им Хеши"
так и надо, я тоже так предлагал, но с английским и русским переводами у меня возникли проблемы из за разных структур ЛГ (правила разные).
"Затем просто читаем много английских текстов, желательно по нужной нам тематике.
Прога формирует их Хэши, но и вместе с тем перекрестные связи между образами и словами англ. текстов."
здесь инвестора ждет засада. Качество перевода будет низким (хотя и много лучшим, чем промт).
"затем подаем русский текст. прога активирует одновременно англ. и русские слова (как это сделано,тоже тайна
берутся просто эти самые хэши, как вы их называете (смысл).
, но в этом секрет ошибкоустойчиваости программы), при этом получаем образ-ХЕШ какого-то английского текста (замечу в памяти его нет, но зато у нас есть отлаженый алгоритм восстановления текста из его образа (тоже тайна).
здесь не тайна, а засада, сам решить пока не могу.
"Вот и все...
Все эти возможности по отдельности оттестированы, нужно время собрать все это в кучу. Потому и ищу интересного инвестора. Мы уже не справляемся."
молодцы.
[
Ответ
][
Цитата
]
гость
94.25.182.*
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 16:15
"Но наша программа в будущем, уверен сможет найти схожее понятие и выдать его в качестве перевода."
поскольку вы опираетесь только на сходимости, то вы это качественно не сделаете, пока не объедените 2 разных иерархии ЛГ. Интерфейс нужен. преобразование координат из одной системы в другую. Вы столкнетесь с отсутствием матаппарата для подобных операций, более того, вы столкнетесь с АКСИОМАТИЧЕСКИМИ проблемами в матаппарате...
придется делить и умножать на ноль (которым и будет система интерфейса по отношению к 2-м имеющимся системам). Т.е. система перехода как бы математически является нулевой, объединяющей обе системы.
http://www.liveinternet.ru/users/tar729/post92076207/
вперед ребята!
как корректно делать такие преобразования я знаю.
[
Ответ
][
Цитата
]
Corwin
Сообщений: 1324
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 16:31
С таким подходом Вам найти инвесторов вряд ли удастся. Между тем что Вы продемонстрировали в своей программе и тем что Вы рассказываете целая пропасть. Фактически сейчас у Вас в программе просто дается оценка файлам на основании сравнения их содержимого с запросом. На сегодня подобных программ есть довольно много, и вряд ли Ваша может претендовать на какое либо ноухау.
Также если ваши файлы для поиска (из директории программы) слепить в один файл, то Ваш поиск вообще оказывается бесполезным.
И неужели так сложно дать несколько примеров где Ваша разработка показывает наиболее интересные результаты? Я не прошу у Вас алгоритм создания, синонимов, просто продемонстрируйте файлы обучения в результате которых программа обучается какимто синонимам. Если конечно Вы вообще не вводите синонимы вручную.
Кстати в документации Вы указывали что подобный метод хранения информации более компактен нежели простое хранение текстов - но если Вы используете подобную таблицу для хранения каждого символа, то Ваша БД уже будет занимать больше места чем обычный текстовый файл.
[
Ответ
][
Цитата
]
dr_dax
Сообщений: 44
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 16:42
гость,Признаюсь, очень близко на 70% наверное, и примерно на 80% как я думал в самом начале когда начали делать. Оставшиеся % отведу на ньюансы. Приятно, что не один до такого додумался, а то год назад на одном форуме меня гавняли как могли, разве что к умолишенным не причисляли. Но так как описано работать не будет, мы это пробывали в самом начале. Уточню, у нас сравниваются не зоны совпадения, так тоже работать не будет, пробывали. Вернее будет, но в очень ограниченных условиях и при очень маленьком кол-ве текстов. Способ действительно хитрый. И секрет именно в востановлении текста из образа. Кстати ничего сложного в этом нет, у нас как-то почти сразу получилось восстанавливать во вполне читаемой форме. Что и позволяет предполагать хорошее качество переводов.
А так, желаю успехов на этом поприще.
[
Ответ
][
Цитата
]
dr_dax
Сообщений: 44
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 17:07
Цитата:
Автор: Corwin
И неужели так сложно дать несколько примеров где Ваша разработка показывает наиболее интересные результаты? Я не прошу у Вас алгоритм создания, синонимов, просто продемонстрируйте файлы обучения в результате которых программа обучается какимто синонимам. Если конечно Вы вообще не вводите синонимы вручную.
Кстати в документации Вы указывали что подобный метод хранения информации более компактен нежели простое хранение текстов - но если Вы используете подобную таблицу для хранения каждого символа, то Ваша БД уже будет занимать больше места чем обычный текстовый файл.
По поводу размера памяти, напоминаю, у нас сейчас исследовательский проект, цель которого не оптимизация, а проверка идей. Все проверим, дойдем до оптимизации. Там много чего оптимизировать надо. К примеру версия что выложена далеко не лучшая, там качество поиска ну так себе в сравнении с той, что есть еще. Но другая версия работает раз в 10 медленнее, что как-то стремно выкладывать для тестов.
И мы ведь тут об искусственном интеллекте говорим, верно?
Можете сделать следующее.
Создайте несколько файлов инструкциями, например:
1. Файл с именем "Поднять руку", файл с именем "Поднять ногу" и т.п. т.е. файлы с действиями.
2. В каждом файле напишите инструкцию какие действия должны ассоциироватся с данным файлом.
3. Загрузите еще побольше текстов по любой другой тематике.
4. Теперь можете задавать нечеткие команды соотв каждому файлу и получать его имя, т.е. действие.
ну и еще пример, у нас там есть текст:
********
Австралийский хирург использовал шарик для пинг-понга в ходе осложнившейся операции по пересадке печени двухлетней девочке. Это позволило успешно закончить вмешательство и сохранить ребенку жизнь.
Макензи Аргэт (Mackenzie Argaet) из Канберры родилась с редким (один случай на 10-12 тысяч новорожденных) пороком развития - атрезией желчных путей. При этом состоянии желчные протоки печени не соединяются с двенадцатиперстной кишкой, а заканчиваются слепо, что приводит к застою желчи и, как следствие, печеночной недостаточности. В результате этого девочке понадобилась пересадка печени.
Когда хирург Альберт Шан (Albert Shun) из Детской больницы в Вестмиде поместил фрагмент печени взрослого донора в брюшную полость девочки, оказалось, что трансплантат чересчур велик и пережимает крупные кровеносные сосуды. Тогда хирург, ранее слышавший о применении за рубежом шариков для пинг-понга при операциях, решил использовать их в трансплантологии. Он отгородил шариком новую печень от сосудов девочки, восстановив нормальный кровоток.
По словам Шана, со временем шарик обрастет печеночной тканью, удалять его необходимости нет. Восстановительный период после операции прошел без осложнений, к настоящему времени Макензи полностью выздоровела. Вдохновленные успехом, Шан и его коллеги успешно использовали шарики для пинг-понга еще в нескольких операциях.
********
Так вот на запрос "австрийский нехеровый шарики пользовал для печени", этот текст
Выходит на 1-3 место (при еще 1000 текстах в базе). Думаю, что человек решил бы точно также?
А спросите тоже самое у гугла или еще где-то. Вы видимо не видите одной детали. Моя система дает ответ тем вернее, чем больше вы опишете в своем запросе, а любой поисковик - наоборот. Эта пропасть между тем что у нас и тем что у них, - огромна.
[
Ответ
][
Цитата
]
Corwin
Сообщений: 1324
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 17:35
>По поводу размера памяти, напоминаю, у нас сейчас исследовательский проект, цель которого не оптимизация, а проверка идей.
Я ничего не имею против и прекрасно Вас понимаю. Просто Ваша документация расходиться с Вашей рабочей моделью.
В остальном если честно то не вижу ничего нового. Сам несколько раз писал нечеткий поиск фраз по тексту и видел несколько похожих программ, так что ничего принципиально нового здесь нет.
Относительно инет поисковиков - при таких количествах информации которую они хранят использование посимвольного нечеткого поиска крайне не желательно, поскольку он довольно ресурсозатратный. И Гугл как и большинство поисковиков вполне способны выделить те странички на которых было обнаружено наибольшее количество слов.
[
Ответ
][
Цитата
]
Павел Фоменко
Сообщений: 1081
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 17:41
Цитата:
Автор: Тарасов
...
Фантазёр
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 17:42
QUOTE Автор: dr_dax
То что есть совпадение с тем что гость(тарасов) вам пишет и вашей работой, скорее минус.
вот когда вы думали как он, вас и представляли как умолешенного (вы же еще наверняка и спорили, когда вам говорили, что это работать не будет), каким тарасов и является. Поздравляю (совершенно серьезно) что вы наконец взялись за ДЕЛО, что уже отдалило вас от тарасова как минимум на 30%.
Цитата:
И мы ведь тут об искусственном интеллекте говорим, верно?
Можете сделать следующее.
Создайте несколько файлов инструкциями, например:
1. Файл с именем "Поднять руку", файл с именем "Поднять ногу" и т.п. т.е. файлы с действиями.
2. В каждом файле напишите инструкцию какие действия должны ассоциироватся с данным файлом.
3. Загрузите еще побольше текстов по любой другой тематике.
4. Теперь можете задавать нечеткие команды соотв каждому файлу и получать его имя, т.е. действие.
Хм... интересный подход использования ТехтМининг и Инф.Рет. для контроля.
весьма интересно!!!
надо будет над этим подумать..... занятно.
Цитата:
Так вот на запрос "австрийский нехеровый шарики пользовал для печени", этот текст
Выходит на 1-3 место (при еще 1000 текстах в базе). Думаю, что человек решил бы точно также?
А спросите тоже самое у гугла или еще где-то. Вы видимо не видите одной детали. Моя система дает ответ тем вернее, чем больше вы опишете в своем запросе, а любой поисковик - наоборот. Эта пропасть между тем что у нас и тем что у них, - огромна.
А зря вы думаете, что другие алгоритмы хуже с этим справятся. Надо еще посмотреть какие еще были тексты в той базе. В этой области, сравнение результатов само по себе -- есть проблема (на полном серьезе, целые научные работы пишут только о том, как же правильно результаты сравнивать).
Хорошо, что у вас алгоритм дает такой результат, но... как Corwin заметил, это не говорит о том, что это лучший результат (или вообще выше среднего).
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 17:47
Цитата:
Автор: Corwin
... И Гугл как и большинство поисковиков вполне способны выделить те странички на которых было обнаружено наибольшее количество слов.
Хочу заметить, что это не совсем правильно, когда имеется ввиду "наибольшее количество"="то что нужно". Надо еще учитывать длину документа, причем, чем длинна меньше тем лучше. Ну сами подумайте, если вы ищите стихотворение "Я помню чудное мгновенье" и есть два варианта: 1) брошюра только с этим стихом и 2) большая энциклопедия, где не смотря на присутствие большей части (или вообще всего) этого стиха есть еще куча мелких совпадений разных фраз.
Я думаю понятно, что в данной ситуации предпочтительнее первых вариант.
[
Ответ
][
Цитата
]
dr_dax
Сообщений: 44
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 18:10
Давайте наберемся терпения, на след неделе будет виндовая версия. Просто мы обсуждаем все пока с моих слов, я так понял никто с этого форума прогу еще не опробывал. Попробуете, поиграетесь и зададите вопросы.
Ну и отвечая на вопрос о стихотворении, вероятнее всего оно и будет вверху. Тут все зависит от очень многих факторов.
И это, ну что вы блин тут друг друга чмырите? Попали бы вы ко мне на сайт, я бы вас сразу для профилактики забанил
Уверен, неправы мы все, абсолютного знания несуществует, равно как и абсолютного заблуждения. Но чем чем более частностей охватывает знание, тем дальше оно от заблуждений.
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 18:58
Цитата:
Автор: daner
вы наконец взялись за ДЕЛО, что уже отдалило вас от тарасова как минимум на 30%.
ой, не могу - теперь будем измеряться в процентах от Тарасова
Думаю бы Тарасову взяться бы за дело - тоже отдалился бы от себя
[
Ответ
][
Цитата
]
tac
Сообщений: 2601
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 19:02
Цитата:
Автор: dr_dax
И это, ну что вы блин тут друг друга чмырите?
Да, не - у нас тут здоровая критика
[
Ответ
][
Цитата
]
гость
94.25.174.*
На: Вот вам над чем подумать, реализован концепт новой технологии
Добавлено: 21 май 09 19:09
не забывайте, Тарасов полез в науку 3 года назад, а до этого писал сказки на удаве...
так что не вам оценивать мой вклад и мои аналитические способности, и тем более методики получения знаний (мое ноу-хау). К формату записи смысла я пришел еще год назад, ежли не ошибаюсь, а общего времени, потраченного на эту тему измеряется ровно в количествами постов на эту тему в тот период, т.е. порядка 40 часов примерно. Я же без вас дураков не могу думать и синтезировать. Вся моя деятельность на форуме, это 90% гавкания с вами, дибилами, так что реально, на эту тему я потратил 4 часа...
Вот ради этих 4-х часов работы моего мозга с максимальным КПД, я и присутствовал на форуме в тот период. Мои теперешние интересы несколько иные, и будьте уверены, КПД то же...а вы как были идиотами, так и остаетесь. Я использую не ваш ум, а именно вашу тупость, потому что только дибил может задать те вопросы, которые умному никогда не придут в голову. Вот я вас тут и держу за таких дебилов, а ваше мнение на этот счет меня никогда не волновало...
[
Ответ
][
Цитата
]
Стр.3 (10)
:
1
2
[3]
4
5
6
7
...
10
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net