GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.3 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:01
Вот одна интересная цитата из какого-то поста на форуме. Она по аналогии может относиться и к тому, как анализируются слова и в звуковом варианте.

"По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт
занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы
преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь
в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм.
Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по
отдльенотси, а все солво цликеом. "

С объяснением причин этого явления я конечно не согласен, но это уже другая история.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:16
Цитата:
Автор: rrr3
Все конечно красиво, НО возникает в моей голове три вопроса:

Отвечу, как я это понимаю. Понимание очень сложно донести. Вот Tester64 не любит многословие. Он любит конкретику. А вы не видите в моих общих размышлениях конкретики. И это нормально.
Вы, как и многие наверно убеждены, что не ответив на вопрос что такое ИНТЕЛЛЕКТ, нечего со свиным рылом да в калашный ряд... (многословие) Прости, Testеr64!
А я приведу пример из жизни. Человек удобряет почву, поливает, сажает саженцы. Тема майская! И... вырастает помидор. Человек создает условия для роста, а как этот рост происходит в семечке... в саженце...в плоде.. он до конца не знает. По вашему, мы никогда бы помидором и не закусывали, а все бы думали да гадали, а что такое помидор?
Так и интеллект. У каждого он есть. Это помидор еще надо пойти да купить, да хороший не ГМИ... А интеллект вот он... в голове...
Надо моделировать условия, в которых может вырасти помидор... пардон, интеллект.

Ваше "на закуску"
"Этих алгоритмов в голове образуется множество, образно говоря, на разные ситуации, даже на разные слова, и от разных источников звука и т.д"
Это ключевой момент, я о нем талдычу многожды и буду это делать с упорством китайского земледельца. Алгоритмов конечное число! Необходимое и достаточное для непрерывного роста помидора. Сложность в структуре, которая должна вырастать. Сложность - это количество уровней иерархии памяти. А вот каков этот необходимый и достаточный набор - предмет исследований.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:17
Изменено: 28 окт 13 5:37, автор изменений: Kek
del
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:23
Изменено: 28 окт 13 5:37
del
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:30
Изменено: 28 окт 13 5:38, автор изменений: Kek
del
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:34
Изменено: 28 окт 13 5:38
del
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:37
Цитата:
Автор: Kek
...Надо моделировать условия, в которых может вырасти помидор... пардон, интеллект.

В части надо "моделировать" и интеллект еще должен "вырасти" (даже у новорожденного) - вопросов нет, согласен. Другое дело - что понимается под "условия"...

Вы же знаете что такое помидор, это аналогично тому, что Вы знаете что такое интеллект. Не зная что такое помидор вырастить его Вы бы не смогли, замучились семена выискивать! И Вы правы, необходимо вначале выяснить что такое Интеллект на достаточном уровне (не выясняя, что такое отдельная мысль).

Цитата:
... Сложность в структуре, которая должна вырастать. Сложность - это количество уровней иерархии памяти. А во каков этот необходимый и достаточный набор - предмет исследований.

1. "набор" - это что? Набор чего?
2. Может ли сложность заключаться только в количестве уровней, при условии того, что ""Этих алгоритмов в голове образуется множество, образно говоря, на разные ситуации, даже на разные слова, и от разных источников звука и т.д" .Это ключевой момент, я о нем талдычу многожды и буду это делать с упорством китайского земледельца."
Нет ли такой ситуации, что в одних случаях уровни (иерархии) будут одни в других иные, т.е. в состоянии перманентного переплетения?
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 1:47
Цитата:
Вот Tester64 не любит многословие. Он любит конкретику.
Спасибо за понимание. Было время, я тоже много размышлял над осознанием, пониманием, корнем вопроса... короче искал "Главный вопрос жизни, вселенной и всего такого". Но и тогда я НЕ использовал СТОЛЬКО абзацев для отображения одной фразы как rrr3.

Цитата:
Вы, как и многие наверно убеждены, что не ответив на вопрос что такое ИНТЕЛЛЕКТ, нечего со свиным рылом да в калашный ряд...
Я считаю что в ветке, где название включает "Инструментарий" и "эксперимент" по обычной технологии распознавания ФОНЕМ речи не стоит поднимать регулярный вопрос "что такое ИНТЕЛЛЕКТ?". И вообще этот вопрос уже давно пора загнать в оффтопик или в риторические! Обсуждаются в первую очередь вопросы технические, а во вторую алгоритмы распознавания, но не "философия бытия повлиявшая на возникновение вопроса что важнее первое или второе".

Цитата:
...Это помидор еще надо пойти да купить, да хороший не ГМИ... А интеллект вот он... в голове...
Надо моделировать условия, в которых может вырасти помидор... пардон, интеллект.
Сначала надо делать "условия" - создать десятки инструментов более высокого уровня, а уж потом расчитывать что на них можно будет построить более сложные механизмы приближающие нас к мечте...

Цитата:
Алгоритмов конечное число! Необходимое и достаточное для непрерывного роста помидора. Сложность в структуре, которая должна вырастать. Сложность - это количество уровней иерархии памяти. А во каков этот необходимый и достаточный набор - предмет исследований.
Во-во! Только отладив большую часть механизмов/алгоритмов можно будет безпопасно (без зависания) придумывать необычные коомбинации этих алгоритмов или даже придумать что-нибудь новое.

Цитата:
Либо использовать современные средства типа SAPI5, либо делать что - то свое, в рамках представленного подхода. Я бы предпочел свое. И здесь поле для сотрудничества и совместной работы.
Здесь я с Вами полностью солидарен - SAPI не дает и 10той части возможностей и нужной скорости. Это скорее гонка за модой или желание закончить и сдать проект в рекордные сроки. А для совместной работы... Вам прийдется внести кое-какие изменения в проект. Большую часть я уже перечислил - нарежте функционал на модули. Так проще отлаживать, искать баги, добавлять "фишки". Особенно коллективом. Еще советую при нарезке вводить процедурно/функциональный подход между модулями. Это поможет безопасно нарезать блоки на DLL-библиотеки и дать возможность разрабатывать свои "замены" библиотек на других языках. Когда-то делал опрос - Делфи не достаточно популярен даже здесь. Я сам работаю на Делфи2009 ради юникода и отладку предпочел проводить в своей родной среде, тестируя в Делфи7 только перед возвратом в коллектив разработчиков. В идеале советую разработать нечто вроде своего API орентированного ИСКЛЮЧИТЕЛЬНО на отладку алгоритмов распознания - некий набор отладочных процедур и функций возвращающих готовые для обработки левыми алгоритмами буферы или потоки содержащие разные уровни/слои абстракции звука - набор уровней, набор частот, производные уровней, производные частот...
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 2:10
Цитата:
Автор: rrr3
Другое дело - что понимается под "условия"...
Нет ли такой ситуации, что в одних случаях уровни (иерархии) будут одни в других иные, т.е. в состоянии перманентного переплетения?


Вот здесь вы забегаете вперед. Я не знаю. В статье я на практическом примере показал как построить всего-навсего только один уровень памяти и немного сказал о том, как построить следующий.
Условиями будет то обстоятельство, что, 3-х уровневая система будет распознавать и накапливать новизну. А вы можете представить себе сейчас какой будет объем этой трех-уровневой памяти? Я не могу. Только эксперимент. И я не исключаю, что все это заткнется. Уже сейчас у кого-то просто глючит моя программа. Вот когда 3-хуровневая система будет показывать устойчивую работу, тогда можно будет говорить об оптимизации условий ее существования, о перекрещивании уровней и т.д.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 2:21
Цитата:
Автор: Tester64
Еще советую при нарезке вводить процедурно/функциональный подход между модулями. Это поможет безопасно нарезать блоки на DLL-библиотеки и дать возможность разрабатывать свои "замены" библиотек на других языках.

Я не знаю всего. Я плохой программер, есть люди, которые знают Дельфи лучше меня, хотя я работаю на нем еще с первой версии. Поэтому ваши несомненно правильные советы, в плане организации проекта, я не смогу осуществить. Я не знаю как работать с DLL.
Проект открытый, каждый может взять его и использовать в том понимании, в каком он силен.
Я же наметил себе дальнейший путь. И буду пока его осуществлять в том стиле (а его у меня нет) программирования в каком работаю более 20-лет.
Вот эти конкретные шаги:
1. Второй уровень памяти с двумя кадрами. Научиться их сортировать и сравнивать.
2. Затем много - много говорить в микрофон. И вот здесь эта чертова SAPI5 поможет. Пусть девка трындит... или мужик Николай. А я им напишу в тексте слова, какие считаю нужными.
3. Оценить объем памяти второго уровня. Почесать репу... если все будет устойичиво, то третий.
4. Но может уже после второго уровня подумать об оптимизации памяти, О ЗАБЫВАНИИ! О свертках о корреляционном сравнении и посмотреть как оно уменьшает память и какие при этом ошибки в оценке похожести.
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 9:45
Цитата:
Я не знаю как работать с DLL.
Это довольно просто! Если проект пойдет, я помогу...

Цитата:
2.
Грамотнее научиться работать с wav/mp3.
Цитата:
3. 4.
Сначала уберите глюки и потратьте время на НАДЕЖНОСТЬ системы. Моя программа в свое время несколько месяцев тихо себе аудиографики рисовала (несколько видов) от малейших шумов моих или/и (выбираемо) в компьютере. Если мешала, сворачивал в часы и она рисовала маленький график в часах... И то надежность и качество FFT меня не устроила для понимания НА ЧТО (какие данные) кидать распознавалку. Не успел доделать ПОЛЗУНОК для быстрой смены качества записи (процессор быстро жрало). Застрял на OpenGL когда пытался нарисовать 2 3D графика полупрозрачным вращающимся с вложением (видно у какого уровень больше или меньше и где)



Конечной целью было НАГЛЯДНО сравнить ФФТ графики двух фонем. Если бы я ГЛАЗАМИ смог бы найти сходство, то тогда уже имело бы смысл распознавалку набрасывать на поисх "подобных признаков" как сходство фоток или лиц на фотках... Но подводило качество ФФТ, скорость отрисовки, физическое ограничения на количество квадратов на мониторе (очень плотное не удобно изучать).
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 9:54
Цитата:
Автор: Tester64
Сначала уберите глюки и потратьте время на НАДЕЖНОСТЬ системы.

Делаю...
[Ответ][Цитата]
ЭСГТР
Сообщений: 8449
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 08 май 13 11:22
Цитата:
Автор: Kek


Вы абсолютно правильные вещи говорите. Я выдал на гора только предварительную работу. В перспективе нужна обратная связь по голосу. Система должна иметь возможность говорить свой паттерн и, слаша этот свой поток, опять запихивать в распознавалку. Но. Здесь технический вопрос. Как это сделать. Либо использовать современные средства типа SAPI5, либо делать что - то свое, в рамках представленного подхода. Я бы предпочел свое. И здесь поле для сотрудничества и совместной работы. Ведь кокретную задачу очень тяжело иной раз вычленить из основного потока. А ситуация с выводом голоса именно такова и хорошо вычленяется.
Теперь вопрос. Когда говорят слово вектор я не понимаю этого. Вот что такое из массива сделать векторную форму? Вот одномерный массив из 10 значений... Как?
Я не знаю ваших технических возможностей. Правильнее наверно сканировать мозг и смотреть форму образуемую нейронными связями. Это даст возможность решить задачу от обратного. Но наверно это слишком сложно. Нужно начинать с простого.
Пусть массив определяет скалярный уровни каждой из гармоник (возможно через коэффициенты). Одно число Одна гармоника. Теперь соберем "ёжик" возьмём произвольную точку в пространстве и от неё отложим все вектора, разместив их в пространстве через одинаковые угловые значения. Посчитаем поверхность, определим результирующую, напишем матрицу... что то с ней поделаем... как то так. Я не математик.... вся надежда на Вас.
А можно попробовать иначе.... приведём все амплитуды гармоник к единице времени, а дальше будем работать с коэффициентами.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 09 май 13 10:29
Цитата:
Автор: ЭГТР
Может быть нужно взять десяти мерное пространство....

три динамических массива массивов выпили из меня весь моск...но я еще жив
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 09 май 13 11:50
Цитата:
три динамических массива массивов выпили из меня весь моск...но я еще жив

Я это уже проходил! Советую сделать отдельный класс для универсального циклического массива переменной длины. А потом пользоваться только именами этих массивов... В десятки раз упрощает логику и понимание программы. И только на 5-10%(максимум) увеличивает потребление процессора. Опять же проще будет сделать методы для сложения, вычитания, сравнения, поворота, преобразований и т.д. масива.
[Ответ][Цитата]
 Стр.3 (78)1  2  [3]  4  5  6  7  ...  78<< < Пред. | След. > >>