GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.63 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Звенящая пустота.
victorst
Сообщений: 821
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 8:07
Изменено: 01 ноя 13 8:19
Разрешите и мне вставить свои пять копеек.
Цитата:
Автор: Kek
Я наблюдаю многожды всякие реализации кадров и пытаюсь понять закономерности. Но мне хочется понять как в потоке формировать объекты, на основании какого критерия? Варианты есть. Первое-это учитель. Он говорит системе - это все есть реализация одного объекта (одно слово).
Второе - максимум огибающей и прилежащие к нему кадры слева и справа можно назвать объектом. При каком-то сочетании это похоже на фонему.
Информация о мире, в котором живет разумный субъект (человек, робот и т.д) поступает в разум в виде совокупности ощущений различных сенсорных систем. Но чем занимается то, что принято называть "правым полушарием мозга"? Скорее всего ищет статистические зависимости в сенсорных данных. Каждый орган чувств подает поток сенсорных данных, в которых разум находит статистические закономерности и до возможного предела их абстрагирует. Возможно, что далее идет межсенсорное абстрагирование, т.е. учет всех потоков данных и результатов локального сенсорного абстрагирования в общей системе.
Однако у такого "образного" мышления есть довольно низкий потолок возможностей абстрагирования.
И лишь некоторые разумные субъекты, у которых есть абстрактное мышление, а точнее - способность связывать в единый образ совершенно рецептивно разные наборы данных в окружающем нас мире, имеют способность, которую называем проницательностью. Это - способность находить скрытые знания.
Много лет назад ученые в области ИИ взялись за эту вторую область - абстрактное мышление. Но, видимо, зря они оставили без внимания образное.
Kek. Про какие объекты вы говорите? Уточните, пожалуйста.
Если принять учителя как еще один поток сенсорных данных, с той лишь разницей что степень достоверности этого потока высока,то структура распознающей системы становится проще.
К чему все я это писал?
Если искать закономерности лишь в сенсорных данных, то никогда не найти те инварианты речи, которые находит человеческий мозг.
Если мы видим квадратный стол на 4 ножках, то ни из каких сенсорных данных не извлечь информацию о том, что круглый стол в одной центральной ножкой тоже стол. Ровно так все и происходит с речью, т.к. речь - это не обычный природный звук. Инвариантность восприятия речи возникает в слаженной работе образного и абстрактного мышлений. При этом абстрактное мышление находит в сенсорных данных с помощью огромной накопленной базы знаний скрытые знания. И лишь тогда возможна полноценная классификация или идентификация речи и ее элементов.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 8:37
Изменено: 01 ноя 13 8:46
Цитата:
Автор: victorst
Kek. Про какие объекты вы говорите? Уточните, пожалуйста.
Если принять учителя как еще один поток сенсорных данных, с той лишь разницей что степень достоверности этого потока высока,то структура распознающей системы становится проще.

Уточню. Я до последнего не ввожу в систему учителя, как поставщика объектов или кластеров. Система должна выработать весь свой собственный ресурс, как вы правильно говорите, образного.
Пока роль учителя - поставлять поток. Это, кстати, может быть и заранее определенная база слов в звуковом формате. Главное - пока нет обратной связи от системы к поставщику. Значит система работает самостоятельно. Проще это или нет - не факт. Но система должна на основании каких-то критериев формировать объекты из потока.
На данный момент у меня реализовано следующее.
В неком безразмерном буфере запоминаются все кадры.
Если кадр уже был, то запоминается сколько раз это происходило.
Можно сказать, что это буфер простейших объектов.
Следующий буфер запоминает сочетание двух ткадров - это тоже обекты.
Дошло до 8 кадров подряд. Это объект из 8 кадров.
Есть полная статистика.
Такое образование объектов приводит к неограниченному росту размеров памяти.
Чем больше по размерности объект, тем их больше в условиях помех, различных интонаций, темпов и силы звука. Все это несмотря на НЕКИЙ инвариант.
Вопрос. Как остановить рост памяти? Ведь даже произнося одно и тоже слово, память растет.
Возможный ответ. Среди реализаций объектов надо провести инвентаризацию.
Как?
Учитывать структуру кадра. Т.к кадр, состоящий из 20 гармоник, не элементарен!
Как еще можно формировать объекты? Не объединяя тупо кадры.
Например, можно объединять кадры вокруг максимумов огибающей. Это совершенно иной способ.
Сочетание описанных способов может дать некую оптимизацию памяти.
Итак. Объект - это набор кадров. Такой набор, который в конечном итоге не даст памяти разбухать.
Многократное повторение одного и того же слова с разными вариантами должно привести к тому, что объекты, сформированные из этого потока перестанут повторяться.
Уф....
Здесь есть нюанс. Настраивая степень похожести, я могу тпк загрубить сравнение, что память перестанет расти через 10 вариантов произнесения слова. Но что это будет за база. Проигрывая обратно объекты можно с трудом различить слово. У меня всегда есть проверочка. И это важный инструмент.
И так. Есть тупой способ формирования объектов. По сочетанию кадров. Есть возможность управлять разбуханием памяти, оперируя параметром похожести. Надо еще способ формирования объектов.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 8:52
Изменено: 01 ноя 13 9:02
Цитата:
Автор: Slava



кстати, насчет студентов - а вы отслеживаете, какова их дальнейшая судьба?

Цитата:
Автор: ЭГТР

У вас же (от вас же) и защищаются...

Конечно отслеживаю. Речь о студентах, где я был руководителем. Последний студент слинял в фирму на з/п раза в 3 больше моей

Цитата:
Автор: Kek

А здесь мне бы хотелось, чтобы хоть кто-то подумал о том, о чем я высказываюсь.
Например - что такое объект? Как можно описать связь одного объекта с другим? Что такое свойство объекта? Можно ли считать свойством объекта его связь с другим объектом? И т.д.
Это не философские вопросы, я собираюсь воплотить все это в коде. И примером объекта будет кадр в моей задаче.

Вы ещё юны, мой друг, по кр. мере в этом вопросе, так что от меня вам совет: объект это слово (но ни в коем случае не "кадр" или фонема). Нет, если б вы вдруг занялись китайским, я бы насчёт фонем ещё подискутировал, но для русского - только слово. Кстати, для немецкого - тоже слово, я думаю. Как у вас с кит. и нем. языками?
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 8:58
Цитата:
Автор: dr2chek



Конечно отслеживаю. Речь о студентах, где я был руководителем. Последний студент слинял в фирму на з/п раза в 3 больше моей


Сочувствую
Очень похожая ситуация
Но только разница еще больше
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 9:03
Цитата:
Автор: Kek


Более чем. Проблемма в выборе. То, с чем можно играться предостаточно. Но вопрос правильный. Как играть? И опять же - а в чем задача? Распознавание слов - это одно. А иерархиезация потока - это другое. А что у вас в арсенале? Можно не конкретно, а вообщем.


Так, много разного
Усилитель - он же всеяден
Приходите - все расскажу
Только заранее сговориься нужно, а то я последнее время в основном дома считаю
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 9:06
Цитата:
Автор: Slava



Сочувствую
Очень похожая ситуация
Но только разница еще больше

Да не, я не переживаю. По кр. мере, мозги я ему "вправил" за 3 года учёбы, и мне за это не стыдно, а дальше это его жизнь, и я не вправе вмешиваться. Много ли студентов остаётся работать по специальности - вы сами знаете процент
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 9:16
Цитата:
Автор: victorst

речь - это не обычный природный звук.

Отчего же? Вы - порождение природы, разве нет? Речь выделяет только наличие формант, на которые удивительно точно настроен наш слух. Я подозреваю, что формантный анализ "зашит" в неокортексе изначально.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 9:18
Изменено: 01 ноя 13 9:23
Цитата:
Автор: Kek


Уточню. Я до последнего не ввожу в систему учителя, как поставщика объектов или кластеров. Система должна выработать весь свой собственный ресурс, как вы правильно говорите, образного.
Пока роль учителя - поставлять поток. Это, кстати, может быть и заранее определенная база слов в звуковом формате. Главное - пока нет обратной связи от системы к поставщику. Значит система работает самостоятельно. Проще это или нет - не факт. Но система должна на основании каких-то критериев формировать объекты из потока.


Вы себя невольно обманываете, но это - вполне типично и не имеет серьезного значения
У вас все есть, и оно скрывается в том, что вы добивались инвариантности первичных описаний, контролируя разборчивость того, что по ним восстанавливалось
Если вам это удалось, то, значит, нужное от учителя в ваших кадрах уже есть
Остается вопрос - а что же нужно вам на самом деле в том, что скрывается за вашим поиском
Ну а что касается учителя, то что его бояться? - он всегда есть, и главное - чтобы был хорошим
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 9:20
Цитата:
Автор: dr2chek


Да не, я не переживаю. По кр. мере, мозги я ему "вправил" за 3 года учёбы, и мне за это не стыдно, а дальше это его жизнь, и я не вправе вмешиваться. Много ли студентов остаётся работать по специальности - вы сами знаете процент


Да, к сожалению
И если раньше было примерно 3%, которые - не благодаря, а вопреки, то теперь этот процент вблизи нуля
И спросить, вроде, не с кого, хотя реформаторы не прячутся и собою гордятся
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 01 ноя 13 9:54
Цитата:
Автор: dr2chek
Вы ещё юны, мой друг, по кр. мере в этом вопросе, так что от меня вам совет: объект это слово

Скажите, о, наимудрейший из учителей, мы все ваши студенты на веки, как дать знать системе, что вот этот кусок потока - это слово? А вот этот кусок - набор слов... Что такое кадр - система знает.
Кстати. Недавно в очередной раз залез в Гугл через Хром, проверить распознает ли система несуществующие слова. Я четко произнес:

"Лилима".

Система не отреагировала. Значит можно предположить, что она настроена на слова, а не на фонемы.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 02 ноя 13 10:20
Цитата:
Автор: Kek


Скажите, о, наимудрейший из учителей, мы все ваши студенты на веки, как дать знать системе, что вот этот кусок потока - это слово? А вот этот кусок - набор слов...

"Навеки" пишется слитно.
Ответ простой. Зажмурьтесь, а потом откройте глаза и оглядитесь вокруг. Вы увидите (надеюсь) разнообразные предметы. Так вот, предметы эти - суть объекты в вашем сознании. Вы эти объекты уверенно различаете, как индивидуально, так и в куче. Ровно так же происходит и со словами - они интерпретируются, как объекты в сознании. Поскольку неокортекс, в первом приближении, по всей поверхности коры одинаков, следовательно обрабатывает инфу схожим образом, будь это изображение, звук, запах и др.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 02 ноя 13 10:30
Цитата:
Автор: Kek


Недавно в очередной раз залез в Гугл через Хром, проверить распознает ли система несуществующие слова. Я четко произнес:

"Лилима".


Кто знает, как вы произносите это. Можно произнести по-китайски, в переводе будет "Ли здесь?"
[Ответ][Цитата]
covax
Сообщений: 1609
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 02 ноя 13 11:14
Цитата:
Автор: dr2chek
Ответ простой. ..... Ровно так же происходит и со словами - они интерпретируются, как объекты в сознании.


Что это значит? Что представляют из себя объекты в сознании? Почему слово = объект?
А фонема не объект? Обязательно ли нужен объектный формализм, может можно обойтись без объектов в сознании?
[Ответ][Цитата]
victorst
Сообщений: 821
На: Проект Sound-Agent. Звенящая пустота.
+1
Добавлено: 02 ноя 13 22:30
Изменено: 02 ноя 13 22:37
Цитата:
Автор: covax
Что это значит? Что представляют из себя объекты в сознании? Почему слово = объект?
А фонема не объект? Обязательно ли нужен объектный формализм, может можно обойтись без объектов в сознании?
Помуссирую вопрос об объектах. Когда нечто в реальном мире попадает в зону нашего внимания, то разум не может это нечто перенести в себя, чтобы манипулировать этим нечто. Для таких манипуляций он, этот разум создает заменитель, символ, заменяющий этот объект внешнего мира. И с этим символом как отражением чего-то реального уже можно производить умственные операции.
В простейшем случае (образное мвшление) для создания символа достаточно некоторого набора перцептивных свойств, отличающих этот символ от других. Например, для зрительного символа - положение на сетчатке глаза, цвет, размер яркостного пятна и т.д. Для звукового символа - набор частот в спектре, длительность звучания...
Для абстрактного мышления все немного сложнее, т.к. тут происходит качественный скачок в представлении объектов реального мира с помощью символов. Мы можем назначить символу совершенно напрямую с ним не связанный набор свойств, например, каталогу файлов на жестком диске компьютера дать название "Прочитанные мною книги" или еще как-то назвать коллекцию файлов в этом каталоге. Но и в этом случае мы как-то аргументируем для себя, почему мы так это назвали, объясняем какую-то причину появления данного символа.
Если человек силой своего сознания сосредоточится на изучении звука речи, то со временем, когда он вникнет в суть пролемы, в поле его внимания будут попадать все более и более тонкие сущности реального мира, которые он будет выделть из остальных. И соответственно этим сущностям будет создавать в своем мозгу новые символы. В таком случае и фонема и слово будут "объектами", а точнее - символами, означающими что-то конкретное, т.к. будут к ним приписаны различные наборы свойств. Но т.к. все это - работа разума, а у каждого он свой, то и наборы свойств у каждого символа да и сам набор символов у каждого свой, чисто субъективный.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 02 ноя 13 23:51
Цитата:
Автор: victorst
Для звукового символа - набор частот в спектре, длительность звучания...

Первоначальное выявление объектов в виде сочетания подряд идущих кадров - мало эффективным оказалось.
Иерархия свойств объекта видимо должна быть такой:
- просто звук - у него есть начало и конец.
Далее система анализирует свойства этого объекта-звука. И этими свойствами могут быть либо - максимумы огибающей с прилегающими зонами, либо одинаковые по спектральному составу кадры - два и более. Это свойства. Далее система накапливает проявлния этих свойств в разных первоначальных звуках и формирует устойчивые свойства, набирая статистику. Вот такой планчик, все это реально проверить.
[Ответ][Цитата]
 Стр.63 (78)1  ...  59  60  61  62  [63]  64  65  66  67  ...  78<< < Пред. | След. > >>