GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.11 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 7:33
Цитата:
Автор: Андрей
Вы копаете там, где уже тысячу раз копали и ничего не выкопали.

Спектр - более компактная форма - это раз. Ухо с волосками - делает спектр - это два. Но двигаемся мы не туда - это три. Моделировать речевой аппарат однозначно полезно и нужно. Для замыкания петли обратной связи. Это отдельная работа.
Но я именно сейчас попробую высказать направление.
Проект называется XXX-Agent, а не XXX-Filter. Но мы упорно хотим делать фильтр. У агента должны быть "ручки" и "ножки", которые представляют из себя некие параметры, доступные программе.
Критерий движения вперед у агента - это критерий новизны. Но на данный момент новизны так много, кадры получаются все время разные, что непонятно, а когда же она, новизна, закончится, чтобы включить какие-то оптимизационные критерии. Я говорил, что кепстральные коэфы - дают ложное срабатывание. Корреляционный анализ, тоже можно настроить так, что будет много похожих кадров.

Так вот. Предположим, что мы бинаризируем картинку так, что паттерн и слово будут представлять из себя прямоугольники. Сравнивая, их система будет быстро получать похожесть. Новизна закончится, а где ее взять? А надо изменить уровень бинаризации в сторону повышения детализации. Это изменение - и есть "ручки" и "ножки" агента. Агент получит новизну от детализации, которая вскоре так же должна закончится.
Это просто метод, который должен самонастраивать (пардон, Андрей не любит "само") настраивать систему. Детали этой настройки - отдельный разговор, но я просто опять возвращаюсь к методам, которые не включают в себя готовые параметры распознавания, а приобретаются в процессе.
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 7:53
Пробуют и артикуляцию моделировать и восстанавливать, но это очень сложно, громоздко и не эффективно.
Да и бессмысленно.
Ведь аккустические инварианты фонем давно найдены и известны.
Это - огибающая спектра (или форманты, или кепстральные коэффициенты из неё).

Но в чём проблема?
В том, что сами по себе они не достаточно стабильны и надёжны.
Но искать более надёжных нет смысла.
Их просто не существует.
Одна и та же фонема в различных контекстах звучит (воспринимается) по разному.
В одном окружении она будет восприниматься как "а", в другом как "о" в третьем как "э"...
Важна не столько огибающая, сколько её динамика.
Но и этого для надёжного распознавания не достаточно.

Пропустите запись фразы через какой-то фильтр, чтобы сильно исказить её.
Тогда на слух не распознаете не только отдельные фонемы или слоги, но и отдельные слова.
А всю фразу распознаете.
И чем она длиннее - тем легче распознаете.
Если идти от фонем к словам и фразам, то неопределённость только возрастает.
А человек наоборот, чем длиннее - тем легче распознаёт.
Ибо подключаются высокоуровневые фильтры - словарные, грамматические, смысловые..
Без них (высокоуровневых анализаторов) обычную беглую речь не распознать.
Можно надеяться только на чёткую.

[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 7:58
Цитата:
Автор: Анатоль

Ибо подключаются высокоуровневые фильтры - словарные, грамматические, смысловые..
Без них (высокоуровневых анализаторов) обычную беглую речь не распознать.


Слово "высокоуровневые" - ключевое. И построить некий фильтр действительно архи сложная задача. Но надо строить не фильтр, та агента.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 8:10
А, вот, вспомнил:
еще предлагается включить в набор фонем "а", подлежащих распознаванию, попугайскую речь. Маленьких попугаев, ну и майму можно тоже. Они чертовски хорошо звукоподражают речи. Слабо?
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 10:18
Цитата:
Автор: Андрей
Например, навскидку, можно пытаться из звука восстанавливать движения артикуляционного аппарата и распознавать речь уже по ним. Ведь для человека важно отличать в речи только то, что сам сможешь повторить. Кроме того, физические ограничения речевого аппарата накладывают ограничения на возможные продолжения звучания.
Вы копаете там, где уже тысячу раз копали и ничего не выкопали.


В.Н.Сорокин ровно так и пытается делать. Кое-что получается
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 10:20
Цитата:
Автор: Kek
Слово "высокоуровневые" - ключевое. И построить некий фильтр действительно архи сложная задача. Но надо строить не фильтр, та агента.


Попробуйте найти старую книжку Г.И.Цемеля - будете приятно удивлены
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 10:24
Цитата:
Автор: Slava
В.Н.Сорокин ровно так и пытается делать. Кое-что получается


Слава, не сочтите за оскарбление, но вы никогда не даете ссылки. Кто такой Сорокин, где он печататеся...
Вот Википедия говорит, что это полузащитник:

"Владимир Николаевич Сорокин (укр. Володимир Миколайович Сорокін; 3 февраля 1937, Москва, СССР) — советский футболист, полузащитник..."
Не думаю, что полузащитник знает что - либо об артикуляции, нет, конечно знает...матерные выражения при острой атаки форварда создают неповторимую артикуляцию речевого аппарата.


[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 10:31
Цитата:
Автор: Kek

Слава, не сочтите за оскарбление, но вы никогда не даете ссылки. Кто такой Сорокин, где он печататеся...


Возможно, вики уже изучает предпочтения пользователей
Сорокин Виктор Николаевич - пара книжек, у нас работает
В крайнем случае попозже я тоже могу там поискать
[Ответ][Цитата]
ЭСГТР
Сообщений: 8461
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 10:41
Цитата:
Автор: Андрей

И что? Осциллограммы тоже достаточно. Так что теперь, распознавать осциллограммы?... Почему подход такой ограниченный? Почему не ищется новых путей и альтернатив? Например, навскидку, можно пытаться из звука восстанавливать движения артикуляционного аппарата и распознавать речь уже по ним. Ведь для человека важно отличать в речи только то, что сам сможешь повторить. Кроме того, физические ограничения речевого аппарата накладывают ограничения на возможные продолжения звучания.
Вы копаете там, где уже тысячу раз копали и ничего не выкопали.
Зачем то же человек беззвучно проговаривает всё то что распознаёт? А может распознаёт то что проговаривает?
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 10:45
Цитата:
Автор: Kek
вы никогда не даете ссылки
Потому что всё можно найти самому.
Список работ.
Сравнительно свежий обзор.

UPD:
Цемеля сюда же.
[Ответ][Цитата]
гость
37.203.201.*
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 10:57
Ну вот, ещё немного помучаетесь и, возможно, наконец поймёте, что подход коим пытаетесь осуществить распознавание принципиально неверен.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 11:00
Цитата:
Автор: Андрей

Потому что всё можно найти самому.
Список работ.
Сравнительно свежий обзор.

UPD:
Цемеля сюда же.


Спасибо Андрей, но я говорил о книгах этих людей. Они были в семидесятых-восьмидесятых годах. Ну и для компании - работа А.А.Пирогова по динамическому спектру речи и фонетической функции
[Ответ][Цитата]
covax
Сообщений: 1609
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 11:04
Цитата:
Автор: гость
Ну вот, ещё немного помучаетесь и, возможно, наконец поймёте, что подход коим пытаетесь осуществить распознавание принципиально неверен.


У вас есть альтернатива? Так предложите! Иначе вы напоминаете обезьяну пуляющую в посетителей зоопарка какашками через клетку. Ваши беспочвенные выпады начинают утомлять.
[Ответ][Цитата]
covax
Сообщений: 1609
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 11:08
.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 май 13 11:11
Цитата:
Автор: covax
У вас есть альтернатива? Так предложите! Иначе вы напоминаете обезьяну пуляющую в посетителей зоопарка какашками через клетку. Ваши беспочвенные выпады начинают утомлять.

А вы уверены, что это один и тот же человек?
[Ответ][Цитата]
 Стр.11 (78)1  ...  7  8  9  10  [11]  12  13  14  15  ...  78<< < Пред. | След. > >>