GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.34 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 9:31
Цитата:
Автор: Slava
Скажите, а что должно быть понятно?


Хорошая визуализация - никому не мешала.
Если две картинки похожи - то и звуки похожи, если непохожи - то и звуки непохожи.
Вот и получается что амплитуду надо выражать в децебелах (логарифм) а частоту - в мелах (тоже логарифм) это придает спектру наглядность.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 10:11
Цитата:
Автор: Артем

Хорошая визуализация - никому не мешала.
Если две картинки похожи - то и звуки похожи, если непохожи - то и звуки непохожи.
Вот и получается что амплитуду надо выражать в децебелах (логарифм) а частоту - в мелах (тоже логарифм) это придает спектру наглядность.


Сказанное выглядит логичным, но только на первый взгляд.
Вы с легкостью путаете субъективное и инструментальное сходства, а это - далеко не одно и то же.
В частности, хорошо известно, что слуховое восприятие практически не зависит от фазовых искажений в сигнале, но форма сигнала, воспринимаемая зрительно при этом может меняться катастрофическим образом.
Визуализируя сигналы, вы можете по незнанию чем-то важным с точки зрения слухового восприятия пренебречь, находясь в полной уверенности, что главное вы сохранили.
Таким образом, снова возвращаемся к постановке задачи - только понимая, что дОлжно получить, можно искать преобразования и визуальные представления. Иначе - ощущение осмысленной деятельности и разбитое корыто в результате
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 10:20
Цитата:
Автор: Slava
только понимая, что дОлжно получить, можно искать преобразования и визуальные представления

Да. Именно.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 20:40
Цитата:
Автор: Slava



В.Н.Сорокин из ИППИ восстанавливает форму импульса, порождающего основной тон
У него недавно вышла книга, где и про это тоже что-то есть

В смысле, а что сложного-то? Достаточно посмотреть на спектр, чтобы догадаться про форму импульса
Кстати, спасибо за ссылку на Чистович - почитал, кое-что даже понравилось. Правда прочитал только книгу 76 года из рубрики "Физиология", которая есть в инете. Как посоветуете, имеет ли смысл заказывать по МБА еще ее статью, которая вышла в сборнике "Акустика речи и слуха" в 86 году?
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 20:51
Цитата:
Автор: dr2chek


В смысле, а что сложного-то? Достаточно посмотреть на спектр, чтобы догадаться про форму импульса
Кстати, спасибо за ссылку на Чистович - почитал, кое-что даже понравилось. Правда прочитал только книгу 76 года из рубрики "Физиология", которая есть в инете. Как посоветуете, имеет ли смысл заказывать по МБА еще ее статью, которая вышла в сборнике "Акустика речи и слуха" в 86 году?


Счас не вспомню, но по сути я ее ценю всего лишь за одну идею - активное восприятие.
Насколько я понимаю, хоть как-то ее разработать пока еще по-настоящему никому не удалось
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 21:07
Цитата:
Автор: Slava



Счас не вспомню, но по сути я ее ценю всего лишь за одну идею - активное восприятие.
Насколько я понимаю, хоть как-то ее разработать пока еще по-настоящему никому не удалось

Если имеете в виду предугадывание собеседника - то да уж, до этого неблизко.. А мне понравилось (кроме все прочего) "крамольное" высказывание, о том, что нейронные пути, задействованные в обработке слуха, так сложны и запутаны потому, что нейрон, как элемент этой системы, не очень подходящий объект для этого
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 21:37
Изменено: 28 окт 13 6:48, автор изменений: Kek
del
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 21:44
Изменено: 28 окт 13 6:49, автор изменений: Kek
del
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 22:12
Изменено: 28 окт 13 6:49, автор изменений: Kek
del
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 23:23
Цитата:
Я стараюсь не влезать на эту ветку, не ограничивайте меня даже в отдельных редких случаях. (Вы не автор ветки, если я не ошибаюсь)


Из за таких сообщений не хочется участвовать в жизни форума. Портите настроение на ровном месте. И движок форума не позволяет Вас "заминусовать". А автор ветки... что он может? Только стирать ВСЕ ваши такие сообщения оставляя пустышку... Сколько часов ему понадобится на вычитывание и чистку (34 страницы по 15 сообщений=)510 сообщений этой ветки? Это не -1! Это на грани оскорбления - автор старался, набирал. Логичнее было бы скрыть от большинства и оставить лишь любителям почитать подобные пустые коментарии... Была бы альтернатива в рунете давно бы удалил форум из фаворитов... Уже почти год как авторы пообещали добавить голосование на коментарии! И так интерсной считаю одну ветку из 100, так и в ней 70% скучный пустй треп не по теме!
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 23:49
Изменено: 28 окт 13 6:49, автор изменений: Kek
del
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 1:25
форумы бывают разные ... черные-белые-красные ... и всем одинаково хочеться на рейтинги заморочиться ! :-)

Ребята не ссорьтесь и не уходите с ветки.
Тут эту ветку всего человек 10 читают, они же и постят. Куда уж меньше?
Это как на лавочке во дворе в домино играть.
Будут результаты, КЕК выложит их на своем сайте и создат новую ветку - и нет проблем!
Я благодаря это ветке пообщался по скайпу с КЕК-ом и Slava.
Полагаю после этого они понимают мои посты, а я их.
А еще раньше зачем-то ЭГРТ обидели ...
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 1:41
Цитата:
Автор: Артем
Я понял одно. В радио отталкиваются от частот. И спектр - это функция от частоты.
А вот в распознавании речи (естественный физический процесс) надо отталкиваться от периода, и строить спектр как функцию от периода.


В распознавании нужно учитывать не только физику процесса (акустику), но и особенности восприятия (психоакустику).

О психоакустическом смысле критических полос.
Это частотные полосы, сигналы в которых (одинаковой интенсивности) вносят схожий вклад в громкость (психическое восприятие интенсивности), поэтому в пределах полос их можно усреднять.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 2:01
Цитата:
Автор: Анатоль

О психоакустическом смысле критических полос.
Это частотные полосы, сигналы в которых (одинаковой интенсивности) вносят схожий вклад в громкость (психическое восприятие интенсивности), поэтому в пределах полос их можно усреднять.


Вот! Строим спектр, так чтобы по оси Y были - децебелы(логарифм амплитуды) а по оси X - мелы (логарифм частоты) и пропускаем через НЧ фильтр с частотой пропускания 1 мел.
На выходе получаем гладкий, красивый спектр безо всяких там гармоник частоты основного тона, в свою очередь ЧОТ мы учитываем другим способом.
как-то-так да?
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 4:26
Цитата:
Автор: Артем
На выходе получаем гладкий, красивый спектр безо всяких там гармоник частоты
как-то-так да?

Да, это огибающая спектра. (Она уже довольно инвариантна).
Дальше из неё получают кепстральные коэффициены. (Еще увеличивается инвариантность и уменьшается размер представления).
А потом это представление звука сравнивают с модельными каким-то способом (динамическое программирование, скрытые марковские модели, нейросети...).
А потом "фильтрация" словарём, частотой последовательностей слов, грамматикой...
И в конце "фильтрация" смыслом и контекстом. Вот именно этот этап распознавания имеет отношение к интеллекту.
[Ответ][Цитата]
 Стр.34 (78)1  ...  30  31  32  33  [34]  35  36  37  38  ...  78<< < Пред. | След. > >>