GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.34 (78)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 9:31
Цитата:
Автор: Slava
Скажите, а что должно быть понятно?
Хорошая визуализация - никому не мешала.
Если две картинки похожи - то и звуки похожи, если непохожи - то и звуки непохожи.
Вот и получается что амплитуду надо выражать в децебелах (логарифм) а частоту - в мелах (тоже логарифм) это придает спектру наглядность.
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 10:11
Цитата:
Автор: Артем
Хорошая визуализация - никому не мешала.
Если две картинки похожи - то и звуки похожи, если непохожи - то и звуки непохожи.
Вот и получается что амплитуду надо выражать в децебелах (логарифм) а частоту - в мелах (тоже логарифм) это придает спектру наглядность.
Сказанное выглядит логичным, но только на первый взгляд.
Вы с легкостью путаете субъективное и инструментальное сходства, а это - далеко не одно и то же.
В частности, хорошо известно, что слуховое восприятие практически не зависит от фазовых искажений в сигнале, но форма сигнала, воспринимаемая зрительно при этом может меняться катастрофическим образом.
Визуализируя сигналы, вы можете по незнанию чем-то важным с точки зрения слухового восприятия пренебречь, находясь в полной уверенности, что главное вы сохранили.
Таким образом, снова возвращаемся к постановке задачи - только понимая, что дОлжно получить, можно искать преобразования и визуальные представления. Иначе - ощущение осмысленной деятельности и разбитое корыто в результате
[
Ответ
][
Цитата
]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 10:20
Цитата:
Автор: Slava
только понимая, что дОлжно получить, можно искать преобразования и визуальные представления
Да. Именно.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 20:40
Цитата:
Автор: Slava
В.Н.Сорокин из ИППИ восстанавливает форму импульса, порождающего основной тон
У него недавно вышла книга, где и про это тоже что-то есть
В смысле, а что сложного-то? Достаточно посмотреть на спектр, чтобы догадаться про форму импульса
Кстати, спасибо за ссылку на Чистович - почитал, кое-что даже понравилось. Правда прочитал только книгу 76 года из рубрики "Физиология", которая есть в инете. Как посоветуете, имеет ли смысл заказывать по МБА еще ее статью, которая вышла в сборнике "Акустика речи и слуха" в 86 году?
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 20:51
Цитата:
Автор: dr2chek
В смысле, а что сложного-то? Достаточно посмотреть на спектр, чтобы догадаться про форму импульса
Кстати, спасибо за ссылку на Чистович - почитал, кое-что даже понравилось. Правда прочитал только книгу 76 года из рубрики "Физиология", которая есть в инете. Как посоветуете, имеет ли смысл заказывать по МБА еще ее статью, которая вышла в сборнике "Акустика речи и слуха" в 86 году?
Счас не вспомню, но по сути я ее ценю всего лишь за одну идею - активное восприятие.
Насколько я понимаю, хоть как-то ее разработать пока еще по-настоящему никому не удалось
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 21:07
Цитата:
Автор: Slava
Счас не вспомню, но по сути я ее ценю всего лишь за одну идею - активное восприятие.
Насколько я понимаю, хоть как-то ее разработать пока еще по-настоящему никому не удалось
Если имеете в виду предугадывание собеседника - то да уж, до этого неблизко.. А мне понравилось (кроме все прочего) "крамольное" высказывание, о том, что нейронные пути, задействованные в обработке слуха, так сложны и запутаны потому, что нейрон, как элемент этой системы, не очень подходящий объект для этого
[
Ответ
][
Цитата
]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 21:37
Изменено: 28 окт 13 6:48, автор изменений:
Kek
del
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 21:44
Изменено: 28 окт 13 6:49, автор изменений:
Kek
del
[
Ответ
][
Цитата
]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 22:12
Изменено: 28 окт 13 6:49, автор изменений:
Kek
del
[
Ответ
][
Цитата
]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 23:23
Цитата:
Я стараюсь не влезать на эту ветку, не ограничивайте меня даже в отдельных редких случаях. (Вы не автор ветки, если я не ошибаюсь)
Из за таких сообщений не хочется участвовать в жизни форума. Портите настроение на ровном месте. И движок форума не позволяет Вас "заминусовать". А автор ветки... что он может? Только стирать ВСЕ ваши такие сообщения оставляя пустышку... Сколько часов ему понадобится на вычитывание и чистку (34 страницы по 15 сообщений=)510 сообщений этой ветки? Это не -1! Это на грани оскорбления - автор старался, набирал. Логичнее было бы скрыть от большинства и оставить лишь любителям почитать подобные пустые коментарии... Была бы альтернатива в рунете давно бы удалил форум из фаворитов... Уже почти год как авторы пообещали добавить голосование на коментарии! И так интерсной считаю одну ветку из 100, так и в ней 70% скучный пустй треп не по теме!
[
Ответ
][
Цитата
]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 21 июл 13 23:49
Изменено: 28 окт 13 6:49, автор изменений:
Kek
del
[
Ответ
][
Цитата
]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 1:25
форумы бывают разные ... черные-белые-красные ... и всем одинаково хочеться на рейтинги заморочиться ! :-)
Ребята не ссорьтесь и не уходите с ветки.
Тут эту ветку всего человек 10 читают, они же и постят. Куда уж меньше?
Это как на лавочке во дворе в домино играть.
Будут результаты, КЕК выложит их на своем сайте и создат новую ветку - и нет проблем!
Я благодаря это ветке пообщался по скайпу с КЕК-ом и Slava.
Полагаю после этого они понимают мои посты, а я их.
А еще раньше зачем-то ЭГРТ обидели ...
[
Ответ
][
Цитата
]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 1:41
Цитата:
Автор: Артем
Я понял одно. В радио отталкиваются от частот. И спектр - это функция от частоты.
А вот в распознавании речи (естественный физический процесс) надо отталкиваться от периода, и строить спектр как функцию от периода.
В распознавании нужно учитывать не только физику процесса (акустику), но и особенности восприятия (психоакустику).
О психоакустическом смысле критических полос.
Это частотные полосы, сигналы в которых (одинаковой интенсивности) вносят схожий вклад в громкость (психическое восприятие интенсивности), поэтому в пределах полос их можно усреднять.
[
Ответ
][
Цитата
]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 2:01
Цитата:
Автор: Анатоль
О психоакустическом смысле критических полос.
Это частотные полосы, сигналы в которых (одинаковой интенсивности) вносят схожий вклад в громкость (психическое восприятие интенсивности), поэтому в пределах полос их можно усреднять.
Вот! Строим спектр, так чтобы по оси Y были - децебелы(логарифм амплитуды) а по оси X - мелы (логарифм частоты) и пропускаем через НЧ фильтр с частотой пропускания 1 мел.
На выходе получаем гладкий, красивый спектр безо всяких там гармоник частоты основного тона, в свою очередь ЧОТ мы учитываем другим способом.
как-то-так да?
[
Ответ
][
Цитата
]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 22 июл 13 4:26
Цитата:
Автор: Артем
На выходе получаем гладкий, красивый спектр безо всяких там гармоник частоты
как-то-так да?
Да, это огибающая спектра. (Она уже довольно инвариантна).
Дальше из неё получают кепстральные коэффициены. (Еще увеличивается инвариантность и уменьшается размер представления).
А потом это представление звука сравнивают с модельными каким-то способом (динамическое программирование, скрытые марковские модели, нейросети...).
А потом "фильтрация" словарём, частотой последовательностей слов, грамматикой...
И в конце "фильтрация" смыслом и контекстом. Вот именно этот этап распознавания имеет отношение к интеллекту.
[
Ответ
][
Цитата
]
Стр.34 (78)
:
1
...
30
31
32
33
[34]
35
36
37
38
...
78
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net