GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.39 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Зри в корень!
гость
37.203.201.*
На: Проект Sound-Agent. Зри в корень!
Добавлено: 02 авг 13 11:29
[del]
[Ответ][Цитата]
victorst
Сообщений: 821
На: Проект Sound-Agent. Зри в корень!
Добавлено: 02 авг 13 22:36
[del]
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 8:55
[del]
[Ответ][Цитата]
гость
37.203.201.*
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 9:14
[del]
[Ответ][Цитата]
гость
37.203.201.*
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 9:21
[del]
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 10:07
На самом деле клиппирование - это действительно из древности, из аппаратных средств.
Несколько уровней клиппирования - это изобретение велосипеда АЦП.

Когда клиппирование заглохнет? Просто добавьте помеху на любой частоте.
Например 50 гц. И все. загнется клиппирование.

Т.е. неизбежно надо проводить анализ в разных частотных поддиапазонах. Размер поддиапазона - это как раз из шкал Мела. Конечно внутри частотного поддиапазона тоже может быть помеха - тут уж мы ее никак не вычеркнем.

Как получить поддиапазоны?
1. Фильтровать. Можно даже вейвлетом Морле. Да любым фильтром.
2. Просто смотреть на преобразование фурье в том поддиапазоне который нам интересен.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:01
[del]
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:04
Цитата:
Автор: Артем

На самом деле клиппирование - это действительно из древности, из аппаратных средств.
Несколько уровней клиппирования - это изобретение велосипеда АЦП.


В том, что начал обсуждать Кек можно увидеть и иное, более интересное
Клиппирование сегментирует поток по времени
А там уже и признаки возникают

Цитата:
Когда клиппирование заглохнет? Просто добавьте помеху на любой частоте.
Например 50 гц. И все. загнется клиппирование.


Испортить можно даже настроение
А помехи такого рода можно фильтровать
Хуже, когда они той же природы - феномен застольной беседы
Но Кек, как я его к этому ни склоняю, никак не хочет говорить о постановке задачи, которая его интересует
Имеет полное право, и не надо его в этом смысле ломать - все равно ничего не получится

Цитата:
Т.е. неизбежно надо проводить анализ в разных частотных поддиапазонах. Размер поддиапазона - это как раз из шкал Мела. Конечно внутри частотного поддиапазона тоже может быть помеха - тут уж мы ее никак не вычеркнем.


Надо - для чего?
А так просто, в общем смысле - конечно, и это надо(?)
И таких "надо" - полным-полно
была бы задача сформулирована

Цитата:
Как получить поддиапазоны?
1. Фильтровать. Можно даже вейвлетом Морле. Да любым фильтром.
2. Просто смотреть на преобразование фурье в том поддиапазоне который нам интересен.


Подумайте прежде о том же феномене застольной беседы
Что полезного в такого рода расфильтровке вы получите?
Когда прояснится, можно и о фильтрах поговорить
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:10
Slava, мне кажется вы преувеличиваете феномен застольной беседы.

По поводу отфильтровки на поддиапазоны.
Сейчас у меня есть аудиокнига (русский диктор мужчина, содержимое - бред :-))
Я как раз скачал winamp чтобы переконвертить mp3 в приличный wav или pcm.
Чтобы собирать статистику.

И увидел там то,что я уже 100 раз видел.
Эквалайзер. (читай шкалу мел :-))
вот список частот
70 180 320 600 1000 3000 6000 12000 14000 16000

Не скажу что это прямо-таки шкала Мел по формуле, но в целом музыканты - не дураки, и давно поделили частоты на поддиапазоны.

[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:12
кстати аудиокнига длинная. 2-х томник. и поделена на 81 кусочек по 5-10 минут
преобразование заняло 15 минут.
теперь это файлы (СТАТИСТИКА МЛЯТЬ!) доступные для анализа.
16 кгц 16 бит.

и еще добавлю.. скачав аудиокнигу текстом - можно собрать статистику появления в тексте разных букв и слогов ...
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:27
Цитата:
Автор: Артем

Slava, мне кажется вы преувеличиваете феномен застольной беседы.


А вы подумайте и попробуйте с ним разобраться
Практика прекрасно прочищает мозги и помогает бороться с тем, что "кажется"

Цитата:
По поводу отфильтровки на поддиапазоны.
Сейчас у меня есть аудиокнига (русский диктор мужчина, содержимое - бред :-))
Я как раз скачал winamp чтобы переконвертить mp3 в приличный wav или pcm.
Чтобы собирать статистику.
И увидел там то,что я уже 100 раз видел.
Эквалайзер. (читай шкалу мел :-))
вот список частот
70 180 320 600 1000 3000 6000 12000 14000 16000


Конечно, пока интересующая задачане обозначена, можно и об этом говорить
А вы уверены, что сжатие и распознавание решают одни и те же задачи

Цитата:
Не скажу что это прямо-таки шкала Мел по формуле, но в целом музыканты - не дураки, и давно поделили частоты на поддиапазоны.


Музыканты свое дело знают
Как далеко это можно распространять, по-вашему?
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:28
Цитата:
Автор: Артем

кстати аудиокнига длинная. 2-х томник. и поделена на 81 кусочек по 5-10 минут
преобразование заняло 15 минут.
теперь это файлы (СТАТИСТИКА МЛЯТЬ!) доступные для анализа.
16 кгц 16 бит.


А почему вы решили, что обратное преобразование сохраняет нужное для той самой не обозначенной задачи?
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:31
Цитата:
Автор: Slava
А почему вы решили, что обратное преобразование сохраняет нужное для той самой не обозначенной задачи?


А я ушами слышу :-) В конце концов кто мне мешает и дальше преобразовывать в mp3 а потом в pcm? :-)
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:32
Цитата:
Автор: Артем



А я ушами слышу :-)


Не ушами, а мозгами, и сколько там всего понакручено еще пока никто не знает
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Зри в корень!
Добавлено: 03 авг 13 11:35
Цитата:
Автор: Артем
кстати аудиокнига длинная. 2-х томник. и поделена на 81 кусочек по 5-10 минут

Аудиокниг хорошего качество много... многие без музыки... многие всего с одним голосом...
Но что вы хотите в них найти??? Ститистику по частотам? Повторяющиеся блоки? Конкретные блоки/фонемы - по образцам?

Цитата:
Почикал... здесь это не сложно.

За это отдельное спасибо... Вот бы еще и шапки этих типов полностью убрать... осталась бы 1/3 от сообщений... Очередной упрек к разработчикам форума - карма и фильтр по пользователям сильно бы упростил чтение веток...
[Ответ][Цитата]
 Стр.39 (78)1  ...  35  36  37  38  [39]  40  41  42  43  ...  78<< < Пред. | След. > >>