GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.31 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:05
Цитата:
Автор: Slava
Прекрасно
А многоголосость вы при этом допускаете?


Одновременную речь разных людей? Нет.
Но хороший алгоритм в этом случае должен сказать. "Непонятно"
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:12
Цитата:
Автор: Артем

Одновременную речь разных людей? Нет.
Но хороший алгоритм в этом случае должен сказать. "Непонятно"


Хороший алгоритм в этом случае должен расплести эти голоса
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:18
Цитата:
Автор: Slava
Хороший алгоритм в этом случае должен расплести эти голоса


Ну если это вообще возможно? Ну если один голос громче - допустим можно. Если есть два уха, то можно настроиться на прослушивания звука с определенного направления, тогда опять же один из голосов становится громче. Ну а на практике? Мы "человеки" можем распознать речь двух говорящих одновременно? в моно реализациии?
и так чтобы слова звучали одновременно, а не перемежаясь?
Сомневаюсь.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:21
Цитата:
Автор: Артем



Ну если это вообще возможно? Ну если один голос громче - допустим можно. Если есть два уха, то можно настроиться на прослушивания звука с определенного направления, тогда опять же один из голосов становится громче. Ну а на практике? Мы "человеки" можем распознать речь двух говорящих одновременно? в моно реализациии?
и так чтобы слова звучали одновременно, а не перемежаясь?
Сомневаюсь.


Напрасно сомневаетесь - в этой проблематике давно уже известен феномен застольной беседы
И это - та граница, по одну сторону которой всякие мелкие поделки, а по другую - нечто настоящее
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:40
хахаха. Запишите на микрофон застольную беседу и попробуйте понять каждого говорящего!
Дайте мне хотя бы 2 микрофона и картина изменится.
А каждое человеческое ухо даже посложнее чем 1 микрофон.
Генетика и эволюция первым делом позаботилась об определении источника звука/опасности.
Все-таки это задачи разного порядка ...
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:51
Цитата:
Автор: Артем

хахаха. Запишите на микрофон застольную беседу и попробуйте понять каждого говорящего!
Дайте мне хотя бы 2 микрофона и картина изменится.
А каждое человеческое ухо даже посложнее чем 1 микрофон.
Генетика и эволюция первым делом позаботилась об определении источника звука/опасности.
Все-таки это задачи разного порядка ...


Вообще-то, известно, кто смеется последним, так что не спешите веселиться
В общем, я понимаю, что вы в полном соответствии с европейской традицией будете пытаться решать эту задачу, начиная с самого простого ее представления
Бог - в помощь, как говорится
Только поглядите вокруг - может быть опыт тех многочисленных, что уже попались на эту удочку, вас все же чему-нибудь научит
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 15:06
Ну хорошо. вы что-то конкретное имеете ввиду?

Я вот сейчас репортаж по телеку смотрел из вагона-ресторана. Понятна речь только 1-го человека. Остальное - гул.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 21:18
Я вижу, Слава уже растолковал нашему Артёму базовые вещи, так что мне существенного уже и нечего добавить к сказанному. Только 3 момента:

1. Артем, вы слушали когда-нибудь радиопостановки? Там часто говорят одновременно, особенно если это КОАПП. И ничего, никакого дискомфорта не происходило, хотя звук был моно.
2. В речи, информация о гласных передается в спектре от 150 до 3-4кГц (зависит от возраста и пола), поэтому разделить на частотные полосы и что-то вычислять внутри их - можно, но бесполезно.
3. Если Артем говорит о военной технике, то на этом можно раскланяться и сказать "до свидания".
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 21:58
Вести с деревни.
Смотрю, мэтры много наговорили... И как всегда одни ограничения. Ну, да ладно...
Артем, нужна куча слов из какого-нибудь словаря. Вырезать из аудиокниг - муторно.
Глянь в яндексе по запрому "озвученные слова wav"
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:01
Застольная беседа.
Да, это проблема сродни той, чтобы воспринимать нормально изображения, на которых одни предметы частично заслоняют другие.
Как в изображении нужно какие-то пространственные экстраполяции делать, так и со звуком, нужны какие-то временнЫе экстраполяции (частотных динамических образов). Частотным анализом не обойтись.
[Ответ][Цитата]
ЭСГТР
Сообщений: 8461
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:11
Цитата:
Автор: dr2chek

Я вижу, Слава уже растолковал нашему Артёму базовые вещи, так что мне существенного уже и нечего добавить к сказанному. Только 3 момента:

1. Артем, вы слушали когда-нибудь радиопостановки? Там часто говорят одновременно, особенно если это КОАПП. И ничего, никакого дискомфорта не происходило, хотя звук был моно.
2. В речи, информация о гласных передается в спектре от 150 до 3-4кГц (зависит от возраста и пола), поэтому разделить на частотные полосы и что-то вычислять внутри их - можно, но бесполезно.
3. Если Артем говорит о военной технике, то на этом можно раскланяться и сказать "до свидания".
Вся эта куча гармоник на подсознательном уровне формирует векторную конструкцию которая соотносится к эмоциям хранящимся в организме, затем совпавшие эмоции размышляются в слова (понятия) и логически выстраиваясь формируют речь участника разговора.
Как бы сказать точнее... представим себе сетку которая пропускает через себя только слово лев, а всё остальное сваливается в другую сетку с другими словами и т.д. сетка реагирует по принципу резонанса. Каждая сетка реагирует только на своё слово. Нет разницы сколько слов в воздухе было, нужные сетки сработают... и лишь задача сознания со своим логическим аппаратом распределить все слова по участникам разговора.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:16
Цитата:
Автор: ЭГТР
Как бы сказать точнее... представим себе сетку которая пропускает через себя только слово лев, а всё остальное сваливается в другую сетку с другими словами и т.д. сетка реагирует по принципу резонанса. Каждая сетка реагирует только на своё слово. Нет разницы сколько слов в воздухе было, нужные сетки сработают... и лишь задача сознания со своим логическим аппаратом распределить все слова по участникам массовки.

На мой взгляд хорошая аналогия. Хотя она и не нова, но нравится.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:22
Изменено: 28 окт 13 6:42, автор изменений: Kek
del
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:31
Цитата:
Автор: Анатоль

так и со звуком, нужны какие-то временнЫе экстраполяции

Так и есть
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 3:00
Kek18 июл 13 21:58
[...Смотрю, мэтры много наговорили... И как всегда одни ограничения...]

Дело в том, что ограничения - неотъемлемая часть постановки задачи
Этому обычно не учат в школе, но жизнь более строгий и умный учитель
Так что есть смысл потратить какое-то время на постановку той задачи, что хотите решать

Анатоль 18 июл 13 22:01
[...Застольная беседа.
Да, это проблема сродни той, чтобы воспринимать нормально изображения, на которых одни предметы частично заслоняют другие...]

Да, сродни, и многие уже не раз говорили, что машинка в мозгах - одна и та же по сути для разных систем восприятия
Но одно дело повторять, а другое - делать

ЭГТР 18 июл 13 22:11
[...представим себе сетку которая пропускает через себя только слово лев, а всё остальное сваливается в другую сетку с другими словами и т.д. сетка реагирует по принципу резонанса. Каждая сетка реагирует только на своё слово. Нет разницы сколько слов в воздухе было, нужные сетки сработают... и лишь задача сознания со своим логическим аппаратом распределить все слова по участникам разговора...]

Мне тоже нравятся Сэлфридж и его демоны. Проблема - в деталях, как всегда
[Ответ][Цитата]
 Стр.31 (78)1  ...  27  28  29  30  [31]  32  33  34  35  ...  78<< < Пред. | След. > >>