GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.31 (78)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:05
Цитата:
Автор: Slava
Прекрасно
А многоголосость вы при этом допускаете?
Одновременную речь разных людей? Нет.
Но хороший алгоритм в этом случае должен сказать. "Непонятно"
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:12
Цитата:
Автор: Артем
Одновременную речь разных людей? Нет.
Но хороший алгоритм в этом случае должен сказать. "Непонятно"
Хороший алгоритм в этом случае должен расплести эти голоса
[
Ответ
][
Цитата
]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:18
Цитата:
Автор: Slava
Хороший алгоритм в этом случае должен расплести эти голоса
Ну если это вообще возможно? Ну если один голос громче - допустим можно. Если есть два уха, то можно настроиться на прослушивания звука с определенного направления, тогда опять же один из голосов становится громче. Ну а на практике? Мы "человеки" можем распознать речь двух говорящих одновременно? в моно реализациии?
и так чтобы слова звучали одновременно, а не перемежаясь?
Сомневаюсь.
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:21
Цитата:
Автор: Артем
Ну если это вообще возможно? Ну если один голос громче - допустим можно. Если есть два уха, то можно настроиться на прослушивания звука с определенного направления, тогда опять же один из голосов становится громче. Ну а на практике? Мы "человеки" можем распознать речь двух говорящих одновременно? в моно реализациии?
и так чтобы слова звучали одновременно, а не перемежаясь?
Сомневаюсь.
Напрасно сомневаетесь - в этой проблематике давно уже известен феномен застольной беседы
И это - та граница, по одну сторону которой всякие мелкие поделки, а по другую - нечто настоящее
[
Ответ
][
Цитата
]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:40
хахаха. Запишите на микрофон застольную беседу и попробуйте понять каждого говорящего!
Дайте мне хотя бы 2 микрофона и картина изменится.
А каждое человеческое ухо даже посложнее чем 1 микрофон.
Генетика и эволюция первым делом позаботилась об определении источника звука/опасности.
Все-таки это задачи разного порядка ...
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 14:51
Цитата:
Автор: Артем
хахаха. Запишите на микрофон застольную беседу и попробуйте понять каждого говорящего!
Дайте мне хотя бы 2 микрофона и картина изменится.
А каждое человеческое ухо даже посложнее чем 1 микрофон.
Генетика и эволюция первым делом позаботилась об определении источника звука/опасности.
Все-таки это задачи разного порядка ...
Вообще-то, известно, кто смеется последним, так что не спешите веселиться
В общем, я понимаю, что вы в полном соответствии с европейской традицией будете пытаться решать эту задачу, начиная с самого простого ее представления
Бог - в помощь, как говорится
Только поглядите вокруг - может быть опыт тех многочисленных, что уже попались на эту удочку, вас все же чему-нибудь научит
[
Ответ
][
Цитата
]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 15:06
Ну хорошо. вы что-то конкретное имеете ввиду?
Я вот сейчас репортаж по телеку смотрел из вагона-ресторана. Понятна речь только 1-го человека. Остальное - гул.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 21:18
Я вижу, Слава уже растолковал нашему Артёму базовые вещи, так что мне существенного уже и нечего добавить к сказанному. Только 3 момента:
1. Артем, вы слушали когда-нибудь радиопостановки? Там часто говорят одновременно, особенно если это КОАПП. И ничего, никакого дискомфорта не происходило, хотя звук был моно.
2. В речи, информация о гласных передается в спектре от 150 до 3-4кГц (зависит от возраста и пола), поэтому разделить на частотные полосы и что-то вычислять внутри их - можно, но бесполезно.
3. Если Артем говорит о военной технике, то на этом можно раскланяться и сказать "до свидания".
[
Ответ
][
Цитата
]
Kek
Сообщений: 1133
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 21:58
Вести с деревни.
Смотрю, мэтры много наговорили... И как всегда одни ограничения. Ну, да ладно...
Артем, нужна куча слов из какого-нибудь словаря. Вырезать из аудиокниг - муторно.
Глянь в яндексе по запрому "озвученные слова wav"
[
Ответ
][
Цитата
]
Анатоль
Сообщений: 1964
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:01
Застольная беседа.
Да, это проблема сродни той, чтобы воспринимать нормально изображения, на которых одни предметы частично заслоняют другие.
Как в изображении нужно какие-то пространственные экстраполяции делать, так и со звуком, нужны какие-то временнЫе экстраполяции (частотных динамических образов). Частотным анализом не обойтись.
[
Ответ
][
Цитата
]
ЭСГТР
Сообщений: 8461
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:11
Цитата:
Автор: dr2chek
Я вижу, Слава уже растолковал нашему Артёму базовые вещи, так что мне существенного уже и нечего добавить к сказанному. Только 3 момента:
1. Артем, вы слушали когда-нибудь радиопостановки? Там часто говорят одновременно, особенно если это КОАПП. И ничего, никакого дискомфорта не происходило, хотя звук был моно.
2. В речи, информация о гласных передается в спектре от 150 до 3-4кГц (зависит от возраста и пола), поэтому разделить на частотные полосы и что-то вычислять внутри их - можно, но бесполезно.
3. Если Артем говорит о военной технике, то на этом можно раскланяться и сказать "до свидания".
Вся эта куча гармоник на подсознательном уровне формирует векторную конструкцию которая соотносится к эмоциям хранящимся в организме, затем совпавшие эмоции размышляются в слова (понятия) и логически выстраиваясь формируют речь участника разговора.
Как бы сказать точнее... представим себе сетку которая пропускает через себя только слово лев, а всё остальное сваливается в другую сетку с другими словами и т.д. сетка реагирует по принципу резонанса. Каждая сетка реагирует только на своё слово. Нет разницы сколько слов в воздухе было, нужные сетки сработают... и лишь задача сознания со своим логическим аппаратом распределить все слова по участникам разговора.
[
Ответ
][
Цитата
]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:16
Цитата:
Автор: ЭГТР
Как бы сказать точнее... представим себе сетку которая пропускает через себя только слово лев, а всё остальное сваливается в другую сетку с другими словами и т.д. сетка реагирует по принципу резонанса. Каждая сетка реагирует только на своё слово. Нет разницы сколько слов в воздухе было, нужные сетки сработают... и лишь задача сознания со своим логическим аппаратом распределить все слова по участникам массовки.
На мой взгляд хорошая аналогия. Хотя она и не нова, но нравится.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:22
Изменено: 28 окт 13 6:42, автор изменений:
Kek
del
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 18 июл 13 22:31
Цитата:
Автор: Анатоль
так и со звуком, нужны какие-то временнЫе экстраполяции
Так и есть
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 3:00
Kek18 июл 13 21:58
[...Смотрю, мэтры много наговорили... И как всегда одни ограничения...]
Дело в том, что ограничения - неотъемлемая часть постановки задачи
Этому обычно не учат в школе, но жизнь более строгий и умный учитель
Так что есть смысл потратить какое-то время на постановку той задачи, что хотите решать
Анатоль 18 июл 13 22:01
[...Застольная беседа.
Да, это проблема сродни той, чтобы воспринимать нормально изображения, на которых одни предметы частично заслоняют другие...]
Да, сродни, и многие уже не раз говорили, что машинка в мозгах - одна и та же по сути для разных систем восприятия
Но одно дело повторять, а другое - делать
ЭГТР 18 июл 13 22:11
[...представим себе сетку которая пропускает через себя только слово лев, а всё остальное сваливается в другую сетку с другими словами и т.д. сетка реагирует по принципу резонанса. Каждая сетка реагирует только на своё слово. Нет разницы сколько слов в воздухе было, нужные сетки сработают... и лишь задача сознания со своим логическим аппаратом распределить все слова по участникам разговора...]
Мне тоже нравятся Сэлфридж и его демоны. Проблема - в деталях, как всегда
[
Ответ
][
Цитата
]
Стр.31 (78)
:
1
...
27
28
29
30
[31]
32
33
34
35
...
78
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net