GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.44 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Зри в корень!
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 0:38
Цитата:
Автор: Tester64

Одну короткую фонему ухо почти не распознает. Возможно это нюанс человеческого уха - только в комплексе.


Я думаю, что вы - абсолютно правы
И только так можно надеяться добиться чего-то существенного
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 6:43
Цитата:
Автор: Артем
Если не секрет откуда вы про это знаете? Как называется этот холтеровский монитор про который вы говорите?

Да ХЗ как он называется - мне прошлой осенью предлагали написать программу по обработке ЭКГ, и устанавливали требования к объему данных и скорости их обработки исходя из трёхсуточной длины записанных сигналов. Именно по монитору я акценты не помню (покупной ли он был или сделанный с нуля). Но в качестве примеров обрабатывающего софта мне накидали несколько ссылок (http://www.diamant.spb.ru/programs.htm , http://www.incart.ru/text.jsp?id=10229#name3 и т.д.) - там где-то тоже можно было найти заявки о долгом времени ношения современных мониторов без сброса данных на диск.
В общем, мне и не предлагали работать с самим прибором - файлы с него сбрасывались бы на комп через USB-интерфейс через обычный виндовый Проводник, надо было просто эти файлы обрабатывать. Так что имени железяки - не знаю.
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 6:50
Цитата:
Автор: Slava
Могу добавить к сказанному, что частотный диапазон вибросигнала на порядок превышает акустический сигнал, воспринимаемый ухом, у него динамический диапазон - на два порядка больше воспринимаемого, а работать почти все время нам приходилось с 16-тибитными АЦП в мониторе и только в самом конце появилась надежда на использование 24-тичетырех битных АЦП.
Хотите что-нибудь добавить?

Нет, ясно, что это уже полностью другая ситуация (не сотни герц частоты оцифровки, как при снятии ЭКГ).
Но "меня терзают смутные сомнения" насчёт может быть излишней фантастичности требований (про десятки килогерц частотного диапазона и 24 бита АЦП). УЗИ беременным делают задолго до наступления схваток
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 7:05
Цитата:
Автор: Victor G. Tsaregorodtsev


Нет, ясно, что это уже полностью другая ситуация (не сотни герц частоты оцифровки, как при снятии ЭКГ).
Но "меня терзают смутные сомнения" насчёт может быть излишней фантастичности требований (про десятки килогерц частотного диапазона и 24 бита АЦП). УЗИ беременным делают задолго до наступления схваток


И правильно терзают
Спектр там примерно от 0.001 до 100 Гц,
а информативные компоненты сигнала оказались где-то вблизи нижней границы динамического диапазона шириной примерно те же пять порядков
Нащупать было непросто на 16-ти битах, оттого и потребовались 24, а в промежутке на рынке просто ничего не оказалось.
Можно обсуждать целесообразность использования вибродатчиков, но там много факторов, влияющих на это. Начинали мы вообще с электромиограмм, снимавшихся одним парнем в штатах с помощью какого-то уникального сверхчувствительного датчика
Самое забавное в том, что в результате оказалось, что отработанная технология и на миограммах прекрасно работает тоже
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:05
Цитата:
Автор: Tester64

Одну короткую фонему ухо почти не распознает. Возможно это нюанс человеческого уха - только в комплексе. Когда-то долго (часов 10) поигрался со своим голосом. МА в долю секунды ничем не отличается от МО и МУ. Попробуйте только фонему А или затянутую МА-А-А-А. Попробуйте написать НАДЕЖНЫЙ метод выявления одной фонемы А в бесконечном потоке.


Вот тут вы правы и неправы.
Что такое одна короткая фонема? Я подразумеваю взрывные.
Полагаю что именно взрывные звуки эволюция научилась слышать в первую очередь
Это удар. Палкой о палку например.

Что же касается МО МУ и МА - то тут действительно нет особой разницы.
Имеет значение только изменение параметров спектра во времени.
Но даже в этом случае в слитной речи я не часто слышу отличие
кОрова от кАрова.
Единственно где можно четко услышать гласную - это ударная гласная.
Ударная гласная характеризуется максимально мощностью и максимальным значением частоты основного тона. Ну например на других гласных 100гц, а на ударной - 150.

Попробуйте проговорить А-О-У. Происходит движение губ.
Они перетекают друг-в-друга плавно. Между ними нет строгой разницы.
Буквы Э-И-Ы - тоже один черт.

Если вы вырезаете кусочек 20 мс из фонемы МА,
вы не можете услышать что там было А или О.
Просто потому что в 20 мс на частоте 400 гц поместится всего 8 периодов.
А 600гц - 12 периодов.
А в более длинный кусочек, например 80мс поместится уже
32 периодов для 400 гц и
48 периода для 600 гц.
Разница становится более выразительной. Не меняется пропорция (в 1.5 раза), но меняется доверительная оценка для этого соотношения (ну точно в 1.5 раза!).

Это также как и преобразование фурье, чем больше точек фурье - тем лучше разрешающая способность по частоте.

Безусловно мысль о том что надо анализировать какие-то магические 40 мс или 20 или другие магические N мс - не очень верная.

Конечно лучше выделить фонему на протяжении всей своей длительности и анализировать ее спектральный отклик по всей длительности.

ВЫВОД: Нужен алгоритм - способный, не разбираясь в том, какая ИМЕННО звучит фонема провести разметку (фрагментацию) во времени, на предмет появления новых фонем.

[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:17
Цитата:
Автор: Артем

ВЫВОД: Нужен алгоритм - способный, не разбираясь в том, какая ИМЕННО звучит фонема провести разметку (фрагментацию) во времени, на предмет появления новых фонем.


Была такая замечательная вещь - называлась "Фонетической функцией А.А.Пирогова"
И человек был совершенно уникальный
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:18
Еще раз сформулирую.
Человеческое ухо прекрасно слышит взрывы. Но слабо отличает их друг от друга.
Человеческое ухо хорошо отличает стационарные длительные звуки (ноты).

А вот для построения алгортма фрагментации - не нужно знать особенности языка.
Нужна статистика.
Для построения алгоритма фрагментации - можно попробовать применить "самообучающийся" алгоритм. Или вариант генетического алгоритма.

Критерием оптимизации может служить предсказание сигнала или спектра сигнала(на 5-10 мс), и энергоэффективность.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:26
Цитата:
Автор: Slava
Была такая замечательная вещь - называлась "Фонетической функцией А.А.Пирогова"
И человек был совершенно уникальный


Slava вы как всегда отжигаете!
Фонетическая функция Пирогова - это тот велосипед, который я пытаюсь изобрести!
И ссылки в инете есть!
http://www.rusphysics.ru/files/Pirogov.Osnovy%20fon.teorii.pdf
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:32
Цитата:
Автор: Артем

Еще раз сформулирую.
Человеческое ухо прекрасно слышит взрывы. Но слабо отличает их друг от друга.
Человеческое ухо хорошо отличает стационарные длительные звуки (ноты).


Человеческое ухо прекрасно различает межфонемные переходы

Цитата:
А вот для построения алгортма фрагментации - не нужно знать особенности языка.
Нужна статистика.
Для построения алгоритма фрагментации - можно попробовать применить "самообучающийся" алгоритм. Или вариант генетического алгоритма.


И что же вам мешает это все проверить?

Цитата:
Критерием оптимизации может служить предсказание сигнала или спектра сигнала(на 5-10 мс), и энергоэффективность.


Может, конечно, но это - всего лишь часть исследования по предыдущему пункту

А Пирогова все же поглядите - это один из столпов в ранней речевой проблематике, но в отличие от Цемеля его интересовало в большей мере предельное сжатие сигнала
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:40
Цитата:
Автор: Артем

Slava вы как всегда отжигаете!
Фонетическая функция Пирогова - это тот велосипед, который я пытаюсь изобрести!
И ссылки в инете есть!
http://www.rusphysics.ru/files/Pirogov.Osnovy%20fon.teorii.pdf


Вот и прекрасно
А что такое - отжигать?
Старые книги - не чета новым - то было время гигантов, фонтанирующих идеями
А теперь главное - наукообразие
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:41
Я сам прочел ссылку - это прекрасно! Это понятно.
Но когда я начал читать список литературы - я угорел
Эту статью написал человек чтобы сообщить кому-то, вы все дураки и придумываете велосипеды.

Цитата:

Литература
1. «Тысяча и одна ночь» − сборник арабских сказок, сложившийся в основном к 15 веку;
повлиял на фольклор и литературу многих народов. Сов. Энциклопедический словарь, гл. ред.
А.М. Прохоров, изд. 4-ое, М., 1989 г., 1632 с
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:45
Цитата:
Автор: Slava
И что же вам мешает это все проверить?

Так я уже этим занимаюсь. Просто теперь я знаю как это называется - и у меня есть формула и ссылка на серьезные статьи.

Я ЭТО ПРОВЕРЮ !!!

А отжигать - это молодежный слэнг.
Огонь - это движение.
Отжигать - придавать ускорение.

[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 8:52
Цитата:
Автор: Артем

Так я уже этим занимаюсь. Просто теперь я знаю как это называется - и у меня есть формула и ссылка на серьезные статьи.

Я ЭТО ПРОВЕРЮ !!!

А отжигать - это молодежный слэнг.
Огонь - это движение.
Отжигать - придавать ускорение.


Я рад за вас и спасибо за науку
Что же касается речи, если о ней все же идет речь как источнике задач, то стоит все же иметь в виду то, что за это время возникло кое-что еще по части анализа и предсказания
Но задачи все же надо стараться формулировать
В общем, рад за вас

[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 9:01
Цитата:
Автор: Артем



Slava вы как всегда отжигаете!
Фонетическая функция Пирогова - это тот велосипед, который я пытаюсь изобрести!
И ссылки в инете есть!
http://www.rusphysics.ru/files/Pirogov.Osnovy%20fon.teorii.pdf


Не видел этой работы
Спасибо
А на ссылки не обращайте внимания, поскольку он сам их приводит в основном в негативном смысле
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Зри в корень!
Добавлено: 07 авг 13 13:07
господа форумчане!
сегодня у меня отличный день.
- На работе я закончил итерацию длительностью 5 месяцев
- На форуме я понял как соединить шкалу Мела и фонетическую функцию Пирогова.

Поэтому предлагаю вам посмеяться над моими опусами.
Первый опус - про меня. Второй опус -я писал. По второй ссылка -мое фото в молодости ...
http://limanolimp.narod.ru/frms/Prikol/pr015.htm
http://limanolimp.narod.ru/frms/Prikol/pr018.htm

p.s. и почему мне кажется что моя палатка и мое распознавание речи имеют что-то общее? ...
p.s.s Егор - мой средний брат. Еще есть Павел - младший брат. А joker - это вовсе не я. Но фотка моя. И текст мой.
p.s.s А вот это мой брат Егор. Между прочим профессор химфака.
http://limanolimp.narod.ru/frms/Prikol/pr010.htm
p.s.s.s Но без этого никак http://limanolimp.narod.ru/frms/Prikol/pr004.htm
[Ответ][Цитата]
 Стр.44 (78)1  ...  40  41  42  43  [44]  45  46  47  48  ...  78<< < Пред. | След. > >>