GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.72 (78)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Проект Sound-Agent. Звенящая пустота.
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 9:32
Цитата:
Автор: гость
Где сам алгоритм?...
Дак особого секрета нет, по-моему. Особенно если это одиночный голос известного пола/возраста и без помех. Получаете сонограмму, выделяете ЧОТ, избавляетесь от гармоник ЧОТ, потом получаете чистый рельеф, потом накладываете его на таким же образом подготовленный образец (а как же без него!), ну и сравниваете, наконец. Некоторый time-warping в этом деле не помешает, само собой
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 9:45
Цитата:
Автор: гость
Это вы так алгоритм описали? научись склеивать буковки в адио-файлах и сразу поймешь как их распознавать... научись писать и сразу читать научишься...
Немного не так все-таки.
Как я понимаю, если у вас есть некая система, умеющая синтезировать речь (которую вы понимаете, как слитную речь, а не как набор звуков), причем синтезирует она не методом склейки фонем (таких систем куча), а полновесно синтезируя (имитируя) орган речи, то у вас открывается путь к распознаванию аналогичной речи, т.к. вы знаете механизм речеобразования, и у вас появляется идеальный для сравнения образец.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 10:28
Цитата:
Автор: Victor G. Tsaregorodtsev
А тем временем в Майкрософте... заявляют не просто о распознавании, а о реалтаймовом голосовом переводе с языка на язык.
туточки
Мне понравилось, но что можно отметить:
1 - синтезатор склейкой (теперь это уже норма, увы)
2 - на немецкий переводит почти всегда хорошо, правда почему-то выдало в начале "wie dir 's geht" вместо "wie geht 's dir". Но немка поняла
Кое где уж совсем коряво было.
3 - с английским конечно хохма иногда получалась. Хотя немка и старалась артикулировать как сумасшедшая, но все-таки система сбивалась (что же будет при небрежном произношении, ужас?). Немка сказала, что английская еда - супер, а система перевела, как "индийская", народ заржал в зале. Второй раз - она говорит что со своим женихом встретится в штатах, а система перевела, что с "вашей невестой". В-общем, такие милые кросс-языковые штучки
4 - работа только с гарнитурой.
[
Ответ
][
Цитата
]
Luarvik.
Сообщений: 17287
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 10:38
Изменено: 16 июн 14 10:44
Цитата:
Автор:
dr2chek
... появляется идеальный для сравнения образец.
Не только.
Появляется возможность распознавать слово целиком... с первого прохода, не особенно дробя слово на фонемы.
[
Ответ
][
Цитата
]
гость
109.229.26.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 14:07
Цитата:
Появляется возможность распознавать слово целиком... с первого прохода, не особенно дробя слово на фонемы.
ЗАЧЕМ? Меня интересует ТОЛЬКО результ! Не супер технологии на грании ИИ. Сказал - распознал с вероятностью 62-75% - обработал! Перенес коробочку в машину - управляй бортовым компом. Перенес домой - умным освещением. На работу - робо-секретарь("набери"+"склад")! И ВСЕ! Больше ничего не нужно! Почему этого нет? Гугл ведь смог! а адаптировать гугл под одну группу языков проще чем под 40 языков... Неужели алгоритмы еще настолько слабые? И гугл/эпл обнаружили некий секрет требующий серверных ресурсов...
[
Ответ
][
Цитата
]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 21:44
Цитата:
Автор: гость
ЗАЧЕМ? Меня интересует ТОЛЬКО результ! Не супер технологии на грании ИИ. Сказал - распознал с вероятностью 62-75% - обработал! Перенес коробочку в машину - управляй бортовым компом. Перенес домой - умным освещением. ...
Хорошо когда интересует ТОЛЬКО результат и только такого уровня.
Как мне показалось, на форуме народ мало заинтересован в таком уровне "результата", а еще меньше в исследовании того какие механизмы могут обеспечивать тот или иной результат. В основном нужен супер-пупер интеллект и обязательно сразу в готовом виде "из коробки", а то, как устроены мозги и следствие его "сильных" вариантов - интеллект высокого уровня, если и интересует, то только как вынужденная приблуда.
[
Ответ
][
Цитата
]
гость
109.229.26.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 23:50
Цитата:
Автор: rrr3
Хорошо когда интересует ТОЛЬКО результат и только такого уровня.
Как мне показалось, на форуме народ мало заинтересован в таком уровне "результата", а еще меньше в исследовании того какие механизмы могут обеспечивать тот или иной результат. В основном нужен супер-пупер интеллект и обязательно сразу в готовом виде "из коробки", а то, как устроены мозги и следствие его "сильных" вариантов - интеллект высокого уровня, если и интересует, то только как вынужденная приблуда.
Увы... скатился форум! готовы завтра начать настраивать готовый интеллект купленный в магазине... Жаль! Когда-то такой интересный форум был!
[
Ответ
][
Цитата
]
rrr3
Сообщений: 11857
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 16 июн 14 23:58
Цитата:
Автор: гость
Увы... скатился форум! готовы завтра начать настраивать готовый интеллект купленный в магазине... Жаль! Когда-то такой интересный форум был!
Дык, если я Вас правильно понял, и Вас интересует только это.
[
Ответ
][
Цитата
]
гость
109.229.26.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 17 июн 14 1:11
Цитата:
Автор: rrr3
Дык, если я Вас правильно понял, и Вас интересует только это.
Что ЭТО? Я хотел бы поучаствовать в проекте по созданию ИИ или по созданию распознавалки голоса. Но я вижу одни лишь обсуждения теорий с переходами на личные оскорбления...
[
Ответ
][
Цитата
]
гость
78.25.123.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 18 июн 14 1:17
кажется, что разговор претерпел неправильную мутацию в тот момент, когда dr2chek
не сосредоточился на том, чтобы сказать как именно неформантно характеризуются
звуки 'и','у'. Тут как раз был бы еще уместен разговор об особеностях коартикуляции
(когда контекст существенно изменяет спектрограмму того или иного фонетического
элемента). Какого рода тут трудности (если они есть) - ведь ассортимент коаритикуляционых эффектов все-таки ограничен, изменения характерны, можно провести
типологию эффектов - естественная коартикуляция, коартикуляция при дефектах голосового
тракта, при дефектах ротовой полости, при артикуляционных патологиях, при разных вариантах намеренного коверкания и интонирования голоса.. можно провести типологические
исследования, выявить типовые особенности, посмотреть влияние уровня зашумленности
сигнала на распознавание его структуры (вариабельной). Расширить соотв. образом базовый ассортимент фонетических элементов, настроить работу распознавателей с расширенным 'алфавитом' (особенно в режиме сочетания анализа снизу с анализом сверху)..
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 18 июн 14 2:23
Цитата:
Автор: гость
кажется, что разговор претерпел неправильную мутацию в тот момент, когда dr2chek
не сосредоточился на том, чтобы сказать как именно неформантно характеризуются
звуки 'и','у'.
Как говорит мой друг, "всё просто как мычание". Прикол в том, что 1-я форманта у этих гласных падает ниже 300Гц (интересующиеся могут уточнить в инете на сколько, если самим лень сделать сонограмму и посмотреть). Т.о., г-н Лаврик, отважно защищающий границу 300Гц, сделал большие глаза и сдулся, не желая позориться прилюдно.
А без 1-й форманты гласная превращается... в некий свист для "и" или гудение для "у".
Понятно, что в потоке речи наша голова угадывает нужную гласную даже при такой жестокой обрезке, но метрологически - это будет облом. Конечно тут нужна и гендерная поправка и по полу - это вообще отдельная большая тема - но кому здесь об этом рассказывать?
[
Ответ
][
Цитата
]
гость
78.25.123.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 18 июн 14 2:41
ну, мне это почти все известно, но рассказывать всегда можно найти кому - все ж зависит от того как подавать материал.. иной раз и сам озадачишься своим собственным изложением вроде как известного-понятного.. нам мешает какая-то изначальная конфрантационность.
cкажем, если при распознавании некая гласная выпадает для идентификации, но факт выпадения более-менее надежно распознается, то при достаточной поддержке сверху
система распознавания будет вполне устойчивой (распознавание цепочек звуков по
'скелету', опорным точкам, контексту etc). дефицит информации из-за зауженного
спектра ведь можно компенсировать на основе избыточности сигнала. никакого фатального 'метрологического' облома - дефицит, искажение информации всегда есть
и система должна быть 'натаскана' на неопределенности возможных типов.
[
Ответ
][
Цитата
]
гость
78.25.123.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 18 июн 14 2:43
распознавание цепочек - бишь не поточечно обязательно, а по относительным (вторичным)признакам. Инварианты могут быть заданы и на третичных признаках.
[
Ответ
][
Цитата
]
гость
78.25.123.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 18 июн 14 2:46
cкажем, можно отметить сам факт ухода плотности энергии сигнала за нижнюю границу
окна анализа.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 18 июн 14 2:50
Цитата:
Автор: гость
нам мешает какая-то изначальная конфрантационность.
Ну.. лично мне она не мешает. По паре реплик виден уровень, ну а дальше... лекторий по ликбезу мне как-то не с руки организовывать.
Цитата:
Автор: гость
cкажем, если при распознавании некая гласная выпадает для идентификации, но факт выпадения более-менее надежно распознается, то при достаточной поддержке сверху
система распознавания будет вполне устойчивой (распознавание цепочек звуков по
'скелету', опорным точкам, контексту etc). дефицит информации из-за зауженного
спектра ведь можно компенсировать на основе избыточности сигнала. никакого фатального 'метрологического' облома - дефицит, искажение информации всегда есть
и система должна быть 'натаскана' на неопределенности возможных типов.
Да я со всем этим сразу же соглашусь, НО: представьте тест на изолированную гласную. Вот просто произносите протяжно "и" или "у". Вот он облом.
[
Ответ
][
Цитата
]
Стр.72 (78)
:
1
...
68
69
70
71
[72]
73
74
75
76
...
78
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net