GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.17 (29)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
dr2chek
Сообщений: 871
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 21 июн 10 21:25
Цитата:
Автор: Slava

на этом мы остановились, но все было абсолютно прозрачно


Ну что... Молодцы конечно! Требовался еще один рывок
А шипящие глухие и взрывные согласные пытались идентифицировать? Правда, таких вопросов можно еще пару десятков задать, так что не будем засорять форум
Значит, поищете по возможности?
Если вы удачно решили первых 3 пункта, то исходники бы не помешали, точно
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 21 июн 10 21:40
dr2chek 21 июн 10 21:25
[...А шипящие глухие и взрывные согласные пытались идентифицировать? Правда, таких вопросов можно еще пару десятков задать, так что не будем засорять форум
Значит, поищете по возможности?
Если вы удачно решили первых 3 пункта, то исходники бы не помешали, точно...]

Поищем. Но там все жутко медленно считалось. Счас точно не помню. Но часа два на каком-то старом пенте то ли минута, то ли секунд 10-20 реального сигнала
А с шипящими как-то не видели особых проблем, да и от задачи многое зависит.
Например, когда-то мы синтезировали шепотную речь - разборчивость была замечательной, но голос узнать было невозможно
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 21 июн 10 21:43
Цитата:
Автор: Slava

когда-то мы синтезировали шепотную речь - разборчивость была замечательной, но голос узнать было невозможно

Формантный синтез делали, или склейкой?
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 21 июн 10 21:43
Цитата:
Автор: Slava

dr2chek 21 июн 10 14:31
[...Краткий отчет по "подарку"...]

Если интересно, мог бы поделиться с вами тем, что мы в свое время наработали по этому поводу


Хорошая инфа
что 5 раз на одном компьютере это работает..
Возможно "Нюанс" даст вам 5 раз и на русскояз версию..

НО и Нейронус
возм могут снять защиту
для исследователя-академика
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 21 июн 10 21:45
что-то происх с 17 стр этого топика..
с трудом влез подозревая обмен сикретными X-файлами..
Но надеюсь это не кр гэ-бня а Сисадминский баг
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 21 июн 10 21:51
Цитата:
Автор: Capt.Drew

что-то происх с 17 стр этого топика..
с трудом влез подозревая обмен сикретными X-файлами..
Но надеюсь это не кр гэ-бня а Сисадминский баг

Это баг. Я уже давно заметил: когда текущая страница подходит к концу, высвечивается якобы следующая, но она-то пустая на самом деле - и сразу выкидывает в корень
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 21 июн 10 21:55
Цитата:
Автор: Capt.Drew

НО и Нейронус
возм могут снять защиту
для исследователя-академика

Академику влом переустанавливать драйвера заради кривой Нюансы...
Честно
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 22 июн 10 8:47
У меня есть редактор звука, переводит звук в спектр-картинку, на которой можно рисовать, потом назад проиграть как звук. Если в низких частотах нарисовать мусору получается похоже на бормотание на неизвестном языке. Картинки нагляднее, а алгоритмы те же.

При распознавании сложность наверно с взрывными согласными, нужна модель инерции речевого аппарата, чтобы видеть предпринятые говорящим усилия как от одного звука перейти к другому. У музыкальных инструментов такой инерции мало, в wav-pcm как бы вообще нету.

вот еще забавный клип, девченку заставили издать несколько звуков, потом собрали мелодию
http://vkontakte.ru/video65646043_145677308
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 22 июн 10 14:31
dr2chek 21 июн 10 21:43
[...Формантный синтез делали, или склейкой?...]

Нет. Мы тогда занимались тем, что сейчас можно было бы назвать квантильным анализом - разбиением спектра на равномощные полоски. Очень даже любопытная вещь и перспективная, но тоже бросили по дороге
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 22 июн 10 14:40
NO. 22 июн 10 8:47
[...При распознавании сложность наверно с взрывными согласными, нужна модель инерции речевого аппарата, чтобы видеть предпринятые говорящим усилия как от одного звука перейти к другому. У музыкальных инструментов такой инерции мало, в wav-pcm как бы вообще нету...]

Был когда-то великий речевик - Цемель Герш Израилевич. Он с этим и не только легко справлялся. Книжка у него была. Хорошая
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 22 июн 10 15:20
вот нашел
http://www.twirpx.com/file/206251/

наверно кроме речи ещё нужно лепет и бормотание
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 22 июн 10 15:31
NO. 22 июн 10 15:20
[...наверно кроме речи ещё нужно лепет и бормотание...]

Это - он, но книжка не та. Та была, кажется, зелененькой и он там автор, а не редактор. Один из плеяды великих речевиков
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 22 июн 10 15:54
NO. 22 июн 10 15:20
[...наверно кроме речи ещё нужно лепет и бормотание...]

Лепет и бормотание - тоже понадобятся. Со временем
[Ответ][Цитата]
ЭСГТР
Сообщений: 8461
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 23 июн 10 11:25
А пока они используются, к сожалению, без надобности....
[Ответ][Цитата]
Capt.Drew
Сообщений: 4179
На: Ai Drew :: Прикладные Q&A ЕЯ системы Общения: NLP/NLSU/VoiceXML
Добавлено: 26 янв 11 18:49
Цитата:
Автор: ЭГТР: А пока они используются, к сожалению, без надобности....
subj: Новости Ноосферы: Анализ и Выводы

Россы вступают в 21-век с несколько ослабленными позициями в новейших IT-технологиях.. Мать-Родина успешна расшугала пытливую молодежь, Софт или заимствуют на халяву или покупают в Германии или где.. а на Западе - с большинсва интересных работ - укроссов вытеснили гибкие Индусы - за к-ми поддержка Страны и Народа.. И до Аннушки Чатман - русский акцент не возбуждал федералов и морпехов.. Так что - научиться негде и не у кого..

К счастью, еще есть среди нас Титаны мысли, стоящие на плечах западных Гигандов.. одним из этих Могикан Планетарной НООСФЕРЫ является ваш покорный слуга, но, плз - без рукосуйства и панибратства..
[Ответ][Цитата]
 Стр.17 (29)1  ...  13  14  15  16  [17]  18  19  20  21  ...  29<< < Пред. | След. > >>