GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.15 (35)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 16:03
Кирсоф, все о чем вы говорите, уже давным давно придумано: наберите в поиске "база аллофонов", и будет вам счастье.
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 16:09
dr2chek 20 сен 10 20:26
[...Меня так и подмывает отправить вам пару-тройку образцов, сгенерированных моим формантным синтезатором - вдруг вы бы переменили свое мнение...]
То, что гласные в стационрарных участках у вас получаются хорошо, я совсем не сомневаюсь. Но гласными ведь дело не ограничивается. Да и у нас, когда мы вырезали голоса своими гребенками, все тоже весьма недурно звучало, но форманты там очень хило просматривались.
[...Да адаптация возможно вытянет, особенно при наличии живого диктора-образца. Но я честно говоря вынашиваю еще более крамольную мысль - есть ли механизм в принципе, который позволил бы производить речь, уже настроенную на одного диктора, в другой фонетической базе, проще говоря на другом, иностранном языке, но без акцента... Как бы наш синтезатор должен послушать уже совсем другого диктора-иностранца, и повторить в конце концов за ним без запинки и без акцента, но все таки "своим" голосом...]
Идея не выглядит слишком крамольной, так как речевой аппарат у всех гомо..., в общем-то, один и тот же. Но есть довольно сильные различия в общем характере языков - певучие, гортанные и т.п. Мне кажется, это может создать проблемы. Я про фонетику мало знаю, но есть спецы. А еще есть феномен попугайской речи
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 16:15
Анатоль 21 сен 10 12:03
[...Нужно стремиться синтезировать не отдельне гласные или согласные, а дифоны (в первую очередь дифоны СГ).
Из отдельных звуков ничего путного не получится.
Не только гласная влияет на согласную, но и наоборот...]
Был такой замечательный исследователь в пору расцвета речевой тематики - Г.И.Цемель. Он основывал свою работу по распознаванию речи именно на такого рода слогах, включая и ССГ и СССГ. Всего там у него получалось, если память мне не изменяет, порядка трех сотен слогов.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 16:22
Цитата:
Автор: Slava
А еще есть феномен попугайской речи
Вы о попугаях - птичках? Так с ними практически все ясно...
[
Ответ
][
Цитата
]
Кирсоф
Сообщений: 1206
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 16:23
Цитата:
Автор: dr2chek
Кирсоф, все о чем вы говорите, уже давным давно придумано: наберите в поиске "база аллофонов", и будет вам счастье.
Придумано, значит РЕАЛИЗОВАНО.
Теория ядерного распада была заложена лет за двадцать до РЕАЛИЗАЦИИ в виде атомной бомбы.
Теория конкатенативного синтеза речи тоже известна, как минимум, лет 10. Ждемс, теперь РЕАЛИЗАЦИИ.
Так что очередь за счастьем сохраняется и для Вас.
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 16:55
dr2chek 21 сен 10 16:22
[...Вы о попугаях - птичках? Так с ними практически все ясно...]
О птичках, конечно. Ну да, практически все ясно, только ведь и они решают вашу проблему, причем, на доступной им технике.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 17:19
НЕт, качество попугайской речи меня не устраивает. Кстати, еще майны неплохо подражают.
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 17:27
dr2chek 21 сен 10 17:19
[...НЕт, качество попугайской речи меня не устраивает. Кстати, еще майны неплохо подражают...]
Это - чайки что ли? - не слышал. Да и попугаев живььем тоже не слшал никогда. Но ведь говорят, вполне разборчиво и лучше, по-моему, чем звучит клиппированная речь
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 18:01
Зачем чайки? Майны из семейства скворцовых.
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 18:06
dr2chek 21 сен 10 18:01
[...Зачем чайки? Майны из семейства скворцовых...]
Спасибо. У нас тут птичками другие занимаются.
Майна-вира - ошибки ассоциативности, так сказать - издержки методологии
[
Ответ
][
Цитата
]
Анатоль
Сообщений: 1964
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 18:53
Цитата:
Автор: dr2chek
Вы о попугаях - птичках? Так с ними практически все ясно...
А мне не ясно.
Они синтезируют звуки похожие на услышанные?
Если женский голос обучает попугая одному слову, а мужской другому, будет ли попугай и произносить эти слова разными голосами, или каким-то "своим" ?
Если разными (похожими на обучающие) тогда да, всё ясно, а если нет - тогда это очень интересно.
Вы случайно не знаете, какой тут вариант имеет место?
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 21 сен 10 20:45
Однозначно разными, с т.зрения прозодии - он же ПОПУГАЙ. Т.е. вообще магнитофон типа, хоть и с другим принципом звукоизвлечения, чем у человека.
Вы когда-нибудь пересмешников слышали? Они же собирают всякий звуковой мусор: мелодии мобильников, звуки клаксонов, трески, фрагменты песен певчих птиц... потом все перемешивают и выдают в мелкой нарезке, секунды по 3 у них песни - в-общем ухохотаться можно, насколько старательно они это выводят, одну песню повторяют раз 5 практически идентично, потом тут же переходят к следующей и т.д. Но главное остается: одна песня повторяется как магнитофон несколько раз. А вот например горихвостки, те наоборот, хоть песня у них те же 3-5сек, но они не повторяются; по крайней мере в течение получаса я таковых не обнаружил, но у них и интервалы между песнями около 10сек.
[
Ответ
][
Цитата
]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 22 сен 10 14:25
dr2chek 21 сен 10 20:45
[...А вот например горихвостки, те наоборот, хоть песня у них те же 3-5сек, но они не повторяются; по крайней мере в течение получаса я таковых не обнаружил, но у них и интервалы между песнями около 10сек...]
Замечательно приятно, что вы всем этим занимаетесь
[
Ответ
][
Цитата
]
Кирсоф
Сообщений: 1206
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 23 сен 10 21:25
В Системной Аналитике есть много Классификаций и Градаций. Расскажу про одну из них. Она относится к характеристикам людей, которые, в общем случае, делятся на ДВЕ УСЛОВНЫЕ КАТЕГОРИИ:
СОЗИДАТЕЛИ и ИЗУЧАТЕЛИ.
Сие означает, что одни люди по своей природе являются Созидателями. Они постоянно что-то изобретают: радио, атомную бомбу, компьютер, лазер... Скоро создадут и Искусственный Разум. Вторые же, Изучатели, ЗНАЮТ, как устроено то, что до них СОЗДАНО Созидателями. Поэтому Изучателям досталась лишь роль изучать, какое расстояние у Слона, созданного Содателем, от его хобота до хвоста и наооборот.
[
Ответ
][
Цитата
]
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 23 сен 10 22:26
Чтобы покончить с "птичьей" темой, приведу некоторые интересные на мой взгляд сведения, но в рамких синтеза речи. Энное время назад некоторая интересная организация опубликовала метод синтеза речи методом сложения 2-х (или больше) синусоидальных сигналов. Подробнее можно ознакомиться тут:
http://www.haskins.yale.edu/featured/sws/swssentences/replication.html
Они продемонстрировали неожиданную в общем-то вещь: восстановить на слух речь (пусть без взрывных и шипящих) можно, заменив формантныq "горб" одинокой синусоидой. В принципе, достаточно первых 2-х формант, но они приводят варианты и с 3-ей, но как слышно особой ясности 3-я не добавляет.
С другой стороны, я проводил эксперименты с белым шумом (или с гребенкой синусоид), вводя небольшую неравномерность в АЧХ в зоне формант гласных. Как и ожидалось, наш слух уверенно распознает гласную на фоне равномерно заполненного спектра при превышении формантных горбов относительно этого "уровня моря" всего на 2дб. Но здесь есть обязательное условие: нужно попеременно предъявлять нашему слуху то плоский, то волнистый варианты спектра. Иначе при прослушивании только волнистого варианта, слух быстро привыкает к нему и далее считает его "эталонным" плоским.
Таким образом, наш слух "настроен" на восприятие определенной неравномерности в спектре звука для последующего перевода этой неравномерности в ощущения гласных звуков. Причем настроен он очень "решительно".
Теперь перейдем к попугаям. Вот хороший образец этой речи:
http://www.ruclip.com/video/gxhkh-bvCAw/г
де-кошка.html
Думаю, что на слух не глядя вряд ли кто распознает, кто там говорит "мяу", если выделить только этот фрагмент. Ну и вообще попка молодец!
Я попытался произнести это мяу с той же интонацией и темпом, сравнил поверхности спектров своего и попугайского мяу - видно что да, действительно близки в области первых 2-х формант. Если же смотреть на детали, а именно чистоту гармоник, шумовую модуляцию, то видно что это произнес не человек.
Более того, если вычленять фонемы из речи попугая, то слышно, что их бывает даже невозможно идентифицировать. Т.е. попугай "жульничает", домешивая местами что-то невообразимое, но интегрально, в слитной речи, это "прокатывает"!
Конечно интересно, как же попугаям так "повезло", что они могут имитировать 2 форманты человека, вроде иследования показывают что их подвижный язык позволяет перестраивать резонаторы (на усыпленной птичке вместо связок вставляли генератор и двигали языком, снимая АЧХ голосового тракта)... Но там еще неясностей хватает. Особенно для фонемы "у", у которой очень низкая форманта, стало быть и объем резонатора д.быть большим, но, если посмотрите другие ролики, видно что самый мелкий попугай с ней легко справляется...
Вывод из всего этого такой: необязательно слепо копировать речь для целей синтеза, возможны и другие неожиданные способы, и слух наш готов нам в этом помогать (или обманываться, что в конечном счете и не важно).
[
Ответ
][
Цитата
]
Стр.15 (35)
:
1
...
11
12
13
14
[15]
16
17
18
19
...
35
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net