dr2chek 23 сен 10 22:26
[…Чтобы покончить с "птичьей" темой, приведу некоторые интересные на мой взгляд сведения, но в рамких синтеза речи. Энное время назад некоторая интересная организация опубликовала метод синтеза речи методом сложения 2-х (или больше) синусоидальных сигналов. Подробнее можно ознакомиться тут:
http://www.haskins.yale.edu/featured/sws/swssentences/replication.htmlОни продемонстрировали неожиданную в общем-то вещь: восстановить на слух речь (пусть без взрывных и шипящих) можно, заменив формантныq "горб" одинокой синусоидой. В принципе, достаточно первых 2-х формант, но они приводят варианты и с 3-ей, но как слышно особой ясности 3-я не добавляет…]
Любопытный эксперимент. Но я стал кое-что слышать далеко не с первой попытки. И возникает вопрос – а что слышится, если оригинал вообще неизвестен. Т.е. проводили ли они корректный эксперимент такого рода?
[…С другой стороны, я проводил эксперименты с белым шумом (или с гребенкой синусоид), вводя небольшую неравномерность в АЧХ в зоне формант гласных. Как и ожидалось, наш слух уверенно распознает гласную на фоне равномерно заполненного спектра при превышении формантных горбов относительно этого "уровня моря" всего на 2дб. Но здесь есть обязательное условие: нужно попеременно предъявлять нашему слуху то плоский, то волнистый варианты спектра. Иначе при прослушивании только волнистого варианта, слух быстро привыкает к нему и далее считает его "эталонным" плоским…]
Забавно. Я уже говорил, что мы когда-то экспериментировали с динамическим синтезом на основе квантильного описания формы спектра и шумовым источником. В результате была прекрасно различаемая шопотная речь. Не могу вспомнить, слышали ли мы там гласные или нет. К сожалению, воспроизвести это сейчас уже нет возможности.
[…Таким образом, наш слух "настроен" на восприятие определенной неравномерности в спектре звука для последующего перевода этой неравномерности в ощущения гласных звуков. Причем настроен он очень "решительно"…]
Наверно, но по модулю шопотности
[…Теперь перейдем к попугаям. Вот хороший образец этой речи:
http://www.ruclip.com/video/gxhkh-bvCAw/где-кошка.html
Думаю, что на слух не глядя вряд ли кто распознает, кто там говорит "мяу", если выделить только этот фрагмент. Ну и вообще попка молодец!
Я попытался произнести это мяу с той же интонацией и темпом, сравнил поверхности спектров своего и попугайского мяу - видно что да, действительно близки в области первых 2-х формант. Если же смотреть на детали, а именно чистоту гармоник, шумовую модуляцию, то видно что это произнес не человек…]
Почему-то не удалось послушать. Впрочем, для меня это – обычное дело.
[…Более того, если вычленять фонемы из речи попугая, то слышно, что их бывает даже невозможно идентифицировать. Т.е. попугай "жульничает", домешивая местами что-то невообразимое, но интегрально, в слитной речи, это "прокатывает"!
Конечно интересно, как же попугаям так "повезло", что они могут имитировать 2 форманты человека, вроде иследования показывают что их подвижный язык позволяет перестраивать резонаторы (на усыпленной птичке вместо связок вставляли генератор и двигали языком, снимая АЧХ голосового тракта)... Но там еще неясностей хватает. Особенно для фонемы "у", у которой очень низкая форманта, стало быть и объем резонатора д.быть большим, но, если посмотрите другие ролики, видно что самый мелкий попугай с ней легко справляется...]
Возможно, вы слышали про очень старый эффект – я его знаю как «синтетический бас» - немцы когда-то использовали его в своих маленьких приемниках, которые бухали так, что невозможно было в это поверить. Смысл в том, что высшие гармоники основного тона при его полном отсутствии в сигнале создают эффект его полного присутствия. Вполне возможно, что и в случае с попугаями это тоже играет. Но тогда – вопрос: значит, тот самый критерий сходства, которым они пользуются имитируя слышимое, у них тот же, что и у нас. И снова, как ни грусттно, - вам от этого не уйти.
[…Вывод из всего этого такой: необязательно слепо копировать речь для целей синтеза, возможны и другие неожиданные способы, и слух наш готов нам в этом помогать (или обманываться, что в конечном счете и не важно)…]
Да, но придется в критериях сходства фундаментально разбираться