GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.16 (35)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
NO.
Сообщений: 10700
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 23 сен 10 23:14
Синусоидами чего-то не в той октаве.
Я такое тоже рисовал, на спектре внизу если покарябать получается очень похоже на речь.
А форманты это что?
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 24 сен 10 7:39
Да это просто акустический резонанс в полости рта. Можно для каждого индивида построить табличку: такая-то гласная - такие-то частоты формант(обычно F1 и F2 берут), а F0 резервируют под частоту основного тона.. Правда эта нормализация без толку, т.к. у всех этот набор разный.
То, что "не в той октаве", так это естественно, ведь они не генерируют F0, а частоты F1 и F2 доходят до 3кГц.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 24 сен 10 11:33
В высоких частотах четкой нотой вообще не хорошо, для шипящих-свистящих лучше там просто шум сделать.
Картинка похожа на перфокарту. В итогде должно получиться 5 бит на букву и может 5 бит на оттенки если точность 32 вида. Итого 10-ю пальцами можно играть речь.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 24 сен 10 14:55
dr2chek 23 сен 10 22:26

[…Чтобы покончить с "птичьей" темой, приведу некоторые интересные на мой взгляд сведения, но в рамких синтеза речи. Энное время назад некоторая интересная организация опубликовала метод синтеза речи методом сложения 2-х (или больше) синусоидальных сигналов. Подробнее можно ознакомиться тут:
http://www.haskins.yale.edu/featured/sws/swssentences/replication.html
Они продемонстрировали неожиданную в общем-то вещь: восстановить на слух речь (пусть без взрывных и шипящих) можно, заменив формантныq "горб" одинокой синусоидой. В принципе, достаточно первых 2-х формант, но они приводят варианты и с 3-ей, но как слышно особой ясности 3-я не добавляет…]

Любопытный эксперимент. Но я стал кое-что слышать далеко не с первой попытки. И возникает вопрос – а что слышится, если оригинал вообще неизвестен. Т.е. проводили ли они корректный эксперимент такого рода?

[…С другой стороны, я проводил эксперименты с белым шумом (или с гребенкой синусоид), вводя небольшую неравномерность в АЧХ в зоне формант гласных. Как и ожидалось, наш слух уверенно распознает гласную на фоне равномерно заполненного спектра при превышении формантных горбов относительно этого "уровня моря" всего на 2дб. Но здесь есть обязательное условие: нужно попеременно предъявлять нашему слуху то плоский, то волнистый варианты спектра. Иначе при прослушивании только волнистого варианта, слух быстро привыкает к нему и далее считает его "эталонным" плоским…]

Забавно. Я уже говорил, что мы когда-то экспериментировали с динамическим синтезом на основе квантильного описания формы спектра и шумовым источником. В результате была прекрасно различаемая шопотная речь. Не могу вспомнить, слышали ли мы там гласные или нет. К сожалению, воспроизвести это сейчас уже нет возможности.

[…Таким образом, наш слух "настроен" на восприятие определенной неравномерности в спектре звука для последующего перевода этой неравномерности в ощущения гласных звуков. Причем настроен он очень "решительно"…]

Наверно, но по модулю шопотности

[…Теперь перейдем к попугаям. Вот хороший образец этой речи:
http://www.ruclip.com/video/gxhkh-bvCAw/где-кошка.html
Думаю, что на слух не глядя вряд ли кто распознает, кто там говорит "мяу", если выделить только этот фрагмент. Ну и вообще попка молодец!
Я попытался произнести это мяу с той же интонацией и темпом, сравнил поверхности спектров своего и попугайского мяу - видно что да, действительно близки в области первых 2-х формант. Если же смотреть на детали, а именно чистоту гармоник, шумовую модуляцию, то видно что это произнес не человек…]

Почему-то не удалось послушать. Впрочем, для меня это – обычное дело.

[…Более того, если вычленять фонемы из речи попугая, то слышно, что их бывает даже невозможно идентифицировать. Т.е. попугай "жульничает", домешивая местами что-то невообразимое, но интегрально, в слитной речи, это "прокатывает"!
Конечно интересно, как же попугаям так "повезло", что они могут имитировать 2 форманты человека, вроде иследования показывают что их подвижный язык позволяет перестраивать резонаторы (на усыпленной птичке вместо связок вставляли генератор и двигали языком, снимая АЧХ голосового тракта)... Но там еще неясностей хватает. Особенно для фонемы "у", у которой очень низкая форманта, стало быть и объем резонатора д.быть большим, но, если посмотрите другие ролики, видно что самый мелкий попугай с ней легко справляется...]

Возможно, вы слышали про очень старый эффект – я его знаю как «синтетический бас» - немцы когда-то использовали его в своих маленьких приемниках, которые бухали так, что невозможно было в это поверить. Смысл в том, что высшие гармоники основного тона при его полном отсутствии в сигнале создают эффект его полного присутствия. Вполне возможно, что и в случае с попугаями это тоже играет. Но тогда – вопрос: значит, тот самый критерий сходства, которым они пользуются имитируя слышимое, у них тот же, что и у нас. И снова, как ни грусттно, - вам от этого не уйти.

[…Вывод из всего этого такой: необязательно слепо копировать речь для целей синтеза, возможны и другие неожиданные способы, и слух наш готов нам в этом помогать (или обманываться, что в конечном счете и не важно)…]

Да, но придется в критериях сходства фундаментально разбираться
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 24 сен 10 21:14
2 Slava.
Вот ссылки на попугая, вроде должны работать:
http://www.zumodrive.com/share/7tAKOWU0Mj - видеоролик 3mb, формат .flv
http://www.zumodrive.com/share/7tAUMmNiZD - аудиодорожка 0,7mb, формат .wav

Начните уж с аудиодорожки, для максимального эффекта

Ну и коротко по вашим комментам.
1. с эффектом восстановления F0 из высших гармоник хорошо знаком, хотел бы реализовать это программно (для анализатора речи)
2. файлы Haskins Labs я тоже не с первого раза понимаю, привыкание наступает через 5-10 повторов, после чего можно уже догадаться о чем речь
3. Модуль шепотности не полностью подходит к сожалению, хотя очень удобен в использовании, и все из-за наличия F0, из которой можно выделить пол и возраст субъекта
4. По критериям сходства - да, тут есть над чем ломать голову...
[Ответ][Цитата]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 25 сен 10 14:52
dr2chek 24 сен 10 21:14
[...Начните уж с аудиодорожки, для максимального эффекта...]

[...Ну и коротко по вашим комментам.
1. с эффектом восстановления F0 из высших гармоник хорошо знаком, хотел бы реализовать это программно (для анализатора речи)...]

Унас на гребенках это хорошо получалось

[...2. файлы Haskins Labs я тоже не с первого раза понимаю, привыкание наступает через 5-10 повторов, после чего можно уже догадаться о чем речь...]

Мне кажется, там дело не в медленном понимании, а в том же, что когда мы слышим знакомую мелодию, то начинают всплывать соответствующие слова

[...3. Модуль шепотности не полностью подходит к сожалению, хотя очень удобен в использовании, и все из-за наличия F0, из которой можно выделить пол и возраст субъекта...]

Эт понятттно

[...4. По критериям сходства - да, тут есть над чем ломать голову...]

Мне кажется, что в вашей постановке это - единственное, над чем по-настоящему нужно ломать голову.
[Ответ][Цитата]
kcrotor
Сообщений: 402
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 26 сен 10 14:35
Не хотите попробовать создать такую демоверсию?
1) Огромный выбор комплектации, от "клеточного жука" за 2 человекодня до "Сверх ИИ из фантазий НьюПоиска" за 10 человеколет.
2) Никаких неалгоритмизируемых задач, космических кораблей, делений на ноль и прочей лженауки. Всё в рамках классического подхода и может быть запрограммировано.
3) Никакой философии, только практические инженерные идеи и подходы, от полностью готовых к реализации до тех где вам будут предоставлены широчайшие возможности изобретать, исследовать и всесторонне раскрыть ваш творческий потенциал.
4) Никаких "сумасшедших гениев" задача построения ИИ теперь доступна любому образованному человеку.
5) И наконец, специальное предложение! При выборе полной комплектации вы получите антистарение в подарок совершенно бесплатно!

Вот такая вот рекламка веселая получилась
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 26 сен 10 16:56
Цитата:
Автор: kcrotor
Вот такая вот рекламка веселая получилась

Не тем людям предлагаете и не те задачи.
Вот схема более работоспособного рецепта. Всего-то надо заменить ОЧБР на ИИ и подкорректировать практические схемы применения.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 27 сен 10 14:05
kcrotor 26 сен 10 14:35
[...Не хотите попробовать создать такую демоверсию?...]

ИИ меня не интересует ни в каком виде, так что - спасибо
[Ответ][Цитата]
kcrotor
Сообщений: 402
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 27 сен 10 14:19
Цитата:
Автор: Slava
ИИ меня не интересует ни в каком виде, так что - спасибо

А что вас интересует?
[Ответ][Цитата]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 27 сен 10 14:41
kcrotor 27 сен 10 14:19
[...А что вас интересует?...]

Меня интересует Усилитель интеллекта-разума человека и все связанное с этим для человека
[Ответ][Цитата]
kcrotor
Сообщений: 402
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 27 сен 10 14:48
Цитата:
Автор: Slava
Меня интересует Усилитель интеллекта-разума человека и все связанное с этим для человека

А в каком виде вы представляете свой усилитель? Как некоторого электронного секретаря? Или как чип (или биологическую структуру) вживленную в мозг? или как фармацевтический препарат? Или еще как-нибудь? Какую из реализаций вы планируете осуществить в первую очередь?

ЗЫ: Я пытаюсь найти точки соприкосновения наших интересов.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 27 сен 10 15:01
kcrotor 27 сен 10 14:48
[...А в каком виде вы представляете свой усилитель? Как некоторого электронного секретаря? Или как чип (или биологическую структуру) вживленную в мозг? или как фармацевтический препарат? Или еще как-нибудь? Какую из реализаций вы планируете осуществить в первую очередь?
ЗЫ: Я пытаюсь найти точки соприкосновения наших интересов...]

Где-то тут и совсем недавно я кому-то уже такое писал.
Усилитель - развитие очень старой идеи Эшби. Возможно, вы о таком слышали. Мне она попалась в очень старом и очень интересном сборнике "Автоматы". Затем она слилась с попыткой объяснить феномен ментального резонанса (термин мой). Поэтому Усилитель - и учитель и секретарь и творческий партнер и т.д. и т.п. Много, о чем можно говорить. Пока реализуется, естественно, в компе и не только. Остальное меня не волнует.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 28 сен 10 3:03
Цитата:
Автор: Slava
феномен ментального резонанса

я смотрю кино Colossus: The Forbin Project (1970)
http://vkontakte.ru/video33042881_151692463
там советский и американский ИИ объединились, оно в репродуктор говорит "this is a voice of Colossus and Guardian, the voice of unity". фильм по-английски
[Ответ][Цитата]
Slava
Сообщений: 3070
На: А ЧТО ЕСЛИ СООБЩА СОЗДАТЬ ДЕМОВЕРСИЮ ИИ
Добавлено: 28 сен 10 13:16
NO. 28 сен 10 3:03
[...я смотрю кино Colossus: The Forbin Project (1970)
http://vkontakte.ru/video33042881_151692463
там советский и американский ИИ объединились, оно в репродуктор говорит "this is a voice of Colossus and Guardian, the voice of unity". фильм по-английски...]

Спасибо, но я кино обычно не смотрю. А вам кажется, там это есть?
[Ответ][Цитата]
 Стр.16 (35)1  ...  12  13  14  15  [16]  17  18  19  20  ...  35<< < Пред. | След. > >>