GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.76 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Звенящая пустота.
гость
78.25.122.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 21 июн 14 22:24
A.> звук в пространстве признаков, где координатными осями будут шкалы положения
> языка, губ, силы выдоха, напряжения гортани и т.п. И именно это моделировал при
> создании виртуального синтезатора голоса, а не спектры.

> все ли из здесь присутствующих при восприятии речи могут представить движения рта
> говорящего? Уверен, что да. А хоть кто-то из присутствующих может на слух точно
> определить частоту гармоники? Думаю, что нет. А от компьютера зачем-то это требуют

Тут нужно быть очень осторожным с логикой..

Ребенок при обучении распознаванию-продуцированию речи как раз комплексирует разнородные потоки - аудио, видио, артикуляционное чувство. До этого дошел на шишках
кек, об этом говорил сеченов, это старая академическая истина (cо своими следствиями).

Ребенок подражает артикуляционной мимике нависшего над ним лица (отдавая предпочтение голосу с тембральной структурой материнского (воспринимаемого еще пренатально и сразу
постнатально).

Но! Чревато слишком упростить дело. 'Беccознательный' ребенок (т.е. мозгом) осуществляет некую 'аналитическую' операционную обработку аудио-потока - именно это
имеется в виду в идеологии обобщенного (перестраиваемого-адаптивного) спектрального нейроанализа.

Эта аналитика только совершенствуется опытом речевых игр и взаимодействий с матерью
(от гуления к первичной фонограмматике и собственно первичной (pivot) грамматике).
Прогрессивная кластеризация звуков и схематизация фонетических переходов (в т.ч. на
уровне артикуляционных программ).

В итоге мы способны распознавать не только по губам, с опорой на различение движения губ, но и чисто аудиально.

Тут С САМОГО НАЧАЛА не нужно впасть в ошибку интроспекционизма: как мы 'сознательно'
не обрабатываем спектр, точно так же мы сознательно не анализируем движение гортани,
языка и губ. мы на это можем обратить внимание. Но обратить внимание нужно на то,
КАК РАБОТАЕТ МОЗГ МЛАДЕНЦА. А это интроспекционистски недоступно.
[Ответ][Цитата]
гость
78.25.122.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 21 июн 14 22:37
dr2chek> всё равно от неопределенности время-частота никуда не деться

да. и ОСА как раз призвано адаптироваться под эту неопределенность. Это можн делать
систематически, а можно 'кусочными' ПФ с эвристиками того или иного рода (ПФ-ориентированными).

> что дальше

разумеется. Общая схема канонична: предобработка-обработка-постпроцессинг. Постобработка это как раз учет результативности и эффективности обработки для
настройки предобработки. Общая схема адаптации-обучения. Тут как раз очень
уместен ОСA, когда проблема эвристик выносится на уровень функционирования
глобальной схемы (глобального функционирования - смысла жизни по андрею ).
(эвристики скорости, точности, надежности, эффективности, риска etc)

[Ответ][Цитата]
гость
92.39.139.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 21 июн 14 23:36
Цитата:
Автор: Андрей
Возможно она просто читает по губам. Хотя всё-равно подозрительно.

Правильно, именно подозрительно.
Глухие от рождения они ещё и немые, но произносить нечленораздельные звуки могут.
Чтение по губам это одно, а распознавание звуков и речи это другое.
Для приобретения такой шустрости в распознавании и воспроизводстве речи надобно довольно длительное время для обучения, а тут сразу и распознаёт,и воспроизводит речь,
да ещё и жестикулирует впопад. Будто никогда не была немой
Цитата:
Автор: Андрей
Обращает на себя внимание, что первый слуховой опыт вызывает сильные эмоции (и тут Сеченов снова оказался прав, что ребёнка к развитию влечёт удовольствие от получения нового опыта), и что они как-то очень быстро начинают что-то распознавать.

Ну с детьми всё верно. Первые звуки их пугают. Затем они к ним привыкают. Затем они их обучаются распознавать и воспроизводить, ориентируясь на говорящее окружение. И делают это значительно быстрее взрослых, но не мгновенно же.
[Ответ][Цитата]
covax
Сообщений: 1609
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 0:40
Цитата:
Автор: Андрей
...(и тут Сеченов снова оказался прав, что ребёнка к развитию влечёт удовольствие от получения нового опыта), ...


Ребёнок с рождения активен. Активность обеспечивается собственным сенсорным потоком, который непосредственно поступает на эффекторы, особо не ограничиваясь отсутствующим (пока что), интеллектуальным функционалом ЦНС. Удовольствия тут никакого нет. Сенсорный поток причиняет ребёнку боль, т.к интенсивность потока выше привычного внутриутробного номинала, и поэтому ребёнок раздражителен в первые месяцы. С ворзрастом сеточка ЦНС растёт, вместе с этим падает плотность потока-раздражителя.
К 30 годам ребёнок уже не делает лишних движений, провоцирующих ответную реакцию среды чтоб замкнуть контур познавательной активности.

Цитата:
Автор: Андрей
... и что они как-то очень быстро начинают что-то распознавать.


Скорее, адекватно реагировать, чем "распознавать".
[Ответ][Цитата]
гость
109.229.10.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 1:23
Цитата:
Автор: Андрей
Вот потому так и работает...
Большинство разработчиков интересует не философская чистота, а быстрый результат и бабло. А кто тише едет, тот дальше будет.

Покажите мне инженера которого интересует философская чистота, а не красота инженерного решения!!! И покажите мне философа который сделал что-то полезное как инженер!!! В одной задаче философ и инженер не совместимы! Вернее даже философ всегда мешает инженеру работать. Отвлекает его бредовыми идеями и лозунгами...

Когда я говорил "Как она работает - не важно!", я имел в виду что это чисто инженерная проблема! Основные технологии известны! Это как с ракетой - если известно что китайская хлопушка взлетает - значит и человека отправить можно. Тяжело, но можно. И наверняка прийдется решить еще кучу чисто технических проблем. А не философских из разряда "а есть ли смысл жизни у ракеты?".

Так и здесь! Задача ясна. Принципы для старта известны. Осталось найти время и сесть за работу! Процессора на домашнем компе уже должно хватить(100 пентиума было явно мало). Домашней звуковой тоже по идее достаточно(это уже не 8битный звук с помехами). И можно даже докупить дешевый стерео микрофон(не надо прислушиваться слушая свой же голос в записи). Доступной информации по работе со звуком - уйма(лет 10 назад мне даже музыкант не мог обьяснить что такое звук на записи, хотя писал свою музыку на компе, а доступа к спец журналам небыло). И даже готовых открытых библиотек по работе со звуком много. Осталось найти на это свободное время!

Жаль! Надеялся что хотя-бы Кек не бросит идею! Теперь уверн - здесь 100% философов!
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 2:03
Цитата:
Автор: гость

Жаль! Надеялся что хотя-бы Кек не бросит идею! Теперь уверн - здесь 100% философов!


Здесь много разных - как всегда
Странно, что вас это удивляет
А скажите, плз, чем вы разочарованы и чем хотели бы заниматься?
[Ответ][Цитата]
гость
92.39.139.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 2:33
Цитата:
Автор: covax
К 30 годам ребёнок уже не делает лишних движений, провоцирующих ответную реакцию среды чтоб замкнуть контур познавательной активности.

Ну если в 30 лет всё ещё ребёнок, то тогда конечно...
[Ответ][Цитата]
гость
92.39.139.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 2:38
Цитата:
Автор: гость
Жаль! Надеялся что хотя-бы Кек не бросит идею! Теперь уверн - здесь 100% философов!

И вы в том числе?
[Ответ][Цитата]
гость
109.229.10.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 2:39
Цитата:
Странно, что вас это удивляет

Просто убедился что последний инженерный проект, обсуждаемый на этом форуме закрылся!
Цитата:
А скажите, плз, чем вы разочарованы и чем хотели бы заниматься?

Распознаванием голоса! С нуля! А не дописывая чужой опенсорс проект 10летней давности. Я давно и сильно обогнал Кек-а в области обработки звука (то что он выкладывал), забросил свой проект и надеялся что он меня хотя-бы догонит, а в идеале и перегонит... Что-бы не быть единственным кто занимается подобным... А он ушел с темы!
[Ответ][Цитата]
гость
109.229.10.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 2:39
Цитата:
Странно, что вас это удивляет

Просто убедился что последний инженерный проект, обсуждаемый на этом форуме закрылся!
Цитата:
А скажите, плз, чем вы разочарованы и чем хотели бы заниматься?

Распознаванием голоса! С нуля! А не дописывая чужой опенсорс проект 10летней давности. Я давно и сильно обогнал Кек-а в области обработки звука (то что он выкладывал), забросил свой проект и надеялся что он меня хотя-бы догонит, а в идеале и перегонит... Что-бы не быть единственным кто занимается подобным... А он ушел с темы!
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 3:43
Цитата:
Автор: гость
Постобработка это как раз учет результативности и эффективности обработки для
настройки предобработки.


Хорошо, а как Вы видите предобработку (имея в виду, что спектр в реальном времени уже получен)?
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 3:54
Цитата:
Автор: Андрей
А хоть кто-то из присутствующих может на слух точно определить частоту гармоники?

А кто здесь хоть что-то говорил о частоте гармоники?
Интересна во-первых, частота основного тона, во-вторых, центральная частота форманты (лучше двух формант). Эти параметры дают ключ к определению возраста, пола источника. Ну и однозначно указывают на ту или иную гласную.
[Ответ][Цитата]
covax
Сообщений: 1609
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 3:59
Цитата:
Автор: гость
Я давно и сильно обогнал Кек-а в области обработки звука (то что он выкладывал), забросил свой проект и надеялся что он меня хотя-бы догонит, а в идеале и перегонит... Что-бы не быть единственным кто занимается подобным... А он ушел с темы!


Kek ушёл из тупикового направления в котором, по-прежнему пребываете вы. И с чего вы взяли , что проект закрылся?
[Ответ][Цитата]
гость
109.229.10.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 4:23
Цитата:
И с чего вы взяли , что проект закрылся?
Кек сам признался что распознавание голоса ему больше не интресно...
ЗДЕСЬ

Цитата:
Хорошо, а как Вы видите предобработку (имея в виду, что спектр в реальном времени уже получен)?
А вот это я бы расказал Кек-у если бы он меня догнал...
[Ответ][Цитата]
гость
109.229.10.*
На: Проект Sound-Agent. Звенящая пустота.
Добавлено: 22 июн 14 4:25
[Ответ][Цитата]
 Стр.76 (78)1  ...  72  73  74  75  [76]  77  78<< < Пред. | След. > >>