GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.32 (78)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 3:02
Цитата:
Автор: Артем

Ну хорошо. вы что-то конкретное имеете ввиду?

Я вот сейчас репортаж по телеку смотрел из вагона-ресторана. Понятна речь только 1-го человека. Остальное - гул.


Вам понятна речь того человека, на котором вы фокусируете свое внимание
Почему вы фокусируете именно на нем внимание - отдельный интересный вопрос
Говорил уже здесь, что в Питере работала весьма нетривиальная тетя - Чистович
Она занималась активным восприятием речи
Реально - почти ничего, но идеи заслуживают внимания
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 7:07
Цитата:
Вам понятна речь того человека, на котором вы фокусируете свое внимание

Не обязательно. Может "понятный" человек был ближе к микрофонам. Может остальные имеют в голосе такие частоты, которые вызывают наводки в усилителях микрофона, заглушая остальные частоты. А может наоборот "несущие частоты" непонятных голосов фильтруются усилителем или чиской шумов глючных микрофонов, а у понятного несущие частоты вне этой сетки фильтра. Возможно дует постоянный ветер, который свистит в определенных частотах и сверхкачественный микрофон отсеивает внешние шумы, захватывая и несущие остальных говорящих. Подобное бывает в мобилке при внешних шумах - машина проехала и вместо шума на другой стороне "просадка" громкости.

2Kek
Постоянно вижу у Вас фразу "кадр". Если я правильно понял, поток нарезается на фиксированые сегменты (аналог вагонов поезда) и в них пытаетесь найти совпадения с образцами. А если искомая фонема растянута или смещена на несколько "кадров"?

Я в своей системе планирую использовать "ступенчатое" распознавание, которое не имеет точки отсчета.

Еще хотел спросить (Кек), Вы тестировали программу на холостом ходу в циклической пстоянной записи (не помню как в последней версии, но раньше видел) много часов? Не могу понять. Проект реанимировал пол-года нзад переписав его с нуля. Иногда начинает ПИЩАТЬ. Хотя вывода на колонки не делаю - только запись. До этого (в прошлом проекте) тоже замечал подобное. Не всегда, но иногда после 6-12 часов постоянного заполнения буфера (не выключаю, сворачиваю и "забываю" на несколько суток). Не могу понять. Это сбой моей аудиокарты, сбой WinAPI, не правильное заполнение буферов (пишу мимо), забываю очищать какие-то системные буферы WinAPI, глюк Делфи (видел тихий бесконечный мониторинг-сигнализацию на С++).
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 7:41
Tester64, я правильно понял что вы тоже что-то программируете по теме этой ветки?
причем на Делфи?
а давайте в скайпе встретимся. мой скайп karukovartem и я готов общаться после 22-х.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 7:56
Еще раз про многоголосье.
У меня жена и двое детей 5 и 7 лет.
Уверяю вас, понять что они говорят, когда они говорят одновременно - нереально.
(такое бывает)
Даже одного.
При каких-то ограничениях типа разный тебр или темп и просто короткие знакомые фразы подтверждаемые мимикой - ну можно. Но это специфичная задача. Совсем другого порядка.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 8:07
Цитата:
Автор: Артем

Еще раз про многоголосье.


А вы музыку слушаете?
Можете ли следить за отдельными инструментами?
Если не пробовали, попробуйте послушать то, что называется малыми формами - дуэты, трио, квартеты

Ну а про жену и малых детей - их и так многие не слышат
А вы про это у нее спросите
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 8:13
Цитата:
Tester64, я правильно понял что вы тоже что-то программируете по теме этой ветки?
причем на Делфи?
а давайте в скайпе встретимся. мой скайп karukovartem и я готов общаться после 22-х.

Правильно, но я его временно отложил - поджимают сроки по работе. У меня другой подход (чем у Кек-а). Более плавный что-ли. Хочу сначала УВИДЕТЬ что мне прдстоит распознавать. Превратить звук в визуальную бегущую картинку вроде ленты отпечатков пальцев или горный ланшафт, на которую можно будет натравить распознавалку. А это процесс ОЧЕНЬ тонкий требует многих тестов. Любое разложение требует проверить обратное преобразование и вычисление потерь. Не хочу терять НИЧЕГО при преобразовании. Пока не буду уверен на 100% что выкинутое не уменьшит качество разпознавния больше чем на 1-2%. Не доверяю ни одной заранее известной формуле пока не смогу ее проверить. Предстоит сделать полноценный узкоспециализированый редактор звука. А это работа не на один месяц. Хочу ВИЗУАЛЬНО наложить (а не сравнивать некой формулой) две одинаковые фонемы от разных авторов.

Сейчас уже есть бесконечная запись кольцевого буфера в программе напоминающей антивирус Касперского (скрыто, не навязчиво, можно приостановить на время). Идет отрисовка уровней громкости в маленьком плавающем полупрозрачном окошке и в иконке около часов. Заготовка для снятия сигнала с разных источников - микрофон и (что еще круче) весь ВНУТРЕННИЙ аудио-сигнал (все аудио плееры врое винампа, видео плееры вроде VLS, Torrent-Stream, онлайн радио, онлайн тв, флеш-проигрыватели фильмов онлайн, аудио-книги...)... но... иногда начинает ПИЩАТЬ само по себе - нужно исправить ошибку прежде чем развивать программу дальше - потом тяжелее будет разобраться.

Следующие этапы (ближние) - писать МОЙ БУФЕР в файл, проигать на колонки без потерь, читать из файла. В разном качестве. Потом разложение ФФТ, сложение ФФТ, проигрывание сложеного. Отобразить ФФТ на 3Д графике........ список длинный.
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 8:13
Ну намек на правильность алгоритма устойчивого к помехам я начал улавливать.
Типа появился какой-то звук, а мы пытаемся его сопровождать во времени...
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 8:40
Я тут еще одно кунгфу вспомнил.
Полиспектры и в частности биспектра.
Вот моя статья. (статья одна ссылки две)
тут
http://www.mlabsys.com/ml-press/ChipNews-2006-February/ChipNews_2-2006_Polyspectral_Analyzer.pdf
и тут
http://www.chip-news.ru/archive/chipnews/200602/Article_05.pdf
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 10:43
Цитата:
Автор: Артем

Я тут еще одно кунгфу вспомнил.
Полиспектры и в частности биспектра.
Вот моя статья. (статья одна ссылки две)
тут
http://www.mlabsys.com/ml-press/ChipNews-2006-February/ChipNews_2-2006_Polyspectral_Analyzer.pdf
и тут
http://www.chip-news.ru/archive/chipnews/200602/Article_05.pdf


Прибор прикольный, картинки яркие, но что он делает? Для чего он нужен? К чему подключается? Явно не микрофон на входе и разьем клавиатуры на выходе!
[Ответ][Цитата]
Артем
Сообщений: 174
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 11:21
Tester64, в скайпе будем общаться? мой скайп karukovartem
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 19 июл 13 22:49
Цитата:
Автор: Артем
Tester64, в скайпе будем общаться? мой скайп karukovartem
Пока не горю желанием.... Не вижу темы для разговора!

Мне помощь не нужна. За много лет понял что в группе могу быть только с программистами моего уровня, который считаю довольно высоким (Вы себя таким ЗДЕСЬ не проявили). Времени на работу над ЭТИМ проектом в ближайшие 2-3 недели не найду. Этот проект - один из 5-6ти "для отдыха", "отвлечения" и "саморазвития". В ближайший год-два коммерческой ценности не предтавляет. Мой подход ЗДЕСЬ не пользуется популярностью а полуфабрикат (как и исходники) выкладывать не хочется (много личных наработок за больше чем 10 лет). Здесь любят "быстрые" результаты. Возможно покажу позднее (если мой проект и ветка не загнутся) свою программу лично Кек-у, как единственному кто действительно что-то "кодит" по этой теме (и сможет оценить программу, а не "обоср...ь" общий подход к проблеме) и возможно тем кто ему в этом реально помогает (кодить).

Система распознавания понадобится еще не скоро - минимум пол года. Даже теорию распознавания пока не подбираю - слишком много этапов надо пройти ДО этого(описывал полный цикл в этой ж ветке). Поэтому даже своей теорией распознавания пока поделится не могу - еще не знаю какую использую (вряд-ли нейроны). Есть подозрения/предположения, но не более того..

p.s. Проект считаю инженерно-программерским, а не ИИ-шным. Даже если будут методики поиска закономерностей в бесконечном чужом аудио-потоке, первая 100-1000 образцов фонем явно будет сделана/подобрана вручную, а не "Великим Самообучающимся Алгоритмом".

p.p.s. Ни в одном научном иституте не состою (хватило сил и мозгов сбежать из этого болота) и научные статьи не пишу.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 июл 13 7:19
Цитата:
Автор: Tester64
Возможно покажу позднее (если мой проект и ветка не загнутся) свою программу лично Кек-у, как единственному кто действительно что-то "кодит" по этой теме (и сможет оценить программу, а не "обоср...ь" общий подход к проблеме)

Забавный ход. А как вы определяете, кто реально кодит, а кто нет? Список можете предложить? Ну и насчет обосрать - кто кодит, тому можно, или как?


Цитата:
Автор: Tester64
p.p.s. Ни в одном научном иституте не состою (хватило сил и мозгов сбежать из этого болота) и научные статьи не пишу.

Ну и глупо как раз. Написать научную статью - это значит по меньшей мере самосовершенствоваться в научном взгляде на проблему и научном решении этой проблемы.
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 июл 13 8:33
Цитата:
Забавный ход. А как вы определяете, кто реально кодит, а кто нет? Список можете предложить? Ну и насчет обосрать - кто кодит, тому можно, или как?

Пусть Кек определяет! По почте... А не общую ссылку на форум. Программа это позволяет - лицензионная защита через ключи была встроена в программу еще ДО начала обработки звука.

p.s. Ничего личного. На этом форуме слишком много тролей, а я не хочу их подкармливать. Здесь бываю слишком редко что-бы запоминать всех НЕ тролей по никам. Хабр таких отсеивает, а здесь их плодят. Я запомнил только Кек-а как активного участника и реального разработчика со своим продуктом, а не идеями. Ограниченое количество автоматически активируемых через интернет лицензий даст возможность оценить мои наработки НЕ ВСЕМ.

Цитата:
Ну и глупо как раз. Написать научную статью - это значит по меньшей мере самосовершенствоваться в научном взгляде на проблему и научном решении этой проблемы.

"Кто может - делает, кто не может - учит"
Кодерство - прыжки на следующие ступени, статьи - утаптывание текущей, прошлых и фантазии на тему конца лестницы.
[Ответ][Цитата]
dr2chek
Сообщений: 871
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 июл 13 11:00
Цитата:
Автор: Tester64


Пусть Кек определяет! По почте...

А, это. Да на здоровье.
Но все-таки, вы противопоставили себя любимого другим участникам форума, а на просьбу уточнить - ушли в кусты. Некрасиво как-то... Б-г вам в помощь.
[Ответ][Цитата]
Tester64
Сообщений: 1910
На: Проект Sound-Agent. Инструментарий. Эксперимент.
Добавлено: 20 июл 13 11:30
Цитата:
Но все-таки, вы противопоставили себя любимого другим участникам форума, а на просьбу уточнить - ушли в кусты. Некрасиво как-то... Б-г вам в помощь.


Я всегда программистов уважал больше теоретиков. Всегда СИЛНО не любил тролей. И всегда больше любил над чем-нибудь поработать а не что-нибудь обсудить. На форуме (прикинул 72страницы*20тем на страницу=)1440 тем. Из них реально по теме разработки ИИ штук 10?

Что утонить? я вроде ничего особенно не скрываю. Общий план своих работ и их направление выложил. Исходники - мои и только. Могу помочь в решении конкретных проблем, но не подарить решение всех сразу. Результатом могу поделиться с тем кому он будет полезен для "прыжка на следующую ступень", а не для того чтобы ВСЕ участники ветки форума почуствовали что они ПОМОГЛИ мне его достичь. В ветке почти 500 сообщений. Полезных теме штук 100.
[Ответ][Цитата]
 Стр.32 (78)1  ...  28  29  30  31  [32]  33  34  35  36  ...  78<< < Пред. | След. > >>