GotAI.NET - Форум - Искусственный интеллект

Все темы | Новая тема

Стр.20 (78)

<< < Пред. | След. > >>

Поиск:

Автор

Тема: На: Проект Sound-Agent. Инструментарий. Эксперимент.

rrr3
Сообщений: 11857

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 4:06

Изменено: 28 окт 13 6:14, автор изменений: Kek

del

[Ответ][Цитата]

Анатоль
Сообщений: 1964

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 4:13

Цитата:

Автор: rrr3
???!!!

Ну Вы же свой Нечто сами изобретали.
А если и пользовались какими-то знаниями про нейроны, случайности, хаос, структуры, смерть... - то это всё достояние цивилизационного интеллекта (добытые с нуля другими).

Имеется ввиду что цивилизационный интеллект все свои знания добывает сам с нуля, без помощи животного интеллекта, а не то, что каждый человек добывает с нуля.
Наоборот, именно знаниями, моделями цивилизационного интеллекта люди делятся, обмениваются.

[Ответ][Цитата]

rrr3
Сообщений: 11857

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 4:45

Цитата:

Автор: Анатоль
Ну Вы же свой Нечто сами изобретали.
А если и пользовались какими-то знаниями про нейроны, случайности, хаос, структуры, смерть... - то это всё достояние цивилизационного интеллекта (добытые с нуля другими).

Имеется ввиду что цивилизационный интеллект все свои знания добывает сам с нуля, без помощи животного интеллекта, а не то, что каждый человек добывает с нуля.
Наоборот, именно знаниями, моделями цивилизационного интеллекта люди делятся, обмениваются.

Научить нельзя, можно научиться. Откуда такая поговорка? Какой в ней смысл.
Каков механизм добывания с нуля другими и понимания Вами? Сам факт, того, что мы не можем (и не только мы) понимать с ходу друг друга, как правило, о чем может говорить? А если даже кажется что поняли, но идентичны ли сигналы, структура и т.п. и т.д. в наших мозгах, но с другой стороны различны ли базовые механизмы?

[Ответ][Цитата]

Анатоль
Сообщений: 1964

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 5:15

Вот все мы прекрасно умеем распознавать образы (зрительные, слуховые).
Это делают наши животные (образно-ассоциативные) интеллекты.
У каждого свой, отдельный, только его животный интеллект.

А цивилизационный интеллект распределён среди нас, один, общий, но у каждого какая-то часть (в значительной мере перекрывающиеся части ввиду жизни в одной цивилизации).

И вот этот цивилизационный интеллект не знает как распознавать образы (мы не можем этого друг другу рассказать, хотя и умеем это делать).
Почему?
Потому что между этими типами интеллекта пропасть, они не обмениваются своими знаниями.
Каждый из них (типов интеллекта) добывает свои зниния, строит свои модели мира сам, с нуля.
Животный интеллект ничего не скажет цивилизационному, как он распознаёт образы.
Цивилизационный (общность людей) должен сам, с нуля изобрести какие-то алгоритмы для этого.
Или подсмотреть (если удастся), исследовать, как же это делает животный интеллект?

И эта пропасть во всём. Распознавание - только для иллюстрации.

Нет у этих типов интеллекта ничего общего.
Не различать их, рассматривать в одной куче (называя ЕИ) - ошибка, которая будет приводить лишь к путанице.

[Ответ][Цитата]

rrr3
Сообщений: 11857

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 5:29

Цитата:

Автор: Анатоль
А цивилизационный интеллект распределён среди нас, один, общий, но у каждого какая-то часть (в значительной мере перекрывающиеся части ввиду жизни в одной цивилизации).
....
Нет у этих типов интеллекта ничего общего.
Не различать их, рассматривать в одной куче (называя ЕИ) - ошибка, которая будет приводить лишь к путанице.

Ну это совсем новое (для меня) Ваше определение цивилизационного интеллекта. Лень искать ссылки, но ранее Ваши слова вроде были другими. По сути, это подобно тому, что цивилизационного интеллекта у отдельно взятого индивидуума НЕТ.???.
Если так, то это другое дело. Интеллект у социума (цивилизации).
В этом случае это одно и то же только на разных материалах! (Нейрон-люди, мозг-социум, - грубо, примерно, образно)
В этом понимании - социум и мозг - разные материалы (примеры) формирования, функционирования ЕИ. Разных ЕИ, но с одними и теми же базовыми механизмами.

[Ответ][Цитата]

Tester64
Сообщений: 1910

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 13:37

Цитата:

Может быть еще такой сценарий. Все таки именно у одиночки появится не просто конечное решение - это не реально, но какой-то сдвиг реальный, который явным образом укажет на некий путь из всех возможных. Вот тогда может произойти кристаллизация. Вопрос, на сколько это что-то должно быть убедительным и вообще что это может быть? В рамках данной темы могу представить следующее:
- распознавалка делает свое дело, узнает в непрерывном потоке слова
- постоянно обучается и улучшает свои качества
- появляется в инете чат-бот с возможностью говорить и распознавать речь. Это дает возможность еще больше накапливать данные и совершенствоваться.
Но это будет не ИИ, а проверка идеи.

Просчитывал и такой вариант... Вы же один из немногих на этом форуме кто реально занимается распознаванием и обрабткой речи... Неужели еще не поняли КАКИХ ресурсов потребует подобная программа? Если на один голос/поток еще есть надежда, то на 10-100 пользователей Вам уже понадобиться ПАРК СЕРВЕРОВ... А если еще и добавить само-обучаемость, которая всегда ПОВЫШАЕТ а не понижает требования к продуктивности харда... Базы растут, сверять голос нужно каждый раз с большей базой... Винчестеры не справляются с отдачей баз, процессоры зашкаливают... Нужна многопоточность, распределение обработки одного аудио-потока на 5-10 серверов... Лучший вариант - Вашу разработку купит корпорация обладающая подобнм парком или способная купить его под Вашу программу... Не забывайте КАКИМИ ресурсами должно обладать реальное ИИ, которое растет/развивается. Не меньше серверов википедии (там только хранение, а не обработка информации).

Когда я говорил о "2х родственных душах", я имел в виду не конечную мечту ИИ-шника, а разработку и полноценное тестрование ноу-хау программы СПОСОБНОЙ К САМООБУЧЕНИЮ, а не ее применение... Даже если Ваша робо-кошка будет вести себя не как робот, а как человек, Вам понадобятся МИЛЛИОНЫ для разработки фабричного образца и выпуска его на рынок... Пол года назад поднимал тему домашнего виртуального робота - там были интересные коментарии по цене разработки робо-пылесоса.

Я в свое время потратил 3 года и кучу человеко-часов (больше 300 дней делал) на алгоритм, который теоретически мог быть сконфигурирован на разные виды саморазвития... ноу-хау... аналогов в мире нет... десяток лет на теорию... больше 3мб чистого кода... но... проверить не успел... Сейчас прошло много лет и программу нужно серьезно перебрать - появились новые технологии, умерли старые (тогда обычному пользователю были доступны SQL-базы разве что на Аксес или фокс-про, реальная многопоточность возможна была только на серверах с двумя чипами-процессорами, линукс был мечтой, юникс был только для интернет-серверов). И все равно уверен, что не вложив в программу 10-100К$ на помошников-разработчиков, невозможно будет в ближайшие 5 лет ее запустить.

Хотя разработать ПОЛЬЗОВАТЕЛЬСКУЮ программу распознающую речь хозяина теоретически возможно... Когда-то была супер-знаменитая программа Dragon-dictate (кажется так писалось) которая обещала обучиться под хозяина, но обучение портило базу после 5-6 часов работы. Разработка программы остановилась... Может с новыми ресурсами (хард мощнее, микрофоны круче, звуковые карты без шумов в транзисторах и со встроеными шумо-подавителями) и новыми программными технологиями (все-таки это было 10-15 лет назад) у Вас или у меня получится сдвинуть с мертвой точки локальную рускоязычную распознавалку...

[Ответ][Цитата]

Slava
Сообщений: 3070

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 13:46

Цитата:

Автор: Tester64
Может с новыми ресурсами (хард мощнее, микрофоны круче, звуковые карты без шумов в транзисторах и со встроеными шумо-подавителями) и новыми программными технологиями (все-таки это было 10-15 лет назад) у Вас или у меня получится сдвинуть с мертвой точки локальную рускоязычную распознавалку...

Распознавалка без понималки а вас не получится
Простите, а что вы понимаете про понималку?

[Ответ][Цитата]

Tester64
Сообщений: 1910

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 14:05

Цитата:

Распознавалка без понималки а вас не получится
Простите, а что вы понимаете про понималку?

Я не гонюсь за понималкой... пусть для начала услышит, сравнит по базе и адекватно среагирует...

[Ответ][Цитата]

Kek
Сообщений: 1133

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 14:22

Цитата:

Автор: Tester64
Просчитывал и такой вариант... Вы же один из немногих на этом форуме кто реально занимается распознаванием и обрабткой речи... Неужели еще не поняли КАКИХ ресурсов потребует подобная программа? Если на один голос/поток еще есть надежда, то на 10-100 пользователей Вам уже понадобиться ПАРК СЕРВЕРОВ...

Если вы имеете в виду распознавалку инвариантную относительно диктора, то я льщу себя надеждой, что этот инвариант есть. И тогда не важно сколько разных людей говорят. Я повторяю ссылку на Google
https://www.google.com/intl/en/chrome/demos/speech.html
Не поленитесь зайдите под Хромом. Это же реальный инвариант!
Я не знаю что за этим стоит в гугле, сколько серверов, но есть еще пример!
У меня телефон Nokia C2-01. У него голосовой набор. Сначало произносиш 13 разных слов, телефон обучается. Потом я говорю имя контакта разными интонациями и разным голосом по возможности... И он распознает! Ё! Где тут десять тысяч серверов?
Я честно скажу. Начал активно заниматься речью именно тогда, когда это телефон приобрел. Это был триггер моего сознания!

[Ответ][Цитата]

rrr3
Сообщений: 11857

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 21:46

Цитата:

Автор: Tester64
Я не гонюсь за понималкой... пусть для начала услышит, сравнит по базе и адекватно среагирует...

Анализ, синтез, индукция, дедукция, прочая хрень....
Я уже обращал внимание на то, что может не быть единого алгоритма "распознавания" каких-то фонем (образно букв), даже для каждой фонемы - свой алгоритм, с дальнейшим "складыванием" из них слов. Если так, то при обчном подходе, дальше тупик. Естественная распознавалка, похоже, работает иначе. Приводился пример, когда слова читаются вполне сносно и в том случае, когда буквы внутри слова порой не в том порядке.
1. Слона не возможно "распознать" разглядывая только его "внутренности" (хобот, хвост и т.п. и т.д.). Обязательно нужны еще "внешности" (сопоставление с другими "табуретками").
2. Исходя из сказанного в каких то случаях "распознается" фонема, в каких-то целое слово, в каких-то - "распознавание" этого же слова в другом произношении имеет другой "алгоритм", в каких-то случаях распознается сочетание слов, а не слово в отдельности и т.д. и т.п.
3. Т.е., если я правильно понял существующий подход на данной ветке (а я не программер, могу ошибаться) - это много затрат с минимальной перспективной, т.к. он "логический" ("линейный").
4. Не заню сколько и для чего требуется много ресурсов железа, но предполагаю, что как бы там ни было, для "универсального", достаточно адаптивного и самообучаещегося хорошего "распознавания", так или иначе, рано или поздно, придется "программить" .... дальше промолчу.... иначе убьете... за навязчивость.

[Ответ][Цитата]

victorst
Сообщений: 821

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 22:30

Цитата:

Автор: Kek
У меня телефон Nokia C2-01. У него голосовой набор. Сначало произносиш 13 разных слов, телефон обучается. Потом я говорю имя контакта разными интонациями и разным голосом по возможности... И он распознает! Ё! Где тут десять тысяч серверов?
Я честно скажу. Начал активно заниматься речью именно тогда, когда это телефон приобрел. Это был триггер моего сознания!

Вот тут и есть самый важный момент всего вашего проекта. Когда я говорил о первой сигнальной системе, я подразумевал, что и первая и вторая сигнальные системы не существуют в отрыве от мира. И если взять лишь мир звуков и более узко - мир речи, то да, наделано много специализированных штук вроде таких телефонов. НО. Они при кажущейся успешности распознавания речи выполняют лишь эту узкоспециализированную задачу. Часто лишь статистическим методом.
В гуглях, насколько мне известно, статистика огромная, поэтому не составило особого труда составить такую базу. В телефоны видимо уже аналогичную но попроще базу устанавливают и немного донастраивают нашим тембром голоса. Никакого реального понимания речи в человеческом смысле такие системы не делают.
Стоит попытаться слегка расширить круг возможностей такого аппарата и на пути встанет непреодолимая преграда - отсутствие модели нашего с вами 4D мира ( 4- е измерение- время.). Ведь звуки и речь не существуют сами по себе. Они - одна из неотъемлемых частей нашего с вами мира. И работать только с этой частью - неправильно. Слепые и глухие от рождения люди имеют от рождения многие механизмы в своем мозгу для работы с реальным полноценным миром. Поэтому они научаются транслировать сигналы с оставшихся органов чувств в полчти полноценную модель мира.
В самой захудалой букашке в виде простейших рефлексов и инстинктов записана эта модель мира в той или иной форме. Букашка неотделима от того мира, в котором живет. И если этот мир резко поменять, то она умрет ввиду недостаточной адаптируемости. Наибольшую адаптируемости к изменениям мира имеет человек ( и тараканы с крысами). Человек - ввиду его обширной модели мира и своего поведения (опыта).
Так вот. Если нет образной и абстрактной или хотя бы одной из этих моделей мира, то никаким заклинаниями не помочь программе перейти рубеж от специализированной игрушки к саморазвивающемуся ИИ. Нужна такая модель мира, которая была бы инвариантна к органам чувств потому, что органы чувств раскрывают лишь лишь одну какую-то из сенсорных сторон мира. А модель видит как бы внутрь предметов. Вспомните Гомера. Взор разума намного мощнее обычного зрения и слуха.
Возьмем птицу. Сравним ее поведение с самолетом, вертолетом. Да, она летает медленнее, ниже. Но зато как она летает. Так же и с речью. Масштабы у гуглей большие, но они пока ортогональны к механизмам мышления в нашем понимании этого термина.
Все вышесказанное - лишь сугубо мое личное мнение.

[Ответ][Цитата]

rrr3
Сообщений: 11857

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 22:47

Цитата:

Автор: victorst
... Никакого реального понимания речи в человеческом смысле такие системы не делают...

Если я правильно понял содержание ветки, такого и не требуется пока. Достаточно, чтобы пока могла просто "писать диктант". Но и для этого подходы приводимые в ветке, на мой не просвещенный взгляд, не приемлемо затратны (и скорее всего не реализуемы).

[Ответ][Цитата]

victorst
Сообщений: 821

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 22:50

Цитата:

Автор: rrr3
Если я правильно понял содержание ветки, такого и не требуется пока. Достаточно, чтобы пока могла просто "писать диктант".

Я к тому про модели мира, что программе нужно не только слушать, но и слышать. А это - две большие разницы.
Насколько я это представляю, чем совершеннее модель мира, тем лучше работает вся система в целом т.к. эта модель по сути дела мощнейший фильтр со множеством обратных положительных и отрицательных связей, который позволяет по обрывкам в условиях сильного шума собрать целостный образ слышимого. А именно с помехами и несовпадениями одних и тех же звуков, произнесенных разными людьми или в разных условиях одним и тем же человеком и столкнулся Kek. А т.к. такой фильтр м.б. самообучающимся, то делайте выводы сами.

[Ответ][Цитата]

rrr3
Сообщений: 11857

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 23:07

Изменено: 28 окт 13 6:15, автор изменений: Kek

del

[Ответ][Цитата]

rrr3
Сообщений: 11857

На: Проект Sound-Agent. Инструментарий. Эксперимент.

Добавлено: 27 июн 13 23:11

Цитата:

Автор: Анатоль
Ну Вы же свой Нечто сами изобретали...

Я Нечто не изобретал... Я просто привел наброски примеров как их можно "изобретать" на основе необходимых и достаточных базовых категорий. Так сказать попытался сфокусировать разбредающееся во все мыслимые и не мыслимые стороны внимание исследователей ЕИ и конструкторов СИИ на пакете (портфеле) базовых категорий.
А вот этот Пакет базовых Категорий подсмотрел у... не побоюсь громкого слова, Природы.
А подсмотрел по "технологии" известной века...

[Ответ][Цитата]

Стр.20 (78): 1 ... 16 17 18 19 [20] 21 22 23 24 ... 78

<< < Пред. | След. > >>

Форум: Проблемы искусственного интеллекта