GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.1 (2)След. > >>   Поиск:  
 Автор Тема: Будущее за GPU...
гость
46.159.159.*
Будущее за GPU...
Добавлено: 06 мар 18 0:15
CPU морально устарели из-за обратной связи и линейной архитектуры

Современные CPU отстают от GPU в тысячи раз

Будущее за GPU, которые скоро полностью вытеснят CPU

Для этого необходима новая ОС, учитывающая особенности GPU
[Ответ][Цитата]
гость
84.19.181.*
На: Будущее за GPU...
Добавлено: 06 мар 18 6:39
Костя ты супер!
[Ответ][Цитата]
.
Сообщений: 786
На: Будущее за GPU...
Добавлено: 06 мар 18 8:33
Изменено: 06 мар 18 14:04
.
[Ответ][Цитата]
.
Сообщений: 786
На: Будущее за GPU...
Добавлено: 06 мар 18 13:58
Изменено: 06 мар 18 14:04
.
[Ответ][Цитата]
гость
46.159.93.*
На: Будущее за GPU...
Добавлено: 06 мар 18 14:03
[Ответ][Цитата]
гость
31.130.8.*
На: Будущее за GPU...
Добавлено: 08 мар 18 14:44
Цитата:
Автор: гость

CPU морально устарели из-за обратной связи и линейной архитектуры

Современные CPU отстают от GPU в тысячи раз

Будущее за GPU, которые скоро полностью вытеснят CPU

Для этого необходима новая ОС, учитывающая особенности GPU


Для этого необходима новая аппаратная архитектура, обеспечивающая "массивный" параллелизм на уровне потоков, а не на уровне данных, и новая модель программирования с жёсткой привязкой к этой архитектуре. Компьютеры должны оставаться программируемыми универсальными вычислителями, а GPU для этих целей не годятся. Современные CPU пошли по тупиковому пути развития, по пути специализации, обеспечивая параллелизм на уровне данных (SIMD расширения). В результате, прирост вычислительной мощности современных CPU обеспечивается в основном только за счёт задач, поддающихся распараллеливанию на уровне данных. Для GPU эти ограничения ещё сильнее. Если бы это было не так, то GPU уже давно бы вытеснили CPU. Например, в 386 процессоре было 275000 транзисторов и он обеспечивал сносное выполнение одного потока команд в архитектуре x86. В современных CPU насчитывается уже по нескольку миллиардов транзисторов (например, число транзисторов процессора RYZEN 7: 4,8 млрд.), то есть, потенциально, они способны выполнять около 10000 потоков команд, но вместо этого мы имеем то, что имеем.
[Ответ][Цитата]
Валентин
Сообщений: 3055
На: Будущее за GPU...
Добавлено: 08 мар 18 15:06
Изменено: 08 мар 18 15:10
Цитата:
Автор: гость CPU морально устарели из-за обратной связи и линейной архитектуры
Современные CPU отстают от GPU в тысячи раз Будущее за GPU, которые скоро полностью вытеснят CPU
Для этого необходима новая ОС, учитывающая особенности GPU

- Не берите на себя роль предсказателя. Только ОС тут не выручит. Нужна новая система программирования, новый язык параллельных представлений задач, транслятор, отладчик и т.д.
Я думаю, что железо и софт не должны проектироваться раздельно.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Будущее за GPU...
Добавлено: 08 мар 18 15:32
Микросхема на заказ
Как произвести на фабрике свой чип и сколько это будет стоить
https://defence.ru/article/1909/
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3084
На: Будущее за GPU...
Добавлено: 11 мар 18 9:13
Изменено: 11 мар 18 9:19
Цитата:
Автор: гость
Современные CPU отстают от GPU в тысячи раз

Это от криворукости программистов.
На других форумах пару раз постил картинку 2015г о правильном допиливании некоторой нейросетевой библиотеки под CPU.

Посередине - результаты допиленного варианта либы, работающего на процессоре. Бывшая разница в порядок между базовым CPUшным вариантом (слева) и вариантом для GPU (справа) - справедлива только для конкретного кода, а не для случая "в общем" (ибо видим, что другой код опроверг эту разницу в порядок)
В общем, всё определяется только теоретическими Гига/ТераФЛОПСами устройства. А не его внутренней степенью параллельности.
Там, кстати, последней строкой на картинке - почасовые цены аренды амазоновских серваков, на которых это тогда запускалось. ЕМНИП, сейчас картина поменялась - серваки с видяхами стоят дороже, т.е. более медленное решение может быть экономически выгоднее.


Есть и другой случай - поиск объектов на видео. Пока размер кадра позволяет держать и данные, и модель в CPUшном кэше - паритет с видюхой. Но с какого-то размера - нескольких мегабайт кэша процессора перестаёт хватать, а у видюхи ОСТАЮТСЯ ГИГАБАЙТЫ её быстрой памяти. Если кого интересует - тоже картинку с результатами найду.
Т.е. не путайте скорость самих вычислителей - и зависимость времени вычислений от объёма быстрой памяти (или от скорости доступа к памяти).


Ну и как-то ссылался тут на буржуинскую ВУЗовскую лекцию 2008г о вариантах написания функции перемножения матриц на CPU. В зависимости от криворукости программиста выбранного программистом решения/языка (и в зависимости от знаний программистом архитектуры процессора и системы его команд) - разница может доходить до почти 300000 раз. Я не ошибся с числом нулей - почти 300000 раз. Триста тысяч, да.
Тут тоже интересующиеся могут спросить ссылочку.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Будущее за GPU...
Добавлено: 11 мар 18 11:19
Цитата:
Автор: Victor G. Tsaregorodtsev
у видюхи ОСТАЮТСЯ ГИГАБАЙТЫ её быстрой памяти

нет там такой, вроде бы global в 300 раз медленнее, чем shared
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3084
На: Будущее за GPU...
Добавлено: 11 мар 18 11:43
Цитата:
Автор: NO.
нет там такой, вроде бы global в 300 раз медленнее, чем shared

ХЗ, сравните пропускную способность обычной оперативной памяти - это десятки гигабайт в секунду (цифры из таблички на этой странице https://ru.wikipedia.org/wiki/DDR4_SDRAM), и видеопамяти - сотни гигабайт в секунду (см табличку на странице https://ru.wikipedia.org/wiki/Видеокарта).
[Ответ][Цитата]
NO.
Сообщений: 10700
На: Будущее за GPU...
Добавлено: 11 мар 18 12:06
Глобальная память в отдельных микросхемах, она и так медленная, так ещё и доступ не распараллеливается в тысячи раз. Быстрая память shared, но её размер около 32К, а не гигабайты, туда даже таблицу 256*256 не всунуть.
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3084
На: Будущее за GPU...
Добавлено: 11 мар 18 12:29
Цитата:
Автор: NO.
Глобальная память в отдельных микросхемах, она и так медленная, так ещё и доступ не распараллеливается в тысячи раз. Быстрая память shared, но её размер около 32К, а не гигабайты, туда даже таблицу 256*256 не всунуть.

Тогда как возможны сотни ФПС в играх (да, знаю, что не во всех) на экране FullHD и выше разрешением? FullHD и уж тем более 4К в полноцвете - это далеко не 32кб.
Шаред - это, видимо, обычный видимый всем ядрам аналог кэша. Который просто управляется не системой кэширования (которой у видяхи, видимо, нет) - а вручную программистом (ну, или драйвером видюхи или иным софтом). Вариант - аналог не кэша, а отдельного=дополнительного регистрового файла (набора).
Ну и посмотрите прайсы торгующих комп.железом контор. Они там пишут про размер набортной видеопамяти и могут указать, что это GDDR4 или GDDR5 (т.е. с пропускной способностью в сотни гиг - таки быстрее обычной ОЗУ, к которой лазит проц).
Аль Вы троллите?
[Ответ][Цитата]
kondrat
Сообщений: 3086
На: Будущее за GPU...
Добавлено: 17 май 18 8:54
Нужна помощь профессионалов. Есть ли в современных процессорах автоматическое распараллеливание кода? Если - да, то как оно работает?
У меня есть свой подход, но он выглядит каким-то громоздким.
[Ответ][Цитата]
гость
94.230.208.*
На: Будущее за GPU...
Добавлено: 17 май 18 12:21
Цитата:
Автор: kondrat

Нужна помощь профессионалов. Есть ли в современных процессорах автоматическое распараллеливание кода? Если - да, то как оно работает?
У меня есть свой подход, но он выглядит каким-то громоздким.
Есть, но как работает не скажу, потратьте сами 10000 часов, инфрмация и скилы стоят дорого
[Ответ][Цитата]
 Стр.1 (2): [1]  2След. > >>