Форум: Проблемы искусственного интеллекта

Регистрация | Вход

Все темы | Новая тема Стр.1 (2) След. > >> Поиск:

Автор Тема: Будущее за GPU...

гость
46.159.159.*

Будущее за GPU...
Добавлено: 06 мар 18 0:15

CPU морально устарели из-за обратной связи и линейной архитектуры

Современные CPU отстают от GPU в тысячи раз

Будущее за GPU, которые скоро полностью вытеснят CPU

Для этого необходима новая ОС, учитывающая особенности GPU

[Ответ][Цитата]

гость
84.19.181.*

На: Будущее за GPU...
Добавлено: 06 мар 18 6:39

Костя ты супер!

[Ответ][Цитата]

.
Сообщений: 786

На: Будущее за GPU...
Добавлено: 06 мар 18 8:33
Изменено: 06 мар 18 14:04

.

[Ответ][Цитата]

.
Сообщений: 786

На: Будущее за GPU...
Добавлено: 06 мар 18 13:58
Изменено: 06 мар 18 14:04

.

[Ответ][Цитата]

гость
46.159.93.*

На: Будущее за GPU...
Добавлено: 06 мар 18 14:03

https://dtf.ru/10882-nvidia-zakon-mura-poteryal-aktualnost-a-gpu-stanut-zamenoy-cpu

[Ответ][Цитата]

гость
31.130.8.*

На: Будущее за GPU...
Добавлено: 08 мар 18 14:44

Цитата:
Автор: гость

CPU морально устарели из-за обратной связи и линейной архитектуры

Современные CPU отстают от GPU в тысячи раз

Будущее за GPU, которые скоро полностью вытеснят CPU

Для этого необходима новая ОС, учитывающая особенности GPU

Для этого необходима новая аппаратная архитектура, обеспечивающая "массивный" параллелизм на уровне потоков, а не на уровне данных, и новая модель программирования с жёсткой привязкой к этой архитектуре. Компьютеры должны оставаться программируемыми универсальными вычислителями, а GPU для этих целей не годятся. Современные CPU пошли по тупиковому пути развития, по пути специализации, обеспечивая параллелизм на уровне данных (SIMD расширения). В результате, прирост вычислительной мощности современных CPU обеспечивается в основном только за счёт задач, поддающихся распараллеливанию на уровне данных. Для GPU эти ограничения ещё сильнее. Если бы это было не так, то GPU уже давно бы вытеснили CPU. Например, в 386 процессоре было 275000 транзисторов и он обеспечивал сносное выполнение одного потока команд в архитектуре x86. В современных CPU насчитывается уже по нескольку миллиардов транзисторов (например, число транзисторов процессора RYZEN 7: 4,8 млрд.), то есть, потенциально, они способны выполнять около 10000 потоков команд, но вместо этого мы имеем то, что имеем.

[Ответ][Цитата]

Валентин
Сообщений: 4536

На: Будущее за GPU...
Добавлено: 08 мар 18 15:06
Изменено: 08 мар 18 15:10

Цитата:
Автор: гость CPU морально устарели из-за обратной связи и линейной архитектуры
Современные CPU отстают от GPU в тысячи раз Будущее за GPU, которые скоро полностью вытеснят CPU
Для этого необходима новая ОС, учитывающая особенности GPU

- Не берите на себя роль предсказателя. Только ОС тут не выручит. Нужна новая система программирования, новый язык параллельных представлений задач, транслятор, отладчик и т.д.
Я думаю, что железо и софт не должны проектироваться раздельно.

[Ответ][Цитата]

NO.
Сообщений: 10700

На: Будущее за GPU...
Добавлено: 08 мар 18 15:32

Микросхема на заказ
Как произвести на фабрике свой чип и сколько это будет стоить
https://defence.ru/article/1909/

[Ответ][Цитата]

Victor G. Tsaregorodtsev
Сообщений: 3187

На: Будущее за GPU...
Добавлено: 11 мар 18 9:13
Изменено: 11 мар 18 9:19

Цитата:
Автор: гость
Современные CPU отстают от GPU в тысячи раз

Это от криворукости программистов.
На других форумах пару раз постил картинку 2015г о правильном допиливании некоторой нейросетевой библиотеки под CPU.

Посередине - результаты допиленного варианта либы, работающего на процессоре. Бывшая разница в порядок между базовым CPUшным вариантом (слева) и вариантом для GPU (справа) - справедлива только для конкретного кода, а не для случая "в общем" (ибо видим, что другой код опроверг эту разницу в порядок)
В общем, всё определяется только теоретическими Гига/ТераФЛОПСами устройства. А не его внутренней степенью параллельности.
Там, кстати, последней строкой на картинке - почасовые цены аренды амазоновских серваков, на которых это тогда запускалось. ЕМНИП, сейчас картина поменялась - серваки с видяхами стоят дороже, т.е. более медленное решение может быть экономически выгоднее.

Есть и другой случай - поиск объектов на видео. Пока размер кадра позволяет держать и данные, и модель в CPUшном кэше - паритет с видюхой. Но с какого-то размера - нескольких мегабайт кэша процессора перестаёт хватать, а у видюхи ОСТАЮТСЯ ГИГАБАЙТЫ её быстрой памяти. Если кого интересует - тоже картинку с результатами найду.
Т.е. не путайте скорость самих вычислителей - и зависимость времени вычислений от объёма быстрой памяти (или от скорости доступа к памяти).

Ну и как-то ссылался тут на буржуинскую ВУЗовскую лекцию 2008г о вариантах написания функции перемножения матриц на CPU. В зависимости от ~~криворукости программиста~~ выбранного программистом решения/языка (и в зависимости от знаний программистом архитектуры процессора и системы его команд) - разница может доходить до почти 300000 раз. Я не ошибся с числом нулей - почти 300000 раз. Триста тысяч, да.
Тут тоже интересующиеся могут спросить ссылочку.

[Ответ][Цитата]

NO.
Сообщений: 10700

На: Будущее за GPU...
Добавлено: 11 мар 18 11:19

Цитата:
Автор: Victor G. Tsaregorodtsev
у видюхи ОСТАЮТСЯ ГИГАБАЙТЫ её быстрой памяти

нет там такой, вроде бы global в 300 раз медленнее, чем shared

[Ответ][Цитата]

Victor G. Tsaregorodtsev
Сообщений: 3187

На: Будущее за GPU...
Добавлено: 11 мар 18 11:43

Цитата:
Автор: NO.
нет там такой, вроде бы global в 300 раз медленнее, чем shared

ХЗ, сравните пропускную способность обычной оперативной памяти - это десятки гигабайт в секунду (цифры из таблички на этой странице https://ru.wikipedia.org/wiki/DDR4_SDRAM), и видеопамяти - сотни гигабайт в секунду (см табличку на странице https://ru.wikipedia.org/wiki/Видеокарта).

[Ответ][Цитата]

NO.
Сообщений: 10700

На: Будущее за GPU...
Добавлено: 11 мар 18 12:06

Глобальная память в отдельных микросхемах, она и так медленная, так ещё и доступ не распараллеливается в тысячи раз. Быстрая память shared, но её размер около 32К, а не гигабайты, туда даже таблицу 256*256 не всунуть.

[Ответ][Цитата]

Victor G. Tsaregorodtsev
Сообщений: 3187

На: Будущее за GPU...
Добавлено: 11 мар 18 12:29

Цитата:
Автор: NO.
Глобальная память в отдельных микросхемах, она и так медленная, так ещё и доступ не распараллеливается в тысячи раз. Быстрая память shared, но её размер около 32К, а не гигабайты, туда даже таблицу 256*256 не всунуть.

Тогда как возможны сотни ФПС в играх (да, знаю, что не во всех) на экране FullHD и выше разрешением? FullHD и уж тем более 4К в полноцвете - это далеко не 32кб.
Шаред - это, видимо, обычный видимый всем ядрам аналог кэша. Который просто управляется не системой кэширования (которой у видяхи, видимо, нет) - а вручную программистом (ну, или драйвером видюхи или иным софтом). Вариант - аналог не кэша, а отдельного=дополнительного регистрового файла (набора).
Ну и посмотрите прайсы торгующих комп.железом контор. Они там пишут про размер набортной видеопамяти и могут указать, что это GDDR4 или GDDR5 (т.е. с пропускной способностью в сотни гиг - таки быстрее обычной ОЗУ, к которой лазит проц).
Аль Вы троллите?

[Ответ][Цитата]

kondrat
Сообщений: 4026

На: Будущее за GPU...
Добавлено: 17 май 18 8:54

Нужна помощь профессионалов. Есть ли в современных процессорах автоматическое распараллеливание кода? Если - да, то как оно работает?
У меня есть свой подход, но он выглядит каким-то громоздким.

[Ответ][Цитата]

гость
94.230.208.*

На: Будущее за GPU...
Добавлено: 17 май 18 12:21

Цитата:
Автор: kondrat

Нужна помощь профессионалов. Есть ли в современных процессорах автоматическое распараллеливание кода? Если - да, то как оно работает?
У меня есть свой подход, но он выглядит каким-то громоздким.
Есть, но как работает не скажу, потратьте сами 10000 часов, инфрмация и скилы стоят дорого

[Ответ][Цитата]

Стр.1 (2): [1] 2 След. > >>

Главная | Материалы | Справочник | Гостевая книга | Форум | Ссылки | О сайте

Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net