Проблема «CPU против GPGPU»: Тупиковое будущее? На примере ASUS

Идея этого краткого материала-рассуждения родилась из одного чудесного факта. В процессе оптимизации Premiere Pro и After Effects, и уже после того, как от меня уехала ASUS TUF GeForce RTX 3090 24GB (обзор делал мой коллега Денис Зайченко здесь) я узнал, что из последнего с крайним обновлением пропала возможность оптимизировать программу под многоядерные процессоры — распределять рендер между потоками CPU.

GPGPU CPU

Это объяснялось тем, что Adobe медленно, но верно переходит с оптимизации под CPU на оптимизацию GPU. Это, если что, называется GPGPU, или General Purpose GPU. И с оптимизацией под это дело могут возникнуть громадные проблемы, будь у вас хоть Intel Xe Graphics, хоть ASUS RTX 3090 24GB!



Основы GPGPU

Казалось бы, проблем быть не должно — ведь GPU в современной версии состоит в том числе и из т.н. потоковых процессоров. У NVIDIA они, к примеру, называются ядра CUDA. И эти процессоры работают по тому же принципу, что и ядра привычного CPU.

GPGPU CPU

Разница в мощности. Ядра CPU обладают внушительной вычислительной мощностью, но мизерным количеством, даже учитывая многопоток. А ядра GPU, хоть и мизерны по мощности, но способны выполнять определённую задачу. И при этом их в сотни раз больше. Если не тысячи.

Видеоматериал о GPGPU

Не хотите читать? Смотрите видео:


Аппаратное ускорение

И, скажем, у Premiere Pro обработка эффектов Lumetri на процессоре — да что там, простой энкодинг-декодинг H264 — занимает дикий кусок времени. И это нормально, разные задачи под разное железо выполняются с разной эффективностью. Собственно, даже крошечный аппаратный ускоритель видеообработки в iGPU делает настоящие чудеса, меняя скорость рендера порой многократно!

GPGPU CPU

А учитывая растущую мощность GPU — скажем, у ASUS TUF RTX 3090 целых 24 гигабайта видеопамяти и более десяти тысяч ядер CUDA — вполне логично, что приложения оптимизируются под такое дело.

GPGPU CPU

Под десятки тысяч мелких работников, которые распараллеливают работу, снимая нагрузку с CPU. Но вопрос. Не слишком ли много берёт на себя видеокарта? Я заметил, что при рендере тяжелых эффектов, переходов и просто изменения картинки дополнительными средствами, компьютер начал тормозить.

Память видеокарты забивалась под ноль, процессор в рендере почти не участвовал… как и оперативка. А нюанс в том, что ОЗУ у меня 128 ГБ.

HyperX 3600 MHz 2x32GB

И, для примера, в Premiere Pro половина оперативки простаивает, процессор занят наполовину, декодер-енкодер видюхи расслаблен, зато VRAM забита в зюзю и производительность почти на нуле.

GPGPU CPU

Совместная работа

Хуже всего происходит при рендере проекта со смешанными кусками — связанными композициями After Effects, например. Вот там видеопамять забивается в ноль почти сразу, без предупреждения.  И для увеличения скорости рендера необходимо закрывать все поедающие VRAM приложения. Вроде тех же Premiere Pro и After Effects! И оставлять, скажем, только Media Encoder.

И! Упускается важный фокус. Скажем, After Effects жрёт ещё и ОЗУ, причём за обе щёки. НО! Он умеет кэш сливать! Освобождать память для других приложений. Но с видеопамятью ни одна программа так не работает! Память либо забивается, либо освобождается после закрытия проекта.

GPGPU CPU

И да, безусловно, VRAM быстрее, чем DRAM, и порой значительно. Однако в обзорах Transcend и не только я повторял — для рабочих задач лучше много медленной памяти, чем крошечный кусочек супер-быстрой.

GPGPU CPU

Если программа умеет только забивать память, но не освобождать её максимально эффективно — то скорость памяти не поможет. И получается, что в моём ПК для Adobe Creative Suite лежит целая прорва ОЗУ… которую было бы неплохо использовать при рендере.

Читайте также: Обзор ноутбука ASUS ROG Zephyrus G14 2021 — восторг без вау-эффекта

Но нет — это возлагается практически полностью на несчастную GTX 1080 Ti, где объём памяти более чем в ДЕСЯТЬ РАЗ меньше! И можно сказать, мол, есть же вроде те же RTX, вроде той же модели ASUS TUF RTX 3090, которые тянут NVLink с объединением памяти! Но тут снова нюанс.

GPGPU CPU

За стоимость двух RTX 3090, то бишь — за 2x $2000 (MSRP уже не считаем, это не соответствует современной действительности) мы получаем… 24 ГБ памяти. Которую ещё и не факт что можно будет использовать при рендере! Да, единицы программ эту функциональность реализуют. В основном — моделирование и научные вычисления. Да и настройка там лютая дичь.

GPGPU CPU

А за $4000 мы можем забить плашками DDR4 с ECC все каналы памяти даже AMD Threadripper! 256 ГБ будет в ХУДШЕМ СЛУЧАЕ! Да ещё и с коррекцией ошибок, чего нет у RTX 3090.

GPGPU CPU

Единственная причина, которую я вижу, и которая может остановить перед оптимизацией GPU как вычислителя, а RAM как буфера — задержка между ОЗУ и видеокартой будет слишком большой, чтобы перекрыть бонусы от объёма. С другой стороны, нехватка VRAM всё равно процесс замедляет. А RAM хотя бы добавить можно, если что!

Итоги по GPGPU

В этом и опасность. Даже если у вас ASUS TUF RTX 3090, которую вы специально купили под задачи GPGPU, вы всё равно можете упереться в ботлнек, которого можно было бы избежать. Если бы программы чаще использовали RAM вместо VRAM. Я не представляю себе, как это можно изменить — но если тенденция будет продолжаться, то это будет и вправду тупиковое будущее.

Цены на ASUS TUF RTX 3090 24GB

Украина:



Rozetka

Все магазины

Россия:



Все магазины

Post Проблема «CPU против GPGPU»: Тупиковое будущее? На примере ASUS at Root Nation.

Другие новости раздела: Кратко по миру

Кратко по миру

КАК ИИ ЗАХВАТИТ НАШУ ЖИЗНЬ | РАЗБОР

💸Получите шанс выиграть до 5 000 000 рублей со СберИнвестициями: 💰Нужны перемены? Рассчитайте кредитный потенциал для вашего бизнеса в СбербанкОнлайн и оформите кредит по сниженной на 3% ставке.

Кратко по миру

THE LINE — ГОРОД БУДУЩЕГО | РАЗБОР

💠Первая умная LED-одежда и аксессуары Cyberpix: По промокоду Droider скидка 15% 🤟Мы в телеграм) Все то, о чем еще несколько десятилетий назад писали фантасты, кажется, становится реальностью. Вот и

Кратко по миру

ЭЛЕКТРОМОБИЛЬ ОТ XIAOMI: TESLA НАПРЯГЛАСЬ? | РАЗБОР

📺Этот и другие QLED Телевизоры HYUNDAI на официальном сайте Реклама. ООО Мерлион. ИНН 7719269331. erid: 2Vtzqvm6aL2 Секретная империя XIAOMI: 🤟Мы в телеграм) Один из самых ожидаемых гаджетов года —

Кратко по миру

МЕТАЛИНЗЫ - ЭТО РЕВОЛЮЦИЯ | РАЗБОР

🌐Единое пространство для бизнес-коммуникации и совместной работы МТС Линк — 🤟Мы в телеграм) Сегодня мы поговорим о металинзах. Это абсолютно новая технология, которая может изменить мир мобильной

Похожие публикации

Кратко по миру

RN FAQ #21: В чём РЕАЛЬНЫЕ преимущества линейки ASUS TUF Gaming на примере RTX 3090

На определённой презентации, которая прошла относительно давно (репортаж делал мой злобный двойник Денис Зайченко здесь), от спикера ASUS я услышал довольно занятную информацию. Которая, скажу не

Кратко по миру

Обзор ASUS TUF Gaming GeForce RTX 3090 24GB: 8K-видеокарта в компактной упаковке

Под Новый Год, когда писался этот материал изначально, у меня обычно традиция. Я анализирую то, с чем в компьютере я встречаю грядущие 365 дней. Год назад, волею судеб, мне пришлось пересиживать

Кратко по миру

Процессоры AMD Threadripper – до 16 ядер и разгон до 5 ГГц

Компания AMD представила в Тайвани на выставке Computex свои новые HEDT-процессоры, то бишь процессоры высшего класса (high-end desktop) – Threadripper. Многоядерные решения оправдывают столь

Кратко по миру

Обзор оперативной памяти Kingston Fury Beast 2x16GB DDR5 5200MHz

Знаете, я даже не удивляюсь тому, что среди всех компаний, которые делают новейший стандарт оперативной памяти DDR5, первый её комплект залетел именно от Kingston. Я раньше в глаза не видел DDR5, но

Кратко по миру

Обзор жёсткого диска WD Black Performance 10TB WD101FZBX

Игровые жёсткие диски — вещь странная и весёлая. Сейчас их массово вытесняют SSD, с которых тот же Fallout 4 запускается в несколько раз быстрее. Но у HDD есть и свои плюсы, которые мы рассмотрим —

Кратко по миру

Обзор ASUS TUF Gaming GeForce RTX 3080 Ti 12GB: Карта, расколовшая мир

Забавно, что к RTX 3080 Ti можно подойти АБСОЛЮТНО по-разному. И два главных пути — это считать её либо абсолютно бездарным решением NVIDIA, которое тут же, после релиза, за секунду растворится в

Android Smart TV BOX

Мини-ПК ASUS PN40 и PB40 на платформе Intel Gemini Lake

Модельный ряд мини-компьютеров от компании ASUSTeK Computer на днях официально пополнился устройствами PN40 и PB40. Обе новинки построены на базе платформы Intel Gemini Lake, располагают пассивной

Кратко по миру

Обзор SSD-накопителя Transcend MTE240S 1TB: Ультранадёжный M.2!

Это не накопитель, это загадка Вселенной, скажу честно. Чем больше о Transcend MTE240S 1TB я узнавал, тем сильнее удивлялся всему, что с ним связано. Потому что мой мозг отказывался его понимать. Ну