Проблема «CPU против GPGPU»: Тупиковое будущее? На примере ASUS

Идея этого краткого материала-рассуждения родилась из одного чудесного факта. В процессе оптимизации Premiere Pro и After Effects, и уже после того, как от меня уехала ASUS TUF GeForce RTX 3090 24GB (обзор делал мой коллега Денис Зайченко здесь) я узнал, что из последнего с крайним обновлением пропала возможность оптимизировать программу под многоядерные процессоры — распределять рендер между потоками CPU.

GPGPU CPU

Это объяснялось тем, что Adobe медленно, но верно переходит с оптимизации под CPU на оптимизацию GPU. Это, если что, называется GPGPU, или General Purpose GPU. И с оптимизацией под это дело могут возникнуть громадные проблемы, будь у вас хоть Intel Xe Graphics, хоть ASUS RTX 3090 24GB!



Основы GPGPU

Казалось бы, проблем быть не должно — ведь GPU в современной версии состоит в том числе и из т.н. потоковых процессоров. У NVIDIA они, к примеру, называются ядра CUDA. И эти процессоры работают по тому же принципу, что и ядра привычного CPU.

GPGPU CPU

Разница в мощности. Ядра CPU обладают внушительной вычислительной мощностью, но мизерным количеством, даже учитывая многопоток. А ядра GPU, хоть и мизерны по мощности, но способны выполнять определённую задачу. И при этом их в сотни раз больше. Если не тысячи.

Видеоматериал о GPGPU

Не хотите читать? Смотрите видео:


Аппаратное ускорение

И, скажем, у Premiere Pro обработка эффектов Lumetri на процессоре — да что там, простой энкодинг-декодинг H264 — занимает дикий кусок времени. И это нормально, разные задачи под разное железо выполняются с разной эффективностью. Собственно, даже крошечный аппаратный ускоритель видеообработки в iGPU делает настоящие чудеса, меняя скорость рендера порой многократно!

GPGPU CPU

А учитывая растущую мощность GPU — скажем, у ASUS TUF RTX 3090 целых 24 гигабайта видеопамяти и более десяти тысяч ядер CUDA — вполне логично, что приложения оптимизируются под такое дело.

GPGPU CPU

Под десятки тысяч мелких работников, которые распараллеливают работу, снимая нагрузку с CPU. Но вопрос. Не слишком ли много берёт на себя видеокарта? Я заметил, что при рендере тяжелых эффектов, переходов и просто изменения картинки дополнительными средствами, компьютер начал тормозить.

Память видеокарты забивалась под ноль, процессор в рендере почти не участвовал… как и оперативка. А нюанс в том, что ОЗУ у меня 128 ГБ.

HyperX 3600 MHz 2x32GB

И, для примера, в Premiere Pro половина оперативки простаивает, процессор занят наполовину, декодер-енкодер видюхи расслаблен, зато VRAM забита в зюзю и производительность почти на нуле.

GPGPU CPU

Совместная работа

Хуже всего происходит при рендере проекта со смешанными кусками — связанными композициями After Effects, например. Вот там видеопамять забивается в ноль почти сразу, без предупреждения.  И для увеличения скорости рендера необходимо закрывать все поедающие VRAM приложения. Вроде тех же Premiere Pro и After Effects! И оставлять, скажем, только Media Encoder.

И! Упускается важный фокус. Скажем, After Effects жрёт ещё и ОЗУ, причём за обе щёки. НО! Он умеет кэш сливать! Освобождать память для других приложений. Но с видеопамятью ни одна программа так не работает! Память либо забивается, либо освобождается после закрытия проекта.

GPGPU CPU

И да, безусловно, VRAM быстрее, чем DRAM, и порой значительно. Однако в обзорах Transcend и не только я повторял — для рабочих задач лучше много медленной памяти, чем крошечный кусочек супер-быстрой.

GPGPU CPU

Если программа умеет только забивать память, но не освобождать её максимально эффективно — то скорость памяти не поможет. И получается, что в моём ПК для Adobe Creative Suite лежит целая прорва ОЗУ… которую было бы неплохо использовать при рендере.

Читайте также: Обзор ноутбука ASUS ROG Zephyrus G14 2021 — восторг без вау-эффекта

Но нет — это возлагается практически полностью на несчастную GTX 1080 Ti, где объём памяти более чем в ДЕСЯТЬ РАЗ меньше! И можно сказать, мол, есть же вроде те же RTX, вроде той же модели ASUS TUF RTX 3090, которые тянут NVLink с объединением памяти! Но тут снова нюанс.

GPGPU CPU

За стоимость двух RTX 3090, то бишь — за 2x $2000 (MSRP уже не считаем, это не соответствует современной действительности) мы получаем… 24 ГБ памяти. Которую ещё и не факт что можно будет использовать при рендере! Да, единицы программ эту функциональность реализуют. В основном — моделирование и научные вычисления. Да и настройка там лютая дичь.

GPGPU CPU

А за $4000 мы можем забить плашками DDR4 с ECC все каналы памяти даже AMD Threadripper! 256 ГБ будет в ХУДШЕМ СЛУЧАЕ! Да ещё и с коррекцией ошибок, чего нет у RTX 3090.

GPGPU CPU

Единственная причина, которую я вижу, и которая может остановить перед оптимизацией GPU как вычислителя, а RAM как буфера — задержка между ОЗУ и видеокартой будет слишком большой, чтобы перекрыть бонусы от объёма. С другой стороны, нехватка VRAM всё равно процесс замедляет. А RAM хотя бы добавить можно, если что!

Итоги по GPGPU

В этом и опасность. Даже если у вас ASUS TUF RTX 3090, которую вы специально купили под задачи GPGPU, вы всё равно можете упереться в ботлнек, которого можно было бы избежать. Если бы программы чаще использовали RAM вместо VRAM. Я не представляю себе, как это можно изменить — но если тенденция будет продолжаться, то это будет и вправду тупиковое будущее.

Цены на ASUS TUF RTX 3090 24GB

Украина:



Rozetka

Все магазины

Россия:



Все магазины

Post Проблема «CPU против GPGPU»: Тупиковое будущее? На примере ASUS at Root Nation.

Другие новости раздела: Кратко по миру

Кратко по миру

КАМЕРА iPhone 14 Pro: ОБЪЯСНЯЕМ

Яндекс Бизнес сам приведёт к вам клиентов. Получите 5000 ₽ на первый запуск рекламы для вашего бизнеса до 30 апреля: * Реклама ООО "Яндекс”, ИНН 7736207543, LjN8K943j ОСНОВА с астрофизиком

Кратко по миру

ChatGPT: КАК MICROSOFT ХОРОНИТ GOOGLE? | РАЗБОР

Пробуй курс "Специалист по Data Science" на Яндекс Практикуме бесплатно, переходи по ссылке: 🤟Мы в телеграм) Сегодня мы разберемся с большим вопросом: как и за счет чего Microsoft

Кратко по миру

УМНЫЕ ОЧКИ - ОБЪЯСНЯЕМ | MWC 2023

Скачать Яндекс Путешествия: По промокоду DROIDER10 скидка 10% (до 1000 руб.) на одно бронирование через мобильное приложение до 1 мая (успеть забронировать необходимо до 30 апреля 23:59). 👾

Кратко по миру

САМЫЕ ДИКИЕ ГАДЖЕТЫ MWC 2023

👾 Дружелюбный магазин гаджетов BIGGEEK (cкидки по промокоду DROIDER для наших подписчиков): 🤟Мы в телеграм) На MWC 2023 были не только смартфоны. Команда Droider нашла много интересных и необычных

Похожие публикации

Кратко по миру

RN FAQ #21: В чём РЕАЛЬНЫЕ преимущества линейки ASUS TUF Gaming на примере RTX 3090

На определённой презентации, которая прошла относительно давно (репортаж делал мой злобный двойник Денис Зайченко здесь), от спикера ASUS я услышал довольно занятную информацию. Которая, скажу не

Кратко по миру

Обзор ASUS TUF Gaming GeForce RTX 3090 24GB: 8K-видеокарта в компактной упаковке

Под Новый Год, когда писался этот материал изначально, у меня обычно традиция. Я анализирую то, с чем в компьютере я встречаю грядущие 365 дней. Год назад, волею судеб, мне пришлось пересиживать

Кратко по миру

Процессоры AMD Threadripper – до 16 ядер и разгон до 5 ГГц

Компания AMD представила в Тайвани на выставке Computex свои новые HEDT-процессоры, то бишь процессоры высшего класса (high-end desktop) – Threadripper. Многоядерные решения оправдывают столь

Кратко по миру

Обзор оперативной памяти Kingston Fury Beast 2x16GB DDR5 5200MHz

Знаете, я даже не удивляюсь тому, что среди всех компаний, которые делают новейший стандарт оперативной памяти DDR5, первый её комплект залетел именно от Kingston. Я раньше в глаза не видел DDR5, но

Кратко по миру

Обзор жёсткого диска WD Black Performance 10TB WD101FZBX

Игровые жёсткие диски — вещь странная и весёлая. Сейчас их массово вытесняют SSD, с которых тот же Fallout 4 запускается в несколько раз быстрее. Но у HDD есть и свои плюсы, которые мы рассмотрим —

Кратко по миру

Обзор ASUS TUF Gaming GeForce RTX 3080 Ti 12GB: Карта, расколовшая мир

Забавно, что к RTX 3080 Ti можно подойти АБСОЛЮТНО по-разному. И два главных пути — это считать её либо абсолютно бездарным решением NVIDIA, которое тут же, после релиза, за секунду растворится в

Android Smart TV BOX

Мини-ПК ASUS PN40 и PB40 на платформе Intel Gemini Lake

Модельный ряд мини-компьютеров от компании ASUSTeK Computer на днях официально пополнился устройствами PN40 и PB40. Обе новинки построены на базе платформы Intel Gemini Lake, располагают пассивной

Кратко по миру

Обзор SSD-накопителя Transcend MTE240S 1TB: Ультранадёжный M.2!

Это не накопитель, это загадка Вселенной, скажу честно. Чем больше о Transcend MTE240S 1TB я узнавал, тем сильнее удивлялся всему, что с ним связано. Потому что мой мозг отказывался его понимать. Ну