Добавить новость
Новости сегодня

Новости от TheMoneytizer

Архитектура AMD RDNA 5 удвоит производительность игр

Предполагается, что новое поколение видеопроцессоров Radeon от AMD станет заметным шагом вперёд по сравнению с архитектурой RDNA 4. Одной из ключевых задач команды AMD является реализация возможности выполнения двух инструкций за такт.

Такая особенность позволяет графическому процессору обрабатывать две команды одновременно. Ранее она уже присутствовала в GPU AMD, начиная с RDNA 3, однако жёсткие требования к формированию пар инструкций мешали компиляторам полноценно её использовать, снижая тем самым достижимую теоретическую пиковую производительность. Теперь, согласно новому патчу LLVM, AMD, вероятно, решит эту проблему в рамках архитектуры RDNA 5.

Новые инструкции VOPD3 и изменения в LLVM

Издание Coelacanth’s Dream, ориентированное на Linux, проанализировало последние изменения и установило, что они связаны с набором инструкций gfx13 – производной от gfx130, которую можно считать RDNA 5. Компания, судя по всему, внедряет новый тип инструкций под названием «VOPD3», рассчитанный на более эффективную работу с модулем VALU (векторный арифметико-логический блок, шейдерный элемент), поддерживающим двойную выдачу инструкций. Улучшенная гибкость нового формата должна упростить использование двойных инструкций компиляторами.

Как VOPD3 расширяет возможности вычислений

На аппаратном уровне текущий механизм VOPD работал преимущественно с упрощёнными операциями, содержащими два операнда, что затрудняло формирование совместимых пар инструкций компилятором. VOPD3 расширяет эту возможность до трёхоперандных команд, позволяя выполнять такие операции, как умножение с последующим сложением (FMA). В том же патче уже появилась инструкция F_VMA_F32, что указывает на то, что данная функциональность, вероятно, будет использоваться в RDNA 5.

Прирост производительности и влияние на рендеринг

Благодаря этому частота выполнения пар инструкций возрастёт, что в перспективе обеспечит заметный рост пропускной способности в режиме FP32. Шейдерные блоки будут реже простаивать между тактами, выполняя больше полезной работы, а каждая команда станет эффективнее. Такой подход особенно актуален в высоконагруженных сценариях, например при рендеринге, и поможет игровым движкам лучше задействовать возможности двойной обработки VALU.

Преимущества для ИИ-рендеринга и масштабирования

Сокращение числа ситуаций, в которых синхронизация пар инструкций невозможна из-за архитектурных ограничений, представляет собой важный шаг к повышению общей эффективности оборудования без необходимости искусственно увеличивать показатель IPC за счёт доработки микрокода.

Кроме того, инструкции типа FMA имеют значение и для нейросетевого рендеринга, поэтому технологии масштабирования и генерации кадров также могут получить прирост производительности – даже если само оборудование не становится существенно мощнее – поскольку выполнение двух операций за такт повышает эффективность вычислений.

Читайте на сайте


Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. Абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city
Музыкальные новости
Новости России
Экология в России и мире
Спорт в России и мире
Moscow.media






Топ новостей на этот час

Rss.plus





СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *