Предполагается, что новое поколение видеопроцессоров Radeon от AMD станет заметным шагом вперёд по сравнению с архитектурой RDNA 4. Одной из ключевых задач команды AMD является реализация возможности выполнения двух инструкций за такт. Такая особенность
позволяет графическому процессору обрабатывать две команды одновременно. Ранее она уже присутствовала в GPU AMD, начиная с RDNA 3, однако жёсткие требования к формированию пар инструкций мешали компиляторам полноценно её использовать, снижая тем самым достижимую теоретическую пиковую
производительность. Теперь, согласно новому патчу LLVM, AMD, вероятно, решит эту проблему в рамках архитектуры RDNA 5.Новые инструкции VOPD3 и изменения в LLVMИздание Coelacanth’s Dream, ориентированное на Linux, проанализировало последние изменения и установило, что они связаны с набором инструкций
gfx13 – производной от gfx130, которую можно считать RDNA 5. Компания, судя по всему, внедряет новый тип инструкций под названием «VOPD3», рассчитанный на более эффективную работу с модулем VALU (векторный арифметико-логический блок, шейдерный элемент), поддерживающим двойную выдачу инструкций. Улучшенная гибкость
нового формата должна упростить использование двойных инструкций компиляторами.Как VOPD3 расширяет возможности вычисленийНа аппаратном уровне текущий механизм VOPD работал преимущественно с упрощёнными операциями, содержащими два операнда, что затрудняло формирование совместимых пар инструкций компилятором. VOPD3 расширяет эту возможность до трёхоперандных команд,
позволяя выполнять такие операции, как умножение с последующим сложением (FMA). В том же патче уже появилась инструкция F_VMA_F32, что указывает на то, что данная функциональность, вероятно, будет использоваться в RDNA 5.Прирост производительности и влияние на
рендерингБлагодаря этому частота выполнения пар инструкций возрастёт, что в перспективе обеспечит заметный рост пропускной способности в режиме FP32. Шейдерные блоки будут реже простаивать между тактами, выполняя больше полезной работы, а каждая команда станет эффективнее. Такой подход особенно актуален в высоконагруженных сценариях, например при рендеринге, и поможет игровым движкам лучше задействовать возможности двойной обработки VALU.Преимущества
для ИИ-рендеринга и масштабированияСокращение числа ситуаций, в которых синхронизация пар инструкций невозможна из-за архитектурных ограничений, представляет собой важный шаг к повышению общей эффективности оборудования без необходимости искусственно
увеличивать показатель IPC за счёт доработки микрокода.Кроме того, инструкции типа FMA имеют значение и для нейросетевого рендеринга, поэтому технологии масштабирования и генерации кадров также могут получить прирост производительности – даже если само оборудование не становится существенно мощнее –
поскольку выполнение двух операций за такт повышает эффективность вычислений.
Сообщает mobidevices.com
Новость из рубрики: Гаджеты
Поделиться новостью:
Топ Новости Недели
- СПАС - гармония здоровья и эстетики улыбки...
- Доставка мебели из Китая...
- Отличный производитель сэндвич панелей - Компания МОСПАНЕЛИ...
- Летние шины 225/65 R17 - уверенность на каждом километре...
- Канализационные трубы ПВХ и фитинги...
- Ремонт промышленной электроники с компанией X Plata в Москве...
- Регистрация товарного знака в Казахстане с BROCS...
- Доставка экзотических фруктов из Таиланда с FRUITIQUE в Москве...
- Нетканый геотекстиль: невидимая основа долговечных решений...
- Aurus Residences - высота статуса в сердце Москва Сити...
- Качество Семяныча как ответ на неопределённость рынка...
- Искусство сияния: браслеты с драгоценными камнями...
- Погружение в мир Lineage 2: серверы, которые удивляют...
- Антигравийная пленка для авто в Минске...
- Переезд в другой город из Москвы без стресса и лишних забот...
- VIP Neva - комфортный трансфер и бизнес-такси в сердце Северной столицы...
- Инструмент - важнейший помощник...
- Доходность гостиничного бизнеса...
- Искусство цифрового роста - создание и продвижение сайтов с SEORA...
- Компрессоры ЗИФ от ОАО МЗ "Арсенал"...
16:17, 20 Фев «Премиальный дизайн, высочайшее качество, высокая производительность». Тестирование Samsung Galaxy Book6 Ultra раскрыло его автономность и производительность Авторы Tom’s Hardware протестировали новейший ноутбук Samsung Galaxy Book6 Ultra. Это версия с 16-дюймовым OLED-экраном, новым процессором Core Ultra...
06:17, 17 Фев PlayStation 6 не ограничилась только RDNA 5 — слух По слухам от инсайдера KeplerL2, новая PlayStation 6 не будет полагаться исключительно на стандартный графический чип AMD RDNA 5 — Sony снова пойдёт ...
00:17, 18 Фев История с PS3 может повториться в PlayStation 6? Будущая консоль Sony рискует получить гибридную графику вместо полной RDNA 5 В сети начали обсуждать первые технические детали будущей PlayStation 6. По информации инсайдера Kepler_L2 с форума NeoGAF, новая консоль Sony не буд...
13:26, 25 Фев Модульные школы - архитектура будущего образования уже сегодня Современная система образования все чаще сталкивается с вызовами, на которые традиционное строительство отвечает слишком медленно. Рост населения, не...
05:17, 03 Апр Программное обеспечение для беспилотников: архитектура, технологии и перспективы развития Современные беспилотные летательные аппараты (БПЛА) представляют собой сложные технологические системы, в которых ключевую роль играет по для беспило...
17:17, 10 Фев На Брянщине обсудили ход реализации нацпроекта «Производительность труда» Губернатор Брянской области Александр Богомаз провел оперативное совещание, на котором были подведены итоги реализации нацпроекта «Производительность...
14:17, 06 Мар Все минусы MacBook Neo: экран, процессор, клавиатура и производительность Apple представила MacBook Neo — самый доступный ноутбук в современной линейке Mac. Его цена начинается всего с $599, а для студентов и преподавателей...
22:17, 10 Мар Как разогнать процессор на ноутбуке: увеличиваем производительность без затрат Большинство современных лэптопов оснащены достаточно производительными процессорами, чтобы выполнять офисные задачи. Но этого может показаться мало, ...
21:17, 27 Фев Архитектура добра: как построить опору для почти двух миллионов жизней За четыре года украинского кризиса Российский Красный Крест оказал помощь 1 768 304 людям. Что скрывается за этой статистикой — разбирались наши колл...
05:17, 24 Фев Как повысить производительность кубитов: достигнуто сверхбыстрое обнаружение флуктуаций Используя доступные в коммерческой сфере технологии и инновационные методы, исследователи из NBI расширили границы скорости обнаружения изменений в ч...
16:17, 26 Мар Как устроен майнинг-провайдер полного цикла: архитектура, процессы и экономика бизнеса Современная индустрия криптовалют переживает этап зрелости, в котором на первый план выходят не только технологии блокчейна, но и инфраструктурные ре...
20:17, 20 Мар Samsung заплатит пользователям Galaxy S22 за то, что ограничивала производительность смартфонов в играх Многолетний спор вокруг Game Optimizing Service (GOS) в смартфонах серии Galaxy S22, похоже, официально завершён. Как сообщают корейские СМИ, Высокий...
16:17, 16 Фев DeepRed: новая архитектура для оценки красного смещения по изображениям галактик и гравитационных линз Красное смещение — ключевой параметр в астрофизике, позволяющий определять расстояния до астрономических объектов и исследовать расширение Вселенной....
20:17, 06 Фев Производительность iGPU Intel B390 в Alan Wake 2 конкурирует с Xbox Series S В ходе всестороннего теста производительности, проведённого Digital Foundry, новый интегрированный графический процессор Intel Panther Lake показал н...
18:17, 14 Мар AetherFloat: новая архитектура блок-независимых 8- и 16-битных чисел может сделать ИИ-процессоры быстрее и экономичнее Развитие искусственного интеллекта всё сильнее упирается в ограничения аппаратуры. Современные нейросетевые ускорители — Neural Processing Units (NPU...