Архитектура AMD RDNA4, представленная на конференции Hot Chips 2025, знаменует собой новый этап развития графических процессоров AMD, нацеленных на достижение высокой эффективности и производительности в игровых и профессиональных приложениях. Эта архитектура стала логичным продолжением серии RX 9000, предлагая значительные улучшения во многих аспектах, включая растеризацию, трассировку лучей и машинное обучение. В центре внимания AMD оказалась не только максимальная вычислительная мощность, но и баланс между производительностью и энергопотреблением, что особенно важно для современных игровых систем с высокими требованиями к ресурсам и тепловому режиму. Проектируя RDNA4, разработчики AMD тщательно анализировали как существующие, так и перспективные игровые нагрузки, сосредотачиваясь на потенциальных сценариях использования, которые могут появиться в ближайшие пять лет. В результате архитектура демонстрирует значительный прирост эффективности, особенно в задачах трассировки лучей и машинного обучения, что отражает растущую роль этих технологий в игровой индустрии и профессиональном визуализации.
Ключевым элементом RDNA4 стала улучшенная система компрессии данных, значительно сокращающая объём передаваемой информации и, соответственно, снижающая требования к пропускной способности видеопамяти. Это позволяет архитектуре оставаться производительной даже при использовании более скромных параметров шины памяти - например, 256-битного GDDR6, что сделало архитектуру одновременно мощной и экономичной с точки зрения конструкции. Одной из заметных новаций в RDNA4 является обновлённый медиа-движок, который обеспечивает аппаратное ускорение кодирования и декодирования видео в широком диапазоне кодеков. В высокопроизводительных моделях, таких как RX 9070XT, установлено сразу два таких движка. Это не только ускоряет воспроизведение и обработку видео, но и снижает энергопотребление, позволяя устройству быстро входить в режим ожидания и экономить заряд батареи в ноутбуках и компактных системах.
Важным достижением стала оптимизация для низкой задержки при кодировании с использованием таких кодеков, как H.264, H.265 и AV1. Особенно это актуально для стриминга, где задержки напрямую влияют на качество и своевременность трансляций. Улучшенное качество видео при низкой задержке, подтверждённое на тестах с использованием клипов из Elder Scrolls Online, показывает, что RDNA4 лучше сохраняет контурные детали и шрифты, обеспечивая большее визуальное качество даже при ограничениях битрейта.
При этом повысилась и скорость кодирования, что немаловажно для оперативной обработки видео и задач, связанных с живыми трансляциями и коммуникацией. Дисплейный блок RDNA4 также получил серьёзное обновление. Разработчики внедрили аппаратный фильтр Radeon Image Sharpening, способный усиливать резкость финального изображения с минимальной нагрузкой на GPU и без воздействия на производительность в играх и приложениях. Такой подход позволяет улучшать визуальное восприятие контента как в играх, так и на рабочем столе, обеспечивая чёткие и насыщенные изображения. Кроме того, архитектура включает улучшенные механизмы энергосбережения при работе с несколькими мониторами и высокой частотой обновления.
За счёт динамического управления частотой обновления в связке с технологией FreeSync RDNA4 эффективно снижает нагрузку на память и систему в целом, поддерживая оптимальный баланс между качеством изображения и энергопотреблением. С точки зрения вычислительных изменений, RDNA4 сохранила основную архитектуру рабочей группы (Workgroup Processor) предыдущих поколений, но значительно улучшила блоки, отвечающие за трассировку лучей. Расширенные узлы BVH (Bounding Volume Hierarchy), динамическое распределение регистров и улучшенный планировщик позволили существенно уменьшить ложные задержки и повысить эффективность параллелизма. Это отражается в улучшенной производительности при рендеринге сложных сцен с точной световой обработкой. Интересной технической инновацией стала реализация так называемых "разделённых барьеров".
Традиционные барьеры синхронизации заставляли все потоки внутри рабочей группы ожидать друг друга, что могло приводить к неэффективному простаиванию. Теперь разделение барьеров на сигнальные и ожидающие действия позволяет потокам выполнить независимые операции до момента необходимости взаимодействия, тем самым повышая параллелизм и уменьшает задержки в вычислительных задачах. Архитектура RDNA4 расширила функционал скалярных плавающих операций, что позволяет лучше распределять нагрузки между скалярным и векторным ядрами внутри GPU. Эта оптимизация снижает энергетические затраты и ускоряет выполнение команд с плавающей точкой, что важно для приложений с высокой интенсивностью вычислений и машинного обучения. Важной частью архитектуры является обновлённая подсистема памяти.
Максимальные варианты RDNA4 получили 8 МБ уровня L2 кеша - заметный рост по сравнению с предшественниками (6 МБ у RDNA3 и 4 МБ у RDNA2). Увеличение объёма кеша повышает эффективность работы с трассировкой лучей и существенно снижает количество обращений к Infinity Cache, что ощутимо сокращает задержки. Несмотря на отсутствие отдельного L1 кеша, который присутствовал в предыдущих версиях, глубина и скорость L2 в RDNA4 компенсирует этот момент, обеспечивая быстрое хранение данных и оптимальный баланс между сложностью схемы и производительностью. AMD сделала акцент и на прозрачной компрессии данных, применяемой на всех уровнях SoC - включая медиа и дисплейные движки. Эта технология значительно сокращает объём передаваемых и обрабатываемых данных, снижая загрузку памяти и энергопотребление без ущерба для качества и скорости работы.
В архитектуре реализованы и традиционные CPU-реликвии, такие как система RAS (надежность, доступность и обслуживание), позволяющая обнаруживать и исправлять ошибки в аппаратных компонентах. В случае критических ошибок предусмотрена возможность переинициализации частей SoC без полного отключения GPU, что повышает стабильность работы системы. Безопасность на уровне микропроцессора реализована через выделенные шины и защищённые механизмы доступа к критическим регистрам, обеспечивающие защиту от внешних вмешательств и поддерживающие технологии управления цифровыми правами (DRM). Применение в графических процессорах технологии Infinity Fabric позволило создать эффективную высокоскоростную и когерентную систему межблочного взаимодействия с динамическим управлением частотами и напряжениями (DVFS). Система поддерживает огромную пропускную способность порядка нескольких терабайт в секунду, что обеспечивает стабильную и быструю обработку данных при работе с кешами и памятью.
AMD сохранила в RDNA4 возможность отключения отдельных блоков GPU для создания различных SKU, что позволяет варьировать производительность и энергопотребление продуктов, оптимизировать затраты и присутствовать на разных ценовых сегментах рынка. Выбор монолитного дизайна GPU объясняется стремлением компании к балансировке производительности, стоимости и скорости вывода продукта на рынок. Такой подход остаётся актуальным для графических движков среднего и высокого уровня, где монолитная кристаллография обеспечивает ряд преимуществ по сравнению с составными чиплетами. В итоге архитектура RDNA4 выступает как пример смещённой акцента на эффективность и качественную оптимизацию, нежели на абсолютную производительность с максимальным энергопотреблением. Одним из ярких представителей поколения стал RX 9070, который при меньшем энергобюджете и памяти показывает результаты сопоставимые с топовыми моделями предыдущих поколений.
Это доказывает, что AMD удалось успешно реализовать концепцию сбалансированного GPU, способного эффективно справляться с современными игровыми и профессиональными задачами. Дополнительные улучшения в медиа и дисплейных блоках, а также расширение функционала для ML загрузок делают RDNA4 привлекательным решением как для геймеров, так и для создателей цифрового контента. Сниженное энергопотребление при работе с несколькими мониторами и повышенная эффективность видеоэнкодинга выводят эту архитектуру на новый уровень универсальности. При всей технической сложной и массивности обновлений в RDNA4, AMD не стремилась перепрыгнуть в сегмент абсолютного топа, где конкурируют самые большие и дорогие GPU. Вместо этого компания поставила цель получить заметный прирост в энергоэффективности и универсальности, сохранив или даже улучшив уровень производительности за разумные деньги и с менее сложными техническими решениями.
Таким образом, архитектура AMD RDNA4 - это современный графический процессор нового поколения, сбалансированный и мощный, который отвечает вызовам следующего десятилетия в области игр, компьютерной графики и машинного обучения, предоставляя пользователям высокий уровень качества при оптимальных энергетических затратах и цене. .