Архитектура RDNA 4 от AMD стала значительным этапом в развитии графических процессоров Radeon, продвигая технологические достижения и предлагая впечатляющий уровень производительности и функциональности. Это обновление представляет собой мощный и современный подход к дизайну GPU, позволяя конкурентоспособно справляться с растущими требованиями игрового и профессионального сегментов. В основе RDNA 4 лежат инновации, направленные на улучшение энергоэффективности, вычислительной мощности, а также значительный прогресс в обработке технологий трассировки лучей и искусственного интеллекта, что делает её важной вехой для AMD и рынка графики в целом. Предыстория развития архитектуры GPU AMD охватывает несколько ключевых этапов, каждый из которых способствовал совершенствованию производительности и расширению функциональных возможностей. От предыдущих поколений GCN, через RDNA 1, 2 и 3, AMD постоянно наращивала мощность и эффективность своих решений.
Перед выходом RDNA 4 была представлена версия RDNA 3.5, ориентированная в первую очередь на мобильные устройства и интегрированные решения. Эта версия дала значительный прирост энергоэффективности — примерно на 30% по сравнению с RDNA 3. Достижения обеспечивались оптимизацией работы с регистрами общего назначения и улучшениями в обработке команд, а также добавлением поддержки плавающей запятой в скалярных вычислительных единицах. В совокупности эти изменение позволили добиться повышения производительности при сохранении энергоэффективности, что особенно важно для мобильных и компактных систем.
Однако главный акцент AMD сделала именно на RDNA 4 — архитектуре, оформленной вокруг монолитного дизайна чипов Navi 48 и Navi 44, на которых основаны модели, такие как RX 9070 XT, RX 9070 и RX 9060 XT. Использование узла N4P — усовершенствованной версии 5-нм технологии — позволяет повысить тактовые частоты до 3.2-3.3 ГГц, что значительно улучшает как вычислительную мощность, так и общую производительность в различных задачах, включая трассировку лучей и традиционное растеризованное рендеринг. Важным аспектом дизайна RDNA 4 стала работа с памятью и кэшами.
В условиях конкуренции с более крупными и оснащёнными моделями, например RX 7900 XTX, обладающими значительным объёмом Infinity Cache и большой пропускной способностью памяти, RX 9070 XT демонстрирует выдающиеся результаты благодаря инновационному управлению кэш-памятью. В RDNA 4 размер кэша L2 увеличен вдвое — с 4 до 8 мегабайт, при этом производительность кэша также возросла за счёт удвоенного пропускного канала. Интересно отметить, что эта величина пропускной способности значительно превышает аналогичные показатели у более старших моделей, благодаря чему повышается эффективная скорость доступа к данным. Инфинити кэш третьего поколения получил усиленную проволочную разводку, что улучшило общую пропускную способность, а переработанный процессор команд обеспечивает более точное предсказание потребностей в данных и оптимизацию работы кэша. Дополнительное улучшение касается перестройки L1 кэша в формате буфера чтения-записи, что отражается на перераспределении уровней кэша и в маркетинговом переименовании.
В итоге архитектура получила более эффективное кэширование и сокращение задержек, что положительно сказывается на игровой производительности и быстродействии приложений. Одно из самых больших достижений RDNA 4 касается технологий трассировки лучей, которые являются ключевыми для современного 3D-рендеринга и визуальных эффектов. Начатая в RDNA 2 и развитием в RDNA 3, трассировка лучей стала более оптимизированной и высокопроизводительной благодаря дальнейшим инновациям. RDNA 4 вводит удвоенное количество блоков пересечения для ускорения вычислений, что позволяет проверять сразу восемь объемов для обхода и две треугольных проверок за такт вместо четырёх и одной соответственно. Такая архитектурная особенность повышает эффективность обхода структуры Bounding Volume Hierarchy (BVH), которая лежит в основе трассировки лучей.
Это связано с тем, что BVH организует игровую сцену в иерархическую структуру, позволяющую быстро отсеивать лишние объекты и ускорять поиск пересечений лучей с поверхностями. Важное нововведение — использование ориентированных ограничивающих объёмов (Oriented Bounding Boxes, OBB), позволяющих более точно и эффективно учитывать ориентацию игровых объектов, в отличие от стандартных осевых ограничений. Это снижает вычислительные издержки и оптимизирует использование ресурсов памяти и пропускной способности, что в итоге отражается на повышении производительности трассировки в сложных сценах. Кроме того, архитектура RDNA 4 внедряет методы сжатия узлов примитивов для оптимизации использования видеопамяти и снижения требований к пропускной способности. Эти улучшения способствуют более эффективному кэшированию и общей производительности GPU в задачах трассировки.
Нельзя не отметить введение режима Out of Order memory access, позволяющего обрабатывать запросы к памяти в более гибком порядке, а не строго по очереди. Это реализовано для повышения эффективности использования готовых данных и уменьшения простоев из-за ожидания медленных операций. Ещё одна важная инновация RDNA 4 — динамическое распределение регистров шейдеров. Это позволяет значительно расширить параллелизм вычислений, поскольку шейдеры могут запрашивать больше регистров, что отражается на улучшении производительности как в традиционном растеризованном рендеринге, так и в трассировке лучей. По результатам тестов в традиционной графике RDNA 4 превосходит предыдущие модели с аналогичными частотами и пропускной способностью на 8-27%, а в задачах трассировки лучей рост может достигать 30-85%, а в экстремальных сценариях path tracing — от 70 до 200%.
Особое внимание RDNA 4 уделяет искусственному интеллекту и машинному обучению, которые становятся неотъемлемой частью современных графических решений и напрямую используются в технологиях улучшения изображения и оптимизации работы GPU. Пропускная способность операций в форматах FP16 и BF16 удвоилась, а для INT8 и INT4 — увеличилась в четыре раза. Добавление поддержки новых форматов FP8 и BF8 расширяет возможности архитеκтуры в этой области, делая её конкурентоспособной в задачах AI/ML. Новые технологии также включают поддержку стандарта PCIe 5.0, удваивающего пропускную способность интерфейса по сравнению с предыдущими версиями.
Хотя в текущих условиях это преимущество не проявляется полностью из-за ограничений других компонентов системы, оно обеспечивает готовность платформы к будущим требованиям и более быстрому обмену данными. Обновленный дисплейный движок предлагает улучшения для работы с современными кодеками, такими как HEVC, AV1 и H.264, что положительно сказывается на потоковой передаче и записи видео. Введение функции аппаратной очереди Flip Queue переносит управление кадрами на сторону графического процессора, уменьшая нагрузку на центральный процессор и повышая общую эффективность системы при воспроизведении и трансляции контента. В совокупности все эти достижения делают RDNA 4 ключевым шагом вперёд в эволюции графических платформ AMD.
Она сочетает высокую скорость, продвинутые технологии обработки изображений и улучшенную энергоэффективность. Благодаря этому пользователи получают мощные инструменты для игр, творческой работы и комплексных вычислений, при этом производитель обеспечивает оптимальную балансировку стоимости и производительности. Перспективы развития AMD и дальнейшие шаги в области графических архитектур выглядят многообещающими. RDNA 4 задаёт высокий уровень для последующих поколений, предлагая гибкую, мощную и эффективную основу для инноваций в 3D-графике, AI и мультимедийных технологиях. Подводя итог, архитектура RDNA 4 демонстрирует, как сложное инженерное творчество и тонкая оптимизация низкоуровневых процессов вкупе с масштабными аппаратными обновлениями способны значительно поднять планку современных GPU.
Разработчики игр, профессионалы и энтузиасты могут ожидать от новых видеокарт на базе RDNA 4 впечатляющего прироста производительности и качества изображения, отражающего следующее поколение игровых и вычислительных технологий.