• Главная
  • Блог
  • Обзор видеоускорителя Nvidia GeForce RTX 4080 Super на основе карты Gigabyte Aorus GeForce RTX 4080 Super Master 16G (16 ГБ)

Обзор видеоускорителя Nvidia GeForce RTX 4080 Super на основе карты Gigabyte Aorus GeForce RTX 4080 Super Master 16G (16 ГБ)

02.02.2024 07:59

Общая информация о GeForce RTX 4080 Super

Осенью 2022 года Nvidia представила свою последнюю серию видеокарт, возглавленную топовой моделью GeForce RTX 4090, за которой последовали GeForce RTX 4080 и GeForce RTX 4070 весной 2023 года. Архитектура Ada Lovelace придала этим видеокартам выдающуюся производительность в графических и вычислительных задачах, утвердив их позицию как самых мощных на рынке. Графические процессоры Ada Lovelace превзошли предыдущее поколение по производительности как в растеризации, так и в трассировке лучей. Одной из ключевых новинок стала технология DLSS 3, обеспечившая дополнительное увеличение частоты кадров за счет генерации дополнительных кадров на основе уже созданных.

GeForce RTX 4080 выделялась как одна из самых быстрых видеокарт для игровых энтузиастов, однако рынок ожидал изменений в виде более доступных цен и дополнительного роста производительности. Обычно, Nvidia представляет линейку Super, чтобы удовлетворить эти ожидания, улучшая характеристики базовых моделей по скорости и/или цене. На CES 2024 компания представила три новых модели в линейке GeForce RTX 40 с суффиксами Super: GeForce RTX 4070 Super, GeForce RTX 4070 Ti Super и GeForce RTX 4080 Super.

Новые видеокарты были представлены компанией Nvidia для освежения линейки перед ожидаемым выходом полноценного следующего поколения, запланированного не ранее осени. Первыми появились на рынке GeForce RTX 4070 Super, затем GeForce RTX 4070 Ti Super, а завершила тройку GeForce RTX 4080 Super, выпущенная в конце января. Подробности о конфигурации и ценах на эти новые Super-модели были представлены ранее на нашем сайте, и сегодня мы ближе рассмотрим GeForce RTX 4080 Super.

Судя по техническим характеристикам, GeForce RTX 4080 Super не предлагает значительного увеличения производительности. Эта новинка выделяется, главным образом, своей более низкой ценой по сравнению с базовой моделью GeForce RTX 4080, сохраняя при этом почти те же характеристики GPU и объем видеопамяти. Рекомендованная розничная цена стала заметно доступнее, похоже, даже ближе к снижению цены на модель GeForce RTX 4080, чем к представлению совершенно нового, заметно более мощного варианта видеокарты. Несмотря на это, новинка должна предложить лучшее соотношение цены и производительности по сравнению с предшественницей. Согласно данным Nvidia, производительность GeForce RTX 4080 Super примерно вдвое превосходит GeForce RTX 3080 Ti из предыдущего поколения, что является весьма впечатляющим результатом.

Эта видеокарта предназначена для энтузиастов, стремящихся получить преимущества новой архитектуры и высокую производительность, но при этом по более доступной цене по сравнению с GeForce RTX 4080. Представленная сегодня модель рассчитана на использование в условиях самых высоких разрешений и максимальных графических настроек, включая трассировку лучей. Новинка обещает обеспечить высокую производительность в любых играх, даже в самых требовательных проектах с передовой графикой и трассировкой лучей, используя технологию DLSS — без нее даже GeForce RTX 4090 может оказаться недостаточным.

Архитектура Ada Lovelace, хотя и новая, имеет много общего с предыдущей архитектурой Ampere, которая в свою очередь наследует черты от архитектур Turing и Volta.

Графический ускоритель GeForce RTX 4080 SuperКодовое имя чипаAD103Технология производства5 нм (TSMC 4N)Количество транзисторов45,9 млрдПлощадь ядра378,6 мм²Архитектураунифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.Аппаратная поддержка DirectXDirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2Шина памяти256-битная: 8 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6XЧастота графического процессорадо 2550 МГцВычислительные блоки80 потоковых мультипроцессоров, включающих 10240 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64Тензорные блоки320 тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32Блоки трассировки лучей80 RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVHБлоки текстурирования320 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматовБлоки растровых операций (ROP)14 широких блоков ROP на 112 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадраПоддержка мониторовподдержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)Спецификации видеокарты GeForce RTX 4080 SuperЧастота ядра2295/2550 МГцКоличество универсальных процессоров10240Количество текстурных блоков320Количество блоков блендинга112Эффективная частота памяти23 ГГцТип памятиGDDR6XШина памяти256 битОбъем памяти16 ГБПропускная способность памяти736 ГБ/сВычислительная производительность (FP32)до 52,2 терафлопсТеоретическая максимальная скорость закраски286 гигапикселей/сТеоретическая скорость выборки текстур816 гигатекселей/сШинаPCI Express 4.0 x16Разъемыпо выбору производителяЭнергопотреблениедо 320 ВтДополнительное питаниеодин 16-контактный разъемЧисло слотов, занимаемых в системном корпусепо выбору производителя
Графический ускоритель GeForce RTX 4080 Super
Кодовое имя чипаAD103
Технология производства5 нм (TSMC 4N)
Количество транзисторов45,9 млрд
Площадь ядра378,6 мм²
Архитектураунифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectXDirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти256-битная: 8 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X
Частота графического процессорадо 2550 МГц
Вычислительные блоки80 потоковых мультипроцессоров, включающих 10240 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки320 тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей80 RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования320 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)14 широких блоков ROP на 112 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторовподдержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)
Спецификации видеокарты GeForce RTX 4080 Super
Частота ядра2295/2550 МГц
Количество универсальных процессоров10240
Количество текстурных блоков320
Количество блоков блендинга112
Эффективная частота памяти23 ГГц
Тип памятиGDDR6X
Шина памяти256 бит
Объем памяти16 ГБ
Пропускная способность памяти736 ГБ/с
Вычислительная производительность (FP32)до 52,2 терафлопс
Теоретическая максимальная скорость закраски286 гигапикселей/с
Теоретическая скорость выборки текстур816 гигатекселей/с
ШинаPCI Express 4.0 x16
Разъемыпо выбору производителя
Энергопотреблениедо 320 Вт
Дополнительное питаниеодин 16-контактный разъем
Число слотов, занимаемых в системном корпусепо выбору производителя

Очевидно, что сравнение между GeForce RTX 4080 Super и GeForce RTX 4090 неуместно, поскольку новинка значительно уступает флагманскому решению по числу функциональных блоков, объему видеопамяти и другим параметрам. AD102, используемый в GeForce RTX 4090, заметно превосходит по размерам и мощности AD103, применяемый в GeForce RTX 4080 Super. Если GeForce RTX 4090 является бескомпромиссным флагманом, то GeForce RTX 4080 (Super) предназначена для более широкого круга пользователей. По сравнению с базовой моделью GeForce RTX 4080, рассматриваемая Super-модель обладает незначительным увеличением исполнительных блоков, работающих на слегка повышенной частоте, что может обеспечить небольшой, но всё же прирост производительности. Этот прирост оценивается в несколько процентов, и хотя GeForce RTX 4080 Super не сможет существенно опередить GeForce RTX 4080, она предоставляет определенное улучшение.

Такое обновление линейки видеокарт между поколениями приносит выгоду как самой Nvidia (стимулируя рынок и мотивируя ожидающих более выгодных предложений), так и ее партнерам, выпускающим видеокарты. Теперь они могут предлагать не просто разогнанные старые модели, а новые. Больше появляется более привлекательных ценовых предложений, и видеокарты Super ориентированы, скорее всего, на тех, у кого установлены устаревшие GPU, явно не принадлежащие к семейству GeForce RTX 40. Эти владельцы старых решений могут быть заинтересованы в модернизации, особенно учитывая более привлекательные варианты Super.

Несмотря на то, что GeForce RTX 4080 Super не обеспечивает значительного прироста производительности по сравнению с GeForce RTX 4080, ее сниженная рекомендованная цена делает ее привлекательной. Super-модель можно рассматривать как более доступную версию базовой модели. Если сравнивать GeForce RTX 4080 Super с предшественницей из семейства GeForce RTX 30, то новинка значительно превосходит ее производительность, даже в сравнении с топовой GeForce RTX 3090 Ti. При этом новый GPU потребляет гораздо меньше энергии. Основным конкурентом новинки со стороны AMD является Radeon RX 7900 XTX, близкая к GeForce RTX 4080 по производительности без трассировки лучей, и Super-модель должна укрепить позиции Nvidia в данном ценовом диапазоне, особенно при активном использовании аппаратной трассировки лучей.

Согласно проведенным собственным тестам компании Nvidia, GeForce RTX 4080 Super значительно превосходит аналоги из двух предыдущих (полноценных) поколений, и по понятным причинам сравнение с GeForce RTX 4080 не проводится из-за незначительных различий. Анализируя диаграмму, можно заметить, что большинство протестированных игр используют технологию генерации кадров DLSS 3, что может вызвать неоднозначные реакции у некоторых игроков. В целом GeForce RTX 4080 Super оказывается в полтора раза быстрее, чем GeForce RTX 3080 Ti, а при использовании генерации кадров разница увеличивается вдвое и более. При этом GeForce RTX 2080 Super значительно отстает, особенно в современных играх с активной трассировкой лучей.

GeForce RTX 4080 Super также проявляет высокую эффективность в профессиональных задачах, связанных с созданием цифрового контента. Видеокарта обладает достаточной производительностью, тензорные ядра ускоряют инструменты на основе искусственного интеллекта, а аппаратные блоки трассировки лучей эффективно работают в 3D-пакетах и движках, таких как Blender Cycles, Redshift, V-Ray, Octane и других. Это позволяет ускорить визуализацию сложных сцен и повысить эффективность работы над проектами. По результатам тестов, GeForce RTX 4080 Super превосходит по производительности GeForce RTX 3080 Ti в этих задачах на полтора раза, что является весьма значимым достижением.

Возможности GeForce RTX 4080 Super в области обработки видеоданных аналогичны функционалу флагманской модели. Специализированный аппаратный кодировщик NVEnc восьмого поколения теперь поддерживает кодирование видео в формате AV1. Кодировщик AV1 в архитектуре Ada эффективнее на 40%-50% по сравнению с кодировщиком H.264, использованным в графических процессорах предыдущего поколения. В результате новый формат AV1 позволяет повысить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте.

Заметно, что почти все графические процессоры Ada оборудованы двумя аппаратными кодировщиками NVEnc, что дает возможность кодировать видеоданные с разрешением 8K при 60 FPS или обрабатывать сразу четыре видеопотока разрешения 4K при 60 FPS. При этом скорость обработки более чем вдвое выше, чем у GeForce RTX 3080 Ti, что представляет значительную выгоду в сфере эффективной обработки видео.

В графические процессоры архитектуры Ada интегрирован аппаратный декодер пятого поколения NVDec, который впервые появился в архитектуре Ampere. Этот декодер обеспечивает аппаратное ускорение декодирования видеоданных в различных форматах, включая MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Полноценная поддержка декодирования видеоданных в разрешении 8K при 60 FPS также предоставляется. Эти технологии значительно расширяют возможности видеопроцессинга в графических процессорах.

Таким образом, помимо аппаратного кодирования NVEnc, графические процессоры архитектуры Ada обладают встроенным аппаратным декодером NVDec пятого поколения, обеспечивающим высокую эффективность в обработке видеоданных и поддерживающим широкий спектр форматов и разрешений, включая поддержку 8K при 60 FPS.

Видеокарта Gigabyte Aorus GeForce RTX 4080 Super Master 16G 16 ГБ

Gigabyte Technology, бренд компании Gigabyte, была основана в 1986 году в Китайской Республике, с штаб-квартирой в Тайбэе, Тайвань. Изначально она стартовала как группа разработчиков и исследователей. В 2004 году на основе этой компании был создан холдинг Gigabyte, который объединил несколько направлений, таких как Gigabyte Technology (специализирующаяся на разработке и производстве видеокарт и материнских плат для ПК) и Gigabyte Communications (филиал, занимающийся производством коммуникаторов и смартфонов под брендом GSmart с 2006 года).

Объектом исследования является серийно производимый графический ускоритель Gigabyte Aorus GeForce RTX 4080 Super Master 16G с 16 ГБ памяти GDDR6X и 256-битной шиной данных.

Gigabyte Aorus GeForce RTX 4080 Super Master 16G 16 ГБ 256-битной GDDR6X
ПараметрЗначениеНоминальное значение (референс)
GPUGeForce RTX 4080 Super (AD103)
ИнтерфейсPCI Express x16 4.0
Частота работы GPU (ROPs), МГцBIOS OC: 2625(Boost)—2775(Max)
BIOS Silent: 2625(Boost)—2775(Max)
2550(Boost)—2705(Max)
Частота работы памяти (физическая (эффективная)), МГц2875 (23000)2875 (23000)
Ширина шины обмена с памятью, бит256
Число вычислительных блоков в GPU80
Число операций (ALU/CUDA) в блоке128
Суммарное количество блоков ALU/CUDA10240
Число блоков текстурирования (BLF/TLF/ANIS)320
Число блоков растеризации (ROP)112
Число блоков Ray Tracing80
Число тензорных блоков320
Размеры, мм355×165×75310×130×70
Количество слотов в системном блоке, занимаемые видеокартой44
Цвет текстолитачерныйчерный
Энергопотребление пиковое в 3D, Вт (BIOS OC/BIOS Silent)310/310320
Энергопотребление в режиме 2D, Вт4242
Энергопотребление в режиме «сна», Вт1111
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS OC/BIOS Silent)30,2/29,232,0
Уровень шума в 2D (просмотр видео), дБА18,018,0
Уровень шума в 2D (в простое), дБА18,018,0
Видеовыходы1×HDMI 2.1, 3×DisplayPort 1.4a1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работынет
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Питание: 8-контактные разъемы00
Питание: 6-контактные разъемы00
Питание: 16-контактные разъемы11
Вес карты с комплектом поставки (брутто), кг3,343,0
Вес карты чистый (нетто), кг2,432,2
Максимальное разрешение/частота, DisplayPort3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI3840×2160@144 Гц, 7680×4320@60 Гц

Память

Карта имеет 16 ГБ памяти GDDR6X SDRAM, размещенной в 8 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (MT61K512M32KPA-24 / D8BZF) рассчитаны на номинальную частоту работы в 3000 (24000) МГц.

Особенности карты и сравнение с Gigabyte GeForce RTX 4080 Gaming OC 16G (16 ГБ)

Gigabyte Aorus GeForce RTX 4080 Super Master 16G (16 ГБ) вид спереди
Gigabyte GeForce RTX 4080 Gaming OC 16G (16 ГБ) вид спереди
Gigabyte Aorus GeForce RTX 4080 Super Master 16G (16 ГБ) вид сзади
Gigabyte GeForce RTX 4080 Gaming OC 16G (16 ГБ) вид сзади

Для сравнения взяли видеокарту того же производителя, но более раннего выпуска на базе GeForce RTX 4080. Очевидно, что PCB у них общая. Разница, по сути, только в питании графического процессора.

Ядро данной видеокарты обозначено маркировкой AD103-400, отличающейся от вариантов на GeForce RTX 4080 с маркировкой "-300/301". Дата выпуска ядра – 44-я неделя 2023 года.

Общее количество фаз питания у карты Gigabyte GeForce RTX 4080 Gaming OC 16G (16 ГБ) составляет 21, в то время как у нашей видеокарты Gigabyte Aorus GeForce RTX 4080 Super Master 16G (16 ГБ) — 23 фазы.

Важно отметить, что распределение фаз в этих моделях различается. У Gigabyte GeForce RTX 4080 Gaming OC 16G (16 ГБ) 18 фаз предназначены для ядра, а 3 – для микросхем памяти. А у карты Gigabyte Aorus GeForce RTX 4080 Super Master 16G (16 ГБ) фазы распределены в соотношении 20 к 3, отведенные для ядра и микросхем памяти соответственно.

Зеленым цветом отмечена схема питания ядра, красным — памяти. Все контроллеры расположены на оборотной стороне PCB. Фазами питания ядра управляет ШИМ-контроллер uP9512R (максимум 8—12 фаз в зависимости от модификации).

Очевидно, что 20 фаз питания ядра работают по параллельной схеме.

Трехфазной схемой питания микросхем памяти заведует другой ШИМ-контроллер той же компании uPI Semi — uP9529Q (до 3 фаз).

В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае SiC653A (Vishay), каждая из которых рассчитана максимально на 50 А.

Также на тыльной стороне карты имеется контроллер uS5650Q (uPI Semi), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Управление подсветкой традиционно возложено на контроллер Holtek.

Печатная плата имеет пыле- и влагозащиту.

У данной карты доступны два режима работы, которые определяются двумя вариантами BIOS. Переключение между ними осуществляется с помощью специального переключателя, расположенного на верхней части карты: OC и Silent. Основное различие между этими режимами заключается, главным образом, в скорости вращения вентиляторов. Однако предельное значение энергопотребления для обеих версий BIOS ограничено одинаково и составляет 350 Вт.

Штатные частоты памяти соответствуют референсным значениям, однако как для режима Boost, так и для максимальных частот ядра в обоих версиях BIOS они превышают референсные значения на 2,2%-3%. В результате реальное увеличение производительности в играх по сравнению с референсными моделями ограничивается 2%.

Энергопотребление карты Gigabyte в тестах обоих версий BIOS достигает 310 Вт, с пиковым значением 339 Вт.

При проведении ручного разгона с увеличением лимита потребления до 133%, были достигнуты максимальные частоты 2880/24920 МГц. Однако, даже при таком увеличении лимита потребления, прирост производительности в играх при разрешении 4K оказался всего лишь 5,3% относительно референсных значений, так как драйверы Nvidia не допускают значительное увеличение реального предела потребления. Энергопотребление карты при этом увеличилось до 318 Вт.

Питание для карты Gigabyte осуществляется через 16-контактный разъем стандарта PCIe 5.0.

Рядом с коннектором питания на плате имеется индикатор. Горящий светодиод сигнализирует о нарушении питания (кабель вставлен не до конца или проблемы у БП).

Отметим приличные габариты данной карты, особенно по толщине: около 7,5 см. В результате видеокарта занимает 4 слота в системном блоке.

GeForce RTX 4080, так же как и GeForce RTX 4090 (в отличие от GeForce RTX 3090/Ti), не поддерживает мультиграфическую конфигурацию через технологию SLI, и не оборудована специальным разъемом на верхнем торце.

В отношении видеовыходов, карта оснащена стандартным набором, включающим три порта DP 1.4a и один HDMI 2.1.

Управление параметрами работы видеокарты осуществляется с использованием фирменной утилиты Gigabyte Center, о которой уже упоминалось ранее. Это программное обеспечение предоставляет возможность контролировать вентиляторы, регулировать частоты работы карты, управлять напряжением ядра, а также осуществлять мониторинг состояния видеокарты.

Нагрев и охлаждение

Основой системы охлаждения у карты Gigabyte является массивный секционированный пластинчатый радиатор, выполненный из никелированного материала, с интегрированными тепловыми трубками. Эти трубки эффективно распределяют тепло по поверхности ребер радиатора, обеспечивая высокую эффективность в отводе тепла от нагретых компонентов. Тепловые трубки соединены с обширной медной подошвой, под которой находится испарительная камера.

Этот дизайн демонстрирует выдающуюся эффективность в отводе тепла, что является важным фактором для поддержания низких температур работы видеокарты при высоких нагрузках.

Микросхемы памяти получают охлаждение с использованием той же обширной медной подошвы и термопрокладок. Дополнительно, для эффективного охлаждения преобразователей питания VRM предусмотрена отдельная подошва, которая также интегрирована в тот же радиатор.

Задняя пластина видеокарты не участвует в охлаждении обратной стороны платы, а скорее служит элементом защиты и укрепления жесткости PCB. Кроме того, на этой пластине расположен подсвечиваемый логотип бренда, придавая дополнительный стиль видеокарте.

Ребра радиатора (через один) имеют скосы по краям для большей эффективности прохождения воздуха внутрь.

Поверх радиатора установлен кожух с тремя вентиляторами ∅95 мм, имеющими рифленые лопасти.

Технология вращения центрального вентилятора в противоположную сторону уже не является новинкой, такая концепция работы применялась и во многих моделях серии GeForce RTX 30. По идее, она способствует снижению турбулентности воздушного потока, что приводит к более эффективному охлаждению всех имеющихся контроллеров и микросхем на PCB.

Охлаждение вентиляторов при минимальной нагрузке на видеокарту активируется при снижении температуры GPU ниже 50 градусов и температуры микросхем памяти ниже 80 градусов. При запуске компьютера вентиляторы начинают работу, однако после загрузки видеодрайвера происходит мониторинг текущей температуры, и в случае ее снижения ниже указанных значений, вентиляторы автоматически отключаются. Доступен видеоролик, посвященный этой функции.

Мониторинг температурного режима

Режим BIOS OC:

После двухчасового тестирования под максимальной нагрузкой видеокарты, максимальная температура ядра не превысила 60 °C, а температура микросхем памяти составила 62 °C. Эти показатели являются отличным результатом для видеокарт высокого уровня. Энергопотребление карты достигало до 310 Вт. Важно отметить, что безопасный предел температуры для микросхем памяти GDDR6X составляет 105 °C. Максимальная температура горячей точки GPU ограничивается на уровне 70 °C.

Максимум нагрева — около GPU и у разъема питания.

Мы засняли 9-минутный нагрев и ускорили в 50 раз.

При ручном разгоне (режим BIOS OC) при выставлении лимита потребления в 133% параметры нагрева и шума менялись мало. Несмотря на поднятие лимита, драйвера Nvidia ограничивали потребление, поэтому частоты работы GPU в игровых тестах не поднимались выше 2880 МГц.

Режим BIOS Silent:

В этом случае параметры работы карты практически не поменялись: максимальная температура ядра — 60 градусов, микросхем памяти — 62 °C. Энергопотребление карты составляло те же 310 Вт. Максимум температуры горячей точки GPU — 69 °C.

Шум

Измерения уровня шума проводились в специально подготовленном помещении с минимальной реверберацией и шумоизоляцией. Системный блок, находившийся в состоянии простоя, не содержал вентиляторов и не генерировал механический шум. Фоновый уровень шума составлял 18 дБА, включая шумомер.

Измерения проводились на расстоянии 50 см от видеокарты, на уровне системы охлаждения. Режимы измерения включали:

  1. Режим простоя в 2D: запущен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, и несколько интернет-коммуникаторов.
  2. Режим 2D с просмотром фильмов: использовался SmoothVideo Project (SVP) с аппаратным декодированием и вставкой промежуточных кадров.
  3. Режим 3D с максимальной нагрузкой на ускоритель: использовался тест FurMark.

Оценка уровня шума проводилась следующим образом:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D, в обоих режимах BIOS, температура не превышала 33 °C, вентиляторы не активировались, и уровень шума оставался на фоновом уровне — 18 дБА. При просмотре фильма с аппаратным декодированием ситуация также не изменялась.

Режим BIOS OC:

В режиме максимальной нагрузки в 3D температура достигала 60/70/62 °C (ядро/hot spot/память). Вентиляторы при этом раскручивались до 1320 оборотов в минуту, шум вырастал до 30,2 дБА: это на грани отчетливой слышимости. 

Спектрограмма шума показывает, что раздражающих пиков в процессе исследования не было.

Режим BIOS Silent:

На самом деле, отличий варианта Silent от OC почти нет. В режиме максимальной нагрузки в 3D температура достигала 60/69/62 °C (ядро/hot spot/память). Вентиляторы при этом раскручивались до 1176 оборотов в минуту, шум вырастал до 29,2 дБА: это тихо.

Подсветка

Логотипы бренда на торцах и на обратной стороне карты подсвечены, а также реализована подсветка вдоль краев лопастей вентиляторов. Подсветка активируется только во время вращения вентиляторов; в состоянии покоя свечения отсутствует.

Управление традиционно осуществляется через утилиту Gigabyte Control Center. Стоит отметить интересный режим свечения на краях лопастей, когда скорость смены цветов соответствует частоте вращения вентиляторов.

Имеется возможность сохранения выбранного режима в самой карте, то есть при желании можно настроить подсветку один раз и больше не запускать программу.

Также карта имеет небольшой ЖК-экран на верхнем торце, куда можно выводить предустановленные анимации, данные мониторинга карты, пользовательские надписи, картинки и анимации в формате GIF.

Управление этим экраном также осуществляется с помощью Gigabyte Control Center.

Комплект поставки и упаковка

В комплекте поставки кроме традиционного краткого руководства пользователя имеются также разборная металлическая подставка-кронштейн под карту с набором крепежа и переходник питания.

Подставка не привычная уже в виде штатива, и даже не в виде ранее использовавшегося многими партнерами Nvidia кронштейна-подпорки под карту.

Это тоже кронштейн, но монтируется он на стенку корпуса либо за пределами материнской платы (в случае модели форм-фактора ATX), либо над ней (в случае форм-фактора E-ATX), используя прилагаемый набор крепежа.

Тестирование: синтетические тесты

Мы провели тестирование обновленной видеокарты Nvidia в нашем стандартном комплекте синтетических тестов, который постоянно обновляется с добавлением новых тестов и исключением устаревших. На данный момент мы добавили несколько новых бенчмарков для измерения производительности трассировки лучей и технологий масштабирования разрешения, таких как DLSS, FSR и XeSS. Полусинтетические тесты включают подтесты из пакета 3DMark, такие как Time Spy, Port Royal, DX Raytracing, Speed Way и др.

Мы провели сравнение производительности следующих видеокарт:

  1. GeForce RTX 4080 Super со стандартными параметрами.
  2. GeForce RTX 4090 со стандартными параметрами.
  3. GeForce RTX 4080 со стандартными параметрами.
  4. GeForce RTX 3090 Ti со стандартными параметрами.
    Radeon RX 7900 XTX со стандартными параметрами.

Для более детального анализа производительности видеокарты GeForce RTX 4080 Super были использованы также три видеокарты этой же компании: RTX 3090 Ti, RTX 4080 и RTX 4090. Это позволяет оценить, насколько новая модель приблизилась к топовым вариантам и какова ее производительность в сравнении с предыдущим поколением. Сопоставление с топовой видеокартой AMD Radeon RX 7900 XTX дает нам понимание конкурентоспособности новинки на рынке по схожей ценовой категории.

Тесты 3DMark Vantage

Feature тесты из пакета 3DMark Vantage, ориентированные на DirectX 10, предоставляют возможность рассмотреть аспекты производительности, которые могут быть упущены в более современных тестах.

Feature Test 1: Texture Fill.

Этот тест фокусируется на измерении производительности блоков текстурных выборок. В процессе выполнения теста осуществляется заполнение прямоугольника значениями, считываемыми из небольшой текстуры. Это происходит при помощи многочисленных текстурных координат, которые изменяются каждый кадр. Анализ результатов этого теста позволяет более глубоко понять, как видеокарта справляется с операциями текстурирования, в частности, при частом изменении координат.

Даже несмотря на свой возраст, Feature Test 1 остается полезным инструментом для выявления тонких деталей производительности, что делает его важным компонентом при тестировании новых видеокарт.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно высока, демонстрируя результаты, близкие к теоретическим параметрам. Впрочем, иногда наблюдаются небольшие занижения, особенно в случае некоторых GPU. Графический процессор AD103 на полной версии показал достаточно высокую производительность в текстурном тесте. Если уже RTX 4080 сравнивается с RX 7900 XTX, то старший вариант RTX 4090 явно превосходит, что соответствует ожиданиям.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения, использующий простой пиксельный шейдер, не ограничивающий производительность. В этом тесте интерполированное значение цвета записывается во внеэкранный буфер с использованием альфа-блендинга. Примечательно, что используется 16-битный внеэкранный буфер формата FP16, распространенный в играх с HDR-рендерингом, что делает этот тест современным и актуальным.

Результаты второго подтеста 3DMark Vantage предоставляют информацию о производительности блоков ROP без учета пропускной способности видеопамяти. Тест измеряет производительность подсистемы ROP, при этом ПСП обычно не оказывает существенного влияния на результаты. В случае новой видеокарты GeForce RTX 4080 Super, аналогично базовой модели RTX 4080, скорость подсистемы ROP оказывается близкой, что делает результаты сопоставимыми. Очевидно, что топовая RTX 4090 демонстрирует значительно более высокую производительность блоков ROP, благодаря большему их количеству.

Увы, все видеокарты Nvidia в данном тесте уступают флагманской модели AMD, Radeon RX 7900 XTX, превосходящей даже RTX 4090 в этой задаче. Исторически видеокарты GeForce в тестах, оценивающих пиковую скорость заполнения сцены, часто оказывались вне конкуренции, что подтверждается и текущими сравнительными результатами.

Feature Test 3: Parallax Occlusion Mapping

Feature Test 3: Parallax Occlusion Mapping — один из наиболее интересных feature-тестов, так как данная техника давно применяется в играх. В этом тесте используется метод Parallax Occlusion Mapping, имитирующий сложную геометрию. Задействованы ресурсоемкие операции по трассировке лучей и работа с высокоразрешенной картой глубины. Тест также включает теневую обработку с использованием алгоритма Strauss. Этот тест представляет собой сложное и требовательное к видеочипу испытание пиксельным шейдером, включающим множество текстурных выборок при трассировке лучей, динамические ветвления и сложные расчеты освещения по методу Strauss.

Результаты теста из пакета 3DMark Vantage, оценивающего производительность физических взаимодействий при имитации ткани с использованием GPU (GPU Cloth), зависят от нескольких параметров одновременно и не ограничиваются только скоростью математических вычислений, эффективностью исполнения ветвлений или скоростью текстурных выборок. Этот тест подчеркивает важность правильного баланса внутри GPU, а также эффективности выполнения сложных шейдеров. Он является полезным, поскольку результаты часто коррелируют с производительностью в игровых тестах.

В случае новой модели GeForce RTX 4080 Super результаты в тесте оказались близкими к базовой модели RTX 4080, что вполне ожидаемо, учитывая небольшие улучшения в новинке. RTX 4090 продолжает оставаться значительно мощнее, что соответствует ожиданиям. Радует то, что главный конкурент новинки, видеокарта Radeon RX 7900 XTX, выигрывает у обеих моделей Nvidia, но разрыв не такой большой, и отставание чуть сокращается.

Feature Test 4: GPU Cloth

Feature Test 4: GPU Cloth — четвертый тест, в котором рассчитываются физические взаимодействия при имитации ткани с использованием GPU. Используется вершинная симуляция, включающая комбинированную работу вершинного и геометрического шейдеров с несколькими проходами. Применяется stream out для передачи вершин между проходами симуляции, что позволяет оценить производительность исполнения вершинных и геометрических шейдеров, а также скорость stream out.

Скорость рендеринга в данном тесте зависит от нескольких параметров, прежде всего от производительности обработки геометрии и эффективности выполнения геометрических шейдеров. Однако, результаты этого теста стали недостоверными из-за явных проблем с оптимизацией драйверов как у Nvidia, так и у AMD. С течением времени, драйверы AMD также показывают низкие результаты, и в целом, все видеокарты демонстрируют некорректные данные в этом тесте. Эта ситуация не соответствует теоретическим ожиданиям, и основная причина заключается в отсутствии оптимизаций для устаревшего тестового пакета.

Feature Test 5: GPU Particles

Feature Test 5: GPU Particles — это тест физической симуляции эффектов, основанных на системах частиц, которые рассчитываются с использованием графического процессора. В тесте используется вершинная симуляция, где каждая вершина представляет отдельную частицу. Применяется stream out с той же целью, что и в предыдущем тесте. Тестируется расчет нескольких сотен тысяч частиц, их индивидуальная анимация, а также столкновения с картой высот. Для отрисовки частиц используется геометрический шейдер, который формирует четыре вершины, образующие частицу, из каждой точки. Большую нагрузку на шейдерные блоки представляют вершинные вычисления, а также проверяется эффективность stream out.

В результате второго геометрического теста из 3DMark Vantage мы получили результаты, которые сильно отличаются от теоретически ожидаемых для новой видеокарты. Однако эти результаты уже ближе к действительности, чем в предыдущем тесте. В случае с рассматриваемой видеокартой, если считать эти результаты корректными, она продемонстрировала производительность, близкую к базовой модели, что объяснимо тем, что их частоты примерно одинаковы, и количество блоков не сильно различается. С другой стороны, конкурирующая Radeon RX 7900 XTX уступила всем представленным видеокартам в сравнении, что может быть объяснено только неэффективной оптимизацией драйверов. В предшествующих тестах результаты были значительно выше для всех.

Feature Test 6: Perlin Noise

Feature Test 6: Perlin Noise — последний тест из пакета Vantage и представляет собой математически интенсивное испытание GPU. Он вычисляет несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует свою собственную функцию шума, создавая высокую математическую нагрузку на видеочип. Perlin noise — это стандартный алгоритм, широко применяемый в процедурном текстурировании, требующий множество математических вычислений.

В данном математическом тесте производительность всех решений, хотя и не полностью соответствует теоретическим ожиданиям, обычно находится близко к пиковой производительности видеочипов в экстремальных задачах. Тест использует операции с плавающей запятой, и новые архитектуры Ada Lovelace и RDNA3 должны были раскрыть свои уникальные возможности в работе с соответствующими командами двойного исполнения. Тем не менее, устаревший характер этого теста может ограничивать его способность полностью демонстрировать новые возможности современных GPU, как показывают сравнительные результаты.

Super-модель семейства GeForce RTX 40 показала ожидаемые результаты, опережая базовую модель незначительно. Разница между ними не является существенной. Очевидно, что оба GPU уступают более мощной RTX 4090 во всех аспектах производительности. В сравнении с конкурирующей Radeon RX 7900 XTX с аналогичным ценовым позиционированием, они снова демонстрируют близость, при этом новая GeForce проявляет небольшое превосходство. Будем ждать результатов в более современных синтетических тестах с повышенной нагрузкой на GPU.

Тесты Direct3D 12

Примеры из DirectX SDK компании Microsoft и из SDK компании AMD, использующие графический API Direct3D12, были исключены из наших тестов, поскольку давно проявляли некорректные результаты в большинстве случаев. Единственным вычислительным тестом с поддержкой Direct3D12, который остался в этом разделе, является известный бенчмарк Time Spy из 3DMark. В данном случае нас интересует не только общее сравнение мощности GPU, но и разница в производительности при включенной и отключенной возможности асинхронных вычислений, появившихся в DirectX 12. Для достоверности мы провели тестирование видеокарт в двух графических испытаниях.

Если рассматривать производительность новой модели GeForce RTX 4080 Super в этой задаче по сравнению с базовой видеокартой на основе того же GPU, но чуть урезанной, то можно отметить, что новая видеокарта оказалась совсем немного быстрее, что соответствует теории — разница между ними не может быть значительной. Относительно RTX 4090 обе карты существенно отстают, хотя разница в этом тесте не так велика.

В случае Radeon в этом тесте производительность обычно выглядит несколько лучше по сравнению с конкурирующими по цене GeForce, что стоит учитывать. В этот раз производительность рассматриваемой видеокарты GeForce RTX 4080 Super оказалась немного ниже аналогичного по цене решения конкурента — Radeon RX 7900 XTX, который обычно оказывается чуть медленнее. В реальных играх результаты этого теста не всегда точно предсказывают общую производительность, так что мы рассмотрим их с учетом того, что в задачах растеризации решение AMD может показывать небольшое преимущество. Теперь перейдем к тестам трассировки лучей, где ситуация будет совсем иной.

Тесты трассировки лучей

Одним из первых тестов производительности трассировки лучей является бенчмарк Port Royal создателей известных тестов серии 3DMark. Этот тест работает на всех графических процессорах с поддержкой DirectX Raytracing API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей в двух режимах, а также традиционным для растеризации методом.

Бенчмарк демонстрирует несколько новых аспектов использования трассировки лучей через DXR API, включая алгоритмы отрисовки отражений и теней с использованием трассировки. Несмотря на то, что тест не идеально оптимизирован и представляет собой значительную нагрузку для даже мощных GPU, он пригоден для сравнения производительности различных видеокарт в этой конкретной задаче.

Результаты теста наглядно выявляют различия в подходах компаний AMD и Nvidia к интеграции аппаратного ускорения трассировки лучей. Хотя архитектура RDNA3 чуть улучшила положение решений от AMD, RTX 4080 Super продемонстрировала ожидаемую производительность, немного опережая простую RTX 4080. Обе карты значительно превосходят RTX 3090 Ti, которая недавно была топовой. Топовая модель AMD, RX 7900 XTX, оказалась не так уж плоха в этом тесте, превзойдя RTX 3090 Ti, хотя RTX 4080 остается более быстрой.

Позже появился еще один подтест 3DMark, ориентированный на проверку производительности трассировки лучей с использованием DirectX Raytracing. В отличие от предыдущего гибридного теста, этот не использует растеризацию вовсе, фокусируясь исключительно на трассировке лучей. Сцена в этом бенчмарке знакома из других подтестов 3DMark и, будучи небольшой, позволяет лучше оценить способности новых видеокарт, учитывая возможность помещения BVH-структуры в большой кэш, что влияет на производительность.

Конечно, все видеокарты GeForce в этих условиях демонстрируют заметно более высокую производительность по сравнению с Radeon. Это обусловлено тем, что выделенные RT-ядра от Nvidia выполняют большую часть работы и обладают большей универсальностью, не теряя в производительности при включенной трассировке лучей так сильно, как ядра Ray Accelerator в сочетании с обычными SIMD-ядрами у конкурента. В большинстве игр с трассировкой лучей нагрузка на RT-блоки снижается, и положение Radeon становится более конкурентоспособным. Однако в данном тесте видеокарты Nvidia продолжают демонстрировать явное преимущество.

Новая модель RTX 4080 Super ожидаемо опережает базовую модель RTX 4080, и разница между ними оказывается более выраженной, чем ожидалось. Вероятно, прибавка в скорости в задачах трассировки лучей чуть выше, чем в чистой растеризации. Обе карты, основанные на графическом процессоре AD103, хоть и далеки от топовой модели на AD102, но заметно превосходят RTX 3090 Ti и флагман конкурента. Radeon в этот раз уступил даже видеокарте прошлого поколения, а RTX 4080 Super быстрее его более чем в полтора раза. Однако стоит отметить, что это чисто синтетический тест, и в реальных играх результаты могут отличаться, особенно в тех, где активно используется трассировка лучей, как, например, в Portal RTX, Quake II RTX, Cyberpunk 2077, Alan Wake 2 и подобных проектах.

С выходом новых поколений графических процессоров Nvidia и AMD в 2022 году, в пакет 3DMark был добавлен еще один тест с серьезной нагрузкой на трассировку лучей — Speed Way. Этот тест представляет собой более реалистичную нагрузку на различные блоки GPU и ближе к сценариям использования трассировки лучей в современных играх.

Топовые GPU демонстрируют приемлемую частоту кадров в обоих разрешениях, и разница между видеокартами Radeon и GeForce, хоть и остается заметной, но снижается. Единственная видеокарта AMD в данном сравнении, RTX 4080 Super, уже не так сильно уступает своему ценовому конкуренту. В отношении пары видеокарт на чипе AD103, разница между ними оказалась больше ожидаемой. При высокой нагрузке на блоки трассировки лучей RTX 4080 Super продемонстрировала больший отрыв от базовой модели. Как и ожидалось, топовая модель RTX 4090 оказалась значительно более производительной.

Еще одним интересным бенчмарком является Boundary, созданный на реальном игровом движке с поддержкой DXR и DLSS. Этот китайский проект представляет собой бенчмарк с высокой нагрузкой на GPU, активно использующий трассировку лучей для сложных отражений, мягких теней и глобального освещения. Важно отметить, что технологию DLSS в тестах Radeon нельзя использовать.

Без применения технологии DLSS, даже в разрешении Full HD, стабильную производительность демонстрируют лишь самые мощные видеокарты. Топовая модель AMD, хоть и отстает от всех GeForce, включая RTX 3090 Ti предыдущего поколения, все равно обеспечивает более 60 FPS. В разрешении 4K без применения масштабирования картинка остается играбельной только на топовой RTX 4090 и в некоторой степени на RTX 4080, включая новую Super-модель, но с минимальной играбельностью. Рассматриваемая видеокарта, хоть и немного превосходит базовую модель, в этот раз оказывается близкой к ней, и основным ограничивающим фактором является пропускная способность видеопамяти. Показатели единственной видеокарты Radeon в данном сравнении свидетельствуют о том, что в тестах трассировки лучей решения AMD не могут конкурировать даже с устаревшими GPU конкурента, не говоря уже о новом поколении Ada.

С использованием технологии масштабирования разрешения через метод DLSS 2, даже у старшей видеокарты из линейки RTX 30 в разрешении 4K удалось достичь приемлемой частоты кадров, хотя она не дотянула до 60 FPS. В отличие от нее, новая GeForce RTX 4080 Super достигла результатов чуть выше, чем RTX 4080, превышая 60 FPS в 4K. Это означает, что при подобной нагрузке RTX 4080 Super должна обеспечивать играбельность в играх с максимальными настройками при разрешении 4K, уступая только топовой видеокарте своего же семейства, причем незначительно.

Еще одним интересным полуигровым бенчмарком, также созданным на основе китайской игры, является Bright Memory. Оба теста проявляют схожие результаты и качество изображения, несмотря на различия в тематике. Bright Memory оказывается более требовательным, особенно к производительности трассировки лучей. К сожалению, на видеокартах AMD этот бенчмарк не работает, поскольку требует наличие карт Nvidia GeForce RTX.

В данном бенчмарке обновленная модель, построенная на полной версии графического процессора AD103, продемонстрировала результаты, соответствующие ожиданиям, немного превышая уровень базовой RTX 4080 (несмотря на странный провал последней в Full HD). Схожая тенденция видна и на предыдущей диаграмме. Также в этом тесте хорошо проявилась RTX 3090 Ti, особенно в высоком разрешении, что, возможно, связано с преимуществами ПСП или объемом видеопамяти, более значительным у топового GPU предыдущего поколения. В целом результаты для новой Super-модели приятные — в тестах трассировки лучей она добавила несколько процентов по сравнению с RTX 4080, укрепляя позиции Nvidia в ценовом диапазоне около $1000.

Вычислительные тесты

Мы продолжаем исследования для включения в наш пакет синтетических тестов бенчмарков, использующих OpenCL для актуальных вычислительных задач. На данный момент в этом разделе мы рассматриваем довольно старый и малооптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный бенчмарк основан на LuxRender и полагается на OpenCL.

Новая модель GeForce RTX 4080 Super, основанная на полной версии графического процессора AD103, обладает значительным количеством вычислительных блоков и немного увеличенной тактовой частотой. В результате не удивительно, что в данном тесте она легко опережает RTX 3090 Ti предыдущего поколения. Однако превосходство по сравнению с базовой моделью RTX 4080 невелико, что легко объяснимо теоретическими предположениями. По сравнению с топовой видеокартой конкурента, результаты новинки во всех подтестах оказались выше, чем у лучшего Radeon. В самом сложном подтесте разница достигла двукратной, хотя в остальных случаях она не так велика. Как и следовало ожидать, RTX 4090 опережает всех остальных участников.

Давайте также рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark. Этот тест, основанный на трассировке лучей без применения аппаратного ускорения, позволяет оценить возможности GPU в сложных вычислениях. В прошлых тестах мы использовали разные версии бенчмарка, предоставляющие результат в виде времени, затраченного на рендеринг.

В данном тесте, ориентированном на программную трассировку лучей, GeForce RTX 4080 Super вновь демонстрирует заметное превосходство над RTX 3090 Ti. Однако она не смогла обойти базовую модель RTX 4080, их результаты идентичны. Программная трассировка лучей сильно зависит от скорости кэш-памяти и основной видеопамяти, а поскольку параметры ПСП у обеих моделей практически равны, результат оказался одинаковым.

Перейдем к рассмотрению еще одного приложения для рендеринга — OctaneRender. Этот популярный рендерер, совместимый с большинством приложений для создания 3D-контента, использует возможности CUDA и RTX. Версия OctaneRender 2020.1.5 получила поддержку архитектуры Ampere. Бенчмарк, основанный на этом рендерере, предоставляет возможность отключить RTX-ускорение и провести тестирование производительности в нескольких тестовых сценах с разной нагрузкой. К сожалению, он не поддерживает OpenCL. Предоставим общее количество очков:

Новая модель GeForce RTX 4080 Super заметно опережает предыдущую версию из прошлого семейства, что было ожидаемо, особенно при включенном аппаратном ускорении RTX. Это улучшение в результатах особенно заметно для всех графических процессоров Nvidia, архитектура Ada Lovelace продемонстрировала значительные улучшения в области трассировки лучей и вычислений. В вычислительных тестах новая Super-модель, представительница архитектуры Ada Lovelace, продемонстрировала мощные результаты, опережая базовую RTX 4080 более, чем ожидалось. RTX 3090 Ti значительно уступила новинке, отставая почти в полтора раза.

Недавно вышла новая версия Cinebench 2024 от компании Maxon — популярного бенчмарка для тестирования 3D-рендеринга, предоставляющего оценку аппаратных возможностей процессора и видеокарты. Cinebench 2024 базируется на движке рендеринга Redshift, используемом в программе по созданию трехмерной графики и анимации Cinema 4D. Этот бенчмарк позволяет сравнивать результаты между CPU и GPU, используя одни и те же алгоритмы и сцены.

Сегодняшняя новинка, GeForce RTX 4080 Super, немного опережает базовую модель, использующую тот же графический процессор, но в слегка урезанной конфигурации. При этом она также превосходит предыдущее поколение RTX 3090 Ti. Топовая модель RTX 4090 лидирует в рейтинге, но разрыв между ней и рассматриваемой сегодня новинкой не так велик. В отличие от GeForce, конкурирующий Radeon RX 7900 XTX не смог продемонстрировать сильные результаты. Возможно, увеличение темпа выдачи инструкций в новой графической архитектуре RDNA3 не сработало эффективно в этом тесте, и общая производительность увеличилась не настолько сильно, что Radeon отстал, практически вдвое.

Тесты технологий DLSS/XeSS/FSR

В данном разделе мы анализируем дополнительные тесты, связанные с технологиями улучшения производительности. Изначально мы рассматривали только технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), но затем к ним добавилась ещё одна инновация — технология генерации промежуточных кадров, известная как DLSS 3. Для начала, мы внесли в наши материалы отдельный тест второй версии технологии DLSS. Хотя ранее мы уже проводили тесты с применением DLSS в приложениях, использующих трассировку лучей, мы счли важным провести дополнительные измерения в разрешении 8K. Давайте рассмотрим результаты GPU от Nvidia при работе в самом высоком разрешении 8K с использованием технологии DLSS различных уровней качества и обеих версий.

Без включения технологии DLSS 2.0 рендеринг происходит в полном разрешении, что значительно сказывается на производительности. Даже флагманская модель RTX 4090 показывает всего 13 FPS в 8K, что считается недостаточным. Обе модели RTX 4080 сталкиваются с ограничением по объему видеопамяти, особенно уступая RTX 3090 Ti с его 24 ГБ. Однако при включении DLSS на максимальном уровне производительности флагманская модель RTX 4090 достигает комфортных значений частоты кадров, а новая RTX 4080 Super демонстрирует хороший уровень в 45 FPS. Это может быть недостаточно для максимально комфортного игрового опыта, но вполне пригодно для спокойных соло-игр.

Не стоит забывать, что у всех современных видеокарт Nvidia есть еще одно козырь — поддержка технологии DLSS 3.0. В видеокартах архитектуры Ada Lovelace эта технология добавила генерацию промежуточных кадров к уже имеющимся возможностям DLSS 2.x. Включение генерации промежуточных кадров приносит прирост в FPS в полтора раза, как показывают результаты на практике:

С включением новой технологии, GeForce RTX 4080 Super достигает уровня 30 FPS в качественном режиме, обеспечивая минимальный комфорт, а в производительном подходит к 60 FPS — благодаря генерации промежуточных кадров. DLSS 3.0 значительно улучшает плавность видеоряда, при небольшом увеличении задержек управления, оставляя выбор за пользователем. Эта технология может быть особенно полезной при высоких разрешениях, где она обеспечивает играбельную частоту кадров. Важно отметить, что без генерации кадров частота кадров не должна опускаться ниже 30 FPS, так как в этом случае DLSS 3.0 не добавит требуемой отзывчивости.

XeSS — это еще один метод повышения производительности, использующий масштабирование разрешения и восстановление изображения с использованием искусственного интеллекта. Этот метод, предложенный компанией Intel, отличается от DLSS 2.0 и работает на более широком спектре GPU, включая видеокарты Intel. В тестах использовался специализированный бенчмарк из пакета 3DMark.

Включение технологии XeSS значительно повысило частоту кадров — более чем в два раза. С учетом универсальности этой технологии, она может быть рассмотрена как жизнеспособная альтернатива, учитывая наличие у каждой компании своих технологий и специализированных блоков для ускорения. DLSS является наиболее продвинутой, но ограничена использованием только на GPU Nvidia. FSR предоставляет универсальное решение, но не так эффективно использует специализированные блоки и считается менее сложным методом. В тестах удивительно, что RTX 4080 Super показала чуть более высокую эффективность по сравнению с базовой моделью RTX 4080, возможно, за счет оптимизаций в драйверах Nvidia. В целом, новинка проявила себя лучше, чем Radeon RX 7900 XTX, и, несмотря на небольшой отрыв от RTX 4080, она значительно уступает RTX 4090.

Еще одна технология масштабирования рендеринга — FSR 2.0 от AMD. Интересно, что эта технология появилась в тестах 3DMark последней. Сравнение производительности технологий масштабирования усложнено различиями в сценах и качестве изображения. Несмотря на это, FSR 2.0 от AMD предоставляет альтернативное решение с учетом разных разрешений рендеринга и качества, хотя сравнение с другими технологиями требует дополнительного анализа.

Поскольку FSR является универсальной технологией, её эффективность примерно одинакова на различных графических процессорах, и результаты тестов FSR 2.0 не предоставили существенных отклонений. Radeon RX 7900 XTX снова проявил себя менее эффективным даже по сравнению с RTX 4080. При отключенном FSR Radeon был быстрее, но по мере снижения разрешения рендеринга его производительность относительно Nvidia уменьшалась. RTX 4080 Super, соответственно, оказалась еще немного быстрее, что соответствует ожиданиям, учитывая небольшие изменения в архитектуре и частоте GPU. Важно отметить, что новая модель RTX 4080 Super предлагается по заметно сниженной цене, что делает её более привлекательным вариантом для потребителей. Теперь перейдем к реальным игровым тестам, хотя они, вероятно, не принесут нам каких-то сюрпризов.

Тестирование: игровые тесты

  • Компьютер на базе процессора Intel Core i9-13900K (Socket LGA1700):
    • Платформа:
      • процессор Intel Core i9-13900K (разгон до 5,4 ГГц по всем ядрам);
      • ЖСО Cougar Helor 360;
      • системная плата Asus ROG Strix Z790-A Gaming WiFi D4 на чипсете Intel Z790;
      • оперативная память TeamGroup Xtreem ARGB White (TF13D416G5333HC22ADC01, CL22-32-32-52) 32 ГБ (2×16) DDR4 5333 МГц;
      • SSD Intel 760p NVMe 1 ТБ PCIe;
      • SSD Intel 860p NVMe 2 ТБ PCIe;
      • блок питания ThermalTake Toughpower GF3 1000W;
      • корпус Thermaltake Level20 XT;
    • операционная система Windows 11 Pro 64-битная;
    • телевизор LG 55Nano956 (55″ 8K HDR, HDMI 2.1);
    • драйверы AMD версии 24.1.1/2;
    • драйверы Nvidia версии 546.65/551.22;
    • драйверы Intel версии 101.5125;
    • VSync отключен.

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Всё это нами субъективно оценивается по шкале из семи градаций.

Игры без использования трассировки лучей (классическая растеризация):

Современные топовые видеокарты настолько быстры, что даже в разрешении 4K во многих играх общая производительность ограничивается уже не видеокартой, а чаще всего возможностями центрального процессора. Что касается карты GeForce RTX 4080 Super, то она предсказуемо оказывается второй по производительности и прекрасно справляется с любым из представленных выше разрешений при условии игры с максимальными настройками графики (без RT и/или DLSS/FSR/XeSS).

Игры с использованием трассировки лучей и DLSS/FSR/XeSS:

Конечно же, включение RT снижает производительность, однако реализованные уже практически во всех играх с трассировкой лучей технологии масштабирования Nvidia DLSS, AMD FSR и Intel XeSS сильно помогают компенсировать падение скорости от использования RT. Так что в итоге предыдущие выводы остаются в силе.

Выводы и сравнение энергоэффективности

Nvidia GeForce RTX 4080 Super (16 ГБ) — это новый игровой флагман, использующий ядро AD103, аналогичное GeForce RTX 4080, но с полным использованием всех блоков. Несмотря на наличие GeForce RTX 4090, политические ограничения и высокий спрос на ускорители для вычислений в области искусственного интеллекта делают RTX 4090 менее доступными и менее практичными для обычных пользователей. Кроме того, цены на эти карты продолжают расти, делая их недоступными для большинства геймеров-энтузиастов.

GeForce RTX 4080 Super предлагает отличную производительность, достаточную для комфортной игры в разрешениях до 4K с максимальными настройками графики. Он призван заменить предыдущую модель GeForce RTX 4080, предлагая более доступную цену. Однако на начальном этапе некоторые продавцы могут устанавливать завышенные цены, и разница в производительности между RTX 4080 и RTX 4080 Super небольшая, в пределах 2-6%, в среднем около 4%.

На момент подготовки нашего обзора, продажи GeForce RTX 4080 Super еще не начались, поэтому наши выводы основаны на предполагаемых и ожидаемых ценах.

Архитектура Ada Lovelace значительно улучшила возможности исполнительных блоков по сравнению с предыдущим поколением, особенно в области аппаратной трассировки лучей. Ускорение в два раза в определении пересечений луча и треугольника в RT-ядрах третьего поколения является значительным улучшением. Дополнительные аппаратные блоки, такие как Opacity Micromap Engine и Displaced Micro-Mesh Engine, призваны оптимизировать обработку полупрозрачных объектов и ускорить построение структур BVH для сложных объектов.

Shader Execution Reordering, еще одна нововведение, позволяет оптимизировать выполнение шейдеров при трассировке лучей на лету. Это способствует потенциальному двух-трехкратному ускорению для многих алгоритмов трассировки лучей.

Технология поколения GeForce RTX 40, DLSS 3, активно внедряется в игры. Она использует ускоритель оптического потока Optical Flow Accelerator, улучшенный в архитектуре Ada Lovelace. DLSS 3 комбинирует масштабирование разрешения из DLSS 2 с удвоением частоты кадров при помощи вставки промежуточных кадров, используя поле оптического потока. Это позволяет игрокам получать вдвое больше кадров в секунду при сохранении высокого визуального качества.

Относительно энергоэффективности нового ускорителя GeForce RTX 4080 Super, конкретные тесты и данные ожидаются после официального начала продаж и более подробного анализа производительности и энергопотребления.

Отметим, что GeForce RTX 4080/Super занимают ведущие позиции в рейтинге, находясь в первой пятерке лидеров. Они представляют собой самые производительные видеокарты текущего поколения, заметно превосходя модели аналогичного уровня из предыдущих поколений GeForce RTX 30 и Radeon RX 6000. В прямом сравнении между линейками AMD и Nvidia, GeForce RTX 40 абсолютно доминируют: 7 мест в первой десятке, с учетом технологий трассировки лучей и методов масштабирования, они занимают первые 7 мест подряд.

Тестированная модель — Gigabyte Aorus GeForce RTX 4080 Super Master 16G (16 ГБ) — представляет собой крупный флагманский игровой ускоритель последнего поколения. Ее размеры впечатляют: 35,5 см в длину, 16,5 см в высоту, и видеокарта занимает 4 слота в корпусе! При этом потребление энергии не превышает 310-320 Вт, система охлаждения тихая, и температурные параметры находятся в пределах нормы с запасом.

Gigabyte Aorus оснащена 16-контактным разъемом питания версии PCIe 5.0 (в комплекте имеется адаптер-переходник для подключения 3 разъемов питания типа PCIe 2.0, но рекомендуется использовать современный блок питания с поддержкой PCIe 5.0).

Изюминкой этой карты является стильная подсветка вентиляторов и наличие ЖК-экрана на торце, который полезно использовать для вывода данных мониторинга. Также стоит отметить наличие в комплекте надежного кронштейна, который жестко фиксирует тяжелую карту в корпусе ПК.

Производитель предоставляет 4-летнюю гарантию на эту карту при обязательной регистрации на сайте компании.

Отметим еще раз, что GeForce RTX 4080 Super отлично подходит для игры в разрешении 4K с максимальным качеством графики с трассировкой лучей даже без DLSS, а в ряде игр — и для разрешения 8К (но обязательна нужна поддержка DLSS).