Обзор видеоускорителя Nvidia GeForce RTX 4070 Super на основе карты Palit GeForce RTX 4070 Super Dual (12 ГБ)

Общая информация о GeForce RTX 4070 Super

Недавно мы рассмотрели GeForce RTX 4080 Super, третью по времени выхода в обновленной Super-линейке видеокарт. Однако сегодня обратим внимание на те модели, которые появились на рынке ранее. Вспомним, что осенью 2022 года появились первые графические процессоры RTX 40 — GeForce RTX 4090, GeForce RTX 4080 и GeForce RTX 4070. Последняя, вышедшая весной прошлого года, предложила доступное решение с высокой производительностью, особенно благодаря технологии DLSS.

Однако на выставке CES в начале 2024 года Nvidia представила три новые модели с суффиксом Super: GeForce RTX 4070 Super, GeForce RTX 4070 Ti Super и GeForce RTX 4080 Super. Эти видеокарты придали новизну линейке перед выходом следующего поколения осенью. Сегодня мы ближе рассмотрим наиболее доступную из Super-моделей текущего поколения — GeForce RTX 4070 Super, которая, по всей видимости, представляет интерес для потенциальных покупателей.

GeForce RTX 4070 Super была представлена на рынке раньше двух остальных моделей — уже 17 января, за ней последовала GeForce RTX 4070 Ti Super, а GeForce RTX 4080 Super появилась в конце месяца. Несмотря на то, что мы рассмотрели сначала более дорогой вариант, теперь обратим внимание на две более ранние новинки. Детали о конфигурации и ценах на новые Super-модели уже были представлены в наших новостях, и теперь перейдем к ближайшему рассмотрению январского релиза.

GeForce RTX 4070 Super увеличила мощность за счет дополнительных потоковых процессоров по сравнению с обычной GeForce RTX 4070. Она обеспечивает лучшие характеристики и более высокую производительность за ту же рекомендованную цену в $599. При этом GeForce RTX 4070 остается в продаже, снижаясь до $549. Для большинства покупателей GeForce RTX 4070 Super представляется наиболее привлекательным обновлением, учитывая доступную цену и ожидаемый прирост производительности по сравнению с базовой моделью.

Эта модель является значимым дополнением к линейке GeForce RTX 40, предлагая более 20% увеличение исполнительных ядер по сравнению с GeForce RTX 4070 и даже немного опережая флагман предыдущего поколения — GeForce RTX 3090 при более низком энергопотреблении. GeForce RTX 4070 Super рекомендуется для энтузиастов, желающих новую архитектуру и высокую производительность без необходимости тратить тысячи долларов. Этот GPU оптимален для игр с разрешением 2560×1440 при максимальных настройках, включая трассировку лучей, хотя для 4K при таких же параметрах он может не всегда подойти — тем не менее, с поддержкой DLSS, включая новую генерацию дополнительных кадров серии GeForce RTX 40, можно компенсировать некоторые ограничения, особенно в сравнении с флагманом GeForce RTX 4090 без использования DLSS. Графическая архитектура Ada Lovelace сохраняет схожесть с Ampere, а обе они во многом совпадают с предыдущими архитектурами Turing и Volta.

Графический ускоритель GeForce RTX 4070 Super
Кодовое имя чипа	AD104
Технология производства	5 нм (TSMC 4N)
Количество транзисторов	35,8 млрд
Площадь ядра	294,5 мм²
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X
Частота графического процессора	до 2475 МГц
Вычислительные блоки	56 (из 60) потоковых мультипроцессоров, включающих 7168 (из 7680) CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки	224 (из 240) тензорных ядра для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей	56 (из 60) RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	224 (из 240) блока текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	10 широких блоков ROP на 80 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)

Спецификации видеокарты GeForce RTX 4070 Super
Частота ядра	1980/2475 МГц
Количество универсальных процессоров	7168
Количество текстурных блоков	224
Количество блоков блендинга	80
Эффективная частота памяти	21 ГГц
Тип памяти	GDDR6X
Шина памяти	192 бит
Объем памяти	12 ГБ
Пропускная способность памяти	504 ГБ/с
Вычислительная производительность (FP32)	до 35,5 терафлопс
Теоретическая максимальная скорость закраски	198 гигапикселей/с
Теоретическая скорость выборки текстур	554 гигатекселей/с
Шина	PCI Express 4.0 x16
Разъемы	по выбору производителя
Энергопотребление	до 220 Вт
Дополнительное питание	один 16-контактный разъем
Число слотов, занимаемых в системном корпусе	по выбору производителя
Рекомендуемая цена	$599

Название новой графической карты, GeForce RTX 4070 Super, следует традиции именования улучшенных моделей компании Nvidia, которые появляются примерно через год после базовых версий видеокарт. Эта модель представляет собой значительное улучшение по сравнению с оригинальной GeForce RTX 4070, и ее суффикс Super вполне обоснован. Заполняя пробел между GeForce RTX 4070 и GeForce RTX 4070 Ti, новинка обещает более высокую производительность и близость к Ti-версии.

Суффикс Super в данном контексте указывает на увеличение вычислительной мощности GPU за счет добавления активных блоков и увеличения их частоты. В отличие от базовой модели GeForce RTX 4070, которая имела ограниченные характеристики, GeForce RTX 4070 Super приближается к Ti-версии, оснащаясь 56 мультипроцессорами и 48 МБ кэша, что делает ее близкой по характеристикам к GeForce RTX 4070 Ti.

С рекомендованной ценой $599 GeForce RTX 4070 Super остается в том же ценовом диапазоне, что и ее предшественница, GeForce RTX 4070. При этом базовая модель GeForce RTX 4070 получила официальное снижение цены на $50, устанавливаясь теперь на уровне $549. С учетом близких к указанным ценам на рынке, GeForce RTX 4070 Super представляется привлекательным обновлением с хорошим соотношением цена-производительность.

В сравнении с конкурентом, Radeon RX 7800 XT от AMD, GeForce RTX 4070 Super предлагает значительно более высокую производительность и эффективность даже в условиях растеризации. Аппаратная трассировка лучей, ставшая важным критерием, также выигрывает в пользу новой модели Nvidia. Эти преимущества делают GeForce RTX 4070 Super привлекательным выбором, несмотря на возможные коррекции цен со стороны конкурента.

Отмечается, что выбор объема видеопамяти в GeForce RTX 4070 Super, равного 12 ГБ, соответствует целевому использованию карты в разрешении 2560×1440. Подобный объем видеопамяти обеспечивает хорошую производительность в большинстве сценариев использования, хотя некоторым пользователям может показаться, что 16 ГБ было бы более идеальным вариантом. Однако для большинства задач и игр в указанном разрешении, 12 ГБ видеопамяти справляются вполне достойно.

Founders Edition, представленная Nvidia, сохраняет дизайн, характерный для референсных версий, с черным алюминиевым корпусом и системой охлаждения на основе радиатора с четырьмя медными тепловыми трубками и двумя вентиляторами. Система питания также обновлена до 16-контактного разъема, что гарантирует надежное подключение питания. С увеличением максимального энергопотребления до 220 Вт, энергоэффективность GeForce RTX 4070 Super стала выше, в сравнении с предшественниками и конкурентами.

Таким образом, GeForce RTX 4070 Super представляет собой значимое обновление в линейке видеокарт компании, предлагая выдающуюся производительность в своем ценовом сегменте и становясь привлекательным вариантом для энтузиастов, ориентированных на игры в разрешении 2560×1440.

Партнеры компании Nvidia оперативно представили и выпустили на рынок разнообразные версии видеокарт GeForce RTX 4070 Super с собственными дизайнами. Эти варианты включают в себя как разгоненные модели, так и те, которые оборудованы улучшенными системами охлаждения и питания, в том числе с использованием двух или трех вентиляторов. Продукция различных производителей, таких как Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac, уже представлена в различных конфигурациях, предоставляя потребителям множество вариантов для выбора.

Особенности архитектуры

В отличие от видеокарты GeForce RTX 4070 Ti, которая базировалась на полной версии графического процессора AD104, новая модель Super использует чуть урезанный вариант этого чипа. Ее состав включает пять вычислительных кластеров GPC, 28 кластеров текстурной обработки TPC и 56 потоковых мультипроцессоров SM. Общее количество вычислительных CUDA-ядер составляет 7168, с 56 RT-ядрами для аппаратного ускорения трассировки лучей, 224 тензорными ядрами, а также 224 текстурными блоками TMU и 80 блоками ROP. Рабочая частота графического процессора варьируется от базовой 1980 МГц до турбо-частоты 2475 МГц.

Характеристики GeForce RTX 4070 Super практически идентичны тем, что представлены в GeForce RTX 4070 Ti, за исключением небольших отличий в количестве мультипроцессоров и связанных с ними блоков. Этот фактор обеспечивает более чем 20% повышение производительности по сравнению с GeForce RTX 4070, не учитывая дополнительные блоки ROP и расширенный объем L2-кэша. Подсистема памяти остается такой же, как у GeForce RTX 4070 Ti, включая 7168 КБ L1-кэша и 48 МБ L2-кэша. Эффективная частота видеопамяти GDDR6X составляет 21 ГГц, обеспечивая пропускную способность в 504 ГБ/с при 192-битной шине.

Однако, основное внимание привлекает ограничение объема видеопамяти до 12 ГБ, что может вызвать определенные сомнения у потребителей. Несмотря на это, благодаря большому объему L2-кэша, эта модель успешно справляется с ограничениями узкой шины. С учетом цены от $600, этот объем видеопамяти остается приемлемым, особенно для игр в разрешении 2560×1440. В целом, GeForce RTX 4070 Super предоставляет отличное соотношение цена/качество и может удовлетворить потребности большинства пользователей в игровых и профессиональных приложениях.

Все архитектурные усовершенствования в семействе Ada Lovelace были подробно рассмотрены, включая изменения в RT-ядрах новой архитектуры. Эти изменения включают в себя внедрение аппаратных блоков Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительного планировщика для изменения порядка выполнения шейдеров Shader Execution Reordering. Все эти инновации способствуют повышению эффективности аппаратной трассировки лучей.

Также была подробно рассмотрена технология DLSS, которая не просто представляет собой технологию масштабирования разрешения, но также обзавелась возможностью вставки дополнительных кадров на основе информации из уже существующих. Это увеличивает частоту и плавность видеоряда, а также оптимизирует сложную трассировку лучей через накопление информации и реконструкцию. Технология DLSS в версии 3.5 поддерживает генерацию кадров и реконструкцию лучей. В настоящее время она представляет собой более продвинутую и эффективную опцию по сравнению с аналогичными решениями конкурентов.

Эти инновации в области масштабирования и обработки графики становятся неотъемлемой частью повышения производительности в играх и профессиональных приложениях. Применение таких технологий уже становится активным трендом, улучшая качество графики и обеспечивая более плавный игровой опыт. Игры с продвинутой графикой и трассировкой лучей, такие как Alan Wake 2 и Cyberpunk 2077, становятся более доступными благодаря этим инструментам, которые обеспечивают высокое качество графики при более эффективном использовании ресурсов.

В будущем можно ожидать, что использование подобных технологий станет еще более распространенным, а отключение подобных инструментов может стать невозможным в свете их важности для обеспечения высокой производительности и качества графики.

	GeForce RTX 4070	GeForce RTX 4070 Super	GeForce RTX 4070 Ti	GeForce RTX 4070 Ti Super	GeForce RTX 4080	GeForce RTX 4080 Super	GeForce RTX 4090
Графический процессор	AD104	AD104	AD104	AD103	AD103	AD103	AD102
Количество мультипроцессоров SM	46	56	60	66	76	80	128
Количество ядер CUDA	5888	7168	7680	8448	9728	10240	16384
Количество блоков TMU	184	224	240	264	304	320	512
Количество блоков ROP	64	80	80	96	112	112	176
Объем L2-кэша, МБ	36	48	48	48	64	64	72
Базовая частота, МГц	1920	1980	2310	2340	2205	2295	2235
Турбо-частота, МГц	2475	2475	2610	2610	2505	2550	2520
Скорость текстурирования, Мтекс/с	455	554	626	689	762	816	1290
Скорость заполнения, Мпикс/с	158	198	209	251	281	286	444
Емкость памяти, ГБ	12	12	12	16	16	16	24
Шина памяти, бит	192	192	192	256	256	256	384
Частота памяти, ГГц	21	21	21	21	22,4	23	21
ПСП, ГБ	504	504	504	672	736	736	1008
Энергопотребление, Вт	200	220	285	285	320	320	450
Цена, $	599	599	799	799	1199	999	1599

GeForce RTX 4070 Super значительно отстает от GeForce RTX 4080, особенно в количестве функциональных блоков, объеме видеопамяти и ширине ее шины. Это обусловлено более крупным и мощным графическим процессором AD103 по сравнению с AD104. В сравнении с GeForce RTX 4070, новинка обладает на 22% большим количеством исполнительных блоков, работающих примерно на той же частоте, а также на 10% выше максимальным энергопотреблением, что приводит к существенному приросту производительности.

Согласно спецификациям, GeForce RTX 4070 Super должна быть более чем на 20% быстрее, чем обычная GeForce RTX 4070, что делает ее привлекательным вариантом при схожей цене. В реальных играх она демонстрирует улучшение производительности примерно на 15%-16% по сравнению с базовой GeForce RTX 4070 и незначительное замедление (около 7%) по сравнению с более мощной GeForce RTX 4070 Ti. Несмотря на теоретические различия, вызванные различными ограничениями максимального энергопотребления, новинка представляет собой привлекательное предложение с точки зрения сочетания характеристик.

Недостатками GeForce RTX 4070 Super можно считать узкую 192-битную шину видеопамяти и всего 12 ГБ видеопамяти. На данный момент 12 ГБ вполне достаточны, особенно с учетом большого объема L2-кэша в архитектуре Ada, однако в будущем это может потребовать дополнительного внимания.

Видеокарты GeForce RTX 4070 Super появились на рынке 17 января. Цены на них, как правило, быстро приближаются к рекомендованным, хотя на текущий момент они могут продаваться на $50-$100 дороже, в зависимости от бренда и модели. GeForce RTX 4070 и GeForce RTX 4070 Super предоставляют схожее соотношение цены и производительности, но новинка превосходит базовую модель примерно на 15%-16%, предлагая отличную производительность по выгодной цене.

Согласно проведенным тестам от Nvidia, GeForce RTX 4070 Super значительно превосходит своих предшественников из двух предыдущих поколений видеокарт. В сравнении с GeForce RTX 30 поколения, новинка обеспечивает улучшение производительности до 50%, при этом увеличив потребление энергии всего на 10%. Это приводит к более высокому соотношению цены и производительности, делая GeForce RTX 4070 Super привлекательным выбором.

Сравнение с Radeon RX 7800 XT показывает, что GeForce RTX 4070 Super превосходит конкурента в играх без трассировки лучей, что является целью Nvidia. Особенно это заметно при разрешении 2560×1440 на максимальных графических настройках. Между GeForce RTX 4070 и GeForce RTX 4070 Super лучше выбрать последнюю, так как она предоставляет существенный прирост производительности за небольшую дополнительную стоимость. Однако обе видеокарты отстают от GeForce RTX 4080 примерно на 30%.

GeForce RTX 4070 Super продемонстрировала отличные результаты в трассировке лучей, превосходя даже Radeon RX 7900 XT и Radeon RX 7900 XTX. Тем не менее, ограничения по объему видеопамяти (12 ГБ) и узкая 192-битная шина могут проявиться в сложных сценах при 4K-разрешении без использования технологий DLSS/FSR. В профессиональных задачах создания цифрового контента, таких как визуализация в Blender Cycles, Redshift, V-Ray и других, GeForce RTX 4070 Super демонстрирует высокую производительность, делая ее эффективным выбором по соотношению производительности и цены.

Возможности работы с видеоданными у видеокарты GeForce RTX 4070 Super остаются весьма значительными, несмотря на отличия от флагманской модели. Восьмого поколения специализированный аппаратный кодировщик NVEnc обзавелся поддержкой кодирования видео в формате AV1. Важно отметить, что кодировщик AV1 в чипе Ada на 40%-50% эффективнее кодировщика H.264, применяемого в предыдущих моделях графических процессоров. Поддержка формата AV1 открывает возможность увеличения разрешения видеопотока при стриминге с 1080p до 1440p при том же битрейте.

Однако, в отличие от старших моделей GPU Ada, у GeForce RTX 4070 Super имеется несколько отличий. Урезанная версия графического процессора включает в себя два отключенных кластера TPC и несколько неактивных исполнительных блоков. На этом фоне, в Super-модели один из двух аппаратных кодировщиков видеопотока NVEnc деактивирован, в отличие от GeForce RTX 4070 Ti, где оба активны. Это приводит к значительному отставанию в общей производительности кодирования видеоданных — всего в два раза меньше по сравнению с более мощными графическими процессорами Ada, имеющими два активных кодировщика. Это снижает возможности кодирования видео данных с разрешением 8K при 60 FPS или четырех видеопотоков 4K при 60 FPS.

Тем не менее, видеокарта сохраняет аппаратный декодер пятого поколения NVDec, впервые представленный в архитектуре Ampere. Этот декодер поддерживает аппаратное декодирование видеоданных в различных форматах, включая MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Полная поддержка декодирования видео данных с разрешением 8K при 60 FPS также остается в списке возможностей.

Видеокарта Palit GeForce RTX 4070 Super Dual 12 ГБ

Palit Microsystems, оперирующая под брендом Palit, была учреждена в 1988 году в Китайской Республике (Тайвань). Главный офис компании располагается в Тайбэе, Тайвань, а крупный логистический центр находится в Гонконге. Дополнительный офис, ответственный за продажи в Европе, располагается в Германии. Фабрики компании находятся в Китае. На российском рынке Palit присутствует с 1995 года, начиная свой путь с продаж безымянных продуктов, известных как Noname. Марка Palit стала применяться к продукции только после 2000 года. В 2005 году компания приобрела торговую марку и активы Gainward после банкротства этой компании, что привело к формированию холдинга Palit Group. Открыт еще один офис в Шеньжене, ориентированный на продажи в Китае. Внутри Palit Group также сосредоточены несколько дополнительных торговых марок и брендов.

Объектом данного исследования является серийно выпускаемая видеокарта Palit GeForce RTX 4070 Super Dual с 12 ГБ памяти и 256-битной шиной GDDR6.

Palit GeForce RTX 4070 Super Dual 12 ГБ 256-битной GDDR6
Параметр	Значение	Номинальное значение (референс)
GPU	GeForce RTX 4070 Super (AD104)
Интерфейс	PCI Express x16 4.0
Частота работы GPU (ROPs), МГц	2475(Boost)—2825(Max)	2475(Boost)—2760(Max)
Частота работы памяти (физическая (эффективная)), МГц	2625 (21000)	2625 (21000)
Ширина шины обмена с памятью, бит	192
Число вычислительных блоков в GPU	56
Число операций (ALU/CUDA) в блоке	128
Суммарное количество блоков ALU/CUDA	7168
Число блоков текстурирования (BLF/TLF/ANIS)	224
Число блоков растеризации (ROP)	80
Число блоков Ray Tracing	56
Число тензорных блоков	224
Размеры, мм	270×128×40	300×130×55
Количество слотов в системном блоке, занимаемые видеокартой	2	3
Цвет текстолита	черный	черный
Энергопотребление пиковое в 3D, Вт	219	225
Энергопотребление в режиме 2D, Вт	35	35
Энергопотребление в режиме «сна», Вт	11	11
Уровень шума в 3D (максимальная нагрузка), дБА	32,9	31,0
Уровень шума в 2D (просмотр видео), дБА	18,0	18,0
Уровень шума в 2D (в простое), дБА	18,0	18,0
Видеовыходы	1×HDMI 2.1, 3×DisplayPort 1.4a	1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4	4
Питание: 8-контактные разъемы	0	0
Питание: 6-контактные разъемы	0	0
Питание: 16-контактные разъемы	1	1
Вес карты с комплектом поставки (брутто), кг	1,1	2,0
Вес карты чистый (нетто), кг	0,75	1,2
Максимальное разрешение/частота, DisplayPort	3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI	3840×2160@144 Гц, 7680×4320@60 Гц

Память

Графическая карта оборудована 12 ГБ оперативной памяти GDDR6X SDRAM, размещенной на лицевой стороне печатной платы в виде 6 микросхем по 16 Гбит каждая. Микросхемы памяти, произведенные компанией Micron (модель MT61K512M32KPA-21/D8BZC), предназначены для работы на номинальной частоте 2625 (21000) МГц.

Особенности карты и сравнение с Palit GeForce RTX 4070 Ti JetStream (12 ГБ)

Palit GeForce RTX 4070 Super Dual (12 ГБ) вид спереди

Palit GeForce RTX 4070 Ti JetStream (12 ГБ) вид спереди

Palit GeForce RTX 4070 Super Dual (12 ГБ) вид сзади

Palit GeForce RTX 4070 Ti JetStream (12 ГБ) вид сзади

Мы проводим сравнение данной видеокарты с моделью на чуть более высоком уровне от того же производителя, поскольку фактически GeForce RTX 4070 Super ближе к урезанной версии GeForce RTX 4070 Ti, чем к GeForce RTX 4070. Обратите внимание, что обе печатные платы (PCB) полностью идентичны и почти идентично оснащены (за исключением одной фазы питания GPU у модели GeForce RTX 4070 Super, а также различий в элементной базе).

Графическое ядро имеет маркировку AD104-350, и его дата выпуска приходится на 44-ю неделю 2023 года. В то время как у модели GeForce RTX 4070 Ti маркировка ядра «-400/401», а у GeForce RTX 4070 — «-320».

На правой боковой части карты видны разъемы, аналогичные разъемам для 8-контактного питания. Однако они предназначены для подключения мощных внешних вентиляторов в системах, использующих профессиональные версии аналогичных видеокарт. Стоит отметить, что для игровых и профессиональных видеокарт используются одни и те же GPU, и различия могут заключаться только в объеме памяти, конфигурации рабочих блоков, а также в программном обеспечении.

Общее количество фаз питания на рассматриваемой карте Palit составляет 10 (8+2).

На схеме питания отмечены зелёным цветом фазы, отвечающие за подачу энергии ядру, а красным цветом обозначены фазы, относящиеся к питанию памяти. Важно отметить, что все контроллеры широтно-импульсной модуляции (ШИМ) расположены на обратной стороне печатной платы.

За управление 8 фазами питания ядра отвечает ШИМ-контроллер uP9512R, произведенный компанией uPI Semiconductor. Этот контроллер спроектирован с максимальной поддержкой до 12 фаз.

Питанием микросхем памяти управляет ШИМ-контроллер uP9529Q (uPI Semiconductor).

Для преобразователя питания, традиционно используемого во всех видеокартах Nvidia, применяются транзисторные сборки DrMOS. В данной модели используются компоненты NCP302150 от On Semiconductor. Каждая из этих сборок рассчитана на максимальный ток до 50 А.

Также на тыльной стороне платы имеется контроллер NCP45491 (On Semi), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Видеокарта оборудована простой подсветкой, которая управляется через GPU, и поэтому не требует отдельного выделенного контроллера.

Стандартные частоты работы ядра и памяти соответствуют референсным значениям, хотя максимальная частота ядра немного превышает референсное значение.

Энергопотребление карты Palit в тестах достигает 219 Вт. Нельзя увеличить лимит энергопотребления на данной карте, поэтому я не проводил эксперименты с ручным разгоном.

Питание для карты Palit поступает через 16-контактный разъем стандарта PCIe 5.0 (12VHPWR).

В комплекте поставки карты имеется переходник на такой разъем с двух обычных 8-контактных (хорошо всем знакомых).

Несмотря на относительно низкое энергопотребление и небольшую нагрузку на адаптер, рекомендуется использовать полноценные блоки питания ATX 3.0 с разъемом 12VHPWR и кабелем, обеспечивающим 16 контактов для видеокарт нового поколения.

Отметим стандартные размеры этой карты, которые, особенно по толщине (4 см), являются скромными даже на текущий момент. В результате видеокарта занимает всего 2 слота в системном блоке.

Важно отметить, что ни одна из версий GeForce RTX 4070 не поддерживает мультиграфическую конфигурацию через технологию SLI, отсутствует специальный разъем на верхнем торце для этой цели.

Управление функциональностью карты осуществляется с использованием фирменной утилиты Thunder Master. Хотя последняя версия программы, 4.14, выпущена до выхода серии Super и может распознавать GeForce RTX 4070 Super как GeForce RTX 4070, все настройки остаются активными и работоспособными.

Панель разгона позволяет настроить частоты карты, а также задать авторазгон

Панель управления вентиляторами, ими можно управлять раздельно

Панель мониторинга состояния карты

Нагрев и охлаждение

Отмечается применение кулера, построенного по традиционному принципу сквозного продува хвостовой части радиатора. Система охлаждения включает в себя многосекционный никелированный радиатор с тепловыми трубками. Тепловые трубки служат для эффективного распределения тепла по поверхности радиатора.

Тепловые трубки соединены с крупной никелированной медной пластиной, которая эффективно охлаждает как графический процессор, так и микросхемы памяти (посредством термопрокладок). Дополнительная подошва на радиаторе предназначена для охлаждения преобразователей питания VRM.

Задняя пластина выполняет функцию защиты PCB и входит в общую концепцию дизайна.

Над радиатором установлен кожух с двумя вентиляторами диаметром 100 мм, работающими с согласованной частотой вращения (это значение можно настроить через программу ThunderMaster). При низкой нагрузке на видеокарту вентиляторы останавливаются, если температура GPU опускается ниже 50 градусов, а температура микросхем памяти — ниже 80 градусов. В этом режиме система охлаждения полностью бесшумна. При запуске компьютера вентиляторы начинают работу, но после загрузки видеодрайвера они выключаются. Ниже представлен видеоролик на эту тему.

Мониторинг температурного режима:

После двухчасового тестирования под максимальной нагрузкой максимальная температура ядра не превысила 75 градусов (самая высокая точка — 89 °C), а температура микросхем памяти достигла 78 градусов. Эти результаты являются удовлетворительными для видеокарт данного уровня, учитывая компактность системы охлаждения. Энергопотребление карты в тестах достигало 219 Вт, что остается в пределах безопасной работы. Напоминаем, что безопасный предел нагрева памяти GDDR6X составляет 105 °C.

Мы записали и ускорили в 50 раз 8-минутный процесс прогрева.

Максимальный нагрев наблюдался в центральной части PCB, а также около разъема PCIe.

Шум

Измерения шума проводились в помещении, обеспечивающем шумоизоляцию и подавление ревербераций. Системный блок, используемый для измерения шума видеокарты, не содержит вентиляторов и не является источником механического шума. Фоновый уровень шума составлял 18 дБА, представляя собой уровень шума в комнате и уровень самого шумомера. Измерения производились на расстоянии 50 см от видеокарты, на уровне её системы охлаждения.

Режимы измерения включали:

Режим простоя в 2D: работа интернет-браузера, приложения Microsoft Word и несколько интернет-коммуникаторов.
Режим 2D с просмотром фильмов: использование SmoothVideo Project (SVP) с аппаратным декодированием и вставкой промежуточных кадров.
Режим 3D с максимальной нагрузкой на видеокарту: запуск теста FurMark.

Оценка уровня шума проводилась по следующей шкале:

Менее 20 дБА: условно бесшумно.
20–25 дБА: очень тихо.
25–30 дБА: тихо.
30–35 дБА: отчетливо слышно.
35–40 дБА: громко, но терпимо.
Более 40 дБА: очень громко.

В режиме простоя в 2D температура не превышала 35 °C, вентиляторы не работали, и уровень шума соответствовал фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием не произошло значительных изменений.

В режиме максимальной 3D-нагрузки температура достигала 75/89/78 °C (ядро/hot spot/память). Вентиляторы ускорителя вращались до 1847 оборотов в минуту, и уровень шума составил 32,9 дБА — отчетливо слышно, но еще не громко. Спектрограмма шума выглядит достаточно ровной, без выраженных пиков, которые могли бы вызывать дискомфорт.

Не стоит забывать, что тепло, выделяемое картой, остается внутри системного блока, так что использование корпуса с хорошей вентиляцией крайне желательно.

Подсветка

Карта имеет очень скромную подсветку в виде ломаной линии на верхнем торце карты. В качестве некоторого «утешения» для любителей моддинговых штучек компания Palit предлагает возможность модификации кожуха СО с помощью концепции «Автор» (Maker).

Владельцы видеокарт GeForce RTX 40 серии GamingPro и Dual имеют возможность загрузить различные образцы дизайна кожуха с официального сайта Palit. Кроме того, пользователи могут добавить индивидуальные элементы, внести изменения в шаблоны, проявить творческий подход, сохранить результат в виде проектов. Полученные проекты можно затем использовать для 3D-печати или распечатки на собственном принтере, а затем раскрасить и установить вместо стандартного кожуха (который крепится на защелках).

Управление режимами подсветки, включая ее отключение, осуществляется той же утилитой ThunderMaster. Режимов подсветки не так много, но они предельно просты в использовании.

Комплект поставки и упаковка

В комплекте поставки кроме карты имеется лишь переходник питания (о нем мы ранее говорили).

Тестирование: синтетические тесты

Мы провели тестирование обновленной видеокарты Nvidia с использованием стандартных частот в нашем наборе синтетических тестов. Набор тестов постоянно совершенствуется, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы стремимся расширять и улучшать этот набор, и если у вас есть предложения — не стесняйтесь делиться ими в комментариях к статье или отправлять авторам.

Среди новых бенчмарков мы включили несколько тестов для измерения производительности трассировки лучей и технологий масштабирования разрешения: DLSS, FSR и XeSS. Также мы использовали полусинтетические тесты из пакета 3DMark, такие как Time Spy, Port Royal, DX Raytracing, Speed Way и другие. Приложения DirectX 11 и 12, входящие в различные SDK, были удалены, так как они давали некорректные результаты.

Синтетические тесты проводились на следующих видеокартах:

GeForce RTX 4070 Super со стандартными параметрами
GeForce RTX 4070 Ti со стандартными параметрами
GeForce RTX 4070 со стандартными параметрами
GeForce RTX 3090 со стандартными параметрами
Radeon RX 7900 XT со стандартными параметрами
Radeon RX 7800 XT со стандартными параметрами

Этот выбор позволяет нам оценить производительность новой модели GeForce RTX 4070 Super в сравнении с предыдущими версиями и конкурирующими моделями Radeon.

Тесты 3DMark Vantage

Многие года мы продолжаем анализировать устаревшие синтетические тесты из пакета 3DMark Vantage, поскольку в них часто можно выявить интересные аспекты, отсутствующие в более современных тестах. Feature-тесты из этого набора обладают поддержкой DirectX 10 и до сих пор сохраняют свою актуальность, позволяя нам извлекать полезные выводы при анализе результатов новых видеокарт.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. В нем осуществляется заполнение прямоугольника значениями, считываемыми из небольшой текстуры с использованием многочисленных текстурных координат, изменяющихся каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и результаты этого теста часто близки к соответствующим теоретическим параметрам. Однако иногда производительность может быть несколько занижена для определенных GPU. В целом, полная версия графического процессора AD104 в этом тесте демонстрирует высокую производительность, и RTX 4070 Super значительно опережает RTX 4070 — более чем на 20%, что соответствует теоретической разнице между ними.

RTX 4070 Ti, обладающая большим количеством текстурных блоков и повышенным уровнем максимального энергопотребления, также немного быстрее, хотя разница в скорости текстурирования не так велика. Сравнение рассматриваемой сегодня видеокарты с конкурентами компании AMD выдает преимущество в пользу GeForce, несмотря на то, что предыдущие поколения AMD были сильнее в этом тесте. Однако эффективная скорость текстурирования нового семейства Radeon немного снизилась, и близкие по цене решения Nvidia догнали их и в некоторых случаях даже опережают. Таким образом, RTX 4070 Super догнала даже Radeon RX 7900 XT, не говоря уже о младшей модели конкурента.

Feature Test 2: Color Fill

Второй тест измеряет скорость заполнения. В нем используется простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер с использованием альфа-блендинга. Этот тест использует 16-битный внеэкранный буфер формата FP16, часто применяемый в играх с HDR-рендерингом, что делает его вполне современным.

Результаты второго подтеста 3DMark Vantage: Color Fill

Результаты второго подтеста 3DMark Vantage, измеряющего производительность блоков ROP без учета величины пропускной способности видеопамяти, фокусируются на производительности подсистемы ROP. В этом тесте GeForce RTX 4070 Super показывает значительное улучшение по сравнению с базовой моделью RTX 4070, что объяснимо, учитывая четверть разницы в скорости подсистемы ROP. RTX 4070 Ti демонстрирует еще небольшой прирост, хотя количество блоков ROP остается таким же, как у рассматриваемой модели.

Однако результаты Nvidia блекнут перед производительностью конкурента AMD. Все видеокарты Nvidia в этом тесте уступают Radeon RX 7900 XT, превзойденной в два раза. Тем не менее, RX 7800 XT от AMD, близкий по цене конкурент, более конкурентоспособен по сравнению с рассматриваемой GeForce. В области пиковой скорости заполнения сцены видеокарты GeForce всегда отставали от конкурентов, что подтверждается результатами этого теста.

Feature Test 3: Parallax Occlusion Mapping

Третий feature-тест — Parallax Occlusion Mapping, представляет особый интерес, поскольку эта техника давно используется в играх. Тест включает сложную геометрию с использованием техники Parallax Occlusion Mapping, эмулирующей трехмерные формы. Он включает ресурсоемкие операции по трассировке лучей и использование карты глубины высокого разрешения. Также поверхность затеняется с использованием сложного алгоритма Strauss. Этот тест представляет собой высокую нагрузку для видеочипа, включая множество текстурных выборок при трассировке лучей, динамические ветвления и сложные вычисления освещения в стиле Strauss.

Результаты теста в рамках 3DMark Vantage не определяются только скоростью математических вычислений, эффективностью ветвлений или скоростью текстурных выборок. Они зависят от нескольких параметров одновременно, включая баланс GPU и эффективность выполнения сложных шейдеров. Этот тест представляет собой важный инструмент, поскольку его результаты часто коррелируют с производительностью в реальных игровых тестах.

Здесь критическую роль играют и математическая, и текстурная производительность. В тесте 3DMark Vantage новая модель GeForce RTX 4070 Super продемонстрировала ожидаемый результат, превосходя базовую модель RTX 4070 на примерно 23%, что соответствует теоретической разнице между ними. Модель RTX 4070 Ti на том же GPU также оказалась чуть быстрее, что логично. Заметно, что новинка заняла промежуточное положение на диаграмме между конкурентами, такими как видеокарты Radeon RX 7900 XT и RX 7800 XT, ближе к последней. Этот тренд, вероятно, сохранится и в играх без трассировки лучей.

Особый интерес представляет Четвертый тест, оценивающий физические взаимодействия (имитацию ткани) с использованием GPU. Используется вершинная симуляция, комбинирующая вершинные и геометрические шейдеры с несколькими проходами. Stream out применяется для передачи вершин между проходами симуляции. Этот тест позволяет оценить производительность вершинных и геометрических шейдеров, а также скорость stream out.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в данном тесте зависит от нескольких параметров, причем основными факторами влияния являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. На первый взгляд, сильные стороны чипов Nvidia должны были проявиться, однако мы сталкиваемся с явно некорректными результатами в этом тесте. Такие проблемы не ограничиваются только видеокартами GeForce — видеокарты Radeon также попали в ту же ситуацию со временем. Новые драйверы AMD показывают низкие результаты, и, кажется, все GPU представляют некорректные данные в этом тесте, что не соответствует ожиданиям. Проблема, вероятно, заключается в драйверах, которые давно не оптимизированы для данного устаревшего тестового пакета.

Feature Test 5: GPU Particles

Этот тест оценивает физическую симуляцию эффектов, основанную на системах частиц, рассчитываемых с использованием графического процессора. Используется вершинная симуляция, где каждая вершина представляет отдельную частицу. Также используется stream out с той же целью, что и в предыдущем тесте. В тесте рассчитывается несколько сотен тысяч частиц, каждая анимируется отдельно, и также учитываются их столкновения с картой высот. Отрисовка частиц происходит с использованием геометрического шейдера, который создает четыре вершины из каждой точки, формируя частицу. Нагрузка на шейдерные блоки в основном связана с вершинными расчетами, и также тестируется stream out.

Во втором геометрическом тесте 3DMark Vantage также наблюдаются результаты, которые отклоняются от теории, но они уже ближе к реальности по сравнению с предыдущим геометрическим тестом этого бенчмарка. При считывании результатов как корректных, новая видеокарта Super-линейки демонстрирует заметное улучшение по сравнению с базовой моделью, что соответствует ожиданиям, учитывая существенное различие в количестве блоков в GPU. RTX 4070 Ti также проявляет небольшое ускорение. В то время как конкурирующие видеокарты Radeon в этом тесте четко уступают всем представленным видеокартам конкурента, что, возможно, объясняется недостаточной оптимизацией драйверов AMD.

Feature Test 6: Perlin Noise

Последний feature-тест из пакета Vantage представляет собой математически интенсивный тест GPU, в котором рассчитываются несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует свою функцию шума для создания дополнительной нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, и он включает в себя множество математических вычислений.

В данном математическом тесте производительность всех решений, хотя и не совсем соответствует теории, в целом близка к максимальной производительности видеочипов в экстремальных условиях. В тесте применяются операции с плавающей запятой, и предполагалось, что новые архитектуры Ada Lovelace и RDNA3 выявят свои уникальные возможности в двойном исполнении соответствующих команд. Однако этот тест устарел и не полностью способен отразить новые способности современных GPU, судя по сравнительным результатам.

Самая слабая модель из семейства GeForce RTX 40 Super показала ожидаемые результаты, превосходя базовую модель более чем на 20%, что соответствует теоретическим предположениям. Оба GPU также уступают старшей модели RTX 4070 Ti на основе полного чипа, хотя новинка приближается к ее производительности. В сравнении с конкурирующими моделями Radeon в близком ценовом диапазоне, новая модель Nvidia опять показывает скорость между RX 7900 XT и RX 7800 XT, что соответствует ожиданиям. Дальнейший анализ может быть осуществлен в более современных синтетических тестах, которые более эффективно проверяют возможности современных GPU.

Тесты Direct3D 12

Если рассматривать производительность новой модели GeForce RTX 4070 Super в данной задаче по сравнению с базовой видеокартой на основе того же GPU, но с меньшим количеством активных блоков, то можно заметить, что улучшенная видеокарта превосходит ее на 16%-18%. Это немного ниже теоретической разницы между ними, но это объяснимо воздействием других параметров. Несмотря на синтетический характер теста, он измеряет производительность GPU в целом, а не отдельных его блоков. RTX 4070 Ti показывает более сильные результаты, чем ожидалось, возможно, из-за увеличенного максимального энергопотребления: 285 Вт по сравнению с 220 Вт у базовой модели, что, вероятно, ограничивает полное раскрытие новинки.

Все Radeon в данном тесте обычно показывают более высокую производительность по сравнению с конкурирующими по цене GeForce, что следует учесть. В этот раз производительность видеокарты GeForce RTX 4070 Super оказалась ниже ожидаемой. Даже более доступная видеокарта Radeon RX 7800 XT показала схожий результат с новинкой, хотя ожидалось, что она будет чуть медленнее. В реальных играх результаты данного теста не всегда хорошо коррелируют с реальной производительностью, но они указывают на то, что в условиях растеризации решения AMD будут проявлять себя немного сильнее, чем при трассировке лучей, которую мы рассматриваем далее.

Тесты трассировки лучей

Один из ранних тестов производительности в области трассировки лучей — бенчмарк Port Royal от создателей известных тестов серии 3DMark. Этот тест поддерживается всеми графическими процессорами, поддерживающими DirectX Raytracing API. Мы провели проверку нескольких видеокарт в разрешении 2560×1440 при различных настройках. Отражения рассчитывались с использованием трассировки лучей в двух режимах, а также традиционным методом растеризации.

Бенчмарк Port Royal предоставляет новые возможности для тестирования аппаратного ускорения трассировки лучей через DXR API. В тесте применяются алгоритмы рендеринга отражений и теней с использованием трассировки лучей, хотя он не оптимизирован в достаточной степени и создает значительную нагрузку, в том числе на мощные GPU. Тем не менее, для сравнения производительности различных GPU в данной задаче, этот тест вполне подходит.

Результаты теста наглядно демонстрируют разницу в подходах компаний AMD и Nvidia к интеграции аппаратного ускорения трассировки лучей. Хотя архитектура RDNA3 немного улучшила положение AMD, новая видеокарта RTX 4070 Super продемонстрировала ожидаемое улучшение, превосходя RTX 4070 на 18%. Обе эти модели уступают RTX 4070 Ti, обусловленное более высоким энергопотреблением последней и отсутствием ограничений. Решения от AMD продолжают эффективно справляться с трассировкой лучей, и графические процессоры архитектуры RDNA3 демонстрируют меньшие потери по сравнению с предыдущим поколением. Таким образом, RX 7900 XT находится на уровне с RTX 4070 Super даже при трассировке лучей.

Позднее появился еще один подтест 3DMark, специально ориентированный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего бенчмарка, этот тест полностью посвящен трассировке лучей и не использует растеризацию. Сцена в этом тесте уже знакома нам из других подтестов 3DMark и, будучи масштабированной, эффективно демонстрирует возможности аппаратного ускорения трассировки лучей новых видеокарт.

Сценарий меняется в последующем тесте, где практически все зависит от скорости трассировки лучей. Понятно, что в этих условиях все видеокарты GeForce значительно превосходят Radeon. Выделенные RT-ядра Nvidia выполняют большую часть работы и обладают более универсальной природой, не теряя производительности при включении трассировки лучей так сильно, как ядра Ray Accelerator в сочетании с обычными SIMD-ядрами у конкурента. Однако в большинстве игр с применением трассировки лучей нагрузка на RT-блоки обычно ниже, и положение Radeon не так печально. Тем не менее, в данном тесте видеокарты Nvidia продолжают демонстрировать явное преимущество.

Новая модель RTX 4070 Super заметно обогнала базовую модель RTX 4080, и разница между ними составила 22%-23%, что оказалось выше ожиданий. Прирост скорости в задачах трассировки лучей оказался более выраженным, чем в растеризации. Оба варианта, основанные на урезанных версиях графического процессора AD104, несмотря на отсутствие полного чипа, превосходят все решения конкурента. Даже старший Radeon серьезно уступил базовой модели Nvidia, а RTX 4070 Super оказалась быстрее его в полтора раза. Важно отметить, что это синтетический тест, и в реальных играх подобное может происходить лишь в некоторых проектах, например, в Portal RTX, Quake II RTX, Cyberpunk 2077, Alan Wake 2 и аналогичных, активно использующих трассировку лучей.

С появлением новых поколений графических процессоров от Nvidia и AMD в 2022 году в пакет 3DMark был добавлен еще один тест с серьезной нагрузкой именно на трассировку лучей — Speed Way. Этот тест, судя по его нагрузке на различные блоки GPU, кажется более схожим с широко распространенными игровыми проектами, активно использующими трассировку лучей, и поэтому представляет для нас особый интерес.

Приемлемую частоту кадров в обоих разрешениях достигают только топовые GPU, и хотя разница между Radeon и GeForce остается заметной, она значительно сократилась. Представленные в данном сравнении видеокарты AMD уже не так сильно уступают своим условным ценовым конкурентам. RTX 4070 Super на этот раз не так значительно превосходит базовую RTX 4070, разница составила приблизительно 16%. Видеокарта RTX 4070 Ti на полном чипе демонстрирует небольшое преимущество, но и она не сильно вырывается вперед. Для нас важно отметить, что RX 7800 XT значительно отстает, а RX 7900 XT приближается к сегодняшней новинке в высоком разрешении, где RTX 4070 Ti начинает уступать по пропускной способности памяти и ее объему.

Рассмотрим еще один полусинтетический бенчмарк, построенный на реальном игровом движке. Boundary — китайский игровой проект с поддержкой DXR и DLSS. Этот бенчмарк представляет собой серьезную нагрузку на GPU, активно используя трассировку лучей для сложных отражений, мягких теней и глобального освещения. Естественно, технологию DLSS в тестах Radeon мы не можем использовать.

Разрешение 4K без включения масштабирования оказывается неиграбельным на всех рассмотренных решениях. Даже в Full HD-разрешении без использования технологии DLSS приемлемую производительность демонстрируют лишь самые мощные видеокарты. Вторая по скорости в линейке модель AMD уступает всем видеокартам GeForce, включая базовую RTX 4070, которая достигает уровня более 60 FPS. Рассматриваемая сегодня видеокарта примерно на 20% быстрее базовой модели, что соответствует теоретической разнице между ними. Показатели видеокарт Radeon в тестах трассировки лучей явно свидетельствуют о том, что решения AMD не могут конкурировать с GPU конкурента поколения Ada. RTX 4070 Super заметно опережает даже более дорогую Radeon RX 7900 XT.

С включением масштабирования разрешения методом DLSS 2 даже бывшая топовая видеокарта из линейки RTX 30 обеспечивает приемлемую частоту кадров в 4K-разрешении, хотя она не достигает 60 FPS, также как и новая GeForce RTX 4070 Super. Новинка показывает улучшение результатов на до 20% по сравнению с RTX 4070. Хотя в 4K можно играть при такой нагрузке, рекомендуется предпочесть разрешение 2560x1440, как рекомендует Nvidia для этой модели. Это позволит включить все максимальные настройки в самых ресурсоемких играх. RTX 4070 Ti показывает лишь незначительный прирост, что объясняет ее снятие с продажи.

Рассмотрим еще один полуигровой бенчмарк, также основанный на китайской игре — Bright Memory. Интересно, что оба теста похожи по результатам и качеству изображения, несмотря на различную тематику. Однако этот бенчмарк более требователен, особенно к производительности трассировки лучей. К сожалению, на видеокартах AMD он не работает, требуя именно карты Nvidia GeForce RTX.

В данном тесте обновленная Super-модель на основе немного урезанной версии графического процессора AD104 продемонстрировала результат, который оказался ниже ожидаемого при сравнении с базовой RTX 4070. Ситуация в этом случае отличается от предыдущей диаграммы. Замечено, что RTX 3090 также показывает хорошие результаты, особенно в высоком разрешении. Предполагается, что влияние оказывают память видеокарт и ее объем, которые у всех трех видеокарт с индексом 4070 довольно близки. Это может объяснить относительную близость результатов этих карт в данном тесте. Все же новинка продемонстрировала прирост почти на 10% по сравнению с RTX 4070 и опередила даже RTX 3090, хотя только в низком разрешении.

Вычислительные тесты

Мы продолжаем искать бенчмарки, которые используют OpenCL для проведения актуальных вычислительных тестов, чтобы в дальнейшем добавить их в наш пакет синтетических испытаний. На данный момент в этом разделе присутствует устаревший и неоптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот тест, основанный на LuxRender и работающий на платформе OpenCL, является кроссплатформенным.

Новая модель GeForce RTX 4070 Super, основанная на почти полной версии графического процессора AD104, обладает значительным количеством вычислительных блоков. В результате не удивительно, что в данном тесте она превзошла базовую модель RTX 4070, хотя разница между ними не так велика, как предполагается теоретически — всего 10%-11%, вместо ожидаемых 22%. Это объясняется тем, что оба графических процессора достигают предела энергопотребления, который у них различен лишь на ту же величину. Старшая модель видеокарты RTX 4070 Ti показывает немного лучший результат, поскольку ее предел энергопотребления заметно выше, и она редко ограничивается этим параметром. Видеокарты AMD в данном тесте исторически проявляли слабость, и даже Radeon RX 7900 XT не смог догнать рассматриваемую Super-модель от Nvidia.

Далее рассмотрим еще один тест производительности графических процессоров — V-Ray Benchmark, который также представляет собой трассировку лучей без использования аппаратного ускорения. Этот бенчмарк, основанный на рендерере V-Ray, позволяет оценить возможности GPU в сложных вычислениях и выявить преимущества новых видеокарт. В предыдущих тестах использовались разные версии бенчмарка, предоставляющие результаты в виде времени, затраченного на рендеринг, и в виде количества миллионов просчитанных путей в секунду. Однако в данном случае мы ограничимся первым вариантом.

Тест также включает программную трассировку лучей, и в нем новая модель GeForce RTX 4070 Super оказалась заметно быстрее не только RTX 3090 и базовой модели RTX 4070, но также смогла достичь уровня RTX 4070 Ti. По всей видимости, в данном случае энергопотребление GPU не достигло максимального предела. Однако разница между RTX 4070 и RTX 4070 Super далека от теоретических 22%, возможно, это связано с упором программной трассировки лучей в скорость кэш-памяти и основной видеопамяти. Поскольку параметры промежуточного хранилища данных у видеокарт близки, результаты этих карт слабо отличаются. Но важно отметить, что даже топовая видеокарта Radeon от AMD оказалась на обочине.

Перейдем к рассмотрению еще одного приложения для рендеринга — OctaneRender. Этот популярный рендерер, совместимый с большинством приложений для создания 3D-контента, использует возможности CUDA и RTX. Версия OctaneRender 2020.1.5 получила поддержку архитектуры Ampere. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестировать производительность в нескольких тестовых сценах с различной нагрузкой. К сожалению, OpenCL не поддерживается этим тестом и рендерером. Далее приведем общее количество очков:

Обновленная модель GeForce RTX 4070 Super успешно превзошла предыдущую топовую модель из предыдущего поколения, что ожидалось, особенно при включенном аппаратном ускорении RTX, которое значительно улучшает результаты всех графических процессоров Nvidia. В новой графической архитектуре Ada Lovelace сказались улучшения, связанные с трассировкой лучей и вычислениями. В вычислительных тестах RTX 4070 Super продемонстрировала улучшение производительности на 11%-14%, что, хотя немного ниже ожиданий, всё равно близко к тому, что можно ожидать в реальных играх. Замечательно, что RTX 4070 Ti немного опередила новинку, возможно, влияет параметр ПСП или кэширование.

Недавно вышла новая версия популярного бенчмарка 3D-рендеринга — Cinebench 2024 от Maxon. Этот бенчмарк позволяет оценить аппаратные возможности процессора и видеокарты, используя просчет фотореалистичной сцены. Cinebench 2024 базируется на программе для создания трехмерной графики и анимации Cinema 4D, а также на движке рендеринга Redshift. Тестирование CPU и GPU включает использование одних и тех же алгоритмов и сцен, что позволяет сравнивать результаты между процессорами и видеокартами.

В последнем тесте программной трассировки лучей GeForce RTX 4070 Super опередила базовую модель, построенную на том же графическом процессоре, но с различными уровнями урезки, всего на 5%. Этот результат существенно ниже теоретически ожидаемого и ожиданий. Мощная модель RTX 4070 Ti, хоть и уходящая с рынка, также не сильно опережает новинку. Важно отметить, что конкурирующие видеокарты от Radeon показали гораздо более низкие результаты, возможно, увеличение вдвое темпа выдачи инструкций в новой графической архитектуре RDNA3 не сработало в данном тесте, и общая производительность не выросла значительно. Младшая модель Radeon значительно уступила, а старшая также далека от новой RTX 4070 Super.

Тесты технологий DLSS/XeSS/FSR

В данном разделе мы фокусируемся на дополнительных тестах, связанных с технологиями повышения производительности. Изначально мы рассматривали технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), но позже к ним добавились технологии генерации промежуточных кадров, такие как DLSS 3, а затем версия 3.5 с реконструкцией лучей при трассировке.

Первым этапом было включение в материалы тестирование технологии DLSS. Несмотря на проведенные ранее тесты с использованием этой технологии в приложениях с трассировкой лучей, мы считали целесообразным провести отдельное тестирование с рассмотрением результатов нескольких GPU компании в разрешении 4K с активацией технологии DLSS различных уровней качества, включая генерацию кадров (обозначенную на диаграмме как FG).

Без включения DLSS 2.0, рендеринг выполняется в полном разрешении, что существенно сказывается на производительности. Видеокарты продемонстрировали всего лишь до 30 FPS в 4K-разрешении, что оказывается недостаточным. Однако, при активации DLSS на максимальном уровне производительности, частота кадров становится более чем достаточной даже для топовой модели предыдущего поколения RTX 3090, не обладающей поддержкой генерации дополнительных кадров. Новая модель RTX 4070 Super продемонстрировала высокую производительность, сопоставимую с RTX 3090, и приблизилась к RTX 4070 Ti.

Все современные видеокарты Nvidia текущего поколения обладают мощным инструментом — поддержкой технологии DLSS 3.0. Эта технология объединяет возможности DLSS 2.x с генерацией дополнительных кадров. DLSS 3.0 позволяет повысить плавность видеоряда при небольшом увеличении задержек управления. Включение генерации дополнительных кадров приносит прирост в FPS примерно в полтора раза, позволяя использовать более высокое разрешение рендеринга.

XeSS — это еще один метод повышения производительности, основанный на рендеринге в более низком разрешении с последующим масштабированием картинки до более высокого разрешения. Этот метод, предложенный компанией Intel, также использует искусственный интеллект для восстановления информации в кадре. В отличие от DLSS, XeSS работает не только на видеокартах Intel, но также на всех современных GPU, хотя и не так эффективно, как на решениях самой Intel. Для тестирования использовался специализированный бенчмарк из пакета 3DMark.

Активация XeSS приводит к значительному увеличению частоты кадров — более чем в два раза и даже больше. Благодаря своей универсальности, эта технология обоснованно существует, учитывая, что у каждой из трех компаний есть свои технологии и блоки для ускорения, но у них также есть свои недостатки: DLSS является наиболее передовой, но ограничена только устройствами Nvidia; FSR является наиболее универсальной, но простой и не может использовать специализированные блоки для ускорения; XeSS хороша и универсальна, но уступает DLSS как по качеству, так и по функциональности.

В тесте технологии масштабирования рендеринга FSR 2.0, предоставленной компанией AMD, видеокарта GeForce RTX 4070 Super работает заметно быстрее базовой модели RTX 4070, что вполне соответствует ожиданиям. Разница между этими двумя видеокартами на основе модификаций чипа AD104 оказывается значительной. В этом тесте Radeon RX 7900 XT и RX 7800 XT демонстрируют относительно неэффективную производительность, и видеокарты AMD в целом отстают, поскольку RTX 4070 Super превзошла даже более дорогое решение. Вероятно, характеристики сцены более подходят для решений Nvidia.

Еще одним представителем семейства технологий масштабирования рендеринга является FSR 2.0 от AMD. Интересно, почему именно эта технология вошла в список специализированных подтестов 3DMark. К сожалению, сцены для разных технологий масштабирования отличаются, и их прямое сравнение затруднительно. Мы можем рассматривать лишь рост производительности, учитывая разрешение рендеринга и качество, что усложняет анализ.

FSR — это еще одна универсальная технология, работающая практически одинаково на различных графических процессорах. В тестах FSR 2.0 особых откровений не обнаружено. Radeon RX 7900 XTX (не XT, как в предыдущих тестах) проявил себя очень сильно, но следует учесть, что он стоит значительно дороже всех остальных видеокарт и более сравним с GeForce RTX 4080 Super. Новая модель RTX 4070 Super близка к RTX 4070 Ti, и они заметно опережают топовую видеокарту AMD, что соответствует теории. Однако новинка значительно превосходит близкую по цене модель RX 7800 XT, особенно в режимах с включенным FSR различного уровня.

Тесты технологий масштабирования не выявили ничего необычного, что и не удивительно. Новинка заметно быстрее базовой RTX 4070, благодаря большему количеству исполнительных блоков, что отражается в ее превосходстве на десятки процентов в различных тестах. Теперь переходим к реальным игровым тестам, чтобы оценить, насколько RTX 4070 Super стала быстрее своего предшественника без индекса «Super».

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Всё это нами субъективно оценивается по шкале из семи градаций.

Игры без использования трассировки лучей (классическая растеризация):

Если не использовать RT, то с GeForce RTX 4070 Super мы получаем отменный комфорт в играх при высоких настройках графики во всех трех разрешениях, лишь в 4K в ряде сложных игр комфорт может быть чуть ниже. GeForce RTX 4070 Super отлично конкурирует с продуктами AMD — Radeon RX 7800 XT и флагманом их предыдущего поколения Radeon RX 6950 XT.

Игры с использованием трассировки лучей и DLSS/FSR/XeSS:

Включение RT снижает производительность, однако реализованные уже практически во всех играх с трассировкой лучей технологии Nvidia DLSS и AMD FSR (а то и Intel XeSS) сильно помогают компенсировать падение скорости от использования RT. Так что в итоге для мощных карт уровня GeForce RTX 4070 Super/Ti предыдущие выводы по разрешениям остаются в силе. При этом они обходят даже флагмана последнего поколения AMD — Radeon RX 7900 XTX.

Выводы и сравнение энергоэффективности

Nvidia GeForce RTX 4070 Super (12 ГБ) представляет собой младший вариант флагманской линейки графических ускорителей игрового класса от Nvidia. Располагаясь между GeForce RTX 4070 и GeForce RTX 4070 Ti, ближе к последней, эта видеокарта призвана заполнить заметный пробел в производительности между указанными моделями. Различия в производительности между RTX 4070 и RTX 4070 Ti были значительными, что оказалось необычным для видеокарт с одним базовым номером. Это явление уже встречалось в предыдущих моделях, таких как GeForce RTX 3060 и GeForce RTX 3060 Ti, где использовались разные GPU с существенными отличиями в характеристиках.

В текущем поколении GeForce RTX 30, Nvidia решила не заполнять этот пробел, предпочитая избегать подобных различий в условиях всеобщего дефицита видеокарт. Однако в настоящих условиях, после стабилизации рынка IT постпандемии, видна не только значительная разница в производительности, но и в стоимости между GeForce RTX 4070 и GeForce RTX 4070 Ti. Таким образом, появление GeForce RTX 4070 Super стало ответом на запрос рынка, предоставив промежуточное решение для более сбалансированного выбора.

На момент подготовки нашего обзора продажи GeForce RTX 4070 Super уже начались, мы делаем выводы на основании реальных ценников c маркетплейсов.

GeForce RTX 4070 Super (12 ГБ) продемонстрировала вторую по энергоэффективности производительность как в классических играх, так и в играх с включенными технологиями RT и масштабирования. Этот факт является похвальным результатом для новинки. Общий вывод подчеркивает, что топовые видеокарты последнего поколения отличаются высокой энергоэффективностью, значительно превосходя модели аналогичного уровня из предыдущих поколений GeForce RTX 30 и Radeon RX 6000. При прямом сравнении линеек AMD и Nvidia в борьбе за энергоэффективность, видно явное доминирование GeForce RTX 40.

Архитектура Ada Lovelace, на которой базируется GeForce RTX 40, вносит серьезные улучшения в исполнительные блоки по сравнению с предыдущим поколением Ampere, особенно в области аппаратной трассировки лучей. Кроме того, технология DLSS версии 3 представляет собой эксклюзивное дополнение, объединяя в себе масштабирование разрешения из версии 2 и удвоение частоты кадров с вставкой промежуточных кадров через поле оптического потока. Поддержка стандарта HDMI 2.1, аппаратное декодирование AV1, технология RTX IO для быстрой передачи данных, а также возможность выхода в 4K с 120 FPS или 8K с одним кабелем делают RTX 4070 Super технологически продвинутой.

Несмотря на эти достоинства, стандарт DisplayPort ограничен версией 1.4a, в то время как конкурирующие видеокарты Radeon RX 7000 уже поддерживают DisplayPort 2.1 UHBR13.5, что дает им преимущество в передаче изображения в высоком разрешении без потокового сжатия. Тестированная модель Palit GeForce RTX 4070 Super Dual (12 ГБ) обладает компактными размерами, эффективным кулером и потреблением до 220 Вт, требующим один 16-контактный разъем питания стандарта PCIe 5.0.

Производитель предоставляет 3-летнюю гарантию на данную видеокарту.

Подчеркнем еще раз, что GeForce RTX 4070 Super идеально подходит для игр в разрешениях до 4K с максимальным качеством графики в традиционных играх без трассировки лучей. В самых графически сложных играх при разрешении 4K уровень комфорта может немного снизиться.

Также GeForce RTX 4070 Super отлично подходит для игр с трассировкой лучей, поддерживающих технологии DLSS/FSR/XeSS, обеспечивая высокий комфорт в разрешениях 1080p и 1440p. Для достижения того же уровня комфорта в разрешении 2160p (4K) потребуется поддержка в игре технологии DLSS 3. Если же игра с трассировкой лучей не поддерживает технологии масштабирования, то зона комфорта будет ограничена разрешением 1440p (2.5K).