Обзор видеоускорителя Nvidia GeForce RTX 4070 Ti Super на основе карты Palit GeForce RTX 4070 Ti Super JetStream (16 ГБ)

Общая информация о GeForce RTX 4070 Ti Super

На выставке CES 2024 в начале текущего года компания Nvidia представила три новые модели видеокарт, все снабженные характеристиками Super, что подразумевает улучшения по сравнению с предыдущими версиями. Эти новинки внесли свежесть в линейку продукции перед предстоящим выходом следующего поколения. Сегодня мы рассмотрим среднюю из этой тройки – GeForce RTX 4070 Ti Super, появившуюся на рынке 24 января.

Эта модель привлекает внимание тем, что базируется на новой модели GPU, что отличает ее от предшественницы. Ранее мы рассматривали видеокарту GeForce RTX 4070 Super, которая проявила значительный прирост производительности по сравнению с базовой GeForce RTX 4070 – около 15%. С другой стороны, GeForce RTX 4080 Super оказалась практически такой же, как GeForce RTX 4080, но по более доступной цене. А вот GeForce RTX 4070 Ti Super находится где-то посередине: она явно опережает обычную GeForce RTX 4070 Ti, но прирост скорости не настолько велик. Тем не менее, у новой модели есть дополнительное преимущество в виде увеличенного объема видеопамяти – 16 ГБ у Super-версии по сравнению с 12 ГБ у обычной. Этот дополнительный объем может быть полезен для будущих игр с высоким разрешением и максимальными настройками графики, хотя многим проектам, вероятно, будет достаточно и 12 ГБ базовой GeForce RTX 4070 Ti. Несмотря на улучшенную производительность по сравнению с обычной версией, GeForce RTX 4070 Ti Super остается заметно медленнее GeForce RTX 4080, и обе старшие модели уходят со сцены.

По отношению к производительности, видеокарта GeForce RTX 4070 Ti Super предоставляет более чем достаточные возможности для игр с разрешением 2560×1440, включая мониторы с высокой частотой обновления и при любых настройках графики. Эта модель также способна обеспечить приемлемую производительность на 4K-мониторах, однако для достижения 60 FPS с включенной трассировкой лучей придется прибегнуть к технологиям, таким как DLSS и другим оптимизационным методам. Сравнивая производительность GeForce RTX 4070 Ti Super с GeForce RTX 3090 Ti, можно заметить, что новинка предоставляет аналогичные характеристики, но по более доступной цене — $799.

Неудивительно, что AMD ответила снижением цен на Radeon RX 7900 XT, и теперь эта модель от нескольких производителей доступна примерно за $700 в крупных североамериканских магазинах. Если изначально Radeon RX 7900 XT и GeForce RTX 4070 Ti Super позиционировались как прямые конкуренты по цене, то теперь видеокарта AMD оказалась более доступной. Улучшения в новой видеокарте Nvidia, такие как замена графического процессора на AD103, добавление 4 ГБ памяти, увеличение ширины шины на 64 бита и повышение вычислительной производительности на 10%, делают GeForce RTX 4070 Ti Super весьма привлекательной моделью за ту же цену $799. Однако, детальное рассмотрение этих улучшений позволит понять, насколько они в действительности эффективны.

Графический ускоритель GeForce RTX 4070 Ti Super
Кодовое имя чипа	AD103
Технология производства	5 нм (TSMC 4N)
Количество транзисторов	45,9 млрд
Площадь ядра	378,6 мм²
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	256-битная: 8 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X
Частота графического процессора	до 2610 МГц
Вычислительные блоки	66 (из 80) потоковых мультипроцессоров, включающих 8448 (из 10240) CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки	264 (из 320) тензорных ядра для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей	66 (из 80) RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	264 (из 320) блока текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	12 (из 14) широких блоков ROP на 96 (из 112) пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)

Спецификации видеокарты GeForce RTX 4070 Ti Super
Частота ядра	2340/2610 МГц
Количество универсальных процессоров	8448
Количество текстурных блоков	264
Количество блоков блендинга	96
Эффективная частота памяти	21 ГГц
Тип памяти	GDDR6X
Шина памяти	256 бит
Объем памяти	16 ГБ
Пропускная способность памяти	672 ГБ/с
Вычислительная производительность (FP32)	до 44,1 терафлопс
Теоретическая максимальная скорость закраски	251 гигапикселей/с
Теоретическая скорость выборки текстур	689 гигатекселей/с
Шина	PCI Express 4.0 x16
Разъемы	по выбору производителя
Энергопотребление	до 285 Вт
Дополнительное питание	один 16-контактный разъем
Число слотов, занимаемых в системном корпусе	по выбору производителя
Рекомендуемая цена	$799

Название новой модели, GeForce RTX 4070 Ti Super, соответствует традициям компании и указывает на улучшения по сравнению с предыдущей версией, GeForce RTX 4070 Ti. Эта видеокарта становится значительным шагом вперед в линейке, превосходя GeForce RTX 4070 Ti по производительности и приближаясь к характеристикам GeForce RTX 4080. Единственным недостатком может быть сложное наименование новинки, включающее сразу два суффикса.

Учитывая, что графический процессор AD104 в модели GeForce RTX 4070 Ti уже был полностью использован, переход на чип AD103, применяемый в GeForce RTX 4080 и GeForce RTX 4080 Super, стал единственным способом достичь улучшений в серии Super. AD103 обеспечивает преимущества в виде 256-битной шины и 16 ГБ памяти для GeForce RTX 4070 Ti Super, что представляет собой прирост в 33% по сравнению с базовой моделью GeForce RTX 4070 Ti. Кроме того, новинка получила улучшение вычислительной производительности на 10% и увеличение скорости блоков ROP на 20%. Эти технические характеристики существенно превосходят возможности обычной GeForce RTX 4070 Ti, но GeForce RTX 4080 все равно остается более мощной с её 9728 CUDA-ядрами, большим L2-кэшем и количеством блоков ROP.

Рекомендуемая цена для GeForce RTX 4070 Ti Super осталась на уровне $799, таким образом, сохранив ценовую точку своей предшественницы. Новая модель полностью заменяет базовую GeForce RTX 4070 Ti на рынке, оставляя последней лишь остатки. Хотя цена базовой модели GeForce RTX 4070 Ti при запуске могла показаться высокой, GeForce RTX 4070 Ti Super приносит дополнительные 16 ГБ памяти и небольшой прирост производительности за ту же цену. Однако, размещаясь между GeForce RTX 4070 Super за $599 и GeForce RTX 4080 Super за $999, новинка оказывается в среднем ценовом сегменте, где конкуренция с видеокартой Radeon RX 7900 XT от AMD с ценой в районе $700 оказывается заметной.

Выбор 16 ГБ видеопамяти для GeForce RTX 4070 Ti Super основан на широкой 256-битной шине чипа AD103, что представляет собой оптимальный объем на данный момент. Этот запас памяти является идеальным для большинства сценариев использования, даже в самых требовательных играх с разрешением 4K, где иногда 12 ГБ могут оказаться недостаточными. Учитывая, что основное предназначение GeForce RTX 4070 Ti Super — игры в разрешении 2560×1440, 16 ГБ памяти должно быть достаточно на многие года вперед.

В отличие от предыдущих моделей GeForce RTX 4070 Super и GeForce RTX 4080 Super, GeForce RTX 4070 Ti Super не представлена собственной версией Founders Edition от Nvidia и доступна только от партнеров компании. Тем не менее, общий внешний вид GeForce RTX 4070 Ti Super соответствует типичным решениям различных производителей — система охлаждения с тремя вентиляторами, требующая три слота в корпусе, один 16-контактный разъем питания 12VHPWR, три разъема DisplayPort и один HDMI. Это крупная видеокарта, сопоставимая по размерам с GeForce RTX 4080.

Что касается энергопотребления, GeForce RTX 4070 Ti Super не увеличивает его по сравнению с GeForce RTX 4070 Ti, оставаясь на уровне 285 Вт, что на 35 Вт меньше, чем у GeForce RTX 4080. В играх новинка в среднем потребляет на 10-20 Вт больше, чем GeForce RTX 4070 Ti, но при этом заметно опережает конкурентов по энергоэффективности: GeForce RTX 4070 Ti Super потребляет на 70-75 Вт меньше, чем Radeon RX 7900 XTX, и на 30-50 Вт меньше, чем RX 7900 XT. При этом она обгоняет обе видеокарты AMD в большинстве сложных сценариев, таких как игры с трассировкой лучей.

Партнеры Nvidia представили и выпустили на рынок разнообразные версии видеокарты GeForce RTX 4070 Ti Super с уникальными дизайнами. В ассортименте представлены разгоненные модели с улучшенными системами охлаждения и питания, в основном оснащенные тройными вентиляторами, учитывая тенденцию к повышенной тепловыделенности данной видеокарты. Эти обновленные графические ускорители уже доступны от различных производителей, среди которых Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и другие.

Особенности архитектуры

В линейке графических ускорителей GeForce RTX 40 используются графические процессоры AD10x, которые базируются на архитектуре Ada Lovelace. Инженеры Nvidia разработали эту графическую архитектуру, улучшив производительность операций трассировки лучей и машинного вычисления на тензорных ядрах. Переход на современный технологический процесс от тайваньской компании TSMC также оказал существенное воздействие, позволяя интегрировать в чипы большое количество исполнительных блоков. Новые графические процессоры стали более сложными, но при этом они работают на высоких тактовых частотах по сравнению с предыдущими моделями.

Графический процессор AD103, на основе которого построена GeForce RTX 4070 Ti Super, включает все возможности флагманского AD102. Это включает в себя RT-ядра третьего поколения и тензорные ядра четвертого поколения, обеспечивая поддержку всех улучшений трассировки лучей и технологии увеличения производительности DLSS 3.5. Кристалл AD103 внутри новой видеокарты обеспечивает высокую производительность, сравнимую с флагманским решением предыдущего поколения — GeForce RTX 3090 Ti, при этом с более низким уровнем энергопотребления и рекомендуемой ценой.

Аналогично всем графическим процессорам Nvidia, чип AD103 содержит укрупненные кластеры Graphics Processing Cluster (GPC). Они объединяют в себе несколько кластеров текстурной обработки Texture Processing Cluster (TPC), включающих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Кластер GPC самостоятельно выполняет основные вычисления внутри себя, включая движок растеризации Raster Engine, а также четыре-шесть кластеров TPC, состоящих из удвоенного количества мультипроцессоров SM. Рассмотрим структуру графического процессора в конфигурации, применяемой именно в GeForce RTX 4070 Ti Super.

В отличие от полностью разблокированного чипа, применяемого в GeForce RTX 4080 Super с 80 мультипроцессорами SM и 10240 CUDA-ядрами, у версии GeForce RTX 4070 Ti Super часть исполнительных блоков остается заблокированной. Модификация графического процессора AD103-275-A1 включает шесть из семи вычислительных кластеров GPC, 66 мультипроцессоров SM, 8448 CUDA-ядер, 264 текстурных блока TMU, 96 блоков ROP, 264 тензорных ядра и 66 блоков ускорения трассировки лучей. Базовая и турбо-частота новой GeForce RTX 4070 Ti Super составляют 2340 и 2610 МГц соответственно, в то время как у обычной GeForce RTX 4070 Ti они равны 2310 и 2610 МГц — то есть, показатели довольно близкие. Впрочем, в играх достигаются частоты вплоть до 2800 МГц.

Как и другие видеокарты, основанные на этом графическом процессоре, модель GeForce RTX 4070 Ti Super оснащена 16 ГБ GDDR6X-памяти, работающей на эффективной частоте 21 ГГц и подключенной по 256-битной шине, что обеспечивает впечатляющую пропускную способность видеопамяти в 672 ГБ/с. В сравнении с обычной GeForce RTX 4070 Ti, у которой 12 ГБ GDDR6X-памяти и 192-битная шина, пропускная способность памяти равна 504 ГБ/с — что представляет собой значительный прирост для Super-модели. Большой объем кэш-памяти в 48 МБ также положительно сказывается во многих сложных вычислительных задачах, вроде аппаратной трассировки лучей и растеризации, особенно в играх и тестах с большим количеством полупрозрачных объектов и частиц.

Все архитектурные улучшения семейства Ada Lovelace были подробно рассмотрены в теоретическом обзоре, где описаны изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик Shader Execution Reordering для изменения порядка выполнения шейдеров. Что касается возможностей работы с видеоданными, функциональность GeForce RTX 4070 Ti Super не отличается от флагманской модели, поддерживая кодирование видео в формате AV1, что повышает эффективность на 40%-50% по сравнению с H.264, и обеспечивает поддержку декодирования видео в разрешении 8K при 60 FPS.

Программные технологии

Первые видеокарты в серии GeForce RTX были представлены в середине 2018 года, и несмотря на то, что развитие экосистемы GeForce RTX не шло так быстро, как ожидалось многими, оно оказалось важным для индустрии. Аппаратное ускорение трассировки лучей внесло значительные улучшения в реалистичность освещения и отражений в играх и профессиональных приложениях. Технология DLSS стала ключевым инструментом для ускорения графических алгоритмов. На данный момент, более чем в 500 играх и приложениях используются различные технологии RTX, включая трассировку лучей, DLSS и другие приложения искусственного интеллекта.

DLSS стала не только технологией масштабирования разрешения, но и способностью вставлять дополнительные кадры, оптимизируя частоту и плавность видеоряда, а также улучшая сложную трассировку лучей через накопление информации и реконструкцию. Эта возможность предоставляет современным решениям Nvidia дополнительное преимущество перед конкурентами и предыдущими поколениями. Версия DLSS 3.5 поддерживает генерацию кадров и реконструкцию лучей.

Совместно с выпуском новых Super-моделей линейки GeForce RTX 40, Nvidia представила обновление программного обеспечения RTX Video HDR. Оно включает ускоренную конвертацию видеороликов формата стандартного динамического диапазона (SDR) в повышенный динамический диапазон (HDR) при помощи тензорных ядер. Этот процесс также приносит улучшения качества изображения с использованием искусственного интеллекта. Несмотря на рост числа оригинальных HDR-видео, многие ролики, созданные ранее, существуют только в формате SDR. Технология тензорных ядер в графических процессорах GeForce RTX обеспечивает эффективную конвертацию в HDR, улучшая яркость, контрастность и цветопередачу.

Современные графические карты от Nvidia предоставляют возможность одновременного использования технологий RTX Video HDR и RTX Video Super Resolution для улучшения детализации, расширения динамического диапазона и других аспектов видеоконтента. Это доступно в Chromium-основанных браузерах, таких как Google Chrome и Microsoft Edge. Для активации технологий RTX Video HDR и Video Super Resolution требуется HDR10-совместимый дисплей, установленные последние видеодрайверы, включенный режим HDR в настройках операционной системы, а также соответствующие параметры в панели управления Nvidia, доступные в разделе «Adjust Video Image Settings».

Видеокарта GeForce RTX 4070 Ti Super предоставляет возможность эффективного использования в профессиональных задачах по созданию цифрового контента. Её высокая производительность по разумной цене, тензорные ядра для ускоренной работы с инструментами искусственного интеллекта, а также аппаратные блоки для ускоренной трассировки лучей поддерживаются в различных 3D-пакетах и движках, таких как Blender Cycles, Redshift, V-Ray, Octane и многих других. Эти возможности позволяют ускорить визуализацию сложных сцен и повысить эффективность работы над проектами по сравнению с аналогичными видеокартами предыдущего поколения.

Предварительная оценка производительности

Давайте проведем теоретическое сравнение характеристик всех трех новых моделей видеокарт серии GeForce RTX 40, основанных на различных чипах линейки AD10x, с некоторыми предыдущими моделями из этого же семейства. Это позволит нам наглядно оценить различия между всеми решениями компании.

	GeForce RTX 4070	GeForce RTX 4070 Super	GeForce RTX 4070 Ti	GeForce RTX 4070 Ti Super	GeForce RTX 4080	GeForce RTX 4080 Super	GeForce RTX 4090
Графический процессор	AD104	AD104	AD104	AD103	AD103	AD103	AD102
Количество мультипроцессоров SM	46	56	60	66	76	80	128
Количество ядер CUDA	5888	7168	7680	8448	9728	10240	16384
Количество блоков TMU	184	224	240	264	304	320	512
Количество блоков ROP	64	80	80	96	112	112	176
Объем L2-кэша, МБ	36	48	48	48	64	64	72
Базовая частота, МГц	1920	1980	2310	2340	2205	2295	2235
Турбо-частота, МГц	2475	2475	2610	2610	2505	2550	2520
Скорость текстурирования, Мтекс/с	455	554	626	689	762	816	1290
Скорость заполнения, Мпикс/с	158	198	209	251	281	286	444
Емкость памяти, ГБ	12	12	12	16	16	16	24
Шина памяти, бит	192	192	192	256	256	256	384
Частота памяти, ГГц	21	21	21	21	22,4	23	21
ПСП, ГБ	504	504	504	672	736	736	1008
Энергопотребление, Вт	200	220	285	285	320	320	450
Цена, $	599	599	799	799	1199	999	1599

На основе теоретических данных становится ясно, что GeForce RTX 4070 Ti Super принесла несколько значительных улучшений по сравнению с предыдущей моделью, GeForce RTX 4070 Ti. Повышение количества мультипроцессоров SM до 66 и увеличение ширины шины чипа AD103 до 256 бит приносит заметный прирост в вычислительной и памятной производительности, что в теории должно отразиться на реальной производительности в играх и других вычислительных задачах.

Однако, на практике прирост производительности GeForce RTX 4070 Ti Super оказался несколько более умеренным, чем предполагалось. Несмотря на 10% прирост вычислительной мощности, новинка демонстрирует ускорение всего на 7% по сравнению с GeForce RTX 4070 Ti. Она остается недостаточно близкой к GeForce RTX 4080, не догоняя последнюю на 10%-12%. Повышение объема памяти и увеличение L2-кэша, хоть и важные характеристики, не всегда оказывают существенное влияние на производительность, особенно в условиях, когда большинству пользователей достаточно текущих значений.

Несмотря на это, обновление линейки видеокарт между поколениями является выгодным шагом для Nvidia и ее партнеров. Super-модели предоставляют более привлекательные варианты для модернизации систем, особенно тех, у кого установлены более старые GPU. Например, GeForce RTX 4070 Ti Super предлагает существенный прирост производительности по сравнению с предыдущим поколением и даже сравнима с GeForce RTX 3090 Ti, что может быть значимым аргументом для пользователей, рассматривающих обновление своих видеокарт.

Согласно тестам от Nvidia, новая модель GeForce RTX 4070 Ti Super значительно превосходит своих предшественников из двух предыдущих поколений. По данным компании, производительность GeForce RTX 4070 Ti Super превышает GeForce RTX 3070 Ti более чем в полтора раза, и при использовании технологии DLSS 3 даже в 2,5 раза. Это важное обновление для владельцев видеокарт уровня GeForce RTX 3060 (Ti), особенно учитывая новую генерацию кадров DLSS 3, доступную только на новой модели.

С точки зрения энергоэффективности, GeForce RTX 4070 Ti Super подтверждает хорошие показатели, близкие к обычной GeForce RTX 4070 Ti, несмотря на увеличенный объем видеопамяти и более крупный GPU. Потребление до 285 Вт делает видеокарту эффективным решением, что является характерным чертом для продуктов Nvidia.

В сравнении с конкурентами, особенно Radeon RX 7900 XT, GeForce RTX 4070 Ti Super превосходит его в растеризации и более чем на 15%-20% в условиях активной трассировки лучей. Эта видеокарта лучше работает в играх с трассировкой лучей, что делает ее привлекательным вариантом для тех, кто ценит высокую производительность в таких условиях. Вопреки более выгодной цене Radeon RX 7900 XT, большинство покупателей, вероятно, предпочтут GeForce RTX 4070 Ti Super за его улучшенные возможности трассировки лучей и поддержку DLSS 3.5.

Однако, несмотря на значительное обновление от GeForce RTX 4070 Ti Super по сравнению с предшественниками, прирост производительности не всегда соответствует высоким ожиданиям. Он составляет всего 6%-7% по сравнению с GeForce RTX 4070 Ti, и основной стимул для выбора этой модели может заключаться в увеличенном объеме видеопамяти до 16 ГБ. Это может быть актуальным для будущих игр и приложений, требовательных к памяти. Тем не менее, GeForce RTX 4070 Ti Super представляет собой хорошее обновление, обеспечивая высокую производительность и улучшенные возможности для геймеров и профессионалов.

Видеокарта Palit GeForce RTX 4070 Ti Super JetStream OC 16 ГБ

Palit Microsystems была основана в 1988 году в Китайской Республике (Тайвань) и является материнской компанией под брендом Palit. Штаб-квартира находится в Тайбэе, Тайвань, с крупным логистическим центром в Гонконге и дополнительным офисом по продажам в Германии. Также есть производственные объекты в Китае. На рынке России с 1995 года, Palit начала свой путь с продаж неименованных продуктов (Noname), а под брендом Palit продукция появилась после 2000 года. В 2005 году компания приобрела торговую марку и активы Gainward после её банкротства, что привело к созданию холдинга Palit Group. Также был открыт дополнительный офис в Шеньжене, ориентированный на китайский рынок. Palit Group включает несколько других брендов.

Объектом исследования является коммерчески доступная видеокарта Palit GeForce RTX 4070 Ti Super JetStream OC с 16 ГБ видеопамяти GDDR6X и 256-битной шиной.

Palit GeForce RTX 4070 Ti Super JetStream OC 16 ГБ 256-битной GDDR6X
Параметр	Значение	Номинальное значение (референс)
GPU	GeForce RTX 4070 Ti Super (AD103)
Интерфейс	PCI Express x16 4.0
Частота работы GPU (ROPs), МГц	2640(Boost)—2790(Max)	2610(Boost)—2805(Max)
Частота работы памяти (физическая (эффективная)), МГц	2625 (21000)	2625 (21000)
Ширина шины обмена с памятью, бит	256
Число вычислительных блоков в GPU	66
Число операций (ALU/CUDA) в блоке	128
Суммарное количество блоков ALU/CUDA	8448
Число блоков текстурирования (BLF/TLF/ANIS)	262
Число блоков растеризации (ROP)	96
Число блоков Ray Tracing	66
Число тензорных блоков	268
Размеры, мм	330×130×65	310×130×70
Количество слотов в системном блоке, занимаемые видеокартой	4	4
Цвет текстолита	черный	черный
Энергопотребление пиковое в 3D, Вт	272	285
Энергопотребление в режиме 2D, Вт	40	40
Энергопотребление в режиме «сна», Вт	11	11
Уровень шума в 3D (максимальная нагрузка), дБА	29,4	34,0
Уровень шума в 2D (просмотр видео), дБА	18,0	18,0
Уровень шума в 2D (в простое), дБА	18,0	18,0
Видеовыходы	1×HDMI 2.1, 3×DisplayPort 1.4a	1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4	4
Питание: 8-контактные разъемы	0	0
Питание: 6-контактные разъемы	0	0
Питание: 16-контактные разъемы	1	1
Вес карты с комплектом поставки (брутто), кг	1,95	2,5
Вес карты чистый (нетто), кг	1,44	2,0
Максимальное разрешение/частота, DisplayPort	3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI	3840×2160@144 Гц, 7680×4320@60 Гц

Память

Графическая карта оборудована 16 ГБ видеопамяти GDDR6X SDRAM, которая распределена между 8 микросхемами, установленными на лицевой стороне печатной платы. Микросхемы памяти, представленные моделями Micron (MT61K512M32KPA-21/D8BZC), спроектированы для номинальной частоты работы в 2625 (21000) МГц.

Особенности карты и сравнение с Palit GeForce RTX 4070 Ti JetStream (12 ГБ)

Palit GeForce RTX 4070 Ti Super JetStream OC (16 ГБ) вид спереди

Palit GeForce RTX 4070 Ti JetStream (12 ГБ) вид спереди

Palit GeForce RTX 4070 Ti Super JetStream OC (16 ГБ) вид сзади

Palit GeForce RTX 4070 Ti JetStream (12 ГБ) вид сзади

Мы проводим сравнение данной видеокарты с моделью того же производителя и серии, но более низкого уровня, и наблюдаем ожидаемые результаты: обе карты практически идентичны, различаясь только установкой двух дополнительных микросхем памяти. Это объясняется тем, что все печатные платы, предназначенные для современных графических процессоров Nvidia с шириной шины обмена с памятью в 192 бита, на самом деле имеют разводку для 256-битной шины. Уменьшенная ширина шины достигается за счет отсутствия двух микросхем памяти.

Графическое ядро обозначено маркировкой AD103-275, а дата выпуска приходится на 48-ю неделю 2023 года.

Справа на боковой части видеокарты мы замечаем установленные посадочные места, аналогичные разъемам питания с 8 контактами. На самом деле эти места предназначены для подключения мощных внешних вентиляторов в системах, использующих профессиональные версии подобных видеокарт. Стоит отметить, что в основе игровых и профессиональных видеокарт часто лежат одни и те же GPU, и различия могут заключаться лишь в объеме памяти, конфигурации рабочих блоков и программном обеспечении.

Общее количество фаз питания для обеих карт Palit составляет 11 (9+2).

Схема питания ядра обозначена зелёным цветом, а памяти — красным. Все контроллеры широтно-импульсной модуляции (ШИМ) размещены на обратной стороне печатной платы.

Девять фаз питания для ядра управляются ШИМ-контроллером uP9512R от uPI Semiconductor, который способен обеспечивать до 12 фаз.

Питанием микросхем памяти управляет ШИМ-контроллер uP9529Q (uPI Semiconductor).

Для преобразователя питания, как это принято в видеокартах Nvidia, применяются транзисторные узлы DrMOS. В данном экземпляре использованы модули SiC653A от компании Vishay Intertechnology, каждый из которых спроектирован для максимального тока до 50 А.

Также на тыльной стороне платы имеется контроллер NCP45491 (On Semi), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Встроенной подсветки на карте отсутствует, следовательно, отсутствует и соответствующий контроллер.

Заводские частоты памяти совпадают с референсными значениями, Boost-частота ядра немного выше референсного значения, а максимальное значение незначительно ниже. Суффикс «OC» в данном случае не имеет смысла. Разница в производительности между этой картой Palit, имеющей заводские частоты, и картой с референсными частотами составляет всего 0,2%, что можно считать пренебрежимо малым.

Потребление энергии карты Palit в тестах достигает 272 Вт.

Невозможность увеличения лимита энергопотребления на данной карте исключает возможность ручного разгона.

Питание карты Palit осуществляется через 16-контактный разъем стандарта PCIe 5.0 (12VHPWR).

В комплекте поставки карты имеется переходник на такой разъем с двух обычных 8-контактных (хорошо всем знакомых).

Несмотря на относительно низкое энергопотребление и легкую нагрузку на адаптер, рекомендуется использовать полноценные блоки питания форм-фактора ATX 3.0 с разъемом 12VHPWR и кабелем, оборудованным 16 контактами для подключения видеокарт нового поколения.

Следует отметить значительные габариты карты, особенно её толщину, которая составляет 6,4 см. В результате видеокарта занимает 4 слота в системном блоке.

GeForce RTX 4070 Ti не поддерживает мультиграфическую конфигурацию через технологию SLI, а также не имеет специального разъема для этой цели на верхнем торце.

Управление функциональностью карты осуществляется с использованием фирменной утилиты Thunder Master. В тестовой версии с сайта Palit (4.14) на момент проведения испытаний не была полностью совместима с новой линейкой Super, однако все операции выполнялись корректно.

Панель разгона позволяет настроить частоты карты, а также задать авторазгон

Панель управления вентиляторами: три вентилятора поделены на 2 блока (2 крайних + 1 центральный), ими можно управлять раздельно

Панель мониторинга состояния карты

Нагрев и охлаждение

Мы наблюдаем использование кулера, разработанного на основе концепции сквозного воздушного потока через заднюю часть радиатора. В качестве основы системы охлаждения выступает массивный многосекционный никелированный радиатор с тепловыми трубками, которые эффективно распределяют тепло по всей поверхности радиатора.

Тепловые трубки жестко припаяны к крупной никелированной медной пластине, которая эффективно охлаждает как графическое ядро, так и микросхемы памяти (через использование термопрокладок). Для эффективного охлаждения преобразователей питания VRM предусмотрена отдельная подошва, установленная на массивной раме, которая прикручена к радиатору (сама рама также выполняет функцию укрепления всей конструкции).

Задняя пластина функционирует исключительно как элемент защиты для PCB и является неотъемлемой частью общей концепции дизайна.

Над радиатором расположен кожух, оснащенный тремя вентиляторами диаметром 100 мм, каждый из которых оборудован 9 лопастями и работает на одной и той же частоте вращения (по умолчанию). Важно отметить, что через программу ThunderMaster можно индивидуально настраивать скорость вращения для центрального вентилятора и двух крайних вентиляторов.

Пластины радиатора разработаны с применением YFormula Fins, что подразумевает различные углы наклона в зависимости от их местоположения в радиаторе. Эта конструкция оптимизирует прохождение воздушного потока и увеличивает общую площадь контакта между воздухом и ребрами радиатора.

Вентиляторы автоматически останавливаются при низкой нагрузке на видеокарту, при условии, что температура GPU опускается ниже 50 градусов, а температура микросхем памяти — ниже 80 градусов. При запуске компьютера вентиляторы начинают функционировать, но после загрузки видеодрайвера происходит мониторинг рабочей температуры, в результате чего они автоматически выключаются. Видеоролик на эту тему доступен ниже.

Мониторинг температурного режима:

После двухчасового тестирования под максимальной нагрузкой температура ядра не превысила 65 градусов, достигнув максимальной отметки в 78 °C в самой горячей точке. Температура микросхем памяти составила 68 градусов, что представляет отличный результат для видеокарт данного уровня. Энергопотребление карты в тестах достигало 272 Вт, учитывая, что безопасный предел нагрева памяти GDDR6X составляет 105 °C.

Запись и ускоренное в 50 раз воспроизведение 8-минутного теста доступны в видеоформате.

Максимальный нагрев наблюдался около слота PCIe, а также около разъема питания.

Шум

Используемая методика измерения шума предполагает, что помещение оборудовано шумоизоляцией и звукопоглощающими материалами, что минимизирует реверберации. Системный блок, включающий видеокарту, не содержит вентиляторов и не является источником механического шума. Фоновый уровень шума в комнате составляет 18 дБА, включая уровень шумомера. Измерения проводятся на расстоянии 50 см от видеокарты, на уровне системы охлаждения.

Режимы измерения:

Режим простоя в 2D: Загружен интернет-браузер с сайтом, окно Microsoft Word, несколько интернет-коммуникаторов.
Режим 2D с просмотром фильмов: Используется SmoothVideo Project (SVP) для аппаратного декодирования с вставкой промежуточных кадров.
Режим 3D с максимальной нагрузкой на ускоритель: Используется тест FurMark.

Оценка уровня шума следующая:

Менее 20 дБА: условно бесшумно.
От 20 до 25 дБА: очень тихо.
От 25 до 30 дБА: тихо.
От 30 до 35 дБА: отчетливо слышно.
От 35 до 40 дБА: громко, но терпимо.
Выше 40 дБА: очень громко.

В режиме простоя в 2D температура не превышала 36 °C, вентиляторы были выключены, уровень шума равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием не произошло изменений.

В режиме максимальной нагрузки в 3D температура достигала 65/78/68 °C (ядро/hot spot/память). Вентиляторы при этом работали на частоте 1339 оборотов в минуту, уровень шума увеличился до 29,4 дБА, что остается в пределах тихого режима работы.

Спектрограмма шума показывает ровную картину без выраженных пиков, способных вызвать раздражение.

Не стоит забывать, что тепло, выделяемое картой, остается внутри системного блока, так что использование корпуса с хорошей вентиляцией крайне желательно.

Подсветка

Карта не имеет подсветки.

Комплект поставки и упаковка

В комплекте поставки кроме традиционного краткого руководства пользователя имеется переходник питания.

Тестирование: синтетические тесты

Мы провели тестирование обновленной видеокарты Nvidia на стандартных частотах в нашем наборе синтетических тестов. Набор тестов постоянно совершенствуется, иногда добавляются новые тесты, а устаревшие постепенно удаляются. Нам важно расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения, мы будем благодарны за обратную связь в комментариях к статье или в личных сообщениях.

Мы внедрили несколько дополнительных тестов для измерения производительности трассировки лучей и использования технологий масштабирования разрешения и повышения производительности: DLSS, FSR и XeSS. Также в наших полусинтетических тестах мы включили несколько подтестов из популярного пакета 3DMark, таких как Time Spy, Port Royal, DX Raytracing, Speed Way и другие. Однако было принято решение исключить примеры приложений DirectX 11 и 12, входящие в различные SDK, так как они часто давали некорректные результаты, делая анализ бессмысленным.

В наших синтетических тестах мы использовали следующие видеокарты:

GeForce RTX 4070 Ti Super со стандартными параметрами.
GeForce RTX 4070 Ti со стандартными параметрами.
GeForce RTX 4080 со стандартными параметрами.
GeForce RTX 3090 Ti со стандартными параметрами.
Radeon RX 7900 XTX со стандартными параметрами.
Radeon RX 7900 XT со стандартными параметрами.

Для анализа производительности новой модели GeForce RTX 4070 Ti Super мы сравнили ее с тремя другими видеокартами этого производителя. RTX 3090 Ti представляет собой флагманскую модель предыдущего поколения, а RTX 4080 и RTX 4070 Ti являются базовыми моделями из текущего семейства. Кроме того, для определения оправданности цены на новинку Nvidia, мы взяли Radeon RX 7900 XT, который хоть и стоит немного дешевле, но может служить аналогом по цене, и топовый Radeon RX 7900 XTX. Сравнение с этими моделями Radeon поможет понять, насколько конкурентоспособна новая видеокарта.

Тесты 3DMark Vantage

Много лет мы внимательно изучаем устаревшие синтетические тесты из пакета 3DMark Vantage, так как они часто предоставляют уникальную информацию, которой не найти в более современных тестах. Feature тесты этого набора поддерживают DirectX 10 и остаются относительно актуальными, что позволяет извлекать полезные выводы при анализе результатов новых видеокарт.

Feature Test 1: Texture Fill

Этот тест направлен на измерение производительности блоков текстурных выборок. Он включает в себя заполнение прямоугольника значениями, считываемыми из небольшой текстуры с применением многочисленных текстурных координат, изменяющихся на каждом кадре.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте от Futuremark обычно демонстрирует высокие показатели, близкие к теоретическим значениям. Однако иногда результаты могут быть немного занижены для некоторых GPU. В случае видеокарты RTX 4070 Ti Super, которая использует урезанную версию графического процессора AD103 по сравнению с AD104, производительность в этом тесте несколько снижена. RTX 4070 Ti Super оказалась ближе к RTX 4070 Ti, превосходя первую всего на 6% и уступая старшей на 12%. Эта небольшая разница в скорости текстурирования вызывает определенные настораживающие моменты.

Сравнение с конкурентами от AMD показывает преимущество видеокарт GeForce. В предыдущих поколениях видеокарт AMD были сильнее в этом тесте, но эффективная скорость текстурирования у нового семейства Radeon немного снизилась. В результате близкие по цене решения Nvidia настигли и, иногда, опередили AMD. RTX 4070 Ti Super обогнала не только Radeon RX 7900 XT, но и приблизилась к флагманской версии XTX, хотя последняя скорее соответствует более мощной RTX 4080.

Feature Test 2: Color Fill

Второй тест измеряет скорость заполнения цветом. В нем используется простой пиксельный шейдер, не представляющий собой ограничение для производительности. Результаты интерполированного цвета записываются во внеэкранный буфер с использованием альфа-блендинга. Для теста применяется 16-битный внеэкранный буфер формата FP16, часто используемый в играх с HDR-рендерингом, делая тест современным и актуальным.

Результаты второго подтеста 3DMark Vantage демонстрируют производительность блоков ROP, не учитывая пропускную способность видеопамяти. Тест измеряет эффективность подсистемы ROP, при этом влияние ПСП обычно остается минимальным. Для новой видеокарты GeForce RTX 4070 Ti Super ситуация примерно такая же, как и в предыдущем тесте, особенно при сравнении с базовой моделью RTX 4070 Ti. В теории они отличаются по скорости подсистемы ROP, однако результаты оказываются схожими. Также RTX 4080 показывает примерно такое же увеличение производительности, как и в предыдущем подтесте.

Однако все три видеокарты Nvidia в этом тесте уступают двум видеокартам AMD — Radeon RX 7900 XT и XTX. Последние обгоняют все решения Nvidia в этой задаче примерно вдвое. Несмотря на это, видеокарты GeForce в синтетических тестах по пиковой скорости заполнения сцены обычно уступают конкурентам. Следовательно, эти результаты не всегда можно однозначно переносить на реальные приложения, и подобные результаты в данном подтесте не вызывают удивления.

Feature Test 3: Parallax Occlusion Mapping

Этот тест является одним из самых интересных feature-тестов, поскольку техника Parallax Occlusion Mapping давно используется в играх. В этом тесте отображается один четырехугольник (точнее, два треугольника) с применением техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Тест включает в себя ресурсоемкие операции по трассировке лучей и использование карты глубины высокого разрешения. Поверхность также подвергается затенению с использованием тяжелого алгоритма Strauss. Этот тест представляет собой сложное испытание для видеочипа, включающее многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по методу Strauss.

Результаты этого теста из пакета 3DMark Vantage зависят не только от скорости математических вычислений, эффективности исполнения ветвлений и скорости текстурных выборок, но и от нескольких параметров одновременно. Важен правильный баланс GPU и эффективность выполнения сложных шейдеров. Этот тест представляет собой полезный бенчмарк, так как его результаты часто коррелируют с производительностью в игровых тестах, больше, чем в случае с некоторыми другими синтетическими бенчмарками.

В данном случае новая модель GeForce RTX 4070 Ti Super показала результат на 8% выше, чем базовая модель RTX 4070 Ti. Это немного отклоняется от теоретической разницы между ними, учитывая, что новинка должна была быть быстрее. RTX 4080, работающий на более мощной версии того же GPU, также демонстрирует прирост производительности в 12%. Однако новинка оказывается ближе к RTX 4070 Ti, чем к RTX 4080. Важно также сравнение с конкурирующими решениями, такими как видеокарты Radeon RX 7900 XT и XTX, где RTX 4070 Ti Super показывает результат, близкий к младшей модели AMD, сопоставимой по цене.

Feature Test 4: GPU Cloth

Четвертый тест представляет интерес, поскольку он моделирует физические взаимодействия (имитацию ткани) при помощи GPU. В нем используется вершинная симуляция с комбинированным применением вершинного и геометрического шейдеров, а также нескольких проходов. Используется stream out для передачи вершин между проходами симуляции. Таким образом, тест оценивает производительность исполнения вершинных и геометрических шейдеров, а также скорость передачи данных через stream out.

Скорость рендеринга в этом тесте зависит от нескольких параметров, прежде всего от производительности обработки геометрии и эффективности выполнения геометрических шейдеров. В прошлом, сильные стороны чипов Nvidia должны были проявиться, но тест давно предоставляет некорректные результаты. Сначала это затрагивало только GeForce, но с течением времени видеокарты Radeon также столкнулись с этой ситуацией. Более новые драйверы AMD привели к низким результатам, и, следовательно, все GPU показывают в этом тесте некорректные результаты, не соответствующие ни по каким параметрам теоретическим ожиданиям. Это, вероятно, связано с отсутствием оптимизаций драйверов для устаревшего тестового пакета.

Feature Test 5: GPU Particles

Этот тест представляет физическую симуляцию эффектов, основанных на системах частиц, рассчитываемых графическим процессором. Используется вершинная симуляция, где каждая вершина представляет собой отдельную частицу. Stream out также применяется с целью передачи данных между проходами симуляции. В тесте рассчитывается несколько сотен тысяч частиц, каждая анимируется индивидуально, а также учитываются их столкновения с картой высот. Геометрический шейдер используется для отрисовки частиц, создавая четыре вершины из каждой точки, образуя частицу. Большую нагрузку представляют шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage также наблюдаются результаты, которые далеки от теоретически ожидаемых. Однако они ближе к действительности по сравнению с предыдущим подтестом этого бенчмарка. Если считать результаты корректными, то видеокарта Super-линейки показала практически такой же результат, как и базовая модель Ti. В то время как RTX 4080 оказалась заметно более быстрой. Пара Radeon, конкурирующая с рассматриваемой видеокартой, в этом подтесте также проигрывает видеокартам Nvidia, что, вероятно, объясняется недостаточной оптимизацией драйверов AMD. Тем не менее, результаты в целом также вызывают сомнения.

Feature Test 6: Perlin Noise

Последний feature-тест из пакета Vantage является математически интенсивным тестом GPU, в котором рассчитываются несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для создания дополнительной математической нагрузки на видеочип. Perlin noise — это стандартный алгоритм, широко применяемый в процедурном текстурировании, и он включает в себя множество математических вычислений.

В этом математическом тесте производительность всех решений, хотя и не полностью соответствует теории, но обычно близка к пиковой производительности видеочипов в экстремальных задачах. Тест включает операции с плавающей запятой, и новые архитектуры Ada Lovelace и RDNA3 должны были раскрывать часть своих уникальных возможностей в двойном исполнении соответствующих команд. Однако следует отметить, что этот тест устарел и не полностью способен выявить новые способности современных GPU, как следует судя по сравнительным результатам.

Средняя модель Super-линейки в семействе GeForce RTX 40 продемонстрировала ожидаемый результат, находясь между базовой моделью и старшим вариантом с тем же GPU. При этом RTX 4070 Ti превзошла базовую модель всего на 5%, что опять же ниже теоретической разницы, а в сравнении со старшей моделью RTX 4080, основанной на более мощном чипе, новинка отстала значительно — на 14%. Что касается конкурирующих моделей Radeon с близким ценовым позиционированием, то новая модель Nvidia показала скорость примерно посередине между RX 7900 XT и XTX. В следующем разделе мы рассмотрим более современные синтетические тесты, которые предоставляют более высокую нагрузку на GPU.

Тесты Direct3D 12

Мы решили исключить примеры из DirectX SDK компании Microsoft и из SDK компании AMD, использующие графический API Direct3D12, из наших тестов, поскольку давно они показывают некорректные результаты в большинстве случаев. В данном разделе единственным вычислительным тестом с поддержкой Direct3D12, который остался, является известный бенчмарк Time Spy из 3DMark. Нас интересует не только общее сравнение мощности GPU, но и разница в производительности при включенных и выключенных возможностях асинхронных вычислений, появившихся в DirectX 12. Для подтверждения достоверности мы протестировали видеокарты в двух графических тестах.

Если рассматривать производительность новой модели GeForce RTX 4070 Ti Super в данной задаче по сравнению с базовой видеокартой RTX 4070 Ti, заметно, что улучшенная видеокарта оказалась всего лишь немного быстрее — прирост составил 3%-8%. Это значительно ниже теоретической разницы между ними. Старшая модель RTX 4080 продемонстрировала более значительный прогресс, возможно, связанный с различиями в максимальном энергопотреблении: 320 Вт у RTX 4080 против 285 Вт у RTX 4070 Ti Super. Возможно, именно из-за этого ограничения новая модель не смогла достичь более высокой производительности.

Видеокарты Radeon в данном тесте обычно показывают себя лучше конкурирующих GeForce по цене, но это не всегда отражается на реальной производительности в играх. В данном случае более доступная модель Radeon RX 7900 XT продемонстрировала немного более высокую производительность, что может указывать на то, что в растеризации решения AMD могут оказаться более эффективными. На очереди тесты трассировки лучей, в которых GeForce традиционно проявляют свою силу.

Тесты трассировки лучей

Один из ранних тестов производительности трассировки лучей — бенчмарк Port Royal от создателей известных тестов 3DMark. Этот бенчмарк совместим с графическими процессорами, поддерживающими DirectX Raytracing API. Мы провели проверку нескольких видеокарт при разрешении 2560×1440 с различными настройками, включая расчет отражений при помощи трассировки лучей в двух режимах, а также традиционный метод, используемый при растеризации.

Бенчмарк лишь частично демонстрирует базовые возможности трассировки лучей через DXR API, используя алгоритмы отрисовки отражений и теней с использованием этой технологии. Тест не идеально оптимизирован и оказывает значительную нагрузку на даже мощные GPU. Однако он подходит для сравнительного анализа производительности различных GPU в области трассировки лучей.

Результаты теста наглядно демонстрируют различия в подходах компаний AMD и Nvidia к аппаратному ускорению трассировки лучей. Несмотря на некоторое улучшение RDNA3 от AMD, разница остается заметной. RTX 4070 Ti Super расположилась между RTX 4070 Ti и RTX 4080, приближаясь к первой. Интересный момент — сравнение с предыдущим флагманом RTX 3090 Ti, который уступил новинке во всех режимах. Решения AMD пока отстают, но справляются с трассировкой лучей весьма неплохо, особенно флагман RX 7900 XTX, который демонстрирует схожую производительность с RTX 4070 Ti Super в этом тесте. Сравнительно RX 7900 XT отстает, как и ожидалось.

В данном тесте трассировки лучей, особенно важен аппаратный уровень поддержки. GeForce продемонстрировали высокую эффективность благодаря выделенным RT-ядрам, которые выполняют значительную часть работы и остаются более универсальными. В условиях активации трассировки лучей, Nvidia обычно остаются заметно производительнее благодаря этим RT-ядрам по сравнению с ядрами Ray Accelerator и обычными SIMD-ядрами конкурента AMD. Однако в реальных играх, где нагрузка на RT-блоки меньше, разница может быть менее выраженной, и Radeon не так уступают.

Новинка RTX 4070 Ti Super показала небольшой прирост производительности по сравнению с базовой моделью RTX 4070 Ti, всего лишь около 6%, что оказалось ниже предварительных ожиданий. RTX 4080 продемонстрировала заметно более высокую производительность. Старший RTX 3090 Ti отстал от новых решений, подчеркивая прогресс в технологиях. Видеокарты AMD, в свою очередь, существенно уступили RTX 4070 Ti Super, особенно старшая модель Radeon. В синтетических тестах такого рода, результаты могут не полностью соответствовать реальным условиям, например, в играх, где трассировка лучей применяется более эффективно.

С выходом новых поколений графических процессоров в 2022 году, был добавлен еще один тест в пакет 3DMark, называемый Speed Way, который представляет собой более реалистичную нагрузку на трассировку лучей, аналогичную тем, которые активно используются в современных играх. Этот тест интересен для более точной оценки производительности GPU в условиях активной трассировки лучей.

Выбранные разрешения в тестах показали приемлемые частоты кадров только для наиболее мощных GPU. Заметно уменьшилась разница между видеокартами Radeon и GeForce, при этом модели AMD не так сильно уступают конкурентам по цене. RTX 4070 Ti Super располагается посередине между базовой RTX 4070 Ti и старшей RTX 4080 в тесте, где RTX 4080 вырывается вперед с небольшим отрывом. Интересно отметить, что в этом тесте RTX 3090 Ti опережает RTX 4070 Ti, но новая модель превосходит обе представленные видеокарты. Важно, что не только Radeon RX 7900 XT, но и RX 7900 XTX немного, но уступают RTX 4070 Ti Super, даже в более высоком разрешении.

Рассмотрим еще один бенчмарк на реальном игровом движке. Boundary, китайский проект с поддержкой технологий DXR и DLSS, предоставляет тест с серьезной нагрузкой на GPU. В этом бенчмарке трассировка лучей активно используется для сложных отражений, мягких теней и глобального освещения. Заметим, что технологии DLSS в тестах с Radeon нельзя использовать.

4K-разрешение оказалось неиграбельным без включения масштабирования на всех рассмотренных видеокартах. Даже в Full HD-разрешении без использования технологии DLSS приемлемую производительность показывают лишь достаточно мощные GPU. В данном сценарии даже топовая видеокарта от AMD уступает всем видеокартам GeForce, включая базовую RTX 4070 Ti и предыдущую топовую RTX 3090 Ti. Рассматриваемая сегодня видеокарта Nvidia лишь незначительно опережает базовую модель RTX 4070 Ti и заметно уступает RTX 4080. Однако RTX 3090 Ti вновь обгоняется с запасом.

Скоростные показатели видеокарт Radeon вновь подчеркивают, что в тестах трассировки лучей решения AMD не способны держаться наравне с GPU от Nvidia. RTX 4070 Ti Super в таких задачах значительно опережает даже самую мощную Radeon RX 7900 XTX, не говоря уже о более близком по цене конкуренте.

С включением масштабирования разрешения через технологию DLSS даже флагманская видеокарта из линейки RTX 30 в состоянии обеспечивать достаточную частоту кадров для игры в 4K-разрешении, хотя даже GeForce RTX 4080 не достигает 60 FPS. Новая модель RTX 4070 Ti Super продемонстрировала более чем 10% увеличение производительности по сравнению с RTX 4070 Ti, что позволяет наслаждаться играми даже в 4K-разрешении, несмотря на то, что Nvidia рекомендует разрешение 2560×1440 для этой видеокарты. RTX 4080, хоть и немного быстрее новинки, уже устарела и была снята с продажи, уступив место RTX 4080 Super.

Давайте рассмотрим еще один бенчмарк, написанный на китайской игре — Bright Memory. Интересно отметить, что оба теста показывают схожие результаты и качество изображения, несмотря на различия в тематике. Однако этот бенчмарк оказывается более требовательным, особенно к производительности в области трассировки лучей. К сожалению, он не работает на видеокартах AMD, требуя конкретно карты Nvidia GeForce RTX.

В данном тесте обновленная модель Ti Super, основанная на урезанной версии графического процессора AD103, демонстрирует результат, располагаясь между базовой версией RTX 4070 Ti и более мощной RTX 4080. Это немного отличается от предыдущих данных. Тем не менее, в этом тесте RTX 3090 Ti также проявляет себя отлично, особенно в высоком разрешении. Здесь важны параметры ПСП (поверхность в секунду) и объем видеопамяти, которые у современных видеокарт обычно урезаны. RTX 4070 Ti Super добавляет от 8% до 10% по сравнению с RTX 4070 Ti и превосходит RTX 3090 Ti в низком разрешении, демонстрируя идентичный результат в 4K — что представляет собой очень высокий уровень производительности.

Вычислительные тесты

Мы продолжаем исследования для поиска бенчмарков, в которых используется OpenCL для решения современных вычислительных задач. Наша цель — включить их в состав нашего набора синтетических тестов. На данный момент в этом разделе представлен довольно старый и неоптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот тест, ориентированный на кроссплатформенное использование, основан на LuxRender и использует OpenCL.

Новая модель GeForce RTX 4070 Ti Super, построенная на основе урезанной версии AD103, обладает значительным количеством вычислительных блоков. Неудивительно, что она значительно превзошла базовую модель RTX 4070 Ti, хотя разница между ними снова ниже, чем ожидалось согласно теории. Все современные GPU ограничиваются пределом энергопотребления, который для новинки не превышает уровня RTX 4070 Ti. Что касается старшей модели видеокарты RTX 4080, то ее более высокий предел энергопотребления также способствует более высокой производительности. Тем не менее, RTX 4070 Ti Super уверенно опережает даже некогда флагманскую RTX 3090 Ti. Видеокарты AMD в этом тесте исторически не показывают себя наилучшим образом, и даже Radeon RX 7900 XTX уступает рассматриваемой новой Super-модели от Nvidia.

Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark. Этот тест трассировки лучей без применения аппаратного ускорения раскрывает потенциал GPU в сложных вычислениях и может демонстрировать преимущества новых видеокарт. Ранее мы использовали разные версии бенчмарка, предоставляющие результат в виде времени, затраченного на рендеринг, и количества миллионов просчитанных путей в секунду. Однако в наших текущих тестах осталась только первая версия, измеряющая время рендеринга.

Этот тест, также основанный на программном расчете трассировки лучей, выявил, что новая модель GeForce RTX 4070 Ti Super значительно опережает не только RTX 3090 Ti и базовую модель RTX 4070 Ti, но также приближается к уровню производительности RTX 4080. Вероятно, в данном случае энергопотребление GPU не достигает своего максимального предела, а значительное влияние оказывают объем кэш-памяти и основной видеопамяти, как мы ранее отмечали. Исключительно важно, что даже флагманская видеокарта AMD Radeon отстает далеко позади.

Перейдем к еще одному приложению для рендеринга — OctaneRender. Этот популярный рендерер поддерживает технологии CUDA и RTX, а версия OctaneRender 2020.1.5 получила поддержку архитектуры Ampere. В бенчмарке, основанном на OctaneRender, можно отключить RTX-ускорение и провести тест производительности в нескольких сценах с различной нагрузкой. К сожалению, этот тест не поддерживает OpenCL. Приведем общее количество баллов:

Обновленная модель GeForce RTX 4070 Ti Super продолжает демонстрировать свою превосходную производительность, опережая даже предыдущий флагманский представитель линейки. Это ожидаемый результат, особенно в условиях включенного аппаратного ускорения RTX, которое значительно улучшает результаты с применением архитектуры Ada Lovelace. В тестах вычислительной производительности новая RTX 4070 Ti Super показывает результаты, близкие к RTX 4080, а не RTX 4070 Ti, с заметным преимуществом от 13% до 18%. Здесь разница, скорее всего, не обусловлена ограничениями по энергопотреблению, а, вероятно, связана с различной пропускной способностью видеопамяти, которая у новинки заметно выше, чем у базовой RTX 4070 Ti. Это также может быть одной из причин близости к RTX 4080.

Недавно вышла новая версия популярного бенчмарка для 3D-рендеринга — Cinebench 2024 от компании Maxon. Этот бенчмарк предоставляет возможность оценить вычислительные способности как процессора, так и видеокарты, используя сложные алгоритмы и сцены, адаптированные из программы Cinema 4D и движка рендеринга Redshift. Результаты тестирования могут быть сравнены между собой.

В последнем тесте программной трассировки лучей GeForce RTX 4070 Ti Super продолжает демонстрировать свою выдающуюся производительность, превосходя базовую модель RTX 4070 Ti с заметным преимуществом в 17%. Даже более мощная модель RTX 4080, которая ушла с рынка, не существенно опережает новинку. Важно отметить, что предыдущий флагман, RTX 3090 Ti, смог обойти только RTX 4070 Ti, но не новую RTX 4070 Ti Super.

Ещё более значимо, что конкурирующие видеокарты Radeon показали заметно более низкие результаты. Усиление темпа выдачи инструкций в новой графической архитектуре RDNA3 не проявилось должным образом в этом тесте, и общая производительность увеличилась незначительно, оставаясь далекой от теоретически ожидаемой. Младшая модель Radeon отстаёт почти вдвое, а флагманский Radeon имеет существенный отрыв по скорости от RTX 4070 Ti Super.

Тесты технологий DLSS/XeSS/FSR

В данном разделе мы проводим дополнительные тесты, ориентированные на технологии повышения производительности. Изначально это касалось только технологий масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS). Позднее к ним добавилась технология генерации промежуточных кадров — DLSS 3, а затем и версия 3.5 с реконструкцией лучей при использовании трассировки лучей.

Мы начали с включения в наши материалы тестов DLSS, хотя ранее проводились эксперименты с этой технологией в приложениях, использующих трассировку лучей. Мы пришли к выводу, что проведение отдельных тестов в данном направлении будет полезным. Результаты тестирования нескольких GPU в разрешении 4K с применением различных уровней качества DLSS, включая генерацию кадров (обозначенную как FG), представлены на диаграмме.

Без включения технологии DLSS видеокарты рендерили изображение в полном разрешении, что значительно снижало общую производительность, доводя частоту кадров до уровня 30-40 FPS в разрешении 4K — величина, недостаточная для комфортного игрового опыта. Однако, при активации DLSS на максимальном уровне производительности, частота кадров становилась более чем достаточной, даже для топовой модели предыдущего поколения RTX 3090 Ti, не обладающей поддержкой генерации дополнительных кадров. Рассматриваемая модель RTX 4070 Ti Super продемонстрировала высокую производительность, превосходя уровень RTX 3090 Ti без учета генерации кадров и заметно опережая его при ее включении.

Одним из сильных конкурентных преимуществ современных видеокарт Nvidia стала поддержка технологии DLSS 3.0 в графической архитектуре Ada Lovelace. Эта технология объединяет функционал DLSS 2.x с генерацией промежуточных кадров, что позволяет повысить плавность видеоряда при небольшом увеличении задержек управления. Включение генерации промежуточных кадров приносит прирост в FPS еще раза в полтора. Таким образом, при поддержке DLSS видеокарты могут использовать более высокое разрешение рендеринга, приближая производительность в режимах без и с генерацией кадров.

XeSS — это еще одна технология повышения производительности, предложенная Intel, которая также использует рендеринг в меньшем разрешении и масштабирование изображения. Этот метод, подобно DLSS 2.0, включает искусственный интеллект для восстановления деталей в кадре. Отличительной особенностью XeSS является его совместимость со всеми современными GPU, хотя эффективность на картах Intel может быть более высокой. Для тестирования использовался специализированный бенчмарк из пакета 3DMark.

Включение технологии XeSS существенно повысило частоту кадров, достигая уровня в два и более раза. Благодаря своей универсальности, эта технология заслуживает внимания, учитывая наличие собственных методов и ускоряющих блоков у каждой из трех компаний. Однако у каждой технологии есть свои недостатки: DLSS, хоть и самая продвинутая, работает исключительно на продукции Nvidia; FSR, самая универсальная, при этом менее продвинута и не использует специализированные блоки; XeSS, хоть и универсальна, отстает от DLSS как по качеству, так и по функциональности.

В данном тесте модель GeForce RTX 4070 Ti Super, хоть и работает заметно эффективнее базовой RTX 4070 Ti, что соответствует ожиданиям, ближе к ней, чем к старшей RTX 4080. Однако особенно удивительным и даже поразительным является неэффективное выполнение видеокартами Radeon RX 7900 XT и XTX. Эти видеокарты AMD в данном тесте значительно уступают, поскольку RTX 4070 Ti Super обходит даже более дорогую флагманскую модель Nvidia. Возможно, характеристики сцены лучше соответствуют решениям Nvidia.

Еще одним представителем семейства технологий масштабирования рендеринга является FSR 2.0 от AMD. По каким-то причинам именно эта технология стала последней в списке подтестов 3DMark. К сожалению, сцены, использующие разные методы масштабирования, в большинстве случаев различаются, что делает их непосредственное сравнение затруднительным. Мы можем оценивать только по росту производительности, учитывая разрешение рендеринга и разницу в качестве, что сложно сравнивать напрямую.

FSR — это еще одна универсальная технология, которая работает на различных графических процессорах примерно одинаково, и в тестах FSR 2.0 не обнаруживается ничего особенного. Radeon RX 7900 XTX проявляет себя гораздо сильнее, но при этом стоит заметно дороже RTX 4070 Ti Super, что делает его более сравнимым с GeForce RTX 4080 Super. Сегодняшняя модель RTX 4070 Ti Super, несмотря на то что явно уступает топовым видеокартам AMD, должна превзойти своего ближайшего конкурента RX 7900 XT, особенно в тестах с включенной технологией FSR. Теперь перейдем к игровым тестам новой видеокарты Nvidia, чтобы оценить, насколько RTX 4070 Ti Super превосходит базовую модель без суффикса «Super» в реальных условиях, а не только в синтетических испытаниях.

Тестирование: игровые тесты

Конфигурация тестового стенда

Компьютер на базе процессора Intel Core i9-13900K (Socket LGA1700):
- Платформа:
  - процессор Intel Core i9-13900K (разгон до 5,4 ГГц по всем ядрам);
  - ЖСО Cougar Helor 360;
  - системная плата Asus ROG Strix Z790-A Gaming WiFi D4 на чипсете Intel Z790;
  - оперативная память TeamGroup Xtreem ARGB White (TF13D416G5333HC22ADC01, CL22-32-32-52) 32 ГБ (2×16) DDR4 5333 МГц;
  - SSD Intel 760p NVMe 1 ТБ PCIe;
  - SSD Intel 860p NVMe 2 ТБ PCIe;
  - блок питания ThermalTake Toughpower GF3 1000W;
  - корпус Thermaltake Level20 XT;
- операционная система Windows 11 Pro 64-битная;
- телевизор LG 55Nano956 (55″ 8K HDR, HDMI 2.1);
- драйверы AMD версии 24.1.1;
- драйверы Nvidia версии 551.22;
- драйверы Intel версии 101.5125;
- VSync отключен.

Список инструментов тестирования

Во всех игровых тестах использовалось максимальное качество графики в настройках.

Marvel’s Spider-Man Miles Morales (Insomniac Games/Sony Interactive)
Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 2.01 (сентябрь 2023 г.)
God of War (Sony IE/Sony IE)
Call of Duty: Modern Warfare II (Infinity Ward/Activision)
Alan Wake 2 (Remedy/Epic Games)
Ratchet and Clank: Rift Apart (Insomniac Games/Sony/Софтклаб)
A Plague Tale: Requiem (Asobo Studio/Focus Entertainment)
Hogwarts Legacy (Avalance Software/Warner Bros)
Avatar: Frontiers of Pandora (Ubisoft)
Atomic Heart (Mundfish/VK)

Кратко о производительности в 3D-играх

Перед тем как предоставить более детальные тесты, предоставим краткую оценку производительности для данного семейства видеокарт, включая рассматриваемую модель, а также ее конкурентов. Наша оценка является субъективной и основывается на шкале из семи градаций.

Игры без применения трассировки лучей (используется классическая технология растеризации):

В многих сценариях с разрешениями 2K, 2.5K и даже 4K в классических играх общая производительность часто ограничивается не только видеокартой, но и другими компонентами системы, в основном центральным процессором. Это применимо и к рассматриваемой видеокарте Palit (а также ко всем другим картам на базе GeForce RTX 4070 Ti Super). С данной картой можно достичь полной комфортности в играх при любом из упомянутых разрешений, даже при максимальных графических настройках (без учета RT и/или DLSS/FSR/XeSS).

Игры с использованием трассировки лучей и технологий DLSS/FSR/XeSS:

Включение технологии трассировки лучей (RT) снижает общую производительность, однако уже широко применяемые в многих играх технологии Nvidia DLSS, AMD FSR (а также Intel XeSS) значительно помогают компенсировать этот спад скорости. Таким образом, для мощных видеокарт, таких как GeForce RTX 4070 Ti Super, все предыдущие оценки остаются в силе. При этом даже GeForce RTX 4070 Ti (без суффикса «Super») опережает флагман AMD последнего поколения — Radeon RX 7900 XTX.

Результаты тестирования в 3D-играх

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1080, 2560×1440 и 3840×2160

Marvel’s Spider-Man Miles Morales

Cyberpunk 2077 2.01

God of War

Call of Duty: Modern Warfare II

Alan Wake 2

Ratchet and Clank: Rift Apart

A Plague Tale: Requiem

Hogwarts Legacy

Avatar: Frontiers of Pandora

Atomic Heart

Выводы и сравнение энергоэффективности

Nvidia GeForce RTX 4070 Ti Super (16 ГБ) — в настоящее время занимает четвертое место по производительности среди флагманских игровых видеокарт от Nvidia. На более высоких позициях располагаются GeForce RTX 4080, GeForce RTX 4080 Super и GeForce RTX 4090. Однако учитывая вывод с рынка модели GeForce RTX 4080 (которую заменяет GeForce RTX 4080 Super), GeForce RTX 4070 Ti Super скоро займет место в тройке самых быстрых игровых ускорителей.

Его производительность находится где-то посередине между GeForce RTX 4070 Ti и GeForce RTX 4080. Его главная цель — заполнить пробел между новыми моделями GeForce RTX 4070 Super и GeForce RTX 4080 Super после вывода с рын