精准的加减法 AX电竞叛客GeForce RTX 4070 Ti SUPER X3W MAX评测
- +1 你赞过了
【雷竞技须安全稳定 DIY硬件频道】进入2023年1月下旬,RTX 40 SUPER系列显卡的正式揭晓已经来到第二步:RTX 4070 Ti SUPER。它在系列中不同寻常地将“Ti”与“SUPER”两个名称后缀叠加起来,且被NVIDIA定位为在性能、功耗、游戏、生产力、AI应用等领域达成平衡的产品。它能否达成这一目标?相信通过接下来的评测你能找到答案。
我们近期收到了同样来自AX电竞叛客的这款GeForce RTX 4070 Ti SUPER X3W MAX,与前不久的RTX 4070 SUPER X3W MAX相同,它依然采用本代以白色调外观与圆滑外壳过渡为特点的外观设计,拥有三风扇散热的同时具备较为轻薄的体型,在中高端定位的显卡里尤为难得。
包装内依然附赠了双8Pin转12VHPWR电源线、设计独特的螺丝刀兼显卡支架、个性化风格贴纸等配件。保持着6499元,与此前RTX 4070 Ti相同的官方MSRP价格,它的性价比究竟如何?让我们通过游戏、生产力、AI等方面的具体评测来了解。
架构分析
与近一年前发布的RTX 40系同代产品类似,RTX 4070 Ti SUPER基于新一代 NVIDIA Ada Lovelace 架构,这一架构采用新型多单元流处理器、第3代 RT Core和第4代 Tensor Core。核心基于全新定制台积电4N 制程工艺构建而成,拥有更高运行频率且内建大容量L2缓存,凭借多种能力为用户带来更流畅的光线追踪表现与全新创作方式。
最新的2.57.0版本GPU-Z已经可以显示RTX 4070 Ti SUPER的各项规格参数。可以看出它与RTX 4070 Ti不同,基于在RTX 4080与RTX 4090 Laptop中应用的AD103核心,搭载66组多单元流处理器、8448个CUDA核心、264个Tensor核心、66个RT核心。显存规格更为醒目,拥有与RTX 4080近似的16GB GDDR6X 256bit显存,仅在显存频率与总带宽上略低,拥有4K分辨率游玩3A大作与更多应用的能力。
可以看出,RTX 4070 Ti SUPER在核心规格上比RTX 4070 Ti提升约10%,在部分项目例如光栅单元ROPs有20%的提升,显存方面更是拥有跨越式升级。但我们还会产生一个疑问,同样基于AD103核心,它比RTX 4080少了些什么?
DIY玩家总爱谈到“精准刀法”,但老黄究竟刀在了哪?Ada架构中一些计算单元间的关系能够帮助我们解答此类问题。
这是一张Ada Lovelace架构的标准GPC(图形处理簇)图,从中我们可以看出RTX 40系显卡中各式计算单元间的数量与组合关系,例如每个GPC带有16个ROPs(光栅单元);每个TPC(纹理处理簇)包括2组多单元流处理器;每组多单元流处理器会带有1个RT核心、128个CUDA核心,这是架构本身的特性。
但我们会注意到,并不是每个GPC中都一定包含6个TPC,一些RTX 40系显卡拥有的TPC数量不是6的倍数,进而使得多单元流处理器数量不是12的倍数,RTX 4070 Ti SUPER正属于这种情况。
RTX 4070 SUPER配备的5TPC GPC
GPU-Z信息告诉我们,RTX 4070 Ti SUPER拥有96个ROPs,这意味着它的AD103核心为6个GPC,但通过多单元流处理器计算可知拥有33个而不是标准的36个TPC。而RTX 4080拥有112个ROPs、7个GPC,同时TPC数量也不是标准的42个,而是38个。
可以看出,通过配备标准与非标准的GPC组合,RTX 40系显卡能够调整不同型号对光栅、光追、FP32/INT32、张量计算等处理性能的倾向性。读者只需了解,ROPs数量与GPC相关,而其它主要衡量RTX 40系显卡规格的参数均与TPC数量相关即可。
综合以上我们对Ada架构的介绍,以及RTX 4070 Ti SUPER和RTX 4080的各计算单元数关系,不难看出它们的差异主要在于核心减少了1个GPC,而这个GPC包含5个TPC、10个多单元流处理器,16个ROPs(光栅单元)。换句话说即使核显、L2缓存、显存等规格有所降低,RTX 4070 Ti SUPER保留了更多与通用运算、AI相关的处理单元,也难怪NVIDIA将其定义为更平衡的AI应用选择。
外观设计
回到我们手头上的显卡,AX电竞叛客GeForce RTX 4070 Ti SUPER X3W MAX可以说再次凭借美观独特的白色系设计风格吸引了我们的目光。新一代设计语言以白色为主色调,辅以灰色边框与金属背板点缀,并且多处融入圆弧形设计,在光影中带来更多质感变化,整体视觉富有层次感。
散热方面,AX电竞叛客RTX 4070 Ti SUPER采用PUNK MAX 3.0模组,配备6根纯铜复合热管、大面积鳍片与纯铜底座,以及9叶片9cm环形三风扇,可快速传导、发散GPU核心与显存等元件热量,实现更好的低噪音散热效果。
PCB采用NVIDIA公版标准,11+2相供电设计,并采用了日系固态电容、铁素体电感等标准用料。
显卡三围为325*119*52mm,轻薄的2.5槽设计。侧面采用新式12VHPWR电源接口,并配备带有RGB等效的装饰侧板,为玩家机箱增添光效观感。
尾端的“SUPER”铭牌依旧为素白的表面设计提供一抹亮色。
来到显卡背面,采用不规则圆孔风格的新设计风格提供了大面积的风道空间。
理论性能
接下来,我们通过一些基准测试来简单了解这款AX电竞叛客RTX 4070 Ti SUPER的理论性能。
我们使用的测试平台部分配置如下:
首先我们使用3DMARK运行Time Spy(DX12)、Fire Strike Extreme(DX11)、Port Royal(光线追踪)这三项以2K分辨率运行的基准测试。并将其与前代旗舰RTX 3090 Ti、本代RTX 4070 Ti的跑分结果一起参考。
可以看出,得益于更高规格的核心,RTX 4070 Ti SUPER在三个2K分辨率项目中优势更为明显,超越了原本与RTX 3090 Ti互有来回的RTX 4070 Ti约10%-15%。
而作为一款显存容量增至16GB、位宽提升至256bit、带宽高达672.3GB/s的显卡,它的4K性能表现也十分关键,我们测试了4K分辨率的Time Spy Extreme与Fire Strike Ultra,并让它与前代旗舰RTX 3090 Ti、本代更高定位的RTX 4080同台竞技。
如果说此前的RTX 4070 Ti相比RTX 3090 Ti在2K分辨率小胜、4K分辨率棋差一招,那么获得更高显存规格的RTX 4070 Ti SUPER,终于在各项理论测试中对比RTX 3090 Ti完全胜出,4K分辨率下领先幅度约为4%-8%,而TGP功耗维持285W不变,仅相当于对手的63%。此外,RTX 4070 Ti SUPER在4K分辨率下能够提供相当于RTX 4080约83%-86%的理论性能,表现优异。
为了验证AX电竞叛客RTX 4070 Ti SUPER X3W MAX的散热表现,我们进行了30分钟FurMark烤机测试,实测整卡功耗稳定在285W左右,核心功耗约265W,在约25摄氏度室温环境中,GPU核心温度与显存温度分别为66.3摄氏度与66.0摄氏度,热点温度最高约为80摄氏度,以一张2.5槽厚度的显卡来说表现不错。
进入2024年,NVIDIA RTX与DLSS等技术的应用依然处在高速扩展中,RTX 40系显卡的核心卖点之一——DLSS 3目前已经在70个游戏与应用中获得支持。理论测试的最后我们使用3DMARK中的DLSS功能测试,来体验DLSS 3包含的超分辨率、帧生成等技术为游戏流畅性提供的加成。
我们使用3DMARK NVIDIA DLSS功能测试,在4K分辨率下开启DLSS 3质量档,获得了近2倍的平均帧数提升,观察监控Log图可见,前半段不开启DLSS的对比部分CPU频率大幅波动,表明演示内容处于显卡瓶颈状态,因此CPU负载不稳定,开启DLSS 3后则能够完全发挥CPU、GPU两个核心硬件的性能。
游戏实测
接下来进入游戏实测的环节,我们选用了几款支持DLSS 3与光线追踪的游戏,还有一款主流FPS网游,用于测试DLSS 3与Reflex功能,让我们一起看看RTX 4070 Ti SUPER能否在本身更高的硬件规格,以及NVIDIA游戏增强技术加持下,挑战4K分辨率高画质游戏体验。
首先是一些游戏内自带Benchmark测试,包括我们熟悉的高压力光追游戏《赛博朋克2077》与压力较低的《古墓丽影:暗影》,测试均运行在4K分辨率。
《赛博朋克2077》
在预设的光线追踪:超级档位下,我们关闭DLSS相关功能进行游戏内自带跑分,测得平均帧数为25.72帧,最低帧20.83帧。
而开启DLSS 3相关功能,并设为“质量”档后,测得平均帧数为56.44帧,最低帧27.99帧,有大幅度提升,也基本达到了4K60帧流畅游玩标准,玩家可以酌情降低部分画质设置,以获得更稳定的流畅体验。
《古墓丽影:暗影》
在预设全高画质中,关闭DLSS相关功能,测得平均帧数115帧,已经非常流畅,能够基本满足搭配4K高刷新率显示器。
而在开启DLSS后,测试结果平均帧数进一步提升至162帧,搭配市面上诸多4K144Hz以上显示器更加流畅爽快。
接下来的游戏实测均采用预设全高画质、3840*2160分辨率,数据来自NVIDIA FrameView软件记录,标注中“DLSS ON”表示开启包括超级分辨率、帧生成、Reflex在内的DLSS 3相关功能,档位均设置为“质量”。
《赛博朋克2077》
首先是显卡测试常驻嘉宾《赛博朋克2077》,实测在开启包括帧生成技术的DLSS 3功能后,游玩的平均帧数、1%Low帧均能够获得翻倍以上的提升,达到60帧流畅游玩的水平,表现甚至优于游戏内自带Benchmark。同时也能看到,在4K高分辨率游戏中开启Reflex功能对于系统整体延迟的优化表现相当明显,从平均127.2毫秒下降至67.24毫秒。
《霍格沃兹之遗》
2023年备受喜爱的IP衍生大作《霍格沃兹之遗》竟然是一款优化不佳的游戏,对许多人的游戏装备提出了挑战,笔者就曾有使用12GB显存的显卡在2K分辨率下游玩,但爆显存闪退的经历。实测在4K分辨率下,《霍格沃兹之遗》对显卡的压力相比2077不逞多让,不开启DLSS的情况下平均帧数仅为35.5帧,偶发卡顿更是频繁,开启DLSS 3质量档与Reflex增强后,帧数翻倍提升至70.8帧,1%Low帧大幅提升减少了偶发卡顿,并且平均系统延迟同样减半,游玩中能够提供流畅的高品质画面。
《最后生还者Part I重置版》
许多人喜爱的《TLOU》是一款从PS平台移植到PC的游戏,并进行了画面重置,拥有真实生动画面表现的同时似乎失去了PS平台的好优化,对硬件的要求同样不低。实测开启DLSS后游戏平均帧数从55.4帧提升至88帧,1%Low帧从40.5帧提升至61.8帧,提升幅度均为50%以上,使用这款显卡开启DLSS即可畅享4K流畅游玩体验,不过FrameView软件没能读取到游玩过程中的平均系统延迟。
《CS2》
最后我们依旧测试了这款持续更新的经典竞技FPS游戏,不过这回是在4K分辨率下。《CS2》的游戏优化同样不算太好,相比《CS:GO》对硬件的压力提升了许多。实测开启Reflex+增强功能后,游玩过程中的平均系统延迟略微降低了2毫秒,但同时平均帧数与1%Low帧也有所降低,更建议在较低分辨率下游玩此类竞技游戏。
在四款游戏实际游玩测试的最后,我们也借助FrameView软件记录下开启DLSS与Reflex相关功能游玩过程中的GPU功耗曲线。
FrameView统计显示,这三款游戏在游玩中的平均功耗分别为《赛博朋克2077》246W、《霍格沃兹之遗》250W、《TLOU》251W、《CS2》230W,实际游戏功耗正如其它RTX 40系显卡的特性,会低于标称TGP不少,相比RTX 4070 Ti的游戏功耗水平也基本持平,同样对玩家的电源要求宽松,多数时候可轻松适配。
生产力测试
在生产力测试中,我们主要针对Blender与V-Ray 6两种渲染应用,使用Benchmark软件进行跑分。
AX电竞叛客RTX 4070 Ti SUPER X3W MAX在blender的monster、junkshop、classroom三个场景中分别得到3745分、1785分和1886分。作为参考,RTX 3090 Ti得分分别为2933分、1667分和1426分。
在V-Ray 6测试中,使用RTX与CUDA渲染引擎分别得到6104分与4190分。
AIGC:Stable Diffusion
升级显存后带来的一大利好就是本地部署的AI绘图软件、大语言模型等前沿应用,借助搭载16GB显存的AX电竞叛客RTX 4070 Ti SUPER X3W MAX,我们可以单次生成更多数量、单张更高分辨率的图片,同时还能够借助TensorRT加速提升生成应用效率。
输入有关场景、风格、氛围等的一系列描述,我们选择Euler a 50次采样,输出宽高均为1000像素的图片共10张,用时2分48秒,且显存占用约仅为6.8G。
RTX VSR
最后是在NVIDIA控制面板界面中可使用的RTX VSR功能体验,它能够借助显卡性能实时增强网页与流媒体播放的视频,对部分低分辨率内容画质提升的效果显著。新驱动中增加了这一功能是否在活动状态的显示,以及针对Windows开启HDR后提供了单独的适配选项。
想要开启这项功能,我们首先需要配备一块RTX 30系或40系GPU,随后可以在NVIDIA控制面板-调整视频图像设置中找到这项功能。勾选“Super Resolution(超分辨率)”开关,随后在下拉栏内选择1-4的质量等级,最后点击窗口右下方“应用”即可。
我们截取视频网站播放的360P分辨率视频效果来实际看看它的表现:
可以看出,RTX VSR的主要效果在于增强物体轮廓锐度,消除边缘的低分辨率马赛克等模糊现象,不过对于低分辨率下已经损失掉的画面细节难以还原。总体上能够将低分辨率的流媒体内容提升至近似压缩1080P分辨率的观感。
评测总结
对于这款RTX 4070 Ti SUPER,我们早在爆料信息阶段就对它的性能,以及未来将在消费级显卡市场中所处的地位进行过预测。毫无疑问,补足RTX 4070 Ti的短板,在显存规格方面大刀阔斧的提升将使它真正迈入优质的4K游戏、AI、生产力应用显卡行列,“加量不加价”也可称得上是对于玩家的优待。
如果你是2K分辨率240Hz以上的高刷玩家,或是想要在大多数3A大作中高画质畅享4K60帧的超丰富细节,亦或者对效率有一定要求的本地AI与生产力用户,笔者认为RTX 4070 Ti SUPER都是合适的选择。如果你还想在亲民价位段追求一下白色系硬件带来的高颜值独特视觉感受,AX电竞叛客RTX 4070 Ti SUPER X3W MAX就是不二之选。
最新资讯
热门视频
新品评测