GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

拼 命 加 载 中 …


从去年9月开始NVIDIA就开始布局新一代Ada Lovelace架构RTX
40系显卡,在陆续推出90、80、70这些高端旗舰卡之后,面向主流游戏玩家的RTX 4060家族终于来了,首先推出的是RTX 4060 Ti
8GB,到了7月份还会有RTX 4060 Ti 16GB和RTX 4060。

根据Steam的统计,目前硬件排行榜前五的GPU里面有四款是NVIDIA的60系产品,并且有77%的玩家是在1080p或更低分辨率下进行游戏的,而这次RTX
4060系的定位就是1080p的市场。可能有人会觉得上一代RTX 3060 Ti的定位是2K级别的,这次为什么降级了呢?其实是两者的定义不一样,RTX
4060家族是要给玩家带来1080p分辨率下高帧率的光追游戏体验,其实你硬是拿他来跑2K分辨率它肯定是可以的,特别是在DLSS 3的加持下还会有不错的表现。

视频评测:

 

手机通道:哔哩哔哩

RTX 4060家族使用的是NVIDIA的第四款Ada Lovelace架构核心AD106,此前推出的RTX 4090用的是AD102 GPU,而RTX
4080用的是AD103,而RTX 4070家族使用的则是AD104,一颗完整的AD106核心拥有完整的3组GPC,每个含有6个TPC,共18组TPC,每组有两个SM单元,共36组,4608个CUDA单元,拥有两个NVENC和一个NVDEC。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

和完整的AD106核心相比,RTX 4060 Ti少了两个SM单元,有4352个CUDA单元,而且NVENC也少一个,与RTX
4070一样拥有NVENC和NVDEC各一个。

和高一级的RTX 4070相比,RTX 4060 Ti的SM单元从46组减少至34组,CUDA Cores数量从5888个降低至4352个,Tensor
Cores与RT Cores数量也有相应减少,L2缓存从36864KB降至32768KB,显存位宽从192bit降低至128bit,搭配的显存也从12GB
GDDR6X变成了8GB GDDR6,相对的,晶体管数量从358亿减少到229亿,芯片面积也因此降低了许多。

当然和上一代的RTX 3060 Ti相比,RTX 4060
Ti的规模有所扩大,晶体管数量增加了31%,虽然单纯从规格上来看,RTX 4060 Ti的CUDA是要少点,但两者的架构是不一样的,RTX 4060 Ti的RT
Core光追核心从之前的第二代升级到第三代,Tensor Core张量核心也从第三代升级到第四代,此外,还有L2缓存的区别,RTX 4060 Ti相比RTX
3060 Ti可谓是火箭式的提升,从4096 KB提升到了32768KB。

NVIDIA这次给出了RTX 4060 Ti各个计算单元的具体算力,虽然说它的CUDA数量比RTX 3060 Ti要少,但Shaders的算力从上代的16
TFLOPs提升至22 TFLOPs,主要是得益于频率的大幅提升。RT Cores从第二代升级至第三代,算力从32 TFLOPs提升至51
TFLOPs,性能提升了59%之多。提升最大的是Tensor Cores,RTX 4060 Ti上的升级到了第四代,运算性能从130 TFLOPs提升至353
TFLOPs,性能提升了270%,这也是为啥DLSS 3的帧生成功能只有最新的Ada Lovelace架构GPU能用的原因。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

虽然RTX 4060 Ti和RTX 3060 Ti都是使用8GB
GDDR6显存,但位宽从256bit降至128bit,虽然显存频率从14Gbps提升至18Gbps,但带宽依然从448GB/s降低至288GB/s。当然NVIDIA并不会平白无故削减GPU显存位宽的,实际上Ada
Lovelace架构GPU内部的L2缓存较前代有很大幅度的增加,在RTX 3060 Ti上只有4MB,到了RTX 4060
Ti上就有32MB,容量提升了8倍,而且L2缓存的带宽也显著增加,允许SM单元和L2缓存之间更快交换数据。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

GPU增加内部缓存大小原理其实和CPU是一样的,更大的缓存可以增加命中率,这样就可以减少对显存的依赖,NVIDIA内部做过测试,用完整的32MB L2的RTX
4060 Ti和只有2MB的特制RTX 4060 Ti对比过,拥有32MB
L2缓存的GPU把访问显存的次数减少50%以上,在一系列的游戏和综合测试中,大幅提升的命中率能把游戏帧率提升34%,这样GPU就能更有效的利用显存带宽,NVIDIA表示拥有288GB/s显存带宽的Ada
Lovelace GPU与具有554GB/s显存带宽的Ampere GPU性能相近。

Ada Lovelace架构GPU采用了更先进的TSMC 4N工艺,所以RTX 4060 Ti的Boost频率从RTX 3060
Ti的1665MHz大幅度增加到2535MHz,8GB版的整卡TGP是160W,比RTX 4070和RTX 3060
Ti都低了40W,而16GB版由于显存数量翻倍所以TGP增加至165W,推荐电源功率则是550W。

最后我们可以看到RTX 4060 Ti的接口变成了PCI-E 4.0
x8,此前NVIDIA很少会对显卡的接口下手,所以这次的动作确实少见,只不过嘛,在这级别的GPU上PCI-E 4.0
x8的带宽其实已经足够了,毕竟是和PCI-E 3.0 x16相同的,但在某些旧平台上可能会出问题,比如Intel的10代酷睿Comet
Lake就只支持PCI-E 3.0,AMD的锐龙5000G系列同样也只有PCI-E 3.0。

SM架构图

Ada Lovelace的SM单元整体的结构也是与上一代Ampere架构一模一样,分为四个一样的主要计算模块,一个RT光追核心,以及128KB一级数据缓存/共享内存等。

而且每个主要的计算模块内的结构也和Ampere架构一样,有64KB寄存器文件、零级指令缓存、一个Warp调度器、一个分配单元、16个FP32单精度浮点CUDA核心、16个FP32/INT32单精度浮点和整数混合CUDA核心、一个Tensor Core张量核心、四个载入存储单元、一个特殊功能单元(SFU)用于执行图形差值指令。

而差别也很明显,那就是RT Core光追核心从之前的第二代升级到第三代,Tensor Core张量核心也从第三代升级到第四代。

第三代RT Core有效光追算力是上代3倍

全新的第三代RT Core可以提供2倍的光线与三角形求交性能,并且加入了两个全新的重要硬件单元——Opacity Micro-Map引擎和Displaced Micro-Mesh引擎。

Opacity Micro-Map引擎将光线追踪的Alpha-Test几何性能提升2倍;而全新的Displaced Micro-Mesh引擎可动态生成微网格,以产生额外的几何图形。Displaced Micro-Mesh引擎可在提升几何图形丰富度的同时,不以传统复杂几何图形处理的性能和存储成本为代价。

Displaced Micro-Mesh引擎

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

我们知道光线追踪的计算是以光线射向一个平面这样的模型来计算的,而实际的渲染中物体几乎不会是简单的平面型,而是各种曲面,所以就需要将曲面分解成许多个小的三角形平面,然后计算光线与三角形求交。在Ampere架构上,面对一个复杂的曲面,如果想得到逼真的光线追踪效果,那么分解的三角形平面是非常多的,多个三角形平面带来非常复杂的BVH,这就非常难以计算。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

而Ada Lovelace架构的处理方式就不一样,通过Displaced Micro-Mesh引擎,它将这些三角形平面仅通过一个三角形然后加上不同的位移图来表达,显著缩短了BVH的构建时间,同时BVH的存储空间需求也减小了很多,而最终仍然能实现一样的光线追踪最终渲染效果。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

实际应用中由于Displaced Micro-Mesh引擎的存在,面对复杂物体的渲染,BVH的构建速度可以超过15倍,而存储空间的需求却可以小20倍之多,越是复杂的物体该引擎的优势就越能体现。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

而且Displaced Micro-Mesh引擎不止可以应用在游戏领域,对于创作领域的用户来说,也有软件会支持,目前Adobe、Simplygon这两家企业已经确认得到了支持。

Opacity Micro-Map引擎

接下来我们说Opacity Micro-Map引擎。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

Opacity Micro-Map引擎则是可以对游戏中常见的树叶这类物体加速光线追踪计算,Ampere架构面对这种场景的Alpha-Test需要多个着色器来进行计算,而Opacity Micro-Map引擎对于这种不透明的对象进行了不透明度的编码,可以更准确的对物体边缘进行光线追踪计算,简化了叶子轮廓之外完全透明和叶子轮廓之内完全不透明的区域的计算,耗费更少的着色器就可以实现真实的光线追踪渲染。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

以《传送门》RTX版这个游戏为例,Opacity Micro-Map引擎可以让Gbuffer填充速度加快30%,游戏帧率提高10%。

而最终,这些改进下的第三代RT Core可以使完整的Ada Lovelace架构核心具有200 TFLOPS的有效光线追踪计算能力,几乎是上代产品的三倍。

第四代Tensor核心性能超上代5倍

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

对于第四代Tensor Core,最主要的变化是新增了Hopper FP8 Transformer Engine,可提供1400 TFLOPS的张量处理性能,可以说深度学习性能得到了巨大的飞跃,这也意味着通过它可以实现新的技术想法,后面的DLSS 3我们会再次提到Tensor Core的功劳。

说到DLSS 3,作为这次NVIDIA大力宣传的重点,相信大家都急不可耐想深入的了解这个技术,但是为了更清楚的了解DLSS 3,我们还得说两个新东西,那就是着色器执行重排序(SER)和Optical Flow Accelerator光流加速器。

着色器执行重排序(SER)提高光追并行效率

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

着色器执行重排序技术的重大作用是可以极大的提升光线追踪性能,这是与CPU的乱序执行一样的重大创新。

由于光线追踪的特性,它很难并行处理,因为光线会向各个方向反射,并与各种类型的表面相交,所以光线追踪的工作负载需要不同的线程处理,需要不同的着色器,并且需要不同的显存来存取中间的计算过程。

而我们知道GPU的特点就是适合并行处理,只有面对并行处理的任务才可以发挥GPU的特点获得更好的计算效率,而着色器执行重排序就是可以通过实时重新调度任务,即时重新安排着色器负载来提高执行效率,从而更好地利用GPU资源,以实现更佳的光线追踪性能,据称,SER可以为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

应用了着色器执行重排序(SER)之后,《赛博朋克2077》在全景光线追踪模式下可以提高44%的性能,《传送门》RTX版可以提高29%的性能,《Racer RTX》可以提高20%的性能。

DLSS 3全方位提升流畅度、延迟和画质

新一代的DLSS 3包括全新的帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术,与之对应的就是目前在游戏中,DLSS 3对应了这三个选项——帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术——这三个都启用才算是完整的开启了DLSS 3。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

而这其中,帧生成必须RTX 40系列才能支持,超分辨率则是RTX 40/30/20系列都支持,Reflex的要求最低——GTX 900系列及以后的都支持。

总得来说,DLSS 3是提升游戏体验的一整套解决方案,也就是说对于游戏体验的三要素——流畅度、延迟和画质——进行全方位的提升,而不是拆东墙补西墙的那种,接下来我们一个一个说。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

DLSS 3的帧率

先说它如何提升帧率。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

之前的DLSS 2,提升帧率的方式简单说就是以低分辨率渲染,然后通过AI训练重建高分辨率画面返回输出,比如我们将游戏设置成4K,打开DLSS,那么实际的计算过程是先以1080p分辨率渲染帧画面,然后AI学习经过训练的更高分辨率的帧再将这个帧画面压缩到4K最终输出,中间相差的这3/4部分的像素信息是通过AI计算来添加的(本地主要是Tensor Core来计算)。由于以低分辨率渲染,所以在AI补充像素的性能足够的情况下,帧率自然可以提高了。

但是这样无法突破CPU性能的瓶颈,毕竟降低原始渲染分辨率可以使得GPU每一帧的计算量更少,但是CPU每一帧的计算量是不变化的(因为CPU负责计算的部分与分辨率并无关系),实际上,由于帧率提高,CPU的计算量其实还增大了。

那么DLSS 3是怎么做的呢?

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

首先,还是与DLSS 2一样,比如输出4K游戏画面的话,它也是先降低原始渲染分辨率到1080p,然后通过AI计算来添加像素再压缩成4K画面。在连续的游戏画面中,我们就可以通过这样得到连续的4K帧画面,第1帧、第2帧、第3帧等等。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

然后这样的每两帧之间,DLSS 3通过光流加速器为神经网络提供像素级的帧到帧的运动方向和速度信息,然后通过分析前一帧和当前帧几何图形和像素的运动矢量并将其输入至神经网络,就能计算出两帧中间的帧画面了。

实现超越CPU限制的帧数

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

这样连续下去的话,原本的第1帧、第2帧、第3帧中间都会有一个新的帧,等于实际最终输出的帧画面中,有1/2是没有CPU参与的,完全是GPU计算出来的,所以理论上可以将原本受限于CPU性能的游戏帧率提高一倍。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

另外,我们去关注像素的话,会发现靠传统渲染方式计算的像素其实只有1/8,最终输出的游戏画面7/8的像素其实都是通过DLSS 3的一系列AI计算填补上的,这极大的提升了效率。

DLSS 3的画质

然后我们说下画质。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

其实看我们的网站的网友评论可以看到还是有很多网友对DLSS技术很抗拒,认为不是原始渲染出的画面就不好,笔者认为这一观念是需要改变了。且不说网友有这一观念可能是由于初代DLSS技术确实效果不佳,形成了刻板印象,即便之后的DLSS 2超分辨率技术已经有很好的画面也很难摒弃已经形成的观念,对于现在的DLSS技术其实我们可以比较一下这几帧画面,已经完全看不出区别。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

对于DLSS 3的生成帧这方面大家不免想到已经问世好久的各种插帧技术,DLSS 3的生成帧确实也可以算作插帧的一种,但是又与其他的插帧技术完全不一样。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

简单的插帧技术利用两帧之间像素的位移来确定中间帧的图像,这样其实非常容易出现明显令人觉得视觉异常的画面,特别是对于阴影这种需要计算的画面效果,当主体移动之后,正确的阴影是需要经过复杂计算的,单单根据像素的位移来确定的画面几乎肯定违反客观世界的物理规律。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

而DLSS 3它使用光流加速器分析两帧连续的游戏图像,计算帧到帧之间物体、元素的运动矢量数据,综合游戏中的一对超级分辨率帧,以及引擎和光流运动矢量,并将其输入至卷积神经网络,计算生成出新的一帧,大大提高了画面的准确性。

DLSS 3的延迟

最后我们再说延迟。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

通过前面的梳理大家会发现DLSS 3尽管提高了帧速率,也保证了画质,但是对于延迟是没有缩短的,因为每一个新生成的帧都是需要后一帧渲染出来之后才可以准确生成的。更高的帧率提升了游戏的顺滑程度,但延迟会影响游戏的响应度,如果延迟太高,游戏的体验也不会好,而为此,DLSS 3也集成了NVIDIA Reflex技术来降低延迟提高响应速度。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

所以总得来说,DLSS 3是包括了基于AI的超分辨率提升技术、基于AI的帧生成技术以及NVIDIA Reflex低延迟技术这些软件层面以及第四代Tensor Core的1400 TFLOPS的张量处理性能、Ada Lovelace光流加速器300 TFLOPS的光流运算性能以及NVIDIA超级计算机提供的超过1 ExaFLOPS的AI计算性能组成的硬件层面综合实现的一项新技术,对于游戏体验的提升也不是单方面的,而是全方位的提升。

      全新第八代NVENC支持AV1编码

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

Ada Lovelace架构相比Ampere架构的另一项重要升级就是NVIDIA 编码器 (NVENC)升级到了第八代,开始支持AV1编码了。AV1的效率比H.264高40%,这意味着在传输同样质量的画面时候只需要大约70%的数据量,或者说在同样的带宽下可以实现更清晰的画面质量,并且由于AV1是免费、开放的,可以让厂商节省相当一笔费用,AV1已经明显将要取代H.264成为主流格式。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

而在中国的备受欢迎的视频编辑应用“剪映专业版”、Blackmagic Design 的 DaVinci Resolve 18、以及 Adobe Premiere Pro 较为流行的 Voukoder 插件均支持 AV1,且均可通过编码预设使用NVENC AV1编码器。此外,OBS、Discord以及更多的公司都已在采用NVENC AV1编码器。

NVIDIA GeForce RTX 4060 Ti FE的设计和此前的RTX 4070
FE是完全一样的,采用了双轴流推挽式风扇散热设计,尺寸一模一样,都很短,只不过X型边框的颜色从之前的金属灰变成银白色。

RTX 4060 Ti FE这次的外观设计延续了RTX
40/30系显卡的一贯风格,比如说银白色的无限符号状的铝制外框,还有正面右侧的鳍片,也是呈箭头状向左指向风扇处。两个风扇均为7片扇叶设计,直径为90mm。虽然比起RTX
4090和RTX 4080的FE显卡,这两把风扇小得多,但仍然是占据了一部分的边框。

在侧面可以看到横着摆放的12VHPWR接口,而RTX 4060
Ti的TGP也就160W,所以这次NVIDIA附送的是一条8PIN转12VHPWR电源线。附带一提,这次RTX 4060
Ti的部分非公版显卡采用的是单8PIN接口,我们也将会有对应的评测,请大家保持关注!

显卡的重量和RTX 4070 FE差不多,只有1kg多点

RTX 4060 Ti FE的挡板上是四个大的出风口,提供三个视频输出接口,包括三个DisplayPort
1.4a和一个HDMI 2.1接口,均可实现最高8K 60Hz的视频输出,并可实现最多4屏输出,支持HDCP 2.3。

拆开就能看到RTX 4060 Ti FE的PCB其实与RTX 4070 FE是非常类似的,当然供电和显存是明显要少一点,显卡采用了5+1相供电设计,5相核心供电中的4相位于PCB左侧,还有一相位于PCB右下角,所用MOSFET均是来自安森美的NCP302150,PWM芯片是MPS2218,目前查不到具体信息,1相显存供电位于PCB右上角,采用1上2下三个Mosfet,在圆弧边缘附近还有一块uPI
uS5650Q芯片,起到一个监控电流和电压的作用。

位于正中间的,自然是AD106核心,生产日期为22年第45周,也就是去年11月。一般来说,核心丝印的第五行会印有核心的具体型号,格式大概就像AD106-xxx-xxx,但我们手上的这块并没有,实际上RTX
4060 Ti用的是AD106-350核心。

GPU上方和右侧有四颗SK海力士的GDDR6显存,型号为H56G42AS6DX014,是标称18Gbps的显存,单颗容量为2GB,位宽为32bit,合计8GB,位宽128bit。

这次的测试平台采用了Core i9-13900K、微星 MEG Z790
GODLIKE和32GB双通道DDR5-6000内存的组合,这样可以最大程度上确保测试时的瓶颈是在这次的主角也就是显卡之上。

至于测试的显卡,自然包括更高一级的GeForce RTX 4070,还有就是一代RTX 3070和RTX 3060 Ti,以及更上一代的RTX 2060
Super,而AMD方面,我们加入了Radeon RX 6700XT进行对比,会测试1080p和2K两个分辨率,包括传统光栅游戏以及光追游戏,
并且会与其他NVIDIA显卡对比开启DLSS后的游戏性能。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

用GPU-Z查看得到,NVIDIA GeForce RTX 4060 Ti FE的GPU核心基础频率是2310MHz,Boost频率2535MHz,显存频率显示是2250MHz,乘8后得出它的等效数据频率是18Gbps。

这个BIOS的默认温度上限是83摄氏度,可以向上解锁至88摄氏度,功耗方面,默认功耗上限是160W,并且可以解锁至175W,以获取更好的超频能力。

首先当然是看看大家都喜欢的纯理论跑分。我们以3D Mark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike
Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Port Royal以及Speed
Way六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike
Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy
Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port
Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3D Mark显卡单项的得分。

从3DMark的测试可以看得出RTX 4060 Ti与它的上位RTX 4070差距还是蛮大的,在DX11的Fire
Strike测试里面差距超过了30%,而且分辨率越高性能差距越大。DX12的Time Spy则有27%的差距,在两个光追测试里面,两者的性能差距接近40%。

而与上代显卡对比的话,在Fire Strike测试里面1080p分辨率下性能是与RTX 3070相同的,领先同档位的RTX 3060
Ti约12%,但随着分辨率的提升性能差距会逐渐缩小,到了4K的测试里面RTX 4060 Ti性能已经和RTX 3060 Ti相等了,落后RTX
3070约15%,只不过这卡本身也不是为4K设计就是了。不过在Time Spy测试中这个问题到时不明显,性能领先RTX 3060 Ti大概16%,也比RTX
3070要高一些。在两个光追测试中,RTX 4060 Ti是很明显性能要比RTX 3060 Ti高出一截,但低于RTX 3070。

和对手的RX 6700 XT相比,在DX11的Fire Strike测试得分是要低一些的,但DX12的Time Spy测试中RTX 4060
Ti的得分明显要比它高出不少,两项光追测试就更别提了,RTX 4060 Ti要比RX 6700 XT强相当多。

本着详细一点的原则,我们是选择了12款光栅化游戏以及8款支持光追的游戏来进行游戏帧数测试,基本上光栅化游戏我们选的都是极高或者超高的画质预设来进行测试,而光追游戏
除了《赛博朋克2077》外都会拉到预设最大值,这些测试我们都没有开启DLSS或FSR。

1080p光栅化游戏

在1080p不开启光追的情况下,RTX 4060 Ti与RTX
3070的性能几乎相同,当然了各款游戏的表现会有所不一,但整体拉评价值的话两者差别微乎其微。和上代同级的RTX 3060
Ti相比整体性能要领先14.1%,和更早期的RTX 2060 Super相比性能提升了58.5%,与对手的RX 6700XT相比性能则高出7.5%左右。

2K光栅化游戏

虽然说RTX 4060 Ti的定位是1080p分辨率,但2K分辨率下他还是能够很流畅运行这些光栅化游戏的,在分辨率提升后它的性能大概要比RTX
3070低4%左右,和RTX 3060 Ti相比领先幅度也缩小到11.5%,较RTX 2060 Super性能提升了58%,与对手的RX
6700XT相比性能则高出5.6%左右。

1080p光追游戏

实际上以RTX 4060 Ti的性能,即使不使用DLSS依然在1080p下开启光追流畅运行大部分游戏,当然有几款的帧率确实还没达到50fps,那些就建议开启DLSS了。在该分辨率下,RTX 4060 Ti的光追游戏性能只比RTX 3070落后1.6%,相比RTX 3060 Ti性能提升了14%,和RTX 2060
Super相比性能提升了78%之多,而且光追是NVIDIA的强项,RTX 4060 Ti和RX 6700 XT相比光追游戏性能领先了45%之多。

2K光追游戏

在2K分辨率下开光追不用DLSS的话确实有点为难RTX 4060 Ti了,此时他的性能落后RTX 3070约5%,比RTX 3060
Ti高11.2%,较RTX 2060 Super性能提升了76.8%,和RX 6700 XT相比性能依然高出39.7%。

DLSS性能测试

DLSS的测试部分就只有NVIDIA显卡了,其中RTX 4060 Ti和RTX 4070是会同时开启帧生成功能,其他的RTX
30和20系自然不能开,无论1080p和2K分辨率均使用DLSS质量模式,《看门狗:军团》由于不支持帧生成,所以所有卡都是DLSS 2。

不得不说帧生成功能确实是RTX 40系显卡的独门武器,在DLSS 3的加持下RTX 4060 Ti性能至少超出RTX
3070约20%,最多能到40%,和RTX 3060 Ti相比的话至少也有30%的性能提升,最高能到50%,可以说帧生成确实是RTX
40的杀手锏,是与之前的RTX系列显卡最大的差别。

在DLSS 3的加持下RTX 4060
Ti确实能做到在1080p开启光追的情况下超过100fps的游戏体验,部分游戏甚至可以提供接近200fps的帧率,而且一些在2K分辨率下不太流畅的光追游戏,在使用DLSS
3之后可以提供非常流畅的游戏体验,随着NVIDIA与游戏开发者合作的逐渐加深,DLSS开发套件使用起来日趋成熟,即使官方没提供DLSS的支持,也会有玩家通过MOD的方式让游戏支持DLSS技术。

作为RTX 40系显卡,RTX 4060
Ti拥有最新的第八代NVENC和第五代NVDEC,支持AV1格式视频的编码与解码,这里我们测试了Blackmagic Design 的 DaVinci
Resolve 18和较为常用的Handbrake视频转码器,通过编码预设使用NVENC AV1编码器的输出耗时。由于RTX 3060 Ti和RX 6700
XT不支持AV1编码,所以这里用Intel的A770来进行AV1编码对比。

可以看到RTX 4060 Ti的AV1编码性能其实与RTX 4070是差不多的,表现要比Intel的ARC
A770要好,当然如果与更高端拥有双编码器的RTX 4070 Ti相比的话肯定有差距。

在3D渲染类应用里面,RTX 4060 Ti相比RTX 3060 Ti的提升幅度还是比较明显的,最高有大概28%,这得益于新一代的CUDA和RT core性能更强。不过考虑到RTX 4060 Ti只有8GB显存,其实不是那么适合用来做太重度的建模工作。

NVIDIA在几个月前就推出了RTX VSR功能,旨在让低分辨率的视频可以以较高清晰度来播放。这个功能需要一张NVIDIA RTX显卡才可以使用,而RTX 4060 Ti作为最新推出的NVIDIA显卡,我们当然也有用它来打开RTX VSR功能来测试一下。

可以见到,在开启RTX VSR功能之后,视频画面的清晰的确是会有所提升,特别是在动画类视频上,清晰度是提升不止一星半点,差不多就是480P到720P这样的飞跃了。

我们的GPU散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为24.6℃。待机温度是开机以后记录5分钟,满载温度则是完成3DMark压力测试后记录下,数据通过GPU-Z的Log
to File功能记录,以下为温度测试曲线。

NVIDIA GeForce RTX 4060
Ti FE支持风扇待机停转,所以待机温度都是被动散热下的温度,经过5分钟的待机测试,从开始的35.6摄氏度上升到38.2摄氏度左右,5分钟待机过程中最热点温度则是最低是开始的42.4摄氏度,偏后段是45摄氏度。

满载状态下,最高温度位65.6摄氏度,对于显卡来说这温度并不高。关注最热点温度的话,最高也才78.4摄氏度,RTX 4060
Ti 本身的功耗并不高,所以显卡的温度表现相当优秀。

透过GPU-Z来看,RTX 4060 Ti FE在待机时风扇是会停转的,让它在待机状态下完全无任何噪音,当负载和温度超过一定程度后风扇就会启动,满载状态下,风扇最高转速在1500RPM,转速并不高。

通过我们手中的PCAT套件,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Time Spy压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。

统计功耗测试的结果算出,这张NVIDIA GeForce RTX 4060 Ti FE的整卡待机功耗平均为9W,满载功耗平均为148W,峰值功耗也只有189W,而上一代的RTX
3060 Ti满载攻略是200W左右,功率明显要比上代产品降低不少。对于这样级别的显卡功耗来说,电源的话如果平台其他部件的功耗不高那么可以550W的电源来带动,如果其他部件的功耗也较高建议至少650W的电源起步。

上面的测试所知显卡满载时风扇最高转速是1500RPM,PWM大概是33%左右,我们是把显卡放进了环境噪音只有18
dBA的消音房,把其风扇调成同样转速,然后在50厘米的距离上测试其噪音水平,由于显卡在待机时风扇是停转的,所以就不用测试了。

在消音房中NVIDIA GeForce RTX 4060 Ti FE所测得的噪音水平是非常低的,只有28.4
dBA,是一个非常低的噪音值,基本上你不仔细去听的话是基本不会察觉的。

GeForce RTX 4060 Ti天梯榜首发评测:享受1080p高刷光追游戏 – 超能网

超频的时候我们把显卡的TGP上限提升至175W并且加了电压,经过一番折腾后,最终显卡的加速频率能加260MHz,显存频率超了150MHz,此时等效数据频率达到19.2Gbps,通过了3DMark
Time Spy测试,此时显卡得分为14477分,比默认性能提高了2%左右。

其实看GPU的频率的话提升还是很明显的,最高值从2775MHz提升至3060MHz,平均频率也从2740MHz提升到3010MHz,但超频后GPU频率波动确实更大,估计是175W的TGP限制导致显卡的性能无法进一步提升。

其实在RTX 4060
Ti发布之后我看到网友对它的负面评价并不少,现在实际跑下来,感觉其实还好吧,在不计算DLSS相关项目的时候,它的性能要比上代的RTX 3060
Ti要高约12%,如果单独计算1080p的成绩的话更高,和更早期的RTX 2060 Super对比的话性能提升超过50%,当然了如果和RTX
3070对比的话性能还是要略微低一点。

如果游戏支持DLSS 3的话其实RTX 4060 Ti的表现是不会弱于RTX 3070的,这也是RTX
40系对比之前的旧显卡的最大优势,新一代Tensor Core计算性能较上代有极大幅度的提升,这也DLSS 3的帧生成功能现在只有RTX
40系能用的原因,当然了一些游戏在1080p分辨率下开启DLSS还是存在画面模糊的问题,这种情况其实可以单独开启帧生成功能,游戏帧率依然会有不少的提升,又不会让画面变模糊。

当然了RTX 4060 Ti最大的槽点莫过于它与RTX
4070之间性能落差太大了,它大概只有后者70%左右的性能,这中间的性能空缺区间也太大了,虽然说过两个月还有RTX 4060 Ti
16GB,但它与8GB版之间的差距并不会太大,所以RTX 4070和RTX 4060 Ti中间可能还会有其它的产品填补进来。

GeForce RTX 4060 Ti 8GB的建议零售价是3199元,比RTX 3060
Ti发布时的2999元高了200元,考虑到汇率的变动还有现在还有不少RTX 3070和RTX 3060 Ti显卡等着清库存,只能说这个价格可以理解,作为一款主攻1080p游戏的新显卡,它还是非常有竞争力的。

微信公众号

福利Biu,认真分享好福利。发布者:福利Biu(官方),转转请注明出处:https://www.fulibiu.com/xiaoxi/5169.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
福利Biu(官方)的头像福利Biu(官方)作者
上一篇 2023年5月23日 下午9:09
下一篇 2023年5月24日 上午2:14

相关推荐

微信客服
微信客服
分享本页
返回顶部
CTRL+D 收藏本站   便宜云服务器:传送门