上个月AMD通过Radeon RX 6800 XT和Radeon RX 6800显卡的发布重回高端显卡市场与英伟达角力,许多游戏玩家都认为英伟达这边将很快推出新的高端卡型号来回应AMD的较量,当然,英伟达新的高端显卡型号或许正在筹划中,不过这并不妨碍他们在发布RTX 3090/3080/3070之后继续往主流市场布局,推出了GeForce RTX 3060 Ti。
RTX 3060 Ti采用的GA104-200核心
RTX 3060 Ti采用了新的GA104-200核心,它仍然基于GA104核心打造,核心面积392.5mm2,晶体管数量174亿,生产工艺依然是三星为NVIDIA定制的8nm工艺。
不过与与RTX 3070采用的GA104-300核心相比,GA104-200整整少了一组GPC。GA104核心的一组GPC包含4个TPC,每个TPC又包含2个SM单元,每个SM单元拥有的CUDA核心是128个。
所以与RTX 3070相比,RTX 3060 Ti少了1024个CUDA核心,其拥有的CUDA核心数量为4864个,相比RTX 3070减少了约17.4%。此外,在频率方面,RTX 3060 Ti相比RTX 3070也稍有降低,RTX 3060 Ti的基础频率为1410MHz,Boost频率1665MHz。
但是在显存方面,RTX 3060 Ti与RTX 3070则保持了一致,显存位宽是完整的256bit,搭配8GB GDDR6显存,等效数据频率14Gbps,显存带宽一样是448GB/s。
而由于启用的SM单元减少,并且频率降低,RTX 3060 Ti相比RTX 3070的功耗也降低了,RTX 3060 Ti的TGP是200W,RTX 3060 Ti公版显卡的包装盒上也将推荐电源的规格降低到600W。
以上是将RTX 3060 Ti与同代更强的RTX 3070对比,而如果将RTX 3060 Ti与上代同样定位的RTX 2060 SUPER相比较的话,就能看出这一代的60档次甜点卡进步非常巨大。
首先,这一代的60档次甜点卡用上了英伟达游戏卡上第二大的104核心,相当恐怖了,与RTX 2060 SUPER相比,RTX 3060 Ti的核心面积缩小了不少,而晶体管数却增大了66亿个,CUDA核心数量也是从2176暴涨到4864。
Tensor Cores数目有所降低,但是RTX 3060 Ti上的是第三代Tensor Cores,要比RTX 2060 SUPER的第二代Tensor Cores性能强大不少,同样的RT Cores也进化了,来到了第二代RT Cores,并且数目相比RTX 2060 SUPER上的还增多了,AI性能将迎来大涨。
当然,基于新一代Ampere架构的RTX 3060 Ti显卡相比RTX 2060 SUPER显卡还多了这一代安培显卡的一些通用特性。
NVIDIA Ampere架构简介
RTX 30系显卡上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。随着RTX 30系显卡一同发布的,还有DLSS的更新版 – DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。
将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间。
再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
最后当然就是NVIDIA新推出的RTX IO了。这项技术是NVIDIA借助微软此前推出的DirectStorage API来实现的,将会作为插件的形式与后者整合,可以让显卡绕开CPU直接读取SSD数据,从而降低CPU的占用率。不过由于RTX IO需要依靠Windows的DirectStorage API,并且还需要游戏开发商做针对性的优化,所以最快我们也要等到明年才能看到这项技术的具体应用。
NVIDIA Reflex
伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件。
硬件部分是一个与我们这次使用的LDAT很相似的东西,叫Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟。
而软件部分则是NVIDIA Reflex SDK。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟。
NVIDIA Broadcast
NVIDIA Broadcast是为直播主们推出的,这用到RTX GPU的AI能力来对直播主的背景消除或替换,还有摄像头重构图,甚至帮助麦克风进行背景噪音消除。
在安装了NVIDIA Broadcast软件后,它会在摄像头、耳麦与直播软件之间建立一个中间者的角色,让外置设备可以利用到RTX GPU的AI能力来做一些AI增强效果,耳机和麦克风现在支持了降噪功能,AI会分析出哪些是主要音频,哪些是背景杂音进行降噪,给直播主和观众呈现清晰、有用的声音。
而摄像头现在有了自动重构图以及背景处理能力,从摄像头采集到画面,可以设置经过Broadcast进行处理,再传到OBS这些直播软件中,这可以让直播主的背景变得更为生动灵活,同时也可以降低直播场景的搭建成本。
RTX 3060 Ti公版显卡产品介绍
英伟达RTX 3060 Ti公版卡的造型与此前的RTX 3070公版几乎一模一样,正面是两个直径85mm的风扇,具有待机停转功能,散热鳍片是外露的设计,仍然采用了贯穿式的散热设计,背板尾部是镂空的,所以尾部的风扇可以直接穿过整块显卡,形成的风道也有利于整个机箱的散热。
上是RTX 3060 Ti,下是RTX 3070
与RTX 3070公版不同的是,RTX 3060 Ti公版的外边框颜色变成了银白色,将RTX 3060 Ti公版与RTX 3070公版放一起对比的话,这颜色很容易让人想起苹果Mac的深空灰色与银色款的区别。当然了,还有一个区别肯定是刻在背板的显卡型号了。
RTX 3060 Ti公版显卡的厚度是标准的双槽,长度以及高度分别242mm及99mm,尺寸与RTX 3070公版一样。并且也是在顶部有个12pin的供电接口,配合上随包装附送的8pin转12pin的供电线,可以与现有的电源兼容。
RTX 3060 Ti公版显卡的12pin接口那边有一半是没接线的,所以它其实是8pin转6pin,只是为了在物理接口上保证兼容和统一,做成的12pin供电接口设计。视频输出接口方面,仍然是3个DP 1.4与一个HDMI 2.1接口的设计,目前所有的30系显卡都是这样。
而视频接口这部分与上一代的RTX 2060 SUPER相比的话,却可以看到明显的不同。上一代的RTX 2060 SUPER上面同时具有四种视频输出接口,DVI接口是考虑到该型号的目标客户有一部分还在使用较为老旧的平台,显示器可能还是DVI接口的,所以为这一档显卡保留了DVI接口,但是到了RTX 3060 Ti上,则去掉了,符合当下的平台环境,而用于VR的USB-C接口则是在这一代30系显卡上都被砍掉的,相比来说,HDMI和DP接口还是更主流也更有用些的。
RTX 3060 Ti公版卡拆解
拆解开这张RTX 3060 Ti公版卡,发现其散热与RTX 3070公版是一样的,依然有4根8mm直径的热管,3根通向显卡后部,一根则弯曲到显卡前部,与GPU核心接触的部分采用的是纯铜底座。那么由于核心相比RTX 3070的运算单元更少,发热更少,可以预见RTX 3060 Ti公版是要比RTX 3070公版的温度表现还要好些的。
PCB上,可以看到RTX 3060 Ti使用的是GA104-200核心,周围依然是8颗三星的GDDR6显存,型号是K4Z80325BC-HC14,单颗1GB容量,位宽32bit,8颗一共组成8GB的容量、256bit位宽,该显存数据速率为14Gbps。
供电方面一共是10相供电,其中核心左侧的7相和左上方的1相是给核心供电的,而核心右边的那两相是给显存供电的。PWM主控是uP9512R,8相核心供电的MosFET均是来自万国半导体(Alpha & Omega Semiconductor)的,不过上面只刻了生产批次编号,2相显存供电的MosFET均是来大中(sinopower)的7342EK-OW21L。
性能测试
考虑到还是有很多玩家用的是英特尔平台,还不支持PCIE 4.0,并且到了RTX 3060 Ti这种甜点级别来说,我们更考虑实际玩家的处理器情况,最近所以本次测试没有无脑上最强的CPU,而是选用了Intel Core i7-10700K这款价格和性能都较为适合搭配RTX 3060 Ti显卡的处理器,主板采用的是华硕ProArt Z490 CREATOR 10G主板,内存用两根芝奇 皇家戟 DDR4-3600 16GB组成双通道,其他部分如下,不再赘述。
测试平台
本次首发评测对比显卡包括了:RTX 3060 Ti对应等级的上一代N卡RTX 2060 SUPER,还有据消息称与RTX 3060 Ti性能差不多的RTX 2080 SUPER,以及RTX 3060 Ti同架构的上一级显卡RTX 3070,对比显卡也均为英伟达的公版显卡。
A卡这边由于其新架构的显卡目前还只有高端卡,最低的RX 6800也比RTX 3070要性能高上不少,无法与RTX 3060 Ti对位,而如果再拿RX 5700 XT出来对比也没有意义,毕竟不是同价位也不是同一代的新架构和技术,所以本次对比显卡就没有A卡了,希望AMD这边能尽快推出采用新架构的中端显卡,好让玩家看看两家的角力。
此外,操作系统为最新的20H2版本,系统的电源选项为高性能模式,在BIOS开启XMP,让内存运行在3600的频率,其他方面不做过多改变,均采用默认设置。
基准性能测试
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
通过基准测试可以看到,RTX 3060 Ti相比上一代同样定位的RTX 2060 SUPER平均强了36%,并且是压力越大的情况下差距越大,最大差距在模拟4K游戏环境的Time Spy Extreme项目中达到,RTX 3060 Ti在这里相比RTX 2060 SUPER强了40%。
RTX 2080 SUPER是上一代图灵显卡的次旗舰,以定位来说,RTX 2080 SUPER是相比RTX 3060 Ti定位要至少高两级的,但是在基准测试中,RTX 3060 Ti却能刚刚好超过RTX 2080 SUPER一点,再一次实现了新架构跨越两级的性能提升,最大差距也是在Time Spy Extreme项目中达到,这里RTX 3060 Ti在这里相比上一代的次旗舰几乎高了8%的性能。
而与同一代更高一级的RTX 3070相比的话,RTX 3060 Ti肯定是要弱一些的,但是差距并没有RTX 3070与RTX 3080那么大,综合来看,理论测试下RTX 3060 Ti相比RTX 3070平均弱了14%。
2K分辨率游戏实测
基于RTX 3060 Ti的定位,在单机大作的游戏实测部分只测试2K分辨率,分别设置为传统光栅化游戏画面(即没有光线追踪效果)和开启实时光追游戏画面的测试。
传统光栅化游戏测试
传统光栅化游戏画面测试这部分均将游戏画质设置为预设里面的最高画质设置(《地铁:离去》选择Ultra画质),默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用游戏自带的Benchmark输出结果。
我们测的十款游戏都是关注度较高的游戏,并且包含了刚发售不久的新一代单机大作比如《刺客信条:英灵殿》、《尘埃5》、《看门狗:军团》等,从测试来看,RTX 3060 Ti能很好的满足本世代的游戏在2K分辨率下以最高画质流畅运行,《刺客信条:英灵殿》达到了62帧,《尘埃5》67.5帧,《看门狗:军团》也有61帧,可以说是刚刚好达到了3A大作完美的60帧流畅度,不由得再一次感叹老黄的精湛刀法。
而从性能差距来看,就这十款游戏的表现来说RTX 3060 Ti平均领先RTX 2060 SUPER高达38%,而领先RTX 2080 SUPER的幅度为1%,弱于RTX 3070的幅度仅为11%。
实时光追游戏测试
这部分所测几款游戏仍然采用预设最高画质(《地铁:离去》选择Ultra画质),光追效果选项可选的均开为“高”设置,开DLSS的测试中DLSS选项可选的均开为“性能”设置。《光明记忆》和《边境》均为独立的Benchmark测试结果。
实时光线追踪对于显卡的要求非常高,不过其带来的精美画面也是让人难以忘怀,这种逼真效果必然是接下来游戏体验提升的方向,从测试来看,借助英伟达DLSS技术,RTX 3060 Ti仍然能够很好的胜任新一代游戏在开启高质量的光线追踪特效下以2K分辨率流畅运行,比如《看门狗:军团》,在测试中达到了68帧,《地铁:离去》和《古墓丽影:暗影》也分别达到了62.74帧和74帧的流畅度。
而与对比显卡的比较来看,RTX 3060 Ti相比上一代同样定位的RTX 2060 SUPER,在实测的游戏性能方面足足提升了39%,几乎与理论测试相同,这很罕见。并且RTX 3060 Ti也成功达成了“跨越两级的性能提升”这样的成就,稳压上一代的次旗舰RTX 2080 SUPER一丢丢,游戏实测大约领先3%。
与RTX 3070的差距相比理论测试也是进一步缩小,实测游戏性能相比RTX 3070只是弱了12%。对比RTX 3070与RTX 3060 Ti,前者的指导价大约比后者高出30%,而性能提升15%,可以看出老黄对于每张卡的性能和价格的把握还是很精准的。
温度测试
我们的显卡散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为26℃。待机温度是开机以后记录10分钟,满载温度则是完成3DMark Fire Strike压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。
温度方面,RTX 3060 Ti的表现非常的好,不同于上一代的两张公版显卡RTX 2060 SUPER和RTX 2080 SUPER,RTX 3060 Ti公版是具有风扇待机停转功能的,所以RTX 3060 Ti的待机温度是通过被动散热达到的,经过10分钟的待机测试,RTX 3060 Ti公版的最高温度也仅38摄氏度。而满载状态下,RTX 3060 Ti公版的最高温度也仅仅来到了70摄氏度,相比对比的几张公版卡都要低,比RTX 3070更是低了5摄氏度,可见RTX 3060 Ti上的GA104-200核心发热量完全不需要担心。
功耗测试
通过我们专用的显卡功耗测试仪器,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Fire Strike压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
待机功耗方面,GeForce RTX 3060 Ti、GeForce RTX 2060 SUPER、GeForce RTX 2080 SUPER、GeForce RTX 3070的待机功耗均值依次为13.4W、13.1W、14.2W、14.9W。
满载功耗方面,GeForce RTX 3060 Ti、GeForce RTX 2060 SUPER、GeForce RTX 2080 SUPER、GeForce RTX 3070的满载功耗均值依次为201W、173W、242W、219W。通过前面的测试可以看到RTX 3060 Ti相比RTX 2080 SUPER性能还要强一点,但是功耗却低了40W之多,足可见这一代安培显卡的能耗比提升是很明显的。
超频性能测试
将功耗上限和温度上限解锁到最高之后,经过多番手动超频尝试,这款RTX 3060 Ti公版最终在核心频率+120MHz,GDDR6显存数据速率+3Gbps下完成超频。这个状态下,这张RTX 3060 Ti公版卡能顺利通过3DMark的Fire Strike项目测试并且分数最高, 此时这张RTX 3060 Ti公版卡的Boost频率为1785MHz,显存等效频率为17Gbps。这张RTX 3060 Ti公版卡在超频状态下运行3DMark Fire Strike项目的显卡得分与默频状态下显卡得分的对比如下表所示。
或许是由于核心发热量低的原因,使得RTX 3060 Ti在高压下也能经过散热器即使带走热量,让核心温度不至于到一个较高的水平,也有可能是公版卡1665MHz的Boost频率本身比较低,具有较大的超频空间,结果就是测试下来RTX 3060 Ti的超频能力显得非常好,足足提升了12%之多。
总结:性能小胜RTX 2080 SUPER,功耗却低40W
英伟达的60档显卡向来可以说是显卡市场中的主出货型号,因为这一档显卡一直都是能提供相当不错的性能而价格又不至于太过昂贵,是大多数游戏玩家的选择。而到了安培显卡这一代,看起来仍然会延续这样的情况,新的RTX 3060 Ti具有超过上一代的次旗舰RTX 2080 SUPER的性能,功耗低40W,而价格不到3000元,怎么看都是目前主流预算的装机平台中最合适的显卡选择。
而与英伟达之前的60档显卡来比的话,这是英伟达的60档显卡首次用上同一代游戏卡上第二大的GPU核心,单独从这一点也可以看出来这一代的RTX 3060 Ti在性能上有多么强大。
显卡迷你天梯榜(完整显卡天梯榜)
再有一个有趣的点是,虽然RTX 3060 Ti与上一代的RTX 2060 SUPER一样都是399美元,延续了60档显卡的价格水平,但是由于现在人民币对比美元的汇率不同,这一代的RTX 3060 Ti的国内指导价从RTX 2060 SUPER的3199元人民币变为2999元人民币,对于我们来说这也变相的让这张卡更加香了,不过可惜的是RTX 3060 Ti公版目前也没有在国内销售的打算,而非公显卡从目前显卡市场整体缺货的情况来看,应该是会在建议零售价之上销售的。
不过即使如此,RTX 3060 Ti也是目前主流平台最合适的显卡选择,适合那些搭配有2K显示器,期望在2K分辨率下享受最高游戏画质的玩家,同时这张卡的功耗也不高,对电源的要求也相对较低,对于老平台升级的话,也是很合适的选择。
在RTX 3060 Ti发布之前,3000多元价位还是RTX 2060 SUPER这种性能的显卡在售,而现在手持3000多元预算的玩家可以同样的价格买到多40%的性能,另一方面因为AMD这边基于RDNA 2架构的新一代显卡目前还没有与之对位的新产品,所以RTX 3060 Ti这张能完美胜任2K游戏环境,功耗仅200W的新显卡目前就是市场中没有敌手的存在。
超能网公众号
限时特惠:本站每日持续更新海量各大内部网赚创业教程,会员可以下载全站资源点击查看详情
站长微信:11082411