影驰RTX 3080 Ti 星曜OC评测 千面闪耀百变星曜
GeForce RTX 3080 Ti已经于6月2日正式性能解禁,相信看过公版首测的用户们都已经了解其大致性能,这款最新发布的显卡根据性能来看处于RTX 3080与RTX 3090之间,并非常接近后者,综合来看几乎只比RTX 3090少了12GB的显存。今天给大家带来的是影驰GeForce RTX 3080 Ti星曜OC的评测。
再一次发布新卡,玩家最关心的肯定是能不能买到,一卡难求的局面能否得到改善。的确近一年来收到全球芯片短缺加上矿潮的影响,真正有需求的玩家几乎很难买到显卡,反而是矿老板和黄牛冲的最勇猛。
影驰GeForce RTX 3080 Ti星曜OC
NVIDIA也关注到了玩家需求,在官方博客中再次宣布,后续推出的RTX 30系显卡,除了GeForce RTX 3090外将全部从芯片层面限制挖矿,包括之前已经推出的RTX 3060/3060 Ti/3070/3080,以及后续将要推出的显卡。
影驰在GeForce RTX 30系显卡中将全部系列推倒重做,包括黑将、金属大师、星曜以及GAMER系列在外观上均有非常大的改动,今天我们要评测的GeForce RTX 3080 Ti星曜OC,则是更加注重于动手动脑的一款产品,在评测开始前,笔者先将它的特点简要列出,方便大家阅读:
性能超越公版,Boost频率达到1710MHz
上盖可自由涂鸦,并且官方接受私人订制图案
附赠2槽挡板,可兼容更多机箱
影驰GeForce RTX 3080 Ti星曜OC
总的来说,影驰GeForce RTX 3080 Ti星曜OC是一款可玩性很高的显卡,上盖可自由涂鸦,并且官方接受私人订制图案。透明的亚克力罩采用不规则水晶切割面,真正做到“千面闪耀 百变星曜”。性能方面这款显卡几乎与GeForce RTX 3090无差别,同时相对GeForce RTX 3080将显存增加到12GB,更适合4K游戏。
01旗舰核心GA102-225-A1
下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turing为1次,GeForce RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turing为14 TFLOPS。
第一代NVIDIA RTX架构 Turing下的RTX 2080 Ti
第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti
NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RTTFLOPS,而Turing为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达273 TensorTFLOPS,而Turing为114 TensorTFLOPS。
GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看GeForce RTX 3080 Ti在GA102中做了哪些改动。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3080 Ti的CUDA数量是10240个,所以可以推断GeForce RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3080 Ti与GeForce RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。
关于这张卡的定位,更多的还是旗舰游戏,它从参数来看相比GeForce RTX 3080提升很多,非常接近GeForce RTX 3090,仅是显存相差12GB,而大显存对于软件渲染来说又是至关重要的,正如GeForce RTX 3090在发布之初的定位,就是专注于内容创作者。
渲染8K素材占用了17GB显存(点击查看大图)
如图我们使用Keyshot9做测试,渲染8K或4K素材的显存占用率非常高,能达到17GB甚至更高,这对于只有12GB显存的RTX 3080 Ti就完全不够了,爆显存的危害想必大家也知道,可以导致游戏或软件崩溃,从而进程丢失。
02NVIDIA Ampere架构GA102解析
GeForce RTX 3080 Ti采用了GA102核心,拥有280亿(28000 million)个晶体管,628平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。
本次NVIDIAAmpere架构的SM在Turing架构基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3080 Ti共有10240个CUDA,其实它有5120个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了10240的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03影驰GeForce RTX 3080 Ti 星曜OC 外观
影驰GeForce RTX 3080 Ti星曜OC是外观非常独特的一款显卡,导流罩分为两部分,底层为纯白色,能够进行涂鸦设计,上面还有一层透明亚克力罩,让玩家充分发挥动手能力,下面我们也找了几张官方样图来看看涂鸦后的效果。
官方涂鸦后的星曜
官方涂鸦后的星曜
同一张显卡在不同人的手中,能有千种变化,大大提高了可玩性。当然对于绝大多数玩家来说,拿笔画画是太遥远的事情,不过好在影驰GeForce RTX 3080 Ti星曜OC的上盖和背板接受私人订制,助你打造出“百变星曜娘”。关于私人订制,用户购买后可通过电商客服联系影驰官方人员。
影驰GeForce RTX 3080 Ti 星曜OC及包装内配件一览
影驰GeForce RTX 3080 Ti 星曜OC打开包装后除了显卡本体外,还附赠了可替换的2槽位挡板、显卡支架、灯光同步线以及防滑贴等配件。而显卡则为纯白色,正面导流罩分为白色底层以及透明的亚克力罩双层,整体尺寸为316×132×56.5mm(不含挡板)。
影驰GeForce RTX 3080 Ti 星曜OC上机效果
再来看一下上机点亮后的效果,默认为RGB颜色渐变循环,因为有透明亚克力罩的原因,每种颜色看起来都晶莹剔透,仙气飘飘。可以说不涂鸦的影驰GeForce RTX 3080 Ti 星曜OC也是非常好看的。另外所有的灯光效果通过包装内附赠的12V VRGB灯光同步线,可支持四大板厂灯控软件。
11叶静霜风扇
影驰GeForce RTX 3080 Ti 星曜OC的主动散热部分采用11叶静霜风扇,每一片扇叶均为三折设计,能够有效加强进风量,顺畅输送风流,保障散热效果。内部则为大面积镀镍铜底,全面覆盖GPU和显存,搭配6根6mm镀镍复合热管辅助导热。
不规则的水晶切割亚克力罩
从显卡侧面我们可以直观感受到,影驰GeForce RTX 3080 Ti 星曜OC的透明亚克力罩均为水晶切割状,这也是为什么在通电后我们能看到如此晶莹剔透的效果。
影驰GeForce RTX 3080 Ti 星曜OC背板展示
影驰GeForce RTX 3080 Ti 星曜OC背板部分可以看到芯片处有较大面积镂空,方便发热量高的元器件散热,在尾部同样有蜂窝状的镂空处理。另外在供电接口处当外接供电连接正确,正常供电,则白灯亮起,反之则红灯亮起还有电源连接指示灯。
8+8pin供电接口
影驰GeForce RTX 3080 Ti 星曜OC定位于游戏旗舰,性能目前仅次于GeForce RTX 3090,所以功耗也与之相仿达到350W。供电接口采用了8+8pin的设计,推荐电源为750W及以上。
挡板及视频接口
视频输出接口依旧采用了DP1.4a*3+HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。影驰GeForce RTX 3080 Ti 星曜OC的默认挡板为3槽厚度,如有机箱不兼容的情况可以手动替换为包装内的2槽挡板。
043DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥影驰GeForce RTX 3080 Ti 星曜OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,影驰GeForce RTX 3080 Ti 星曜OC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,Boost频率达到1710MHz,相较公版的1665MHz有很大提升。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下(所有测试项均为一键超频后1710MHz测试结果):
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应影驰GeForce RTX 3080 Ti 星曜OC的性能水平。
在该测试中可以发现三款显卡的分数基本难分伯仲,其中在2K/4K分辨率下影驰GeForce RTX 3080 Ti 星曜OC的分数甚至超越了GeForce RTX 3090公版的成绩。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 3080 Ti 星曜OC的分数会略逊于GeForce RTX 3090。对比公版GeForce RTX 3080 Ti高1%,对比GeForce RTX 3080的分数要高出9%左右;对比上一代GeForce RTX 2080 Ti的分数要高出45%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中影驰GeForce RTX 3080 Ti 星曜OC再次超越GeForce RTX 3090,虽然成绩微乎其微,但也的确出现了性能的越级;对比GeForce RTX 3080的分数提升约为13%;对比上一代GeForce RTX 2080 Ti的分数提升则非常大,约为62%。
05游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在《刺客信条:英灵殿》中影驰GeForce RTX 3080 Ti 星曜OC和GeForce RTX 3090的大部分分数相同,仅有1帧的差距。同时GeForce RTX 3080的分数差距在1080P和2K分辨率下也并不大,主要是4K分辨率会有10%左右的差距。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,影驰GeForce RTX 3080 Ti 星曜OC小幅领先GeForce RTX 3090,而相比GeForce RTX 3080的提升约为5%左右。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,但在benchmark的帧数测试中经常会不稳定,在本次测试中影驰GeForce RTX 3080 Ti 星曜OC在4K分辨率下与GeForce RTX 3090相差1帧,另外在4K分辨率下的成绩要领先GeForce RTX 3080 17%左右。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,另外我们注意到,在本次测试中大部分游戏1080P分辨率的成绩基本没有差距,这也是因为如此高性能的GPU在1080P分辨率下已经绰绰有余,开始受制于CPU的性能。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。可以看出三款显卡的成绩基本相同,在整体性能趋同的情况下,分数差距并不大。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
06功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
影驰GeForce RTX 3080 Ti 星曜OC经过我们的实测在满载状态下单卡功耗为350W左右,满载频率保持在1965MHz左右,在整体性能与GeForce RTX 3090相仿的情况下,建议搭配750W及以上电源。
温度方面,本次的影驰GeForce RTX 3080 Ti 星曜OC经过15分钟左右的拷机,温度稳定为71℃左右,在更高频率的情况下比GeForce RTX 3080 Ti低了4℃左右,并且频率稳定无降频情况。
07部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
《赛博朋克2077》DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
08软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
09千面闪耀 百变星曜
NVIDIA GeForce RTX 3080 Ti的发布,确保了其“真游戏旗舰”的地位,其实向来“80 Ti”这个型号在历代显卡中就是作为常规型号的旗舰存在。只不过此次的TITAN型号变为了3090,也一直让大家误解3090是游戏卡。
影驰GeForce RTX 3080 Ti 星曜OC
而此次影驰GeForce RTX 3080 Ti 星曜OC包括其他非公版的显卡推出,在游戏性能上基本已经追评GeForce RTX 3090,而在4K分辨率下,12GB显存也非常合理。如果不涉及到专业软件的4K/8K分辨率素材渲染,24GB显存的确用不到。
说回影驰GeForce RTX 3080 Ti 星曜OC这款显卡,外观方面,在评测中我们展示了涂鸦后的显卡示例,的确称得上“百变星曜娘”,但我想大部分用户都属于,“大脑:我会了;手:你放屁”的类型,所以影驰官方可以推出已经画好的“完成款”,让手残党也能拥有自己的星曜娘,或者单独推出完成款的可替换导流罩。单说影驰GeForce RTX 3080 Ti 星曜OC的原始外观,纯白色加亚克力罩的组合同样有晶莹剔透的感觉,如果机箱内发光源较多,反射后的星曜也是很漂亮的。
影驰GeForce RTX 3080 Ti 星曜OC
性能上影驰GeForce RTX 3080 Ti 星曜OC的Boost频率达到了1710MHz,通过实测可以看到大部分成绩均超越公版,更接近GeForce RTX 3090,甚至在理论性能测试中有超越的现象。
在游戏上,影驰GeForce RTX 3080 Ti 星曜OC在4K分辨率下,基本已经可以完美驾驭市面上大部分3A大作。所以如果想在高分辨率下流畅体验光追游戏,这款卡是非常不错的选择。
影驰GeForce RTX 3080 Ti 星曜OC
但根据目前显卡市场的行情,抛开首发时的价格,依然会涨价很凶,乐观估计在半年后市场价格才会逐渐回落。而根据我们得到的消息,这批发布的显卡供货依然不容乐观,极有可能还是一卡难求。