本
文
摘
要
省流:性能很强,在DLSS3的加持下,RTX 4080 16GB的游戏性能与生产力性能相较RTX 3080 10GB都几乎翻倍,且没有矿卡,故十分值得买!以下为测评正文。
大家好,我是黄昏百分百,很荣幸获得了英伟达与七彩虹的联合邀请,参与到RTX 4080显卡的媒体首测中来,在上代安培架构的首发测评中,我分别测试了iGame GeForce RTX 3080 Advance OC 10G与iGame GeForce RTX 3080 Vulcan OC 10G两款显卡。为此,本次我专门申请了全新一代的iGame GeForce RTX 4080 16GB Vulcan OC显卡。
今天我将通过全新显卡技术介绍与性能实测,帮助大家详细了解采用Ada架构的RTX 40系显卡到底有着多么巨大的架构与性能进步。
好了,废话不再多说,我们开车吧。Ada Lovelace 架构优势分析
说到RTX 40系显卡,首先自然要为大家介绍一下其在制作工艺与架构上的升级,这里我先为大家介绍一下全新的Ada Lovelace架构。
新架构,新制程
▲NVIDIA Ada Lovelace 架构作为 GeForce RTX 40 系列显卡的核心,必须要放在最前面说。Ada 架构基于定制的 TSMC 4N 工艺,晶体管数量从上一代的 280 亿个激增至 760 亿个,是目前世界上工艺最精湛的 GPU 架构。
▲从图灵架构开始,英伟达开始采用 流式多处理器 (Streaming Multiprocessor,SM)架构以执行光线追踪等运算工作,上图左侧为全新Ada架构,右侧为30系所使用的安培架构,从图中可以看出,SM布局基本与上代保持一致,而最核心的变化便是其内Ada 4代 Tensor Core取代了安培架构中的3代的Tensor,用于光线追踪的RT CORE从安培架构的第二代RT CORE升级到了第三代RT CORE。不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。
▲而每两个SM组成一个纹理处理集群(Texture Processing Clusters,TPCs),再由多个TPC组成一个图形处理集群(Graphics Processing Clusters,GPCs)。
▲而Ada架构的GPU则是由多个GPC组成的,以一个完整的AD 102芯片为例,其拥有12个GPC,72个TPC,144个SM,18432个 CUDA核心。
▲而RTX 4080的GPU芯片 *** 拥有9728个CUDA核心,并搭载了16GB 的256bit GDDR6X显存。
▲技术方面,ADA架构的RTX显卡还带来了着色器执行重排序、微网格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。这几个技术,我会在后面详细介绍。
▲最后,在能效比方面,Ada 架构的效率也令人感到不可思议:在相同的功率下,其性能相较安培架构最高可达两倍以上;增大功率,性能还能持续提升。
第三代光线追踪 画面更加真实
这里先说一下着色器执行重排序 (SER) 技术吧。
▲高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染 3D 场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。)
着色器执行重排序 (SER) 技术能够动态调整这些工作负载的顺序,让原本低效的流程变得异常高效。SER 可将光线追踪操作的着色器性能最高提升 2 倍,或将游戏的帧率最高提升 25%。▲通俗一点说,SER技术便是通过将排序,使显卡由逐个运算加法改为了运算乘法,自然效率能够得到大幅提升,同时不会增加显示延迟。
▲紧接着我们再说一下第三代RT CORE新搭载的两款引擎,除了在安培架构中已经使用的Box Intersection Engine与Triangle Intersection Engine两款引擎。Ada架构搭载的新款 RT CORE 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。
▲OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒,围栏等。
▲以树叶为例,全新ADA架构RT Core搭载的OMM引擎可将树叶分为全透明部分,不透明部分与半透明部分,大幅减少着色器工作量,进而明显降低光线追踪对游戏性能的影响。
▲左侧为未开启OMM引擎时的着色器工作量,右侧为OMM引擎开启后的着色器工作量,可见OMM的性能立竿见影。
▲而面对珊瑚蟹这种极不规则,超多个平面(三角形)的物体,则需要DMM引擎来提升光追性能了。
▲相较于安培架构需要将多个三角形与复杂的BVH放入RT CORE中进行处理,ADA机构可以将图形转化为一个基础的三角形,一个Displace Map与一个简单的BVH,再放入RT CORE中进行处理。
▲因此,DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构 (BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。
DLSS 3 让帧数起飞
▲有一说一,光线追踪还是会对游戏帧数有一定的负面影响的,所以就需要DLSS来提升游戏帧数了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度学习超级采样),是一种通过基于 AI 的超高分辨率重新定义实时渲染,即渲染更少的像素,然后使用 AI 构建更清晰、更高分辨率的图像的方法,可以有效的在不牺牲画质的情况下通过AI算法提升游戏的帧率表现。
▲从图灵架构的RTX 20系显卡开始,DLSS技术随着显卡架构一起进化,目前已经进化到了第三代DLSS,除了代表性的DLSS 超分辨率技术,还融合了DLSS帧生成技术与NVIDIA Reflex技术。
▲这里重点说一下DLSS 3中的潜在帧生成技术,其可通过对前后帧的分析,在两帧之间插入一帧,进而是游戏帧数有着近乎翻倍的提升。肯定有朋友会问,这个插帧技术与电视常用的MEMC插帧技术相比有什么区别。
▲这里便要说,电视因为其不参与画面渲染的过程,所以只能够通过算法与预测中间帧应该显示的画面,难免在阴影方面出现不准确的情况,导致插帧后画面不自然。而英伟达显卡的DLSS 潜在帧生成技术因为是在渲染过程中在光流加速器中发生的,所以可以获得准确的运动矢量(MOTION VECTORS),所以可以准确预测出中间画面所处的状态, 自然画面阴影效果就十分准确了。同时,生成的帧不需要CPU提供数据,因此整体帧率可以超过CPU渲染的帧率限制,大幅降低了对CPU性能的要求。
▲同时,DLSS 3 潜在帧生成技术与超分辨率技术结合,渲染1080P分辨率的原始画面,再超分辨率到4K画面,同时,2个4K分辨率的帧之间再生成一帧。所以,平均两个4K帧中,只有一张1080P的帧是CPU与显卡实际渲染的,占总生成画面的八分之一,可见DLSS技术对帧数提升之大。
截至11月15日发文,已有10款DLSS 3游戏发布:1.《瘟疫传说:安魂曲》(A Plague Tale: Requiem)
2.《光明记忆:无限》(Bright Memory: Infinite)
3.《毁灭全人类2:重新探测》(Destroy All Humans! 2 - Reprobed)
4.《暗影火炬城》(F.I.S.T.: Forged in Shadow Torch)
5.F1 ® 22
6.《逆水寒》(Justice)
7.《生死轮回》(Loopmancer)
8.《漫威蜘蛛侠:重制版》 (Marvel’s Spider-Man Remastered)
9.《微软模拟飞行》(Microsoft Flight Simulator )
10.《超级人类》(SUPER PEOPLE)其中,《逆水寒》、《瘟疫传说:安魂曲》我在RTX 4090首测中有所设涉及,本次还加入了《光明记忆:无限》、《毁灭全人类2:重新探测》、《暗影火炬城》、《生死轮回》四款正式版游戏的实测。除了DLSS 3普及速度非常快之外,以上10款游戏有4款为国产游戏,可见国产游戏在新技术的使用上还是非常厉害的,后续文章中我会详细与大家聊。
另外,WRC Generations, 《极品飞车:不羁》(Need for Speed Unbound)和 《战锤40K:暗潮》(Warhammer 40,000: Darktide) 在RTX 4080推出后不久就会发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。
书归正传,我们来比较一下DLSS开启后对画面效果的影响,左侧为DLSS性能模式下的4K分辨率,右侧为原生4K画质:▲首先看一看《赛博朋克2077》BenchMark中的截图,整体画面一眼看上去基本无差异,DLSS似乎能够无比接近原生分辨率了。
▲背景中的这个栏杆,DLSS画面还要比原生4K画质更加锐利清晰。
▲不过,背景的瓷砖上,开启DLSS后还是稍微有一点糊的,不过如果不像我这样放大多倍去找茬,是根本发现不了的。
▲在同BenchMark的酒吧场景中,DLSS开启后,画面效果则要明显比未开启DLSS时更加的透彻,顶部招牌也更加的锐利清晰,个人觉得本场景下DLSS的画质要明显优于原生4K分辨率。
▲同样,在网易大作逆水寒的测试中,DLSS开启后的地砖,相较原生4K分辨率的地砖,纹理上也更加清晰,可见在有光照充足的画面中,开启DLSS后的画面甚至可能超过原生4K分辨率的画质,且其能偶带来大幅度的帧数上升,还是很值得开启的。
NVIDIA REFLEX 低延迟技术
▲NVIDIA REFLEX 低延迟技术主要分为NVIDIA REFLEX SDK与NVIDIA Reflex延迟分析器,其中NVIDIA Reflex延迟分析器涉及到了外设、显示器等其它硬件,本文不做涉及,近介绍一下NVIDIA REFLEX SDK。
▲在传统的图像处理流程中,如果CPU 处理帧的速度快于 GPU 渲染帧的速度(高U低显),则会在CPU到GPU之间有一个等待渲染帧的队列,进而导致渲染延迟的增加。
▲而通过将NVIDIA REFLEX SDK直接集成到游戏中,就可以使CPU的帧处理速度与GPU的渲染速度保持同步,大幅降低渲染队列,并降低CPU背压,进而使游戏能够采样键鼠等外设最新的输入。最终降低画面与输入延迟,提高游戏体验。目前,NVIDIA REFLEX技术已经被集成在了DLSS 3中。
▲目前已经有超过35款游戏与软件支持DLSS 3,包括国产游戏《黑神话:悟空》、《光明记忆:无限》、《生死轮回》、《仙剑奇侠传 7》等。
NVIDIA RTX REMIX 让老游戏重获新生
▲有非常多的经典游戏,无论在剧情上还是游戏性上,都堪称经典,唯独游戏画面上受开发时间限制,已经跟不上现在的潮流。因此,英伟达开发了RTX REMIX软件,可以帮助MOD爱好者在AI的帮助下,对游戏画面进行光追化重构,让游戏重获新生。
▲NVIDIA RTX REMIX可以将素材资源整合给多个软件使用,进而大幅降低MOD制作难度,提高制作效率。
▲V社经典游戏《传送门》最近便推出了RTX版的DLC,也即将上线,之前在Steam上拥有《传送门》原作的同学可以免费获得光追升级哦,游戏的画面效果可以说是立竿见影,算是老游戏重获新生的优秀例子了。各位MOD爱好者们也可以根据自己的喜好对旧游戏进行画质升级,我很好奇各位会拿NVIDIA RTX REMIX去升级哪些游戏的画质。
RTX 4080 全新旗舰级游戏显卡
自从英伟达在安培架构中新增了RTX 3090与RTX 3090 Ti这两款24GB显存的显卡,可以说将图灵架构时代单独命名的TITAN RTX这个生产力工具级别的显卡正式并入了GeForce RTX系列。因此,无论是上代的RTX 3090(Ti)还是本代的RTX 4090,更多情况下还是被当作生产力工具使用,亦或者用来游玩8K与VR游戏,而RTX 4080这个级别的显卡往往更被游戏玩家所喜爱,完全可以视作全新的旗舰级游戏显卡,所以我们首先来测试一下iGame GeForce RTX 4080 16GB Vulcan OC 的游戏性能。
测试平台简介
本次我分别测试了全新的iGame GeForce RTX 4080 16GB Vulcan OC与上一代安培架构的iGame GeForce RTX 3080 Vulcan OC 10G,两款火神显卡,无论是从英伟达的GPU芯片定位,还是从七彩虹 iGame的显卡产品线定位,都完全一致,所以用于比较两代显卡架构与性能上的差距再好不过。
另外,因为我还有幸参与了GeForce RTX 4090的首发测评,当时Intel 13代酷睿处理器的性能测试尚未解禁,当时用的便是12代酷睿 i9-12900K进行测试,本次为了将RTX 4090的性能测试得分同样放入比较,故尽可能的控制变量,依旧使用12代酷睿i9-12900K处理器进行测试,望周知。iGame GeForce RTX 4080 16GB Vulcan OC参数对比
▲可以看到,iGame GeForce RTX 4080 16GB Vulcan OC相较于iGame GeForce RTX 3080 Vulcan OC 10G,在芯片制程、CUDA数量与核心频率上均有提升,其中一键超频核心频率更是上升了47%,这在显卡上来说,绝对是巨幅提升。
而在显存方面,RTX 4080 16GB提升了频率而降低了显存位宽,两者的显存总带宽差的并不大,个人觉得是为了降低GDDR6X的发热,同时大显存也可以一定程度上放置爆显存的发生,这点晚一点我们再来测试。全新iGame GeForce RTX 4080 16GB Vulcan OC相较于上代火神拥有更为凌厉的造型,独特的锖铁色金属外骨骼更显凶悍,为其强劲的性能做出警告。作为后赛博时代的高端硬件,系列经典的锐利三角元素也将完美传承。漆黑的底色体现了它低调的个性,打造锋锐冷酷的高端硬件。9翼扇叶如镰刀般锋利厚实,散热性能甚至比前代13翼扇叶的风扇更加强劲,而且整体也显得更加简洁。
▲背板也经过了优化,部分铝制散热鳞片直接露出,大幅加大了与空气的接触面积,同时方面热空气向上流动,通过CPU水冷的灯牌排出机箱,避免造成闷罐。
▲而iGame 火神显卡最具识别度的LCD显示屏在本世代得到了巨大升级,不仅屏幕分辨率提升到了800*216px,画面更加清晰,而且采用磁吸式分体设计,无论显卡横装、竖装,屏幕内容总在你面前。
▲磁吸式分体设计的另一个好处便是其可以配合着底座独立显示内容,成为可爱的桌面摆件,也可以更好的帮助玩家实时监控游戏帧数与电脑性能。
▲将LCD屏幕取下时,也不用担心显卡没有灯效而难看,iGame专门提供了灯光配件,同样采用磁吸设计,贴上之后,炫酷的RGB立刻就回来啦!
▲通过全新的iGame Center软件,不仅可以调整硬件灯效,快捷的进行硬件超频,还可以为Vulcan系列显卡(包括之前几代Vulcan火神显卡)的LCD屏定制输出图案,且不只是静态图片,gif动图同样可以完美显示,之前我在RTX 3080Ti首发测评时做了动图,本次实在是没有时间,争取下一次再补上。
▲接口方面,依旧是3DP1.4a+1HDMI2.1的配置,另外,一键超频按钮也从RTX 3090Ti起便进行的工艺升级,目前不仅手感更好,而且更不易损坏。
▲供电方面,英伟达在RTX 3090 Ti时便正式改为了PCIe5.0标准的12+4 Pin接口,七彩虹iGame GeForce RTX 4080 16GB Vulcan OC自然采用的也是PCIe5.0标准的12+4 Pin接口,配合着七彩虹为火神设计的22+4项供电,可以为显卡的性能释放提供充足的保障。
最后这里友情提示一下:iGame GeForce RTX 4080 16GB Vulcan OC的尺寸为348.5*159.5*70.4mm(含挡片) ,购买机箱前请仔细确认尺寸,另外,别问我是怎么知道的。3DMark Fire Strike Ultra 测试
▲3D MARK专为DirectX 12设计的Time Spy Extreme, Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,而其Extreme版本则是将分辨率提升至4K。
▲iGame GeForce RTX 4080 16GB Vulcan OC的3D Mark Fire Strike Ultra总得分与显卡得分分别为17324,17221,相较于RTX 3080 10GB的得分11261与10997分别提升了54%与57%。
3D MARK Time Spy Extreme
▲Fire Strike 是一项适用于高性能游戏电脑和超频系统的 DirectX 11 基准测试。即使对于最新的显卡而言,Fire Strike 测试也非常严苛,而Fire Strike Ultra是其4K版本。
▲iGame GeForce RTX 4080 16GB Vulcan OC的3D Mark Time Spy Extreme总得分与显卡得分分别为13038,14035,相较于RTX 3080 10GB的得分8935与8895分别提升了46%与58%。
通过3D Mark的测试,我们基本得知了,在4K分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC的游戏性能基本上可达到RTX 3080 10GB的1.5倍以上,这还是未开启DLSS的情况下的结果,紧接着,我们就来测试一下两款显卡在DLSS开启后的性能表现。3D Mark DLSS test 游戏性能测试
▲3D Mark DLSS test是专门测试显卡DLSS性能的基准测试,其测试原理为连续进行两次的3D Mark Port Royal 光线追踪 基准测试,第一次为关闭DLSS功能,第二次为开启DLSS功能,通过游戏帧数变化来测试DLSS功能对游戏性能的提升,目前3D Mark DLSS test 1.3版本已经支持DLSS 3的潜在帧生成技术。
在4K 分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC在DLSS关闭时平均帧率为39帧,开启DLSS3后帧数暴涨为131帧,是未开启DLSS 3前的3.36倍。
而RTX 3080 10GB在未开启DLSS时基本上卡成PPT了,开启DLSS之后则可以达到平均帧率66帧。
可见,在4K分辨率下,均开启DLSS时,iGame GeForce RTX 4080 16GB Vulcan OC的帧率是RTX 3080 10GB的2倍。
而且,在显卡压力异常严苛的3DMark测试中,iGame GeForce RTX 4080 16GB Vulcan OC依旧有着131 FPS的高帧率,在其他游戏中跑到144 FPS并不是很难,也就意味着其可以跑满目前高端4K电竞显示器 144Hz甚至是160Hz的刷新率,高端显卡与高端游戏显示器的性能,终于达到同步了!另外,3D Mark DLSS test可在不使用8K显示设备的情况看下进行8K游戏的帧数测试,所以家境贫寒如黄昏我,也可以测试显卡的8K分辨率游戏表现了。
在8K分辨率下,如果关闭DLSS,两块显卡都卡在了1帧能玩的状态,应该是显存爆了,而开启DLSS后,iGame GeForce RTX 4080 16GB Vulcan OC则能够提供68 FPS的帧率,是RTX 3080 10GB的30 FPS的2.27倍。两块显卡刚好适配8K 60Hz与8K 30Hz的显示设备。《F1 22》 BenchMark
▲游戏测试中,F1Ⓡ 22为例,它支持NVIDIA DLSS和光线追踪不透明反射、光线追踪透明反射、光线追踪环境光遮蔽和光线追踪阴影几项技术,上次测试RTX 4090的时候,用的还是内测版本,而现在正式版也已经更新,开始支持DLSS 3并内置了Benchmark。
▲在BenchMark测试中,iGame GeForce RTX 4080 16GB Vulcan OC开启DLSS 3时帧率为192 FPS,1%为167 FPS,均可以跑满目前最高端的游戏显示器。
而关闭DLSS后,iGame GeForce RTX 4080 16GB Vulcan OC依旧可以提供78的平均帧率与52的1% Low 帧率,所以如果你依旧在使用4K 60Hz的显示器,在未升级显示器之前,你完全可以畅享原生4K分辨率的光追大作。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的246%。
同时,RTX 3080 10GB在开启DLSS 2后的平均帧率与1% Low 帧率分别为110 PFS与50FPS,两者相差很大,也就是说帧率并不稳定。同时,RTX 4080 16GB的平均帧率是RTX 3080 10GB平均帧率的1.75倍。《赛博朋克 2077》 BenchMark
▲紧接着我们测试《赛博朋克2077》,这款大作的正式版也已经支持DLSS 3了,我们一起去体验光追效果出众的夜之城魅力吧。
▲在测试的过程中,我们将使用NVIDIA最新推出的游戏性能监测软件FrameView来进行测试,其可以实时记录游戏中的帧率、1% Low帧率与延迟等参数,并汇总生成CSV数据库,简单来说,FrameView可以使没有内置Benchmark的游戏也能有拥有更客观准确的性能测试方法。
这里我再补充一下为什么1% Low帧率十分重要,试想一下:
在玩PUBG的时候,你通过十几分钟的搜刮,神装全部到手,但是与人对枪的时候卡了一下,直接被爆头成盒了,这种搜刮十分钟,成盒一秒钟的经历是什么感受。游戏中往往最激烈对抗时的帧数,才是决定游戏成败的核心要素,因此,1% Low时的帧率可能要比那99%不激烈对抗时的帧率还要重要!▲在实际测试中,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为30 FPS,1% Low 帧率为23 FPS,延迟为64ms。
开启DLSS 3后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率暴涨到了117 FPS,1% Low 帧率为93 FPS,延迟则降低到了43ms。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的227%。
RTX 3080 10GB在开启DLSS 2时平均帧率为53 FPS,且1% Low 帧率为41 FPS,延迟为48ms。RTX 4080 16GB在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的2.2倍,且延迟还要更低一些。
由此可见,DLSS 3技术不仅能大幅提升显卡的游戏帧数,还能够降低游戏延迟,可以非常明显的提升游戏体验。《瘟疫传说:安魂曲》
▲《瘟疫传说:安魂曲》也是首批支持DLSS 3的游戏之一,其正式版已经发布,前段时间我看B站上好多UP主在直播,暂时游戏内并无Benchmark,所以我们依旧采用场景复刻+FrameView监控来测试。
▲经实测,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为85 FPS,1% Low 帧率为71 FPS,延迟为60ms。
开启DLSS 3后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率上升到了133 FPS,1% Low 帧率为111 FPS,延迟则降低到了43ms。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的156%。
RTX 3080 10GB在开启DLSS 2时平均帧率为78 FPS,且1% Low 帧率仅为48 FPS,延迟为30ms。RTX 4080 16GB在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的1.7倍。《光明记忆:无限》
▲《光明记忆:无限》是一款国内飞燕群岛工作室的作品,此工作室在英伟达新技术的应用上可以说处于世界领先水准,首代游戏《光明记忆》便同时支持光线追踪技术与DLSS技术,我当时还专门做过光线追踪的效果测试,而续作《光明记忆:无限》更是直接赠送给了首代游戏的玩家,目前其内测版本已支持DLSS 3。
▲经实测,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为74 FPS,1% Low 帧率为54 FPS,延迟为61ms。
开启DLSS 3后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率上升到了168 FPS,1% Low 帧率为134 FPS,延迟则降低到了30ms。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的227%。
RTX 3080 10GB在开启DLSS 2时平均帧率为108 FPS,且1% Low 帧率仅为81 FPS,延迟为21ms。RTX 4080 16GB在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的1.6倍。
这里必须赞叹一句,飞燕群岛工作室对于光线追踪技术与DLSS技术的掌控是真的纯熟,即使游戏中光线追踪拉满,RTX 3080 10GB依旧能够跑到100 FPS以上,RTX 4080 16GB更是跑到了168 FPS,真的是画面与流畅兼得啊,我一个系列老粉玩起来爽爆了!《幻塔》
《幻塔》是完美世界游戏旗下Hotta Studio研发的轻科幻开放世界游戏,PC端测试版已经支持光线追踪与DLSS3,而且其画面可以说将光线追踪拉满也不为过,但就画面来说,算是非常优秀的网游了。
▲经实测,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为42 FPS,1% Low 帧率为32 FPS。
开启DLSS 3后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率上升到了140 FPS,1% Low 帧率为81FPS。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的333%。
RTX 3080 10GB在开启DLSS 2时平均帧率为81 FPS,且1% Low 帧率为56 FPS,延迟为21ms。iGame GeForce RTX 4080 16GB Vulcan OC在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的1.73倍。《生死轮回》
▲《生死轮回》(Loopmancer)是一款国产赛博风横板动作游戏,目前正式版已更新,支持DLSS 3和光线追踪反射。
▲经实测,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为52 FPS,1% Low 帧率为50 FPS,延迟为83ms。
开启DLSS 3后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率上升到了124 FPS,1% Low 帧率为95 FPS,延迟则降低到了惊人的20ms。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的238%。
RTX 3080 10GB在开启DLSS 2时平均帧率为85 FPS,且1% Low 帧率仅为60 FPS,延迟为24ms。RTX 4080 16GB在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的1.5倍。
这里的延迟表现可以看到,无论是iGame GeForce RTX 4080 16GB Vulcan OC开启DLSS 3还是RTX 3080 10GB开启DLSS 2,其延迟都降低到了20ms-24ms,大约是未开启DLSS时的四分之一,可见DLSS对提升竞技游戏与动作游戏的体验有十分重要的作用。《暗影火炬城》
▲《暗影火炬城》是由上海钛核网络负责开发的柴油朋克风类恶魔城游戏,支持光线追踪与DLSS 3,另外,过场的3D演出有全中文配音,国味十足,各种动物都萌坏了,强烈建议大家体验一下。
▲经实测,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为80 FPS,1% Low 帧率为57 FPS,延迟为54ms。
开启DLSS 3后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率上升到了183 FPS,为50 FPS,延迟则降低到了惊人的27ms。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的229%。
RTX 3080 10GB在开启DLSS 2时平均帧率为85 FPS,且1% Low 帧率仅为60 FPS,延迟为24ms。RTX 4080 16GB在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的1.5倍。
这里的延迟表现可以看到,无论是iGame GeForce RTX 4080 16GB Vulcan OC开启DLSS 3还是RTX 3080 10GB开启DLSS 2,其延迟都降低到了20ms-24ms,大约是未开启DLSS时的四分之一,可见DLSS对提升竞技游戏与动作游戏的体验有十分重要的作用。《毁灭全人类 2:重新探测》
《毁灭全人类 2:重新探测》是一款讲述外星人狂轰滥炸地球的邪典故事。玩惯了正派英雄为主角的游戏,玩玩反派主角做调剂也很不错,最新更新后的游戏支持DLSS 3。
▲经实测,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为79FPS,63% Low 帧率为57 FPS。
开启DLSS 3后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率上升到了185 FPS,为63 FPS。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的234%。
RTX 3080 10GB在开启DLSS 2时平均帧率为125 FPS,且1% Low 帧率为45 FPS。iGame GeForce RTX 4080 16GB Vulcan OC在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的148%。《Unity Enemies》Demo
▲Demo《Enemies》是Unity引擎最新发布的免费次世代技术演示Demo,游戏引擎公司用于炫技的软件就不用多说了,不仅SSGI(屏幕空间全局光照)、实时反射光线追踪、DLSS 3等最新的画面技术,还可以在运行中通过快捷键一键开关DLSS技术,从而更直观的比较DLSS对画面效果的影响。
Demo对整机性能的压榨可以说是极其彻底,无论是测试电脑的渲染性能,还是像体验一下次世代的画面效果,《Unity Enemies》都是很不错的,大家有兴趣也可以自行去Unity官网下载、体验。▲经实测,RTX 3080 10GB即使开启DLSS 2,平均帧率与1% Low 帧率也分别只有12 FPS和9 FPS,而iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时依旧有24 PFS的平均帧率与17 PFS的1% Low 帧率,开启DLSS 3后更是有着80 PFS的平均帧率与65 PFS的1% Low 帧率。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前PFS的333%,是RTX 3080 10GB 开启DLSS 2后 FPS的667%。
嗯,即使强如iGame GeForce RTX 4080 16GB Vulcan OC,在《Unity Enemies》Demo测试中也只能跑出80 FPS的成绩,新一代显卡终结者非它莫属。《地铁:离去 加强版》 Benchmark
▲《地铁:离去》是全球首款支持RTX光线追踪的游戏,由4A Games开发,因为其自带功能选项非常齐全的BenchMark,成为了众多装机爱好者们必备的跑分神器。其更新后的加强版支持全新光线追踪技术与DLSS 2.0,是一个很不错的跑分游戏,这里用它便是为了测试两款显卡在DLSS 2下的表现。
▲经实测,iGame GeForce RTX 4080 16GB Vulcan OC在未开启DLSS时平均帧率为50 FPS,1% Low 帧率为37 FPS。
开启DLSS 2后,iGame GeForce RTX 4080 16GB Vulcan OC的平均帧率上升到了97 FPS,为95 FPS。
开启DLSS 2后,RTX 4080 16GB的帧率是开启DLSS前的194%。
RTX 3080 10GB在开启DLSS 2时平均帧率为57 FPS,且1% Low 帧率仅为69 FPS。RTX 4080 16GB在开启DLSS 3时,其平均帧率是RTX 3080 10GB平均帧率的1.7倍。
除了RTX 4080 16GB的帧率要明显高于RTX 3080 10GB之外,还有一点值得注意,RTX 4080的帧率十分稳定,1% Low 帧率与平均帧率仅差2 FPS,可见游戏运行十分丝滑稳定,没有帧率的大起大落,玩游戏时不会因为帧率变动影响沉浸感。《古墓丽影:暗影》BenchMark
▲感谢EPIC给我们送上了古墓丽影三部曲,暗影是其最后一部。因为它是一个测试光线追踪与DLSS 2性能很好的游戏,除此之外,因为其可以提供GPU受限数据,也是判断CPU是否能够带动显卡的重要依据。
另外,因其有3个测试场景,过场黑屏会影响FrameView的帧率统计,所以这里改为了使用Benchmark内置的5%Low进行比较。本次测评中,所有画质与光追特效均为最高配置,4K分辨率时DLSS为性能模式,2K分辨率下DLSS为平衡模式,1080P分辨率下DLSS为质量模式。▲在4K分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC平均帧率164 FPS,RTX 3080 10GB 平均帧率103 FPS,RTX 4080 16GB的表现是RTX 3080 10GB的159%。
在2K分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC平均帧率204 FPS,RTX 3080 10GB 平均帧率141 FPS,RTX 4080 16GB的表现是RTX 3080 10GB的145%。
在1080P分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC平均帧率212 FPS,RTX 3080 10GB 平均帧率164 FPS,RTX 4080 16GB的表现是RTX 3080 10GB的129%。之所以随着分辨率的降低,RTX 4080 16GB的帧数优势也随之下降的原因,便是在4K与2K分辨率下,i9-12900K已经无法满足RTX 4080 16GB的需求,其GPU受限仅为54%与42%,简单来说,就是RTX 4080 16GB太强了,甚至连i9-12900K在2K与1080P分辨率下都带不动它,所以,建议入手RTX 4080 16GB的朋友直接一步到位,入手13代酷睿i9-13900K并配合超高频内存使用。
RTX 4080 16GB可当作生产力工具使用
虽然RTX 4080 16GB并没有像RTX 3090(Ti)或RTX 4090那样搭载24GB的超大显存,不过16GB的显存也已经比较大了,爆显存的风险相对RTX 3080 10G等显卡在生产力方面要有着明显的优势,因此这里我们再来测试一下RTX 4080与RTX 3080的在生产力软件方面的跑分,同时依旧会附上RTX 4090的成绩。
这里要说明一点,RTX 4090在测试时,使用的驱动版本要比本次测试稍老,所以分数上可能差异比较大,故仅供参考。V-Ray 5 Benchmark 测试
▲首先我们使用V-Ray 5 Benchmark进行测试,这款软件内置了3个测评项目,分别为用于测试CPU的V-Ray测试,可以同时测试CPU与GPU的V-Ray GPU CUDA,以及考验显卡RTX渲染功能的V-Ray GPU RTX测试。本次测试中我们只测试V-Ray GPU CUDA测试的单GPU模式与V-Ray GPU RTX测试。
▲RTX 3080 10GB的V-Ray GPU CUDA得分为3031分,而iGame GeForce RTX 4080 16GB Vulcan OC的得分为3031分,是RTX 3080 10GB得分的173%!
▲RTX 3080 10GB的V-Ray GPU RTX得分为2362分,而iGame GeForce RTX 4080 16GB Vulcan OC的得分为4061分,是RTX 3080 10GB得分的172%!
OctaneBench benchmark 测试
▲OctaneBench是目前最流行的GPU渲染基准测试之一,其内置了一系列渲染测试。
▲RTX 3080 10GB的OctaneBench得分为553分。
▲iGame GeForce RTX 4080 16GB Vulcan OC的OctaneBench得分为928.56分,是RTX 3080 10GB得分的168%!
▲附:iGame GeForce RTX 4090 Neptune OC的OctaneBench得分为1259.97分。
Blender Open Data benchmark 测试
▲Blender是一款开源 3D 创建套件。它支持3D 建模、动画、视频编辑等诸多功能,同时支持NVIDIA RTX 渲染OptiX AI 降噪。在RTX 3090 Ti的测试中,我便使用了junk shop进行了光追渲染测试。
而Blender Open Data Benchmark将进行monster、junkshop、classroom三个场景的渲染测试。▲RTX 3080 10GB的测试中,monster、junkshop、classroom三个场景得分分别为2477,1304,1061分。
▲在iGame GeForce RTX 4080 16GB Vulcan OC的测试中,monster、junkshop、classroom三个场景的得分分别为4791,2015,2022分。分别是RTX 3080 10GB得分的193%、155%、191%。
▲附:iGame GeForce RTX 4090 Neptune OC 在monster、junkshop、classroom三个场景下的得分分别为6492,2736,2672分。
达芬奇 DaVinci Resolve AV1编解码测试
▲英伟达提供了4K、8K的RAW格式视频各一个,我将通过达芬奇 DaVinci Resolve对其进行剪辑,输出一个1分钟的视频,编码格式分别为AV1与H265,我们将比较两款显卡在H265输出的效率,以及RTX 4080 16GB在AV1编码下的效率(RTX 3080 10GB并不支持AV1编码)。
▲两组测试中,所有参数均一致,只有分辨率与视频编码不同。
▲经实测,在4K与8K H.265的输出中,iGame GeForce RTX 4080 16GB Vulcan OC要比RTX 3080 10GB效率高129%与124%。因为RTX 3080 10GB并不支持AV1编码输出,我们便改为纵向比较,输出AV1格式还是要比输出H.265稍微慢一些。
▲实际播放中,同分辨率下,AV1格式的视频要比H.265格式的视频更清晰一些,不过图传上传到网上后压缩会比较严重,所以大家可能看的不是很清楚,建议大家有机会也可以自己下载一组AV1视频与H.265进行比较。
因此,支持AV1编码解码,使得iGame GeForce RTX 4080 16GB Vulcan OC可以提供更好的画质输出,同时因为其输出效率要比RTX 3080 10GB高出一倍有余,内容生产者还是很值得升级一下自己的配置,提高自己的生产力的。NVIDIA OMNIVERSE MACHINIMA 简介
▲NVIDIA OMNIVERSE MACHINIMA可以从游戏,素材库等资源库导入视频素材,并通过RTX渲染器进行渲染,叠加以语音自动生成面部表情技术,物理引擎计算,AI动作采集等,将素材整合成整体的画面。
▲不同类型的内容创作者,都可以使用NVIDIA OMNIVERSE MACHINIMA进行实时的RTX内容创作与协作。
▲借由实时动态光线追踪技术所渲染的图片,已经达到了乱真的程度。
▲同时,针对人物的面部动作,还可以通过导入音频进行面部细节动作的自动渲染,这样,生成视频中的人物就不会“木偶感”十足了,同时还剩下的大量的面部东西捕捉工作,让人们能够更加专注在内容本身的创作上。
▲动作捕捉,这点不用多解释了吧,很多电影和游戏,之前都是由专业人士穿着补满传感器的衣服执行那个动作,然后再进行建模,设备成本很高,而通过AI姿势估计功能,则只需要一个摄像头,成本降低明显,且修改动作也变得更加容易了。
将以上这些功能整合起来,视频爱好者就可以相对轻松的创作出属于自己的“史诗般宏伟”的视频作品了。而对于直播主等,NVIDIA BROADCAST则可以帮助他们更加轻松的进行直播。NVIDIA BROADCAST 简介
▲NVIDIA BROADCAST通过智能降噪,虚拟背景,摄像头自动成像功能,将直播主的人像视频源直接合成到主要视频源上,达到炫酷的效果
▲音频采集时自动降噪,AI自动采集直播主的人像部分,完全无需绿布,就可以扣去背景,再将其无缝融入到直播的视频中去。
嗯,简单总结下NVIDIA BROADCAST,它可以帮助直播主开电脑就开始工作而无需绿布背景,更省时间,更省空间。总结
首先,RTX 4080 16GB是非常优秀的4K游戏显卡,在DLSS技术的加持下,在绝大多数游戏中,即使画质最高,光追全开,依旧能够提供144 FPS甚至更高的帧率,满足目前最高端电竞显示器的输入需求,且在DLSS 3的加持下,8K 60 FPS的游戏渲染能力,即使连接8K显示器或电视,依旧可以提供画质细腻,足够流畅的8K游戏体验,可以说是目前最值得考虑的高端游戏显卡了。
同时,16GB大容量GDDR6X显存,以及AV1格式的编码、解码能力,使其也可以在一定程度上作为生产力工具使用,进行4K、8K视频渲染、输出,以及建模等工作。
关于购买建议,如果你目前已经有RTX 3080或RTX 3080 Ti,且你的显示器为4K 60Hz及以下的配置且不打算升级显示器,那么你可以再等等未来的RTX 3070,而如果你已经当了很久等等党,或者早有升级4K 高刷新率显示器的打算,那么,趁着RTX 4080 16GB首发,买一款最新的,毫无矿卡风险的全新高端显卡,还是很值得的。
本次评测所使用的七彩虹iGame GeForce RTX 4080 16GB Vulcan OC显卡,在做工和用料上可以说是整个市面上RTX 4080显卡的金字塔尖了。七彩虹作为显卡销量第一的品牌,在性能,设计,做工上一直在精益求精,作为从RTX 20系便入坑的七彩虹老粉,七彩虹iGame显卡在设计与工艺上的不断进步一直被我看在眼里,这里必须点一个大大的赞!最后,11月16日晚10点,七彩虹将在京东、天猫、抖音、快手等电商平台及线下授权零售经销渠道正式以现货发售或预售的形式同时上架iGame、战斧等多个系列的GeForce RTX 4080,包含 iGame GeForce RTX 4080 16GB Vulcan OC、 iGame GeForce RTX 4080 16GB Neptune OC、 iGame GeForce RTX 4080 16GB Advanced OC、iGame GeForce RTX 4080 16GB Ultra OC及战斧GeForce RTX 4080 16GB 豪华版,感兴趣的话可以去了解一下。
以上便是本次七彩虹iGame GeForce RTX 4080 16GB Vulcan OC显卡测评正文部分的全部内容,希望对你有所帮助,别走开,后面还有本次测评的其他硬件介绍,想要直接装整机的朋友,不妨来抄一下我的作业。
本次测评硬件简介
CPU intel 酷睿i9-12900K
▲12代酷睿首发时我便拿到了i9-12900K,虽然现在13代酷睿测测评已经解禁,为了方便大家比较RTX 4080 16GB与RTX 4090的性能差异,我继续使用12代酷睿来进行测试。
▲Intel 在12代酷睿上首次使用了大小核心设计,i9-12900K/KF共有16个核心,其中分为8个性能核(P核)+与能效核(E核),其中性能核支持多线程技术,主要用于对核心性能要求高的游戏与生产力需求,而能效核不支持超线程技术,用于多任务处理。因此i9-12900K为一款16核24线程的处理器。
英特尔(Intel) CPU处理器 台式机 12代 i9-12900K京东¥4469.00去购买主板 七彩虹CVN Z790D5 Gaming FROZEN 巡洋舰
▲本次测试使用的是七彩虹CVN Z790D5 Gaming FROZEN 巡洋舰主板,CVN系列是七彩虹从航母外观中获得了设计灵感,以上层水准的用料与高端的散热装甲以主攻中高端消费级市场的次旗舰系列。本代CVN系列主板更是弄弄的硬核军事风,还以各种军舰作为中文名,比如我这款便叫作巡洋舰,反正用了七彩虹CVN的主板,大家就都是船长了。
▲看一个主板的做工和用料,首先肯定是要看它的供电部分,稳定的供电是所有的硬件稳定运行的保证。在CPU的供电上,CVN Z790D5 Gaming FROZEN 巡洋舰采用的是16+1+1相F.C.C铁素体电感供电,配备了55A大电流大的L.R.T 8脚MOS,可以在保证自身供电稳定性的同时降低电感线圈对其它元件的干扰。10K黑金固态电容提供稳定的滤波效果,又没有爆浆危险,用料上还是可以的,700系主板出场时便支持Intel 13代酷睿处理器,晚一点我也有可能用这款CPU测试13900K与12900K的性能差异。
七彩虹(Colorful)CVN Z790D5 GAMING FROZEN 巡洋舰京东¥1999.00去购买内存 十铨(Team) DELTA DDR5 6400MHz
▲七彩虹CVN Z790D5 Gaming FROZEN 巡洋舰官方标称内存支持OC 6600MHz,不过目前市面上XMP 频率6600MHz的内存太少了,所以这里我专门选择了十铨(Team)的 DELTA DDR5 6400MHz,其支持intel XMP 3.0技术,可以一键超频至6400MHz,而且搭载了On-die ECC储存机制,可以使系统运行更稳定。
▲除了本次使用的黑色款,十铨(Team) DELTA DDR5还有白色可选,以适应不同的装机风格。
十铨科技 DELTA DDR5 6400 7200 32G(16G*2)炫光RGB台京东¥2639.00去购买SSD 宏碁掠夺者 Predator GM7000 2TB
▲SSD固态硬盘采用的是宏碁掠夺者 Predator的GM7000 2TB, 此前PS5新手向科普文章中使用的就是Predator GM7000,完美支持PS5主机扩容。宏碁掠夺者GM7000官方标称的读写速度分别为7400MB/s与6700MB/s,其中7400MB/s的顺序读取速度在目前的PCIe 4.0固态硬盘中属于绝对的第一匹队,放在此次测试中绝对不会成为显卡读取游戏内容的瓶颈。另外,Predator GM7000采用12nm先进制程主控,PCB布局更紧凑,能够有效降低SSD功耗及发热量,长时间测试下来也不会掉速。
▲经实测,宏碁掠夺者 Predator的GM7000顺序读取速度为7477MB/s,顺序写入速度为6661MB/s,顺序读写速度都符合标称速度,绝对属于目前PCIe 4.0 SSD的第一梯队,可以保证两张显卡测试的稳定运行。
▲之所以选择使用2TB的系统盘,主要原因便是现在的游戏实在是太大了,动辄几十上百个GB,一部蓝光原盘电影也要40、50个GB,512GB乃至1TB的硬盘很容易就装满变红,影响性能表现,而2TB到4TB的则很少会遇到这种问题,当然,如果还是不能满足你的储存需求,那么你需要再补充机械硬盘或者NAS了。
宏碁掠夺者(PREDATOR)2TB SSD固态硬盘 M.2接口(NVMe京东¥1429.00去购买电源 德商德静界(be quiet! ) PURE POWER FM 1000W
▲电源方面,本次使用的是德商德静界(be quiet! )的PURE POWER FM 1000W金牌全模组电源,配备了120mm降噪风扇,使用时基本无噪音,be quiet! 果然名不虚传。
▲PURE POWER FM 1000W采用了LLC架构,可以提供稳定的电源运转,电压调节能力也非常强。
▲德商德静界(be quiet! )的PURE POWER FM 1000W金牌全模组电源配备了双路独立的12V输出接口,且支持多路显卡供电,另外,德商德静界(be quiet! )马上会发布全新的独立12v新接口线缆,所有支持新接口线缆的用户均可联系德商德静界(be quiet! )客服免费获取新线缆,以在RTX 40系及RTX 3090Ti显卡上使用。
德商德静界(be quiet! ) PURE POWER FM 1000W额定全京东¥1099.00去购买水冷 九州风神(DEEPCOOL)冰魔方360
▲水冷采用的是九州风神(DEEPCOOL)的冰魔方360,这款水冷最值得说的便是这款多维无限镜的冷头了,真的是目前最耐看的冷头之一,必须得给设计师点个赞。
▲九州风神(DEEPCOOL)冰魔方360采用了全新的第四代水泵,噪音更低,散热性能更强,配合着九州风神的动平衡泄压技术,使水冷拥有5年的使用寿命,九州风神也为其提供了5年的只换不修超长质保。
本次测试的主角是显卡,所以并未安排CPU烤机测试,晚些我想试试拿这款水冷来呀i9-13900K与AMD R9-7950X。九州风神(DEEPCOOL)冰魔方360CPU水冷散热器(无限镜京东¥999.00去购买机箱 追风者(PHANTEKS) 518XTG 幻影白
▲这款机箱的模块化成都非常高,基本上每一块都可以拆卸或移动,走线时非常方便。
▲虽然这款机箱的两侧均为玻璃制成,但因为背面有着走线挡板的存在,哪怕不是理线高手,也可以把线藏得无影无形,做到眼不见则心不烦。
▲另外,同时支持双360冷排,显卡竖装等,也使得这款显卡成为了数一数二的水冷显卡、高端装机的优选机箱,我一开始是想换一个黑色机箱来测火神的,不过因为手头的机箱都不够长,所以本次便继续使用白色机箱装黑显卡啦。
追风者(PHANTEKS) 518XTG 幻影白电竞游戏水冷电脑铝机京东¥1399.00去购买