铭瑄终于迎来了本身的高规旗舰,MGG系列的诞生可以说弥补了铭瑄不停缺少的高端市场空缺,本日为各人带来的评测正是市场反响火热的——铭瑄GeForce RTX 4070 Ti MGG OC 12G显卡。
至于RTX 4070 Ti的性能定位,想必各人也已经相识。不外下面笔者照旧把一些扼要参数规格举行摆列,让各人有更直观的概念。
1 铭瑄GeForce RTX 4070 Ti MGG OC 12G概览
既然是全新系列,我们先来看看包装。MGG的外包装接纳了清新淡雅的淡蓝色,而且团体没有太多装饰,以系列logo贯穿始终。
该卡接纳金属全覆盖式导流罩,而且附近拥有圆润的倒角,配上深灰色纯铝,有一种刚中带柔的美感。根据官方的说法,该表面计划鉴戒于"水滴"圆润的造型,出现出如同水流般的颠簸。不外个人感觉它团体更像一种液态金属。
别的可以看到,深灰色地区的赛博朋克纹路计划,与团体造型产生了较强的视觉碰撞结果。
以是从图中的角度来看,另有点像跑车的前脸。
不外固然装饰不多,而且仍以MGG系列logo为主,但团体一些圆润的计划,却让金属背板看起来更具质感。
必要留意的是,现在实用于RTX 30系列的12pin接口和电源转接器与RTX 40系列显卡不兼容。
2 点阵氛围灯套件 与 MGG软件应用
下面我们就来单独看看这两个氛围灯套件,不管是随卡附赠的流彩套件照旧点阵套件,反面都有两个较大的磁吸点,磁石中心是与显卡主体接通的触点。
在毗连乐成后,软件左侧的【CONNECT】会亮起变为蓝色。
如今许多3A大作,我们仍旧以全屏独占的游戏方式为主,随时切出Windows,大概点一动手机总会让游戏体验不那么连贯,这个时间模式瞟一眼就能看到,而且没有那么多装饰。
简朴,每每是最有用的。
3 NVIDIA GeForce RTX 4070 Ti 架构浅析
本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,TSMC 4N NVIDIA定制工艺,旗舰焦点AD102到达了可怕的760亿个晶体管,而在RTX 30系显卡中为280亿个。
本次发布的GeForce RTX 4070 Ti到达40-TFLOPS,而不久前发布的RTX 4090则为83-TFLOPs。
本次GeForce RTX 4070 Ti利用了AD104芯片,尺度的5组GPC,NVENC单位减少了3个。
而每个GPC单位又搭载一个独立的光栅引擎、两组ROP分区(每组包罗8个ROP单位)。
由于团体架构分析篇幅较长,关于NVIDIA Ada架构的其他新特性就不在这里先容了,将在文章末端以附录的情势睁开阐明,有爱好的用户可翻至末了。
4 测试平台简介
起首先容一下测试平台,为了保障铭瑄RTX 4070 Ti MGG OC这张显卡的性能发挥,我们的平台也再次举行了全面更新。
RTX 4070 Ti接纳12GB GDDR6X Micron显存,位宽为192bit,显存带宽到达了504.2 GB/s,光栅单位和纹理单位为80和240。
5 理论性能测试
下面先举行的是用来权衡显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数现实测试效果如下:
在针对显卡DX11性能的3DMARKFS套装测试中,铭瑄RTX 4070 Ti MGG OC重要对比上一代旗舰RTX 3090 Ti,此中FS提拔了6%;FSE提拔了2%;FSU差距在5%。
而对比刚刚发布的RTX 4080,综合结果相差20%左右。
综合来看,铭瑄RTX 4070 Ti MGG OC在1080p以及2K分辨率下相比RTX 3090 Ti的上风比力显着,而4K分辨率下照旧有差距的。
究竟两款显卡的显存带宽相差一倍,只管RTX 4070 Ti的L2缓存到达了惊人的48MB,而RTX 3090 Ti只有6MB,但高位宽高带宽团体的上风依然显着。
这项测试联合了实韶光线追踪和传统渲染技能来丈量显卡性能。场景含有光线追踪反射、及时全局光照、网格着色器、体积照明、粒子和后处置惩罚结果。而且故意思的是,Speed Way测试支持自由探索场景,可检察光照及摄像机设置的改变怎样影响视觉结果。
在该项测试中,我们对比了刚刚发布的RTX 4080显卡,从1080p分辨率到8K的差距依次为:25%/25%/25%/55%。
6 通例游戏 性能测试
由于本次RTX 40系参加了DLSS 3新技能,以是背面会举行单独测试,这里依然选择主流的几款3A大作举行游戏性能对比。
这里简朴阐明一下"Low"分数的概念:
游戏benchmark通常测试的FPS即为,一段时间内的游戏均匀帧。而1% Low FPS则是将一段时间内的帧数从大到小分列,取最小的1%出来,再对这1%的数求均匀值。
以是《刺客信条:英灵殿》的0.1% Low则是将整段测试的FPS取最小的0.1%,再对其求均匀值。
但我以为0.1% Low有些过于严苛了,我们在游戏中不大概永久处于帧数最低的特别场景玩,大部门时间仍旧是较为流通的,否则benchmark的均匀帧就完全失去意义了。
在通例游戏测试中,不难发如今1080p分辨率下RTX 4070 Ti可以或许有很大上风,但依附24GB大显存以及1000 GB/s的带宽,在高分辨率下RTX 3090 Ti的上风非常显着。
以是综合来说,RTX 4070 Ti实在与RTX 3090 Ti算是气力相称,只不外两款显卡的"战场"差别,但假如在用户广泛利用的1080p和2K分辨率来说,RTX 4070 Ti的上风更大,更不要说它还可以或许开启DLSS 3这一神技。
7 DLSS 3性能测试
现在已参加DLSS 3的游戏包罗《逆水寒》、《微软模仿飞行》、《扑灭全人类2:重新探测》、《瘟疫传说:安魂曲》、《光明影象:无穷》、《暗影火把城》、《F1 22》、《存亡循环》、《漫威蜘蛛侠:重制版》、《超等人类》。最新发布的则有《WRC Generations》、《极品飞车:不羁》、《战锤40K:暗潮》、《漫威暗夜之子》、《杀手3》。
下面就让我们来现实测试,拥有全新的DLSS 3的游戏,能到达何种帧率。
本次RTX 4070 Ti定位于2K分辨率下的电竞级帧率,在《赛博朋克2077》中的数据反映比力真实稳固,可以看到在DLSS关的光线追踪最高的环境下,即便铭瑄RTX 4070 Ti MGG OC显卡也只有46帧,而且耽误到达了90.8毫秒。而在开启DLSS 3后,帧数为120。
可以看到在关闭DLSS 3后,纵然在2K分辨率下均匀FPS也有39帧,耽误也高达120.9ms。而开启DLSS 3后提拔非常大,性能提拔到达了121%。
这组对比中,由于场景受限,我们选择固定镜头测试,以是三组数据1% Low帧数相对较高。
8 温度及功耗测试
功耗测试中,我们选择FurMark软件举行拷机测试,并接纳GPU-Z检测温度,功耗仅盘算显卡自身。
9 大玩家 新玩法
铭瑄MGG系列最让人不测的是其计划语言,在同型号显卡中,即便是丐版与旗舰的性能差距一样平常也只有2-3%,玩家思量更多的照旧表面颜值,是否是本身中意的。
MGG系列接纳金属全覆盖式导流罩,而且附近拥有圆润的倒角,配上深灰色纯铝,有一种刚中带柔柔中有刚的美感。
再有就是与MGG一同发布的点阵氛围灯套件,它奇妙地将拾音功能融入此中,而且支持Type-C供电独立摆放,既可以吸附在机箱上,也可以放在表现器前做摆件。
铭瑄这个点阵氛围灯套件算是另辟蹊径,马赛克风格虽不算完全的创新,却也是显卡计划中的一股清流。而且它较为浮滑,显色结果也很好。除了拾音功能,时钟模式和自界说模式,也非常得当摆放在桌面上。
现在铭瑄这款RTX 4070 Ti MGG OC 12G显卡已经发售,首发代价7499元,到场满减300元,得手价7199元。而且如今还送代价199元的点阵氛围灯,有爱好的不妨如今动手。
10 附录1-NVIDIA Ada Lovelace架构剖析
Shader Execution Reordering (SER)着色器实行重排序
SER重要的作用是提拔着色器性能,它可以将服从低下的工作负载,动态重组为更高效的工作负载。重要针对光线追踪的性能提拔非常大。
简朴地说,GPU在实行雷同工作的时间服从最高。但随着光追结果越来越强盛,每个场景大概有数百万条光线照射在差别材质上,而我们知道差别材质的反射率,以及反射结果也是差别的。以是如许就为着色器创建了大量的、发散的,服从低下的工作负载。
不外幸亏这么实用的功能并不是RTX 40系的专利,它是一个易于集成的SDK,现在必要游戏开辟商集成在游戏中。别的由于它是一个通用的逻辑,后续也有大概直接集成在Windows的API中,如许游戏开辟者就无需特意引用,直接调用体系API即可。
第三代 RT Cores
RT Core的作用在于更快的光线追踪盘算本领,假如说在RTX 30系显卡中,想要畅享4K高帧率游戏有点吃力,那么RTX 40系显卡中,将显得十拿九稳。
Opacity Micro-Map Engines
在第三代RT Cores中引入了两个紧张的硬件单位,起首是Opacity Micro-Map Engines,可以明白为微映射透明度引擎,它重要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。
好比树叶之类的复杂物体,差别的光线都会影响它的体现状态,以及树叶之间的光线反弹,以是对于光线追踪的盘算量是巨大的。
Displaced Micro-Mesh Engines(DMM)
Displaced Micro-Mesh Engines可明白为微网格置换引擎,它构建光线追踪的BVH(Bounding volume hierarchy)的速率进步了10倍!所利用的的显存淘汰了20倍!
详细的工作原理从图中一览无余,新的DMM可以将面数非常多的复杂图形做简化,创造出简朴的模子,但团体的光线追踪结果稳定。
而这还不是最浮夸的,越复杂的模子每每优化的结果越好,在官方展示的这几组对比示例中,最快可提拔大于15倍的速率,容量简化20倍的模子。
第四代 Tensor Cores
除了光追单位的升级外,第四代张量焦点的升级更加可怕。它接纳了新的FP8张量引擎,在GeForce RTX 4090这张显卡上,吞吐量到达了1.32 Tensor petaFLOPs,进步了5倍。
留意这里的单元——petaFLOPs。以往的TFLOPs为万亿次浮点运算,而petaFLOPs则为万万亿次浮点运算。
本次推出的DLSS 3也是RTX 40系一大卖点,从DLSS 2.3直接迈入了DLSS 3版本,也能看出此次的升级之大。而DLSS 3也被NVIDIA官方称为神经网络渲染新期间。
全新的DLSS 3在原有的DLSS超分辨率的底子上,添加了光学多帧天生技能,以生玉成新的帧,而不像原来只能天生像素。
在GPU受限的游戏中,好比2K分辨率及以上的更高分辨率,DLSS 2可以或许将帧率进步2倍,DLSS 3则可以或许提拔4倍。
本次DLSS 3超过了一个大版本,从想法和原理上也再度升级,完全"料想"1帧的技能,我们表明起来简朴,但实行起来必要大量的推理与演算,以及绝对超前的想法。
不外"凭空"天生的1帧,在耽误上绝对要比DLSS 2高。以是此次完备的DLSS 3中,捆绑了NVIDIA Reflex,可以有用资助减小耽误。
New Optical Flow Accelerator
New Optical Flow Accelerator光流加快器是在第四代Tensor Cores中最新引入的,这也是为何DLSS 3中的帧天生为RTX 40系显卡独享。
光流加快器在本来DLSS 2的底子上,还可以盘算两个一连帧内的光流场,可以或许捕获游戏画面从第1帧到第2帧的方向和速率,从中捕获粒子、反射和光照等像素信息。并分别盘算活动矢量和光流来得到精准的阴影重修结果。
假如说原来DLSS 2可以或许"猜"出一张图剩下的像素,那么DLSS 3除了这些,还可以或许"猜"出下一帧的画面。
双AV1编码器
本次升级的第八代NVENC编码器可以说是直播、视频、后期工作者的极大福音。它初次参加了对AV1编码的支持,最显而易见的结果就是直播。
提及直播,OBS信赖各人都不生疏,在10月份即将发布的补丁中,OBS就参加了对NVENC的AV1编码支持
固然,直播只是我们更轻易见到的AV1上风,在视频工作的全部环节,AV1编码都可以带来极大提拔。
别的再说一下NVIDIA不停夸大的双AV1编码。顾名思义,即部门显卡内搭载了两个编码器,它所带来的结果也是显而易见的。
除了导出速率,8K 60帧的视频录制在从前简直不可思议,而双编码器的利益就是可以将图像一分为二,两个编码器分别处置惩罚7680×2160的图像信息,末了拼合完备。
关于编码部门,大概大部门用户的感受不深,但当有一天,你想录屏的时间,却发现显卡不支持,才会发觉它的紧张性……
随着图像渐渐进入到超清期间,硬件编码和渲染险些已经成为不可或缺的帮忙。固然论质量,硬件编码仍不及CPU软编,但软编做到了极限画质,也要蒙受时间的无穷长。乃至在一张8K渲染图中,两种编码方式的时间差距就已经到达了几个小时,遑论一段10秒的CG动画。在不停进步的硬件编码中,质量和时间也在不停地被挑衅和革新。
11 附录2-Ada Lovelace是谁?
Ada Lovelace(1815-1852)是英国数学家、盘算机步伐首创人,创建了循环和子步伐概念,被称为天下上第一位步伐员。
Ada从小对数学有极高天赋,其父称她为"平行四边形公主",厥后的互助同伴Charles Babbage称她为"数字女巫"。在19岁时Ada嫁给了本身曾经的科学家庭西席,婚后的她对数学热情不减。
而以她名字定名的语言——ada语言,已经成为了美国军方开辟战斗机等尖端武器的语言。
从几行简短的平生简介中,不丢脸出Ada的生命固然只履历了短暂的37个春秋,但却足以被后人铭刻。
这也是为什么此次NVIDIA RTX 40的先行宣传中,用到了"以将来敬传奇"的slogan。