媒介
GeForceRTX4090显卡已经上市有一段时间了,想必各人对它的性能体现已经了然于心,而包罗公版和非公版在内的RTX4090的计划都相称"规矩",如今有张显卡摆脱了限定,在规格、设置以及表面方面都做到了顶尖程度!用料也是极致豪华,就为了给极客玩家带来极致体验。
没错,它就是影驰GeForceRTX4090HOFOCLABPlus显卡,从属于名流堂系列,该系列被广大玩家称之为"旗舰中的旗舰",专为寻求极致性能的玩家量身打造,自从HOF系列显卡推出以来,就不停有超频发烧友及爱好者使用这些显卡革新天下超频记录,至今影驰GeForceRTX4090HOFOCLABPlus显卡已经拥有20项超频记录的美誉。
本日我们也有幸上手这张真正的卡皇,下面就给各人奉上它的具体评测。
下文"影驰GeForceRTX4090HOFOCLABPlus"简称为"影驰RTX4090HOFOC"
表面赏析
第一次收到影驰RTX4090HOFOC显卡的时间照旧有些震动的,究竟超规格的外包装盒从里到位都显暴露这是一种"奢侈品"的感觉,不愧是旗舰之名的显卡定位。
拆开后,影驰RTX4090HOFOC显卡仍旧接纳我们认识的家属式的白色涂装,正面一改之前的钻石切割工艺,而是换成了更具特色的机甲风,还戴上了高贵的象征——皇冠。如许的计划不但拥有丰富的视觉条理感,同时还彰显出顶级显卡才具备的高贵气质。
这张影驰RTX4090HOFOC显卡不止视觉上看起来巨大,体积方面更是重量级,足足有2.7kg重,完全就是一个巨无霸般的存在。
一众显卡厂商也是深知这次RTX4090的重量,因此在包装盒内也配备了全金属通用显卡支持杆套件,可以或许彻底杜绝显卡变形,给予显卡有用掩护。
正面抢眼的除了皇冠灯件外,就属三把巨大的散热风扇了,它们都大到将近撑破显卡外壳了,左右双方的是112mm的静霜风霜,中心的则是92mm,三大特大的散热风扇构成了显卡不可或缺的自动散热部门。
将镜头拉近,每个散热风扇都配有11片专属的静霜叶片,而且扇叶外貌显着颠末特别优化处置惩罚,外貌有磨砂质感,如许做的目标是包管显卡进风量,高效散热包管性能开释。
显卡的反面更加惊艳,同样是全白计划,不外在计划上参加了些小巧思,整个背板被大面积的"HOF"Logo覆盖,而且还配有名流堂特有的皇冠,无不彰显其高贵职位。
高强度的压铸金属背板比一样平常的金属背板更有助巩固显卡不易变型,而且还可以提拔散热效能,加上背板末了设有开孔计划,有用增强风扇气流,影驰RTX4090HOFOC显卡在高频运作下仍能稳固耐用。
而且背板上的HOF皇冠Logo标记照旧一个RGB灯件,在显卡接通电源后可以或许亮起,与其他硬件同步灯效后,RGB结果更是炸裂。
既然说到RGB,前面提到的可拆式皇冠灯件实在也支持ARGB灯效,其背后藏有一个5VARGB接口,神光同步功能信手捏来。
当它与正面融为一体时,一个璀璨夺目标皇冠跃然纸上,时候提示你手上正在利用的影驰RTX4090HOFOC显卡是高贵的象征,是性能的象征。
玩家也可通过影驰官方的魔盘XtremeTuner工具自界说灯光结果,多种灯效共同这个显眼的皇冠计划别有一番韵味,打造专属于你的高颜值显卡。
皇冠灯件除了可以展示炫酷的RGB灯效,还自带检测功能,黄灯表现显卡外接供电非常,而红灯则表现主板非常,玩家排障更直观。
皇冠灯件实在是可拆式计划,纵然你的显卡不是竖装放置,它也可以拆卸后独立放置在显卡顶部,一样可以或许让你360°欣赏它的美。
卸下皇冠灯件后,隐蔽在其之下的"HallOfFame"逐步显现,影驰险些在你看得到的地方都安排了RGB灯效,接纳海景房装机,你将大饱眼福,时候感吃惊艳众人的ARGB。
你以为这就是玩灯的极限了吗,影驰RTX4090HOFOC显卡另有HOFPANELIII多功能外置全彩表现体系,其本质是一个LED表现屏,利用新版的HOFAi软件,你可以在这块表现屏上监控显卡状态,展示图片,播放视频,包罗万象。
通体白色的计划与魅力四射的RGB灯效相联合,放在白色的侧透机箱内恰到利益,既给玩家带来了视觉盛宴,又没有太过高调,更像是一位优雅的武林高手,在小小的机箱内满血输出。
显卡的顶部和底部都配有大面积的鳍片出风口,鳍片的厚度也是相称"离谱",不外如许豪华的堆料有利于内部氛围的快速活动,低落显卡焦点温度。
显卡供电用的是全新的12VHPWR供电接口,利用一根12VHPWR的电源线就可到达供电需求。不外影驰RTX4090HOFOC配备了两个12VHPWR供电接口,最大可以或许给这张显卡提供1200W的供电本领,带666W的最大TDP完全充足了。
供电接口的附近可以看到一个小按钮,这实在是影驰RTX4090HOFOC的BIOS切换按钮,用户通过DualBIOS拨动开关就能选择差别的工作模式。左侧另有ARGB的接口,新的AuroraSyncPro功能可以或许让名流堂RTX40系列显卡与支持5VARGB外接扩展功能的主板实现灯效同步。
显卡底部还可以看到显卡的PCIe金手指,尺度的PCIe4.0x16速率,它可以为显卡提供更快的传输速率。
视频输出接口方面配备了3个DP1.4a和1个HDMI2.1,支持4屏表现或最高8K@60Hz的超清输出。视频输出接口还专门接纳镀金处置惩罚,不但抗氧化性能更强,还能让视频讯号传输更清楚。
IO挡板上另有一个小按钮,实在这是名流堂RTX40系列显卡才具有的HyperBoost一键加快功能,用户只必要通过功能按键就能实现HyperBoost功能一键开启,进步显卡散热器效能以及提拔GPU超频本领,同时按键上配备了状态指示灯,开启一键加快功能,按键亮绿灯,关闭功能时则无灯光。
别的从这个角度也可以看出影驰RTX4090HOFOC显卡惊人的厚度,足足有77mm,已经逾越4槽厚度了,妥妥的性能巨兽。
显卡拆解影驰RTX4090HOFOC可谓是相称"丰富",那它的内部肯定也是堆料十足,我们拆开来一探毕竟,卸下影驰RTX4090HOFOC金属背板上的螺丝后就可以分离散热体系和PCB。
起首映入眼帘的是一张纯白的PCB板,名流堂专属定制,14层OC工艺加持。团体计划公道,安排规整,单从PCB上的接口、供电、焦点、显存等细节就可以看出这肯定是大厂出品的品格。
PCB的反面相比正面就要简便许多了,不外照旧排布了密密麻麻的的电容,影驰为这张RTX4090可以说是煞费苦心,疯狂堆料。
焦点背部电容位置利用了四个POSCAP(导电聚合物钽电容)取代四组MLCC(一组10个MLCC),团体电气性能更强。
PCB的正中心就是本次的主角——AD-102-300-A1焦点,影驰RTX4090HOCOC显卡的心脏,别看它小小的一颗,但实在它集成了763亿个晶体管,相比RTX3090Ti足足多了2.7倍,称它是地表最强卡皇都不敷为过。
焦点的周边则是12颗GDDR6X显存,来自美光科技,型号为2RU47D8BZC,单颗显存容量2GB,12颗构成24GB超大显存。而且这几颗显存的速率但是满血的,显存速率为21Gbps。
影驰RTX4090HOFOC在供电MOSFET上也是堆推测了极致,供电总相数到达了32相之多,此中28相为焦点供电,4相为显存供电,这个规格根本上在一众RTX4090中也是Top1的存在。
无论是焦点供电照旧显存供电,影驰RTX4090HOFOC全部接纳英飞凌的DrMOS芯片,型号为TDA21472,连续输出电流可达70A。
差别于其他显卡的计划,影驰RTX4090HOFOC接纳全新的方案,PWM芯片也来自英飞凌,型号是XDPE1A2G7B,不外现在还查询不到相干信息。
附近另有一颗uS5650Q,它重要负责管理显存供电部门。与上面的PWM芯片通力互助,为显卡提供富足动力。
在焦点四周还能看到两颗BIOS控制芯片,型号为IS25WP016,分别控制这款显卡的P-Mode与S-Mode。
想要有666W的TDP,单一12VHPWR供电接口是不敷的,影驰RTX4090HOFOC有两个12VHPWR接口,每个接口都能提供600W的供电本领,双口完全可以或许支持其这张卡皇。
在两个供电接口的后方,另有4颗R22电容坐镇,为显卡电源输入提供稳固安全的保障。
固然供电不止12VHPWR接口一处,PCIe也是供电之一,影驰RTX4090HOFOC的PCIe接口为尺度的PCIe4.0x16,值得留意的是利用前肯定要在主板打开ResizableBAR功能,这张显卡的性能才气完全开释。
奢华至极的不止供电,连视频输出接口也是镀金计划,抗氧化本领极强,耐久耐用,还可以有用提拔信号传输品格。
继承拆遣散热体系,起首见到的便是大面积的液冷均热板,面积到达了95mm*88mm,云云规格的设置可以或许敏捷吸取GPU产生的热量,并将热量敏捷匀称通报到热管,让AD102焦点时候保持岑寂。
影驰在均热板上为显存、电感、MOS管打仗的地方用上了高系数的导热垫辅助散热。就连焦点处也是厚厚的一层硅脂,可见这个散热体系真的是下足了功夫,堆足了料。
不但仅正面的均热板有散热,金属背板上同样安排了导热垫,共同金属导热性强的特性,影驰RTX4090HOFOC的散热效能可以说是拉满了。
整个散热器除了正面的液冷均热板外,其他地方被大面积的导流型鳍片覆盖,而且还在部门地方安排了不少增强件,用于掩护鳍片稳定形。
散热鳍片下隐蔽着4根Φ8mm+5根Φ6mm的镀镍复合热管,9热管的设置用于压抑AD102焦点绰绰有余。
全部热管在散热鳍片下蜿蜒曲折,终极贯穿整个散热器,而且齐备接纳回流焊接工艺,有利于包管散热体系的高效导热。
三把专属的静霜散热风扇是整个散热体系的自动散热泉源,负担着加快氛围活动,快速带离热量的作用,20mm的厚度计划让散热效能明显提拔,这也是为什么这张显卡在烤机时可以或许做到低温的缘故原由地点
拆解后细看,每把散热风扇上有11片静霜扇叶,升级优化后不但进风量更大,还支持智能启停功能,让显卡随时随地可以或许尽力输出。
总的来说,影驰RTX4090HOFOC完全称得上堆料豪华,极致散热。旗舰级的AD102焦点配上云云规格的硬件,显着是为超频预留了更多余量,这也是名流堂HOF系列显卡的"头号招牌"。
测试平台先容
见地过影驰RTX4090HOF的堆料计划后,就该进入实测环节了,老样子,我们先先容一下此次的测试平台。我们请出了现在最强的游戏硬件,CPU用的是最新的IntelCorei9-13900KS,华硕的Z790Hero主板搭配4根16GB的金士顿DDR5-6000高频内存。
散热方面也是下足了功夫,用的是鑫谷冰封360冰山版水冷散热器,只有这个规格的散热器才有大概顺从13900KS这颗可以超频到6.0GHz的性能怪兽。
既然影驰RTX4090HOF是一块纯白色的显卡,那装机天然离不开时下最盛行的白色主题海景房,机箱上我们选用了昆仑御风机箱白色版。其拥有精彩的功能支持与惊艳众人的颜值,非常得当DIY玩家。
昆仑御风机箱的风道计划不错,因此我们在其前后还加装了多把鑫谷冰霜12散热风扇,不但可以或许给散热添砖加瓦,在颜值方面也是给白色主题装机添彩。
有了刁悍的硬件,表现装备也不能拖后腿,表现器我们接纳了爱攻&保时捷联名PD32M电竞表现器,其搭载了现在顶级的4K144Hz面板,可以完善体验到RTX4090带来的丝滑4K144Hz游戏体验。
理论性能测试正式测试前,我们先在GPU-Z中对影驰RTX4090HOFOC举行一个简朴的相识。从图中可以看到这款显卡的基准频率为2235MHz,Boost频率为2625MHz,远远高于公版FE的2520MHz,这也是其可以或许位列"名流堂"的底气。
别的从GPU-Z中我们还可以相识到这款显卡的功耗和温度设定,眼尖的玩家大概已经发现了,影驰RTX4090HOFOC的默认TGP设定为550W,这已经比平凡的RTX4090的最大TGP还要高了,而且这款显卡支持解锁功耗至666W,温度墙也能放宽至88℃,这显然是为打击超频做足了预备。
接下来我们一起玩一下全天下最好玩的游戏《3DMark》,从3DMark的理论性能来看,影驰RTX4090HOFOC对比上代RTX3090Ti完满是碾压般的存在,起首是代表DX11的FireStrike测试,性能提拔在70%左右。而在代表DX12的TimeSpy测试中,RTX4090与RTX3090Ti也是拉出了远远的差距,TimeSpyExtreme直接突破两万分大关,这让笔者很好奇它的游戏体现。
3DMark中的理论性能提拔已经充足"离谱",AIDA64的GPGPU理论性能测试中,影驰RTX4090HOFOC的体现更令人惊喜,团体性能相比RTX3090Ti提拔了92%以上,近乎翻倍的性能可谓惊人。不少项目乃至有2倍乃至3倍的飞跃,这才是一张卡皇应有的体现。
游戏性能测试想必买的起这张卡的玩家都是标配4K分辨率的表现器吧,不外照例我们照旧看看1080P与2K分辨率下这张显卡的体现,不得不说卡皇之以是为卡皇就是由于超强的性能开释,影驰RTX4090HOFOC显卡在两个分辨率下,大部门游戏都在200FPS以上,这已经不是入门电竞的程度了,而是专业电竞的体现,如今3A也能用电竞的水准嬉戏,完全不敢想象。
4K分辨率才是这款显卡的主战场,从实测效果中可以看出,有着"显卡杀手"之称的《赛博朋克2077》中,影驰RTX4090HOFOC显卡在DLSS2下已经可以或许做到77FPS,更不消说性能更强的DLSS3,而RTX3090Ti仅有48FPS,属实有点不敷看。而在《光明影象:无穷》中,纵然是高画质加复杂光追的苛刻条件下,这代显卡的体现仍旧强势,87FPS的结果领先前代近70%。
既然都是地表最强游戏显卡了,不试试8K分辨率怎么行,在8K游戏测试方面,影驰RTX4090HOFOC显卡可以或许将大部门游戏跑到60FPS以上,像一些优化好的游戏,比方《极限竞速:地平线5》乃至能有85FPS左右,想想8K超高画质驰骋在墨西哥是一种怎样的视觉享受。
总的来说,用RTX4090已经可以或许满意部门游戏运行在8K画质下的需求,相较于RTX3090Ti险些是翻倍的提拔,假如游戏厂商优化到位,8K电竞指日可待。
DLSS 3性能测试
提到RTX40系显卡就不得不提DLSS3这个黑科技了,它无疑是这代显卡升级的重点,相比DLSS2,DLSS3不但可以实现画质于帧数的双向提拔,还新增帧生乐成能,实现游戏帧数翻倍,老黄在发布会上更是直言"DLSS3让游戏性能翻倍"!
3DMarkDLSS3理论性能测试3DMark中新增了DLSS3性能测试,实测下来有DLSS3的加持下,影驰RTX4090HOFOC显卡相比RTX3090Ti真的实现了性能的翻倍,在4K分辨率下,不开DLSS3仅能委曲维持在60FPS附近,一旦开启DLSS3后,性能直接提拔三倍,已经可以满意4K@144Hz的电竞需求。
8K分辨率下更是离谱,不开DLSS3只可以13FPS,测试过程卡成PPT,而开启DLSS3后,帧数暴涨80FPS,迫近百帧,相较上代提拔3倍有多,好像已经可以开始等待8K@120Hz乃至8K@144Hz了。
游戏实测
光说不练假把式,如今《赛博朋克2077》也更新了DLSS3,以是我们也在第一时间测试了DLSS3与DLSS2下的区别,实测下来可以看到4K分辨率下,有了DLSS3的加持后,游戏帧数可以或许进一步提拔,而且提拔幅度还不小。
2K或1080P的环境下提拔幅度更加显着,险些是近百帧的性能差距。不得不说DLSS3是一个划期间的技能,体验下来真的非常棒,它能让低端卡玩游戏变快,高端卡变得更快。
在另一款支持DLSS3的《F122》中也是云云,在4K画质下开启全高殊效,有了DLSS3的加成,影驰RTX4090HOF可以或许跑到175帧,若只利用DLSS2,则帧数只有133帧左右,相称于DLSS3这个黑科技给游戏带来了32%的游戏性能提拔,相称不错。
总的来说,影驰RTX4090HOFOC显卡不开启DLSS功能的游戏性能已经充足了,开启DLSS3后,无论是质量档照旧性能档,其游戏流通度都高于120FPS,对于一款赛车游戏来说,这流通度是真再爽不外了。
固然不少玩家大概担心DLSS3会有降画质的题目,这里我们也截取了DLSS3各个档位下的游戏现实画面,可以看到无论是哪个档次,游戏画质均没有显着影响,乃至由于DLSS3是通过AI举行超分渲染,因此在笔墨等细节纹理上会比原生画质更加清楚。
DLSS3-F122-DLSS-Balance
DLSS3-F122-DLSS-Perfoemance
DLSS3-F122-DLSS-Quality
DLSS3-F122-DLSS-SuperPerfoemance
DLSS3-F122-TAA
UnrealEngine5LyraDLSS3测试
末了我们还测试了使用UnrealEngine5引擎打造的LyraDEMO,此DEMO除了可以或许支持最新的DLSS3技能外,还带上了NVIDIAReflex。笔者这里上传了两个图片给各人看看LyraDEMO里的DLSS3开启与关闭的画质对比,游戏流通度天然是DLSS3开启后提拔较为显着的,到达192FPS,而PCL耽误也进一步低落到了50ms的程度。
Unreal-Engine-5-Lyra-DLSS3-OFF
Unreal-Engine-5-Lyra-DLSS3-ON
视频内容创作性能测试
测完了游戏,必不可少的另有创作生产力测试,这里我们选择PugetBench、PCMark10、等多款常见的测试软件,来测试影驰RTX4090HOFOC显卡在一样平常办公、视频内容生产等方面的性能体现。
起首我们来看看PCMark10Extended项目上各显卡的性能体现怎样,可以看到影驰RTX4090HOFOC显卡在各个项目均完成了对前代卡皇RTX3090Ti的逾越,这与我们上面的实测符合。
影驰RTX4090HOFOC显卡在更快的显存、更强的性能加持下,跑Pugetbench的Pr项目确实比前代卡皇快了许多,有约莫30%的性能提拔,换用新显卡对剪视频、预览、导出等操纵均有资助;Ae项目没有Pr进步那么大,但总归于是新显卡,照旧有肯定性能提拔的。
要说提拔最大的要属达芬奇了,作为首批支持AV1编解码的剪辑软件,占尽上风,同一项目下,架构革新后的影驰RTX4090HOFOC有着更快的渲染时间,本来RTX3090Ti必要几十秒才气完成的操纵,如今仅用17秒!假如你风俗用达芬奇举行创作,那换用影驰RTX4090HOFOC显卡将大幅提拔你的工作服从。
专业内容创作性能测试
另一个提拔可感的行业就是3D渲染了,Blender与OctanceBench测试中影驰RTX4090HOFOC显卡的性能体现同样给力,相比前代RTX3090Ti有95%以上的性能提拔。翻译成人话就是你用影驰RTX4090HOFOC显卡渲染一个雷同的项目,它的耗时只必要前代显卡的一半!
纵然是在SPEX的专业范畴测试中,影驰RTX4090HOFOC显卡也没让人扫兴,有了更快的显存和全新的架构加持后,可以说完全买通了AD102焦点的任督二脉,比起上代旗舰来说,65%的性能提拔相称惊人,这个结果也比其他RTX4090显卡高了近10%。
总的来说,40系显卡这一代光追单位的加强,对于支持光追加快的3D渲染软件是很有利的,多款渲染软件相比上代卡皇的提拔都靠近2倍,因此对于从事这些相干工作的用户,影驰RTX4090HOFOC这款显卡照旧值得思量的。
双编码器专项测试
RTX40系显卡另有一个重磅升级点就是支持最新的AV1编解码,这次影驰RTX4090HOFOCLABPlus换上了最新的双NVENC编码器,作为第八代NVENC编码器,其编解码性能相比前代有了质的飞跃。
最新的RTX4090显卡支持AV1编码,而RTX3090Ti仅支持AV1解码,二者差距相称显着,新的AV1编码技能可以或许在占用雷同空间环境下,提供更加速速的视频编码和更高质量的流媒体传输性能,而且现在很多主流媒体也渐渐支持AV1编码,像达芬奇、万兴喵影、剪映等软件均已支持AV1编码。
我们利用NVIDIA提供的8K片源与工程文件举行测试,同样的素材下AV1编码相比H.265编码所需时间更短,而纵然同为H.265格式导出,影驰RTX4090HOFOCLABPlus的导出时长也比前作快了70%以上。
别的我们来看看H.265格式与AV1格式下的画质区别,从肉眼来看,实在画质险些完全一样,如许也意味着AV1可以用更小的空间占用量实现与H.265划一规格的画质体现,总的来说,无论是导出速率、空间占用照旧画质体现,它都完胜H.265。
超频体验在拆解部门我们看到影驰给这张RTX4090HOFOC显卡安排了超规格的供电模组与散热装置,而且TDP给到了最高的666W,可见超频就是它的最强杀招,那笔者天然是不大概错过这个绝佳的时机,下面一同看看这款显卡的超频潜力毕竟有多大吧。
我们利用影驰官方提供的XTREMETUNER魔盘工具对显卡举行超频,这款工具不但可以解锁GPU焦点的电压限定、功耗限定等,还可以自由调治风扇转速,实测这款显卡的散热设置显着是超规格的,因此风扇转速还可以进一步下探,超低的风扇噪音还你舒服的利用体验。
在解锁了功耗与温度墙后,我们先小试牛刀,将GPU焦点频率先提拔至3090MHz,此时显卡在运行TimeSpy时已经凌驾了4W分大关,而且功耗也突破了550W,要知道这是其他RTX4090都达不到的田地。而且在测试过程中温度始终没有突破60℃,显着这是高规格的散热体系起到了作用。
有了前面的实验后,我们稳步提拔,笔者末了乐成将影驰RTX4090HOFOC的GPU焦点频率提拔了235MHz,显存频率提拔了1000MHz,终极影驰RTX4090HOFOC在3DMark中可以或许稳固运行在3150MHz下,这还只是在风冷状态下,假如是水冷,那它还能再高一些,此时TimeSpy测试得分40459,相比默频状态的38155分进步2000多分,超频潜力可见一斑。
功耗与散热前文中我们提到,影驰RTX4090HOFOC显卡接纳了非常良好的散热计划,那么这款显卡在散热性能测试中的现实体现怎样呢?
在利用Furmark烤机15分钟后,这款显卡的GPU温度稳固在65.5℃,如许的结果比起上代的RTX3090Ti可以说是质的飞跃,假如跟其他RTX4090比起来,那也是妥妥的第一梯队,可见其散热服从简直非常高。
再聊聊内部的发热大户——GDDR6X显存,笔者原以为显存温度也会较高,但没想到有高系数导热垫直触均热板后,显存温度只比焦点高了0.5℃,果然旗舰级的显卡散热都不是盖的,用这套散热体系压抑AD102焦点已经绰绰有余了。
我们也横向对比了一下影驰RTX4090HOFOC显卡与上代卡皇的功耗,从功耗来看,解锁了功耗墙的影驰RTX4090HOFOC简直惊人,不外相比其前代卡皇,它的功耗可以说是相称守旧了,不少项目测试下来,功耗都没有上代那么高,但性能提拔却是实打实的强。
不得不说老黄的AdaLovelace架构和TSMC的4N工艺确实有点东西,妥妥的吊打前代显卡,让RTX40系列显卡的每瓦性能实打实的提拔到了一个新高度。
评测总结
这次可以或许上手这张影驰GeForceRTX4090HOFOCLABPlus显卡照旧相称荣幸的。全新AdaLovelace架构、TSMC4N定制工艺、DLSS3等不可胜数的黑科技聚集于一身,让这张显卡无论是游戏性能照旧专业生产力都遥遥领先RTX3090Ti,不愧为地表最强游戏显卡。
而影驰GeForceRTX4090HOFOCLABPlus显卡自己更是极致奢华的代表,无论是性能、颜值、照旧设置都是当今最强的RTX4090之一。因此对于游戏玩家来说,游戏帧数、散热体现都是旗舰中的旗舰;除此之外它的双12VHPWR供电以及32相的豪华供电规模则为硬核的超频玩家提供了绝佳的舞台,风冷下轻松超3.1GHz,完善解释了顶级非公应有的体现。
一身白衣加身的影驰GeForceRTX4090HOFOCLABPlus也是赚足了眼球,光是皇冠灯件就彰显了这张显卡的高端定位。纯白色的计划配上极具个性的棱角线条,奢华而优雅的表面无疑是颜值党的最佳选择。
总的来说,假如你想见地一下顶尖的RTX4090显卡,那影驰GeForceRTX4090HOFOCLABPlus就是你的不二之选。最高666W的功耗可以或许完全榨干AD102焦点,两倍于前代卡皇的性能体现,毫无疑问,它就是现在地表的性能王者,险些没有对手能与之抗衡。如今影驰GeForceRTX4090HOFOCLABPlus已经上市,售价19999元,各大电商平台均已开售,感爱好的话可以去相识一下。
Ada Lovelace架构解说
Turing、Ampere上两代架构焦点均以人物来定名,前者是盘算机科学之父——艾伦·麦席森·图灵;后者则是"电学中的牛顿"——安德烈·玛丽·安培,电流的国际单元安培就是以其姓氏定名。那AdaLovelace定非凡人,度娘一下果然,这是 人称"数字女王"的阿达·洛芙莱斯,编写了汗青上首款电脑步伐,是被天下公认的第一位盘算机步伐员,果真是一代比一代还要更牛。PS:她的父亲是《唐璜》的作者,墨客拜伦喔。
从Turing架构开始,NVIDIA初次在显卡中参加了加快光线追踪的RTCore单位,以及面向AI推理的TensorCore单位,这革命性的创新使实韶光线追踪成为大概。而Ampere架构则是全面的架构改进,在参加新一代的二代RTCore和三代TensorCore底子上,另有着更先辈的SM单位计划,如许显卡工作服从那是翻倍的提拔。而来到AdaLovelace架构,同时是以服从提拔为大条件,天然是引入了最新的第三代RTCores与第四代TensorCores单位,同时参加浩繁新奇的黑科技,从实行服从来说AdaLovelace架构是上代Ampere架构的2倍以上,乃至光线追踪本领更是到达了可怕的4倍性能。
在报告焦点架构前,我们先相识几个关键词:GeForceRTX4090、AdaLovelace、TSMC4N、608mm、760亿个晶体管、2倍性能功耗比。
各人带着几个关键字来看上面的【显卡规格参数对比】表格,就可以更轻易读懂上述表格了。最新一代的桌面显卡GeForceRTX40系列均接纳全新的AdaLovelace架构焦点,GeForceRTX409的焦点是AD102,现在AdaLovelace架构焦点中最为强盛的,具有760亿个晶体管、16384个CUDA焦点和24GB高速美光GDDR6X显存。
得益于NVIDIA与台积电深度互助的TSMC4N制程工艺,GeForceRTX4090焦点面积仅是608mm(上代RTX3090Ti628mm),在更小的焦点面积下却能塞下多达760亿个晶体管,比上一代的Ampere架构多出了约70%晶体管数目。
值得留意的是,制程工艺的提拔不但能拥有更多的晶体管,其焦点频率更是能跑得很高,GeForceRTX4090Boost频率就已经到达了2520MHz,如许在焦点频率与高规格的双向包管下实现了比上代显卡高达2倍的性能功耗比。
从GTC2022秋季大会中,实在我们就已经发现了,现在GeForceRTX4090显卡中配备的AD102-300焦点实在并非完备的AD102焦点。完备的AD102焦点应该包罗了12个GPC(图形处置惩罚集群)、72个TPC(纹理处置惩罚集群)、144个SM(流式多处置惩罚器)和个带有12个32Bit显存控制器的384Bit显存位宽。
再来看上面的GeForceRTX4090架构图,和完备版本的AD102焦点对比起来就很轻易看出差异。起首,GeForceRTX4090焦点代号为AD102-300,其拥有9个完备规格的GPC(图形处置惩罚集群,每个内建6个TPC),与2个非完备的GPC(图形处置惩罚集群,每个内建5个TPC),共构成了64个TPC,那么SM单位天然就是128个了。至于显存位宽方向那是相称的完备——384Bit。
假如你照旧不太懂,这里笔者就逐一为了AdaLovelace架构显卡的构成。
刚才我们已经说到,一个完备的AdaLovelace架构AD102焦点内部拥有12个GPC,而每个完备的GPC中包罗了一个专用的RasterEngine(光栅化引擎),两组ROPs共16个ROP(光栅化处置惩罚单位),以及6个TPC与12个SM单位。
全新的SM流式多处置惩罚器
AdaLovelace架构中最大的亮点之一:全新的SM流式多处置惩罚器,每个SM包罗了128个CUDA焦点、1个第三代的RTCores,4个第四代TensorCores(张量焦点)、4个TextureUnits(纹理单位)、256KBRegisterFile(寄存器堆),以及128KBL1数据缓存/共享内存子体系,于是这一个全新的SM单位有着凌驾上一代2倍之的性能体现。
已往的Turing架构INT32盘算单位与FP32数目是同等的,而两者相加才构成了64个CUDA焦点。但是Ampere架构开始,左侧的盘算单位实现了FP32+INT32的盘算单位并发实行,也就是说CUDA焦点数目翻倍到了128个。
再来看看AdaLovelace架构的SM,FP32/INT32的盘算单位组合,同样实现了每个SM内含128个CUDA的计划,看似提拔不大,但是当你相识到GeForceRTX4090拥有128个SM,16384个CUDA焦点,那你也就应该明确达82.6TFLOPS的着色器本领是怎样实现的了,比上一代的RTX3090Ti显卡的40TFLOPS,还真是提拔了两倍有多。
别的缓存方面AdaLovelace架构也举行了大规格的提拔,起首每个SM单位中单独配上了128KB的缓存,如许RTX4090显卡中就实现了163MBL1/共享内存。其次焦点的二级缓存举行举行了重新的计划,而且完备AD102焦点是96MB二级缓存,而RTX4090显卡拥有72MB二级缓存,也大概是因此AdaLovelace架构焦点对显存位宽的依靠性并不高。
技能解说:第三代RT Cores与第四代Tensor Cores
以为刚才的CUDA数目与超大L2缓存就已经很猛了,实现上AdaLovelace架构最大的提拔照旧在第三代RTCores与第四代TensorCores身上。
第三代RTCores
RTCores用于光线追踪加快,第三代RTCores的有用光线追踪盘算本领到达191TFLOPS,是上一代产物2.8倍。
在Ampere架构中,第二代RTCores支持界限交织测试(BoxIntersectiontesting)和三角形交织测试(TriangleIntersectiontesting),用于加快BVH遍历和实行射线三角交织测试盘算,固然光线追踪处置惩罚本领已经比初代的Turing架构焦点更高效,但是随着情况和物体的多少复杂性连续增长,传统的处置惩罚方式很难再以更高服从、精确反应出的实际天下中的光线,尤其是光的活动正确性。
以是在第三代RTCores增长了两个紧张硬件单位:OpacityMicromapEngine与DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,重要是用于alpha通道的加快,可以将alpha测试多少体的光线追踪速率进步2倍。
在传统光栅渲染中,开辟职员利用一些Alpha通道的素材来实现更高效的画面渲染,比方Alpha通道的叶子或火焰等复杂外形的物体。但在光线追踪期间,这传统的做法会为光线追踪带为不少无效的盘算,比方活动性的光线多次通过一块叶子,光线每击中一次叶子,都会调用一次着色器来确定怎样处置惩罚相交,这时就会做成严峻的实行本钱与时间等候本钱。
而OpacityMicromapEngine用于直接剖析具有非不透明度光线交集的不透明度状态
三角形。根据Alpha通道的不透明,透明与未知等三个差别的块状态举行处置惩罚:透明则直接忽略继承找下一个,不透明块则记载并告之掷中,而未知的则交给着色器来确定怎样处置惩罚,如许GPU很大部门都不必要举行着色器的调试处置惩罚,可以或许实现更为高效的性能。
DisplacedMicro-MeshesEngine
假如说OpacityMicromapEngine加快的是面处置惩罚,那么DisplacedMicro-MeshesEngine就是多少曲面细节的加快器。如上图所示,在AdaLovelace架构中,通过1个基底三角形+位移舆图,就可以创建出一个高度具体的多少网格,所必要资源占用比二代RTCores更低,服从也更高。
通过NVIDIA给出的创建14:1珊瑚蟹例子来说事,这里我们必要必要1.7万个微网格、160万个微三角形,在AdaLovelace架构中BVH创建速率可加速7.6倍,存储空间缩小8.1倍。DisplacedMicro-MeshesEngine起到了关键性的作用,其将一个多少物体根据差别细节分成密度不一的微网络处置惩罚,赤色密度超高,细节处置惩罚越为复杂。相应的低密度微网络地区则可以开释更多的资源与存储空间,如许DisplacedMicro-MeshesEngine就可以资助BVH加快过程,淘汰构建时间和存储本钱。
同时AdaLovelace架构SM中新增了着色器实行重排序(ShaderExecutionReordering,SER),这是由于光线追踪不再只有强光大概阴影渲染处置惩罚,将来将会更多的是在光线的活动性,如许光线就会变得越来越复杂,想要第三代RTCores与第四代TensorCores有着更高的实行服从,那就得为他们来安排一位管家。而着色器实行重排序(SER)就是为了可以或许即时重新安排着色器负载来进步实行服从,为光线追踪提供2倍的加快,也能更好地使用GPU资源。不外现在仍未有实例,想实现这个功能,还得游戏与开辟工具的支持才行。
第四代TensorCores
TensorCores是专门为实行张量/矩阵运算而计划的专用实行单位,这些运算是深度学习中利用的焦点盘算功能。第四代TensorCores新增FP8引擎,具有高达1.32petaflops的张量处性能,凌驾上一代的5倍。
技能解说:DLSS 3
大概说第四代TensorCores太硬核你不会知道是啥?提拔意义在哪?但是TensorCores最经典的应用DLSS你肯定会知道,这一次AdaLovelace架构支持NVIDIA最新的DLSS3技能。
之前我们也聊过DLSS技能,其计划之初是为了补充光线追踪技能后的性能丧失,详细的体现为开启光线追踪技