shejizhen 发表于 2025-3-9 15:01 只看TA 1楼 |
---|
|
[IT] iGame GeForce RTX 5070 Advanced OC 12GB评测[68P] GeForce RTX 5070正式开卖,让主流PC运行高帧运行2K光追最高画质变得轻而易举,但公版终归有些许限制,例如对频率与超频的限制,追求外观小型化,或者备货不充足。显然,想要在同级别下量大管饱,还是要看NVIDIA合作伙伴AIC生产的非公版GPU,让GeForce RTX 5070性能得到进一步释放。眼前的iGame GeForce RTX 5070 Advanced OC 12GB就是很好的例子。![]() iGame Advanced的地位无需多言,不俗的散热和供电设计,让其在风冷状态下给予GPU更好频率和使用体验,让公版上些许遗憾的地方一次性补齐,确保GeForce RTX 5070长期稳定处于强化状态。 ![]() 因此iGame GeForce RTX 5070 Advanced OC 12GB难免会给大伙带来不少期待,例如它的散热表现如何,DLSS 4加持后还会有什么更进一步的表现,AIGC与多媒体创作能否有新的提升? 趁着AIC非公版评测解禁,现在就让我们第一时间奉上iGame GeForce RTX 5070 Advanced OC 12GB首发评测。 ![]() 用Advanced武装GB205 这一代iGame Advanced引入了引入了哈氏天体的概念,名为Advanced的探测器对神秘星系展开探索,进而融入莫比乌斯环的设计理念。莫比乌斯环是一种拓扑学结构,没有传统意义上正面或者反面,运用在iGame GeForce RTX 5070 Advanced OC 12GB上,让显卡变得神秘莫测,也暗示着更好的性能。 ![]() 在核心上,iGame GeForce RTX 5070 Advanced OC 12GB使用的是一块Blackwell GB205-300-A1 GPU,属于GB200系列。而我们前半年听说最多的Blackwell GB100系列则是针对对AI超算、数据中心、服务器所设计。 Blackwell GB205-300-A1基于台积电4N FinFET定制工艺制造,拥有310亿个晶体管,芯片面积263mm²。在设计理念上,与前两代Ampere和Ada Lovelace架构设计相似即一个GPU中包含若干个GPC(Graphics Processing Clusters,图形处理集群),每个GPC下面再包含若干个TPC(Texture Processing Clusters,纹理处理集群),每个TPC下包含2个SM(Streaming Multiprocessors,流式多处理器)。 ![]() 其中的SM下即为Blackwell微架构的主要体现,包括128个CUDA Core,1个第四代RT Core,4个第五代Tensor Core,4个纹理单元(Texture Units),1个512KB寄存器文件,128KB L1共享缓存,这些缓存可以根据图形和计算工作负载需求进行重新配置。同时,SM还包含两个FP64,FP64 TFLOP速率是FP32 TFLOP速率的1/64,对于消费端而言使用频率不高,但可以保证FP64代码可以被正确的执行。对应的,Tensor Core也包含了少量的FP64 Tensor来确保程序的正确执行。 ![]() Blackwell GB205-300-A1没有使用完整的GB205规格,而是屏蔽了一组TPC。最终让iGame GeForce RTX 5070 Advanced OC 12GB包含了5个GPC,24个TPC,48个SM。总共6144个CUDA Core,80个ROP,192个第五代Tensor Core,48个第四代RT Core。 在内存子系统上,则包括了6MB L1缓存,48MB L2缓存。配合12GB 192-bit GDDR7显存,显存频率可以来到28Gbps,带宽达到672GB/sec,比RTX 4070提高了33%。在编解码能力上,GeForce RTX 5070提供了1个第九代NVENC,1个第六代NVDEC。 这里不妨让我们列举一些参数作为参考: ![]() 重点在于iGame GeForce RTX 5070 Advanced OC 12GB提升了GPU的频率。公版的GPU Boost频率为2512 MHz。在iGame GeForce RTX 5070 Advanced OC 12GB上,则可以来到2572 MHz,比公版多压榨出2%以上的GPU性能。TDP热功耗设计也从公版的270W来到300W,TGP功率则维持在250W。 ![]() 多出的热设计功耗需要对应的散热设计来解决,这也正是iGame GeForce RTX 5070 Advanced OC 12GB强悍的地方。在散热结构上,使用了一套名为旋涡Vortex散热装置,包括镂空背板、金属中框、热管、导流型鳍片,以及半透明黑色装甲和“风镰”扇叶。 ![]() 先来说说“风镰”扇叶。iGame GeForce RTX 5070 Advanced OC 12GB的主动散热由101 86 101mm三个大口径“风镰”扇叶组成,通过空气形成漩涡聚风吸入,以获得进风量。 ![]() 为了保证风扇稳定性,扇叶加固了叶片之间的连接。同时风扇内部使用了双滚珠轴承,以获得更长的使用寿命。 风扇下面则使用了一整套导流型鳍片,这项技术最初运用于服务器,特点是拥有更大的间隙,利于风流进入,加速内部气流循环,从而提升散热效率。连接诶散热鳍片的是2*8 5*6mm的热管配置,热管于散热鳍片之间使用回流焊工艺紧贴。 ![]() ![]() 为了加固整套散热模组,iGame GeForce RTX 5070 Advanced OC 12GB还使用了一套全铝金属中框,让整张显卡拥有更好的稳定性。 ![]() 在压力测试状态下,iGame GeForce RTX 5070 Advanced OC 12GB的GPU温度最高可以来到63℃。同时通过红外线检测,显卡表明温度在20℃的环境中保持清凉状态,显卡表面最高温度源自于裸露的散热鳍片,接近50℃。同时电源接口维持在32℃上下,保持清凉状态。 ![]() 有意思的是,虽然三风扇高负荷运作,但显卡噪音并不明显,只来到47dBA。 ![]() 按照iGame的惯例,iGame GeForce RTX 5070 Advanced OC 12GB在侧面设计了一键超频按钮,通过iGame Center软件配合,RTX 5070核心能够在默认超频的基础上,再提升400MHz甚至500MHz,从而增强显卡的可玩性。 接口面板则与公版相同,提供3个DisplayPort 2.1b接口和1个HDMI 2.1a接口。其中DisplayPort 2.1b支持DSC技术,最高可以实现480Hz条件下实现4K 12-bit HDR。HDMI 2.1a则同样支持DSC技术,最高支持165Hz条件下8K 12-bit HDR。 ![]() 电源接口则使用了12VHPWR接口,并配有12VHPWR 16pin(12 4)转8pin x2的线材兼容老款电源。12VHPWR接口本身可以满足600W功耗设计,应对iGame GeForce RTX 5070 Advanced OC 12GB最高300W以及超频体验没有任何压力。 另外也可以看到与灯光同步接口整合于同区域,方便统一走线。 ![]() 在配件上,iGame GeForce RTX 5070 Advanced OC 12GB还提供了一套Advanced金属支架,用来支撑这块2.5槽位显卡的重量,不过从安装体感来看,iGame GeForce RTX 5070 Advanced OC 12GB在高端显卡阵营中不算重,显卡支架并非必需安装。此外iGame还很贴心的附送了一套螺丝刀,方便玩家拆包装时候不用再另外去找工具。 ![]() ![]() 让星环遇上DLSS 4:游戏氛围拉满 说到游戏,iGame Advanced注定是一把好手。新的设计语言让iGame GeForce RTX 5070 Advanced OC 12GB充满了游戏氛围感。特别是磨砂黑透外甲能够隐约看清显卡的内部结构,设计团队为了彰显显卡的力量感,特别使用了金属红作为风机骨架的颜色,配合磨砂半透明,有很强的氛围感。 ![]() 同时星环设计在这一代iGame Advanced也得以延续,经典的红圈在这里变成了双环RGB灯组配合,并逐渐向扩散,延伸到显卡边缘,制造出了一种氛围感。 甚至金属背板也被iGame进行了巧妙构思,设计师在背板的通风口处进行了隐藏式LOGO设计,通过斜线的高低起伏,在特定角度能观测到iGame LOGO。在横插的状态下,会被用户不经意间发现。 ![]() 在拉满外观上的游戏氛围后,接下来就是iGame GeForce RTX 5070 Advanced OC 12GB的重头戏DLSS 4。 DLSS 4是Blackwell提升游戏体验的重要技术,DLSS 4可以一步到位通过人工智能提升帧率,降低延迟,改善游戏画质。它首次引入了全新的多帧生成技术(Multi Frame Generation,MFG),提供更快的性能和更低的内存使用,并且由CNN卷积神经网络模型更换到了Transformer模型,这让超分辨率(Super Resolution,SR),光线重建(Ray Reconstruction,RR),深度学习抗锯齿(Deep Learning Anti-Aliasing,DLAA)都有了更好的表现,在图像细节质量和稳定上都有所提升。 ![]() 相对于DLSS 3的帧生成需要依靠Ada Lovelace中的光流加速器,配合游戏运动矢量,AI网络配合,仅单独多生成一个帧。DLSS 4可以利用第五代Tensor Core的优势,在渲染帧之间生成最多3个帧,并利用AI模型替代原本的硬件光流加速器,让生成帧的效率提升40%,使用的显存减少了30%。 ![]() 在实战环节,我们我们准备了两套测试平台。一套是针对游戏的AMD Ryzen 7 9800XD3搭配X870E,内容创作上则使用Intel Core i9-14900K搭配Z790作为补充,内存为32GB DDR5-7200。 先是DLSS 4的基础测试,UL 3Dmark DLSS Feature Test项目已经给DLSS 4提供了预览版的支持,iGame GeForce RTX 5070 Advanced OC 12GB通过DLSS 4 4X将帧率提升6.4倍,实际表现几乎是RTX 4070的2倍。实际表现已经超过RTX 4080 SUPER,并接近于RTX 4090 D,这也是黄仁勋在CES 2025上宣传RTX 5070约等于RTX 4090的出处。 ![]() 同时NVIDIA表示在近段时间会推出超过75款应用和游戏支持DLSS 4。在RTX 50系显卡发布到上市这一个月内,数款游戏已经进行了更新。例如来自网易的《漫威争锋》一开始是通过NVIDIA APP的Override选项来实现DLSS 4 2X到4X调节的,现在则可以直接在游戏中进行选择,无需重启游戏。 在实际游戏中,iGame GeForce RTX 5070 Advanced OC 12GB可以将2K最高画质下的游戏帧率提升到400FPS以上,相当于RTX 4070的2.5倍,也是仅开启DLSS 4但不开启帧生成的RTX 5070的2倍。 ![]() 重点在于AI对光影、时间、空间的判断趋于合理,这让DLSS 4带来更好的画质体验。以《星球大战:亡命之徒》为例,游戏中已经内置了帧生成Frame Generation和光线重建Ray Reconstruction两个选项,其中帧生成Frame Generation可以提供2X帧生成和3X和4X的多帧生成。其中DLSS 4 4X给桌面物品带来了更多阴影细节,同时动态表现也稳定很多。 ![]() ![]() ![]() 在游戏体验上,iGame GeForce RTX 5070 Advanced OC 12GB在2K光追最高画质下的表现可以接近200FPS,表现是RTX 4070的2.1倍。 ![]() 同时可以看到,开启DLSS 4 4X之后,游戏中系统延迟并没有降低,这是由于DLSS 4上帧数增加而导致的变动明显,从而导致整体流畅性受影响。为了解决多帧生成带来的不确定性,Blackwell使用了增强版的帧翻转计量(Flip Metering)作为解决方案,它将帧节奏逻辑转移到显示引擎上,让GPU可以更精确的管理显示时序。 因此前面检测的1% Low FPS均使用FrameView利用MsBetweenDisplayChange来计算检测,原因是常规的检测方式依靠CPU将帧传递给GPU传递的时差进行判断,由于Blackwell使用了多帧生成技术,利用Flip Metering而非CPU的帧速率作为判断,因此这套方式并不准确。通过GPU原生的翻转计量,这可以更为精确的抓到结果。 ![]() 在《赛博朋克2077》中,2K光追最高画质下,iGame GeForce RTX 5070 Advanced OC 12GB可以做到170FPS以上,相对于仅开启DLSS 4不开启帧生成的3.07倍,同时也是RTX 4070的3.59倍。 ![]() 同样,如果仅依靠传统的光栅性能,《赛博朋克2077》的超速光追设置可以卡爆所有GPU,但得益于DLSS 4,游戏帧率在提升的同时,通过AI构建的游戏画面也有了更好的稳定性。比如下图中风扇与网格之间犹豫运动产生的伪影不见了,远处细节呈现出更好的清晰度。 ![]() ![]() 讲究氛围感的《心灵杀手2》中,iGame GeForce RTX 5070 Advanced OC 12GB可以在2K光追最高画质下将帧率提升至120FPS以上,将近DLSS 4不开启帧生成的3倍,同时也是RTX 4070 DLSS 3的1.5倍。 ![]() 《心灵杀手2》画质主要区别在于开启DLSS 4 4X之后,动态环境下铁丝网不会因为画面的移动而产生抖动的情况,在体感上比原画质的边缘处理效果好很多。 ![]() ![]() 《霍格沃茨之遗》也是RTX 50系GPU发布之后,首批宣布支持DLSS 4的游戏,在游戏设置中就可以直接开启。iGame GeForce RTX 5070 Advanced OC 12GB可以在2K光追最高画质下获得超过300FPS的游戏体验,同时延迟与原画质相近,但获得了近3倍的帧率。 另外iGame GeForce RTX 5070 Advanced OC 12GB相对于RTX 4070 DLSS 3也有超过2倍的提升。 ![]() DLSS 4 4X同样也让画质有了不少的提升,以《霍格沃茨之遗》游戏桌面物品的光影细节为例,开启DLSS 4之后光影表现稳定了不少,且边缘更为清晰锐利,要知道这可是在帧率成倍提升的前提下,画质也能保证再进一步。 ![]() ![]() 最后是《龙腾世纪4:影障守护者》。游戏提供了对NVIDIA APP支持,在游戏启动之前,就能通过DLSS Override选项,直接对游戏中的分辨率超采样,帧生成进行调整。 ![]() 在体验上,iGame GeForce RTX 5070 Advanced OC 12GB可以在2K光追最高画质中获得接近300FPS的游戏帧率,是RTX 4070 DLSS 3的2.13倍。 ![]() 同时《龙腾世纪4:影障守护者》的DLSS 4游戏体验是相当出众的,远处光影表现比原画质好上不少。 ![]() ![]() 光栅性能挑战RTX 4070 Ti SUPER RTX 5070的基础光栅性能是大伙最关心的话题之一。这里惯例选用DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal作为参考。iGame GeForce RTX 5070 Advanced OC 12GB表现其实与RTX 4070 Ti SUPER差不多了,相对RTX 4070提升20%到40%,相对RTX 3070 Ti提升40%到55%。 ![]() 同样是2K游戏实战环节。DLSS 2游戏中,iGame GeForce RTX 5070 Advanced OC 12GB表现可以比肩RTX 4070 Ti SUPER,同时也比RTX 4070帧率高出40%左右的性能。 ![]() ![]() DLSS 3游戏中iGame GeForce RTX 5070 Advanced OC 12GB相对RTX 4070有30%到50%的提升。需要注意,后期DLSS都会从CNN卷积网络更换成Transformer引擎,随着驱动和游戏的更新,即便是老款的DLSS游戏,游戏帧率也会有明显提升,这套升级对于RTX 20系以后的GPU都会奏效,这也是N卡值得投资的理由之一。 ![]() ![]() 左手AIGC,右手Studio 接下来是创作环节。视频编辑已经成为我们内容创作中非常重要的一个部分。更好的色彩展现能力是保证我们高质量视频输出的保障。iGame GeForce RTX 5070 Advanced OC 12GB配备了1个第九代NVENC编码器和1个第六代NVDEC解码器,并且在硬件上提供对YUV 4:2:2支持。 ![]() 在拍摄、编辑、色彩校正的过程中,YUV 4:2:2是目前获取更多颜色信息、减少文件大小,满足带宽需求的合理选择。在YUV 4:2:2视频中,完整的亮度值被保留,同时保留了一半的原始色度信息,YUV 4:2:2压缩视频帧仅占YUV 4:4:4的三分之二,同时提供了YUV 4:2:0两倍的颜色分辨率。这意味着YUV 4:2:2是个不错的选择。 ![]() 在DaVinci Resolve 19的输出选项中,可以看到iGame GeForce RTX 5070 Advanced OC 12GB能够顺利开启4:2:2 10bit输出。在处理一段索尼A7拍摄的H.265 59.94fps 4:2:2 30秒左右的视频素材时,花费时间大概在19秒左右。 ![]() 基础渲染环节。Blender Benchmark 4.3.0引入的Moster、Junkshop、Classroom三个参考场景作为参考。iGame GeForce RTX 5070 Advanced OC 12GB相对GeForce RTX 4070提升幅度最高可到18%。 ![]() V-Ray 6 Benchmark GPU RTX性能测试中,iGame GeForce RTX 5070 Advanced OC 12GB相对GeForce RTX 4070提升接近50%。 ![]() ![]() SPECviewperf用来考验OpenGL和Direct X API的3D图形性能,测试场景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。iGame GeForce RTX 5070 Advanced OC 12GB相对RTX 4070提升最高40%。 ![]() ![]() 在AI环节,Blackwell开始从硬件层面引入对FP4数据格式支持,则可以很好的解决这个问题。原因是FP4提供了一种较低的量化方式,类似于文件压缩,能够减少模型的大小。相对大多数模型默认使用的FP16精度相比,FP4所需的内存是FP16的不到一半,并且GeForce RTX 50系列可以提供相比上一代2倍以上的性能,FP4可以通过NVIDIA TensorRT模型优化器的量化方式,确保质量不会有太多损失。 ![]() 这里先通过UL Procyon FLUX.1 AI Image Generation Demo for NVIDIA进行测试。FLUX.1是一个基于FP4模型,拥有120亿个图像生成模型参数,因此对显存要求也非常高,必须要在16GB显存以上才能完成。iGame GeForce RTX 5070 Advanced OC 12GB原生支持FP4,对GeForce RTX 4070差距有3.6倍。当然测试过程中,我们也发现了12GB显存的极限,如果你侧重于AI性能表现,还是那句话,显存越大越好。 ![]() 在Procyon的Stable Diffusion 1.5 FP16以及Stable Diffusion XL FP16的测试中,iGame GeForce RTX 5070 Advanced OC 12GB表现也同样亮眼。相对RTX 4070提升16%到21%,Stable Diffusion 1.5 INT8则提升了28%。 ![]() UL Procyon AI的文本生成基准测试选取了多个大语言模型LLMs作为AI性能评估,包括Phi-3.5-mini-3.8B,Mistral-7B-v0.2 7B,Llama -3.1 8B,Llama-2 13B。iGame GeForce RTX 5070 Advanced OC 12GB相对于RTX 4070提升在10%到140%。 ![]() ![]() MLPerf-Client v0.5是由MLCommons联盟开发的机器学习基准测试,成员来自哈佛大学、斯坦福大学、NVIDIA、谷歌的工程师和研究人员,旨在不同平台下探讨GPU的AI性能释放,LLMs大语言模型正好是其中之一。这里MLPerf-client使用Meta的Llama2-7B模型进行。 iGame GeForce RTX 5070 Advanced OC 12GB相对于RTX 4070提升在20%左右。 ![]() ![]() 最后DLSS 4也已经在D5渲染器中得到了应用,已经可以在软件菜单中找到Super Resolution,Ray Reconstruction和Frame Generation选项。另外DLSS 4 4X多帧生成还可以通过NVIDIA APP设置来实现。在实际使用中,iGame GeForce RTX 5070 Advanced OC 12GB可以做到RTX 4070的2倍,表现也已经与RTX 4070 Ti SUPER相当。 ![]() 写在最后:2K游戏体验更酸爽 iGame GeForce RTX 5070 Advanced OC 12GB厉害的地方在于,它可以在RTX 5070公版的基础上,一键超频让性能再进一步。得益于优秀的散热系统,如果你愿意发挥DIY的超频精神,通过iGame Center还可以将频率再提升400MHz甚至500MHz,将RTX 5070的基础光栅性能往上提一提,跨级挑战上一代旗舰GPU也不成问题。 ![]() 在2K游戏领域,通过DLSS 4加持iGame GeForce RTX 5070 Advanced OC 12GB则可以做到在光追最高画质下,轻松将游戏帧率稳定在100FPS甚至200FPS以上,让主流显卡获得了高端显卡的性能,提升幅度是非常明显的。 同样,在AIGC和内容创作领域,iGame GeForce RTX 5070 Advanced OC 12GB应对基础的创作需求也自如应对,让围绕其搭建的新PC平台拥有了更多的价值。 ![]() 当然重点还是iGame Advanced个性化的外观设计、散热以及使用体验足以让其在诸多同级别显卡中脱颖而出,凭借着扎实到位的做工和稳定的表现,以及细节上的惊喜,iGame GeForce RTX 5070 Advanced OC 12GB都应该是非公版显卡中非常值得考虑的那一款。 如果你希望在近段时间组件一套主流且能兼顾性价比的游戏PC,那么不要犹豫,iGame GeForce RTX 5070 Advanced OC 12GB就应该出现在GPU的候选名单中。 ![]()
|
0 |