【PConline 评测】“不服跑个分!”,跑分似乎已经成为了所有购买新显卡用户,甚至于每一张新显卡上市之前所必须经过的一个环节。虽然相对于眼花缭乱的手机跑分软件来说,显卡的跑分程序要少得多,但是很多用户还是会对这些软件测试得到的结果产生很多的质疑,那么究竟这些跑分软件测试出来的成绩靠谱么?是否能代表我们实际使用时候的差别呢?今天就让我们一起来验证一下。
显卡跑分软件简介
显卡领域最权威跑分软件自然是来自FutureMark公司的3DMark系列,最早的3DMark99已经可以追溯到1998年,其后更是不断根据显示技术的革新进行版本的更新换代。目前最新的版本为2013年发布“新3DMark”,测试中出于对比的考虑我们同样会加入上一代的3DMark11。
除了3DMark之外,跑分软件其实也有很多,但要是说最常见的那自然是鲁大师了,这也要得益于国内软件的独(liu)特(mang)推广方式。下至各种网吧电脑性能宣传,上至各种土豪电脑刷分,其免费使用和最终成绩数值比较高都是它比较吸引人的地方。
跑分软件的出发点很简单,就是较为客观的体现不同产品之间的性能差异,所以在测试中也都采用的是比较贴近真实的实际应用成绩。简单点说就是一个固定场景的不可操作的游戏,然后再根据它的实际测试结果对显卡以及整个硬件进行系统打分。
但是即便是采用了实际测试的方法,依旧不能阻止少数人想作弊的脚步,历史上关于显卡跑分成绩的作弊层出不穷,就连显卡厂商也尝试过在测试的渲染中动手脚(有兴趣的可以搜索“火花门”),通过在设置的偷工减料上来实现成绩的提升,不过随着跑分软件的不断更新,这种做法可行性也越来越低了。
测试方法简介:怎么科学怎么来!
因为这次测试的主角是跑分软件,所以显卡的选择方面就显得非常重要,经过深思熟虑笔者决定从两个方面进行重点测试。
1、性能强弱幅度能不能在跑分软件中充分的体现。
2、跑分程序究竟能不能正确的反映出显卡之前的强弱关系。
所以本次测试的显卡分为两组,第一组主要是要测试性能的增长是否能直接反映到分数当中,选用的显卡是GTX960/980/TITAN X。原因也很简单,这3张卡均采用的是相同的架构Maxwell,而且在规格上960/980/TITAN X正好是1:2:3的规模。理想状态下成绩应该接近于1:2:3,不过架构的效率可能会造成一定影响。(测试中我们还将对他们进行统一的超频,将它们的GPU核心的基础频率锁定在1150MHz,进一步加强最终成绩的对比性。因为不同核心的Boost幅度不同,在Boost频率上还存在少许差异)
第一组显卡参数规格对比
显卡:GTX960:GTX980:GTX TITAN X
架构:GM206:GM204:GM200
晶体管数:29亿:52亿:80亿
制作工艺:28纳米:28纳米:28纳米
流处理器:1024:2048:3072
纹理单元:64:128:192
ROPs:32:64:96
显存容量:2GB:4GB:12GB
显存位宽:128bit:256bit:384bit
核心频率:1126-1178MHz:1126-1216MMHz:1002-1076MHz
Boost幅度:3.7%:12.1%:7.5%
测试频率:1150-1213MHz:1150-1251MHz:1150-1224MHz
显存频率:7012MHz:7012MHz:7012MHz
外接供电:6pin:6+6pin:6+8pin
而第二组则主要测试分数是否能反映不同架构的GPU的性能强弱顺序是970/R9 290X这对冤家对头,因为他们的定位比较相近,两者的性能也比较接近,通过比对游戏中和理论测试的成绩,看看两者在理论和实际应用中的成绩排名是否一致。
第二组显卡参数规格对比
显卡:GTX970:R9 290X
架构:GM204:Hawaii
晶体管数:52亿:62亿
制作工艺:28纳米:28纳米
流处理器:1664:2816
纹理单元:104:176
ROPs:64:64
显存容量:4GB:4GB
显存位宽:256bit:512bit
核心频率:1051-1178MHz:1000MHz
显存频率:7012MHz:5000MHz
外接供电:6+6pin:6+8pin
下面让我们走进大家期待已久的测试环节,就让我们用成绩来验证一下跑分软件究竟靠谱不吧!
测试平台简介
硬件平台
CPU:Intel i7-4790K
主板:华硕 Z97-PRO GAMER
内存:海盗船 DDR3 1600 8GBx2 (8-8-8-24)
硬盘:影驰 铠甲战将 512GB 固态硬盘
电源:Antec 1300W HCP Platinum
显卡:
影驰 GTX TITAN X(1000/7012MHz)(测试中频率调为1150MHz)影驰 GTX980(1266/7012MHz)(测试中频率调为1150MHz)影驰 GTX970(1190/7012MHz)(测试中频率调为1051MHz)影驰 GTX960(1228/7012MHz)(测试中频率调为1150MHz)AMD R9 290X(1000/5000MHz)
软件平台
操作系统:Windows 7 ulimate 64bit
显卡驱动:
NVIDIA GeForce 347.88 WHQL / AMD 催化剂 Omega 14.12 WHQL
测试平台说明:测试所用的N卡均来自影驰,频率调整通过半官方的NVIDIA Inspector进行,其中960/980/TITAN X统一超频到1150MHz,GTX970则降频到默认频率1051MHz与公版R9 290X进行对比。
理论成绩及成绩分析:第一组
3DMark11各项得分
显卡:GTX960:GTX980:GTX TITAN X
GPU得分:2980:5705:7744
百分比:100%:191%:260%
GT1场景:16.77:30.94:42.71
百分比:100%:184%:255%
GT2场景:15.53:29.08:39.91
百分比:100%:187%:257%
GT3场景:14.64:28.83:39.87
百分比:100%:197%:272%
GT4场景:8.6:16.71:22.1
百分比:100%:194%:257%
综合场景:16.98:32.35:39.49
百分比:100%:191%:233%
新3DMark各项得分
显卡:GTX960:GTX980:GTX TITAN X
GPU得分:3458:6267:8362
百分比:100%:181%:242%
T1场景:17.96:33.28:45.96
百分比:100%:185%:256%
T2场景:12.93:23.06:30.08
百分比:100%:178%:233%
综合场景:6.55:12.72:18.43
百分比:100%:194%:281%
新3DMark各项得分
显卡:GTX960:GTX980:GTX TITAN X
鲁大师得分:95807:177476:235946
百分比:100%:185%:246%
测试小结:可以看出同样以GTX960为基准的时候,3DMark11与新3DMark的测试结果之间也存在一定的差异,虽然我们将三张卡的频率调整到了比较接近的频率上,但是三者的成绩未能实现理想中的1:2:3,当然在局部测试中分数比例距离理想值也较远,不排除Maxwell架构随着规模加大有效率下降而导致的。(下降才比较正常)
但是从理论测试的成绩我们不难看出,我们平时作为参考的各种得分就是根据各个测试场景的帧率结果,经过公式化的加权计算得出来的。再加上驱动对于这些测试场景的优化已经达到了不能更好的地步,所以说3DMark理论测试的得分体现的就是显卡的实际性能。
虽然被称作“娱乐大师”,但是鲁大师测出来的三张卡的成绩百分比和新3DMark的成绩还是比较接近的,虽然笔者也觉得鲁大师的测试场景很简单。通过对比来看鲁大师的分数还是有很高的参考意义的,当然这里仅讨论显卡跑分分数。
实际游戏成绩对比:第一组
第一组游戏实际测试
显卡:GTX960:GTX980:GTX TITAN X
罗马之子:45:79:126
百分比:100%:176%:280%
看门狗:38:71:75
百分比:100%:187%:197%
孤岛惊魂4:57:93:94
百分比:100%:163%:165%
孤岛危机3:29:55:64
百分比:100%:190%:221%
使命召唤11:101:144:179
百分比:100%:143%:177%
龙腾世纪:34:63:79
百分比:100%:185%:232%
测试结果:能较好的用分数来体现性能的差距(与最理想有一点差距,不一定是由跑分软件造成)。
测试小结:可以看到6款游戏中只有龙腾世纪的百分比数值与理论跑分最接近,其他几款游戏或多或少有一定的出入,TITAN X在这几款游戏中的表现都达不到在理论测试中的成绩,很明显是驱动中对TITAN X在这些游戏中的使用还没有优化。而COD11则是另外一种情形,三块显卡之间的成绩百分比显然不如理论测试中那样大,COD本身的显卡利用效率方面存在一定的问题。
这个环节我们可以很清楚的看到,实际游戏的成绩与理论成绩还是会有一定的差别,毕竟驱动对于测试软件的优化成熟度远高于这些新游戏。但是优化良好的游戏的表现基本都与理论成绩比较符合,少部分游戏成绩超越理论是因为百分比对比对象的问题,因为优化想超越理论测试实在太难了。
理论成绩及成绩分析:第二组
3DMark11各项得分
显卡:R9 290X:GTX970
GPU得分:4172:4666
百分比:100:112%
GT1场景:22.75:25.69
百分比:100%:113%
GT2场景:23.61:23.76
百分比:100%:101%
GT3场景:20.54:23.32
百分比:100%:114%
GT4场景:11.7:13.65
百分比:100%:117%
综合场景:25.14:26.78
百分比:100%:107%
新3DMark各项得分
显卡:R9 290X:GTX970
GPU得分:5050:5264
百分比:100%:104%
T1场景:27.49:28.07
百分比:100%:102%
T2场景:18.28:19.32
百分比:100%:106%
综合场景:10.15:10.59
百分比:100%:104%
新3DMark各项得分
显卡:R9 290X:GTX970
鲁大师得分:149087:145474
百分比:100%:98%
测试小结:可以看到两者的3DMark11的得分差距明显大于新3DMark,如果根据新3DMark的成绩来看,两者的性能差距非常小(3~4%),而且在鲁大师的性能测试中,290X反而超过了GTX970,那么实际游戏中的排名和差距是否会跟这个百分比有差距呢?
实际游戏成绩对比:第二组
第二组的测试游戏与第一组略有不同,因为目前AMD驱动对部分新游戏的优化的并不是很到位,直接影响我们得出正确的结论,所以在第二组的游戏实际测试中我们将引入2款比较旧一点的单机大作,分别是《细胞分裂6》和《地铁:余光》。
第二组游戏实际测试
显卡:GTX960:GTX980
罗马之子:68:73
百分比:100%:107%
龙腾世纪:48:55
百分比:100%:115%
使命召唤11:119:143
百分比:100%:120%
地铁:余光:82:74
百分比:100%:90%
孤岛危机3:42:48
百分比:100%:114%
测试结果:3DMark能准确的体现不同显卡之前的强弱关系。
测试小结:可以看到在很多款游戏中,实际表现都跟理论分数都比较相近,只有极个别的标明属于A/N阵营的游戏成绩会有一定变化(很多标明了阵营的游戏中A/N卡的表现也是差不多的)。通过对多款不同阵营的游戏成绩求平均值,我们可以看到两张卡在游戏中的整体表现还是很接近理论测试分数的。而两者的强弱关系也基本与理论测试中一致。
PConline总结:可信但终究只是个数字
通过两组显卡的针对性测试之后,可以看出理论测试成绩可信度还是有的,尤其是像3DMark这样的专业跑分软件,要知道FutureMark旗下还有一大堆的跑分测试软件,更不要提之前手机端的3DMark软件已经将好几款通过作弊刷分的手机型号进行了拉黑,可以说权威性就是他们的核心竞争力。
而部分国产的其他软件嘛,其实绝大多数用户也只是抱着测测玩的心态来进行测试的,像上图这种说你的电脑已经击败全国XX%的电脑的测试看看就好,因为自己够用与超越多少人之间实在没有必然的关系。
为啥总感觉跑分和游戏有出入?
因为跑分程序发布之后基本不会有所改变,所以显卡厂商有充足的时间对跑分的场景做最到位的优化,这也是为什么很多显卡在新卡发布之后第4、5版驱动之后的理论成绩基本不会再改变的原因。
相比之下游戏的优化就复杂的多了,且不说市面上各种游戏所使用的各种渲染引擎,而且每个游戏还会对引擎做上一些自己的改变。每当一些3A级大作发布的时候,大家就会发现“鸡血驱动”也会随之出现,而且用不用之间的差距还特别大。
而且出于策略的考虑,很多游戏还会在开发之初就会选择自己的阵营(NVIDIA的It"s meant to be played / AMD的Gaming Evolved),实际表现也随之向所属阵营的一方倾斜。而且目前这种趋势已经蔓延到了渲染引擎上,AMD方面最牛的要属随Crysis诞生的CryEngine,NV则拥有Unreal引擎系列,基本采用其中其中一种引擎就会自然进入阵营。
参考之后还要看实际!
其实对于普通消费者来说,跑分软件的实际意义在于了解排除了阵营的影响之后的显卡相对绝对的性能强弱,然后再根据各种游戏的实际需求最终确定适合自己的型号。如果你想了解游戏究竟需要什么显卡才能流畅体验,您可以持续关注我们的游戏硬件栏目(相关链接:游戏硬件)!
笔者总结:随着DX12的越来越近,显示领域也将迎来一次巨变,届时很可能跑分也会有一次彻底的改变,小编到时候也将努力集合到尽量多型号的显卡为大家提供一个最全面的跑分天梯图。
参测成绩截屏图(点击可放大查看)
GTX960跑分截图
GTX980跑分截图
GTX TITAN X跑分截图
GTX970跑分截图