Beyond3d刊登了Visiontek GF4 Ti 4600的测试文章,文章中包括一篇对Nvidia Tony Tamasi和一位Nvidia的工程师关于GF4 Ti的访问:
Q:GF4 Ti当前的规格说多边形生成率是125M-136M三角形/秒。那么这个数字在如何达到的?在真实程序测试中,例如BenMark是否只有50%?当有光照的情形时,这个数字
有什么变化?
Tony:136M顶点/秒是可以用真实程序测试出来的。使用简单的顶点转换程序就可以测得。一些复杂的程序(例如光照和matrix skinning)需要更多的处理流程,因此将减少峰值顶点输出。在业界没有标准Vertex程序定义之前,峰值顶点处理性能仍然是唯一定义顶点程序处理性能的唯一有效法则。
NV工程师:老实说,我没有用过Benmark。但是,我知道在某些有限的环境中硬件可以全速运行。它可以获得最高的数字。
随着光照的增加,这个数字当然会减小,但是我不知道有什么等式。我认为如果只有两个单向光源,那么将没有性能损失,如果更多的话,性能会受到影响。
在任何场合,我认为任何GPU的三角形/秒等效于CPU的主频。事实上,它真的说明不了什么问题,GHz无法告诉你指令/秒的数字或者其他东西。不过如果了解架构,你可以用这些数字来做一些性能预测。
Q:那么你能评论一下在真实的游戏引擎中,例如最新的Unreal 2引擎中,多边形生成率低于10M的事实,只有你们所声称的10%?
Tony:象Unreal2那样的图形引擎并不是设计用来测试GPU的峰值性能的。许多游戏引擎都要求GPU有更高的帧速率,包括场景管理,AI,物理等等,所以给出一个适用于不同程序的关于性能的数字是十分困难的。由于Vertex Shader的可编程性意味着每个应用程序都可能运行不同的Vertex Shader,需要不同的计算量。
NV工程师:就Unreal 2来说,显然有很多复杂的东西,他们可能使用了非常复杂的光照模型或者Vertex Shader。因为大量的顶点或者纹理载入可能会成为总线的瓶颈。他们可能受限于填充率,可能受限于CPU。或者说他们可能存在错误,象是设置错误的Vertex buffer标志位,因此无法获得令人满意的性能。