MWC 2011大会上,NVIDIA展示了新鲜出炉的Kal-El Tegra 3四核心移动处理器,并用测试数据宣称其性能是Tegra 2的两倍,甚至比双核心、2.0GHz主频、4MB二级缓存的笔记本处理器Core 2 Duo T7200还要快10以上。事实真的如此么?
IT信息网站ilsistrmista.net撰文称,其实有不少人都发现了一个很奇怪的地方:Kal-El Tegra 3、Core 2 Duo T7200使用的GCC编译器版本相差很大。
仔细看上图中红框内的文字就可以发现,Kal-El Tegra 3搭配了很新的GCC 4.4.1,并且开启了O3高度优化,甚至还有一些硬件相关设定,但是Core 2 Duo T7200却只用了GCC 3.4.4,优化程度也只是普通的O2。这就不免让我们感到怀疑,难道Tegra 3的表现是依靠编译器和设置优化而来的?
需要指出的是,Core 2 Duo T7200这种乱序执行处理器虽然很依赖指令调度,但是编译器的性能仍然非常重要,不同的编译器、不同的编译器版本、不同的优化级别等设置都会导致很大的性能差异。
想独立测试Tegra 3是不可能了,于是ilsistrmista.net找来了一台戴尔D620笔记本,处理器正是基于Core 2 Duo T7200,并在上边分别安装了RedHat Enterprise Linux 4/6操作系统,因为它们自带的编译器版本3.4.6、4.4.4正好与NVIDIA所用的非常接近,事实上0.0.x的版本差异完全可以忽略。
这台笔记本的其他配置还有:4GB DDR2-667内存、日立80GB 7200RPM硬盘、NVIDIA Quadro NVS 110M显卡。实际上测试中只使用了文字模式,因此与显卡无关。
首先运行NVIDIA使用的CoreMark 1.0测试,可以看出GCC 4.4.4的性能要远远优于GCC 3.4.6。在普通的O2优化级别下,新版本的性能领先12%;用上O3级别之后,GCC 3.4.6性能基本没有提升,但是GCC 4.4.4却增加了28%,这样领先优势就扩大到了41%;继续深度优化后,GCC 4.4.4的性能又略微提升了一些。
再代入NVIDIA给出的数据对比一下,Core 2 Duo T7200更改设置后性能猛增了44%之多,从而将Tegra 3远远甩在了身后。
无论从哪方面说,Kal-El Tegra 3都是一款非常优秀的移动处理器,四个Cortex-A9处理器核心、12单元GeForce GPU图形核心、支持3D立体和2560×1600超高分辨率视频解码、典型负载功耗不高于Tegra 2等等这些都是其他芯片所望尘莫及的,但是很显然,它毕竟只是一颗移动设备用的处理器,性能上相比于主流乃至上代笔记本处理器都有很大的差距,想超越不能只靠这种手段。