日前,AMD发布了ATI Stream SDK 2.0正式版,支持基于CPU和GPU的OpenCL程序开发,不过即使是在Radeon HD 4000系列上,OpenCL性能也会受到限制。
AMD发言人Micah Villmow在官网开发者论坛里指出:“我们已经知道,Radeon HD 4000系列显卡在OpenCL上存在性能问题,但暂时没有计划专门对此进行完善,因为4000系列并没有像5000系列那样专门针对OpenCL进行设计。4000系列的性能会变得更好一些,但这不是(AMD的)工作重心。”
他还进一步解释说:“举个例子,如果(在4000系列上)使用本地存储,它们都会在全局存储中模拟,所以可能需要去主内存中访问两次,这可能就会造成严重的性能损失,而在5000系列上,本地存储都会有硬件本地映射,因此速度会快好几倍……在4000系列上进行(OpenCL)编程也就不能和5000系列上一样。”
根据用户反映,在使用ATI Stream SDK 2.0 Beta 4的时候,Radeon HD 4870的性能只相当于GeForce GTX 260的五分之一左右。考虑到RV770核心从2006年就已经投入开发,而OpenCL 1.0规范直到2008年底才定稿,NVIDIA方面的GT200架构却从一开始就考虑了通用计算,出现这种局面也是可以理解的,同时也解释了ATI Stream SDK为什么不再支持Radeon HD 3000系列。