NVIDIA创始人兼CEO黄仁勋于北京时间今日凌晨在GTC 2012大会上发表主题演讲,光重大宣布就有三四项,但其中最受关注GPU发展动态的用户关注的还是Tesla K20的现身——Kepler架构的真正旗舰GK110终于来了。
此次黄仁勋通过讲解Kepler架构新特性的方式引出了两款产品——Tesla K10与Tesla K20,实际上三种特性中除SMX外均为GK110所独有,包括加强GPU利用率减少轻载使用情况的Hyper-Q以及加强任务并行度的Dynamic Parallelism。
Hyper-Q
由于Kepler架构的改进,GK110可以让最多32个CPU核心为单个GPU提供硬件工作队列,相比之下上代Fermi旗舰GF110只有1个。多条硬件工作队列可显著提升小负载的执行效率。
Dynamic Parallelism
此前的GPU如GF110在执行Kernel(程序内核)时,每执行一个或者一组Kernel都需要与CPU互动一次,Kernel需要由CPU创建。而在GK110中Dynamic Parallelism使得GPU能自己在执行完Kernel后自行判定并创建下面的Kernel,减少了与CPU互动的频率可节省时间,并提升GPU的计算效率。
GK110规格
NVIDIA Tesla K10(双GK104)
实际上宣布的两款产品中,Tesla K10正是此前BSN爆料声称的GeForce GTX 690的Tesla版,并且目前已经上市。NVIDIA宣称其具有3倍于上代Tesla旗舰M2090的单精度浮点计算能力——4.577T FLOPS,内存带宽为320GB/s,单个GPU 160GB/s略小于GTX 690,内存为8GB GDDR5。
GK110核心照片
新产品基于GK110核心的Tesla K20目前NVIDIA官方只宣称双精度浮点约3倍于Tesla M2090,晶体管数量为71亿个,将于2012年第四季度进入市场。从核心图上来看,GK110拥有15个SMX,也就是CUDA Core数量为192*15=2880个。但根据PCinlife管理员cho爆料,其中一组被屏蔽作为冗余之用,上市产品CUDA Core数量为2688个,双精度浮点计算能力为1.4-1.5T FLOPS左右。
NVIDIA Tesla K20(GK110)