异构计算两大引擎再次加速
异构计算今年得到了快速发展。一方面,以杀入Top 500前5的中国高性能计算机天河一号为代表,采用异构计算建设的高性能计算集群开始快速出现;另一方面,以微软的DirectCompute等技术为代表的公开标准程序接口也助推了应用的快速开发。
今年下半年,《中国计算机报》进行了三次关于异构计算的报道,也得到了读者的反馈和好评。
《中国计算机报》将在未来一段时间内,以专栏的形式,对异构计算的进一步发展进行追踪报道,以飨读者。
10月23日,微软发布了Windows 7。同日,DirectX 11也正式亮相。DirectX 11中,DirectCompute 11是最引人注目的新特性之一。
随后不久,11月召开的微软TechED上,AMD不仅展示了明年一季度将要发布的12核服务器处理器工程样机,也携旗下支持DirectX 11的最新显示核心ATI Radeon HD 5870亮相。至此,从硬件到软件,异构计算的两大引擎再次加速。
TechED上,AMD中国区技术经理刘文卓在分论坛中做了名为《CPU与GPU的融合》为题的演讲,揭示了异构计算的未来发展。
我们之前已经谈过,CPU和GPU截然不同的设计架构使得两者各自的禀赋也不相同。CPU适合复杂指令调度、循环、分支、逻辑判断以及执行等程序任务,而GPU适合可以拆分成简单指令的重复的高度并行数值计算。“GPU不是什么都能算,它擅长的是像素处理、压缩解压缩等每部分运算之间没有过多逻辑联系的领域。目前,GPU的发展速度已经远远超过了CPU。”刘文卓介绍,在ATI Radeon HD 5870中,流处理器个数已经达到了1600个,其单精度浮点运算能力达到了2.72TFlops。与之相比,目前最强的CPU的单精度浮点运算能力也仅仅达到了60GFlops,差距非常明显。另外,GPU的能效更高,平均每瓦运算性能达到了14.47GFlops,也较CPU高出很多。
然而,GPU之前的应用领域一直局限在显示领域。“如何将GPU的运算能力运用到更多通用计算领域?这是AMD一直在思考的问题。”刘文卓说,早就看到GPU运算的前景,是AMD并购ATI的重要原因之一。“在石油勘探等领域,用GPU进行计算,性能提升可以达到几百倍。”
OpenCL、DirectCompute等编程环境的出现助推了异构计算的发展。在这些环境中编写程序,可以应用到更多环境中。它们的出现使得异构计算程序编写的复杂性大大降低了。
目前,采用GPU进行高性能计算已经成为科研机构的共识。天河一号就是异构计算在高性能领域应用的代表。有消息称,美国橡树岭国家实验室已经大批采购了NVIDIA的GPU,以应用在高性能计算机中。同时,曙光6000也将采用MIPS架构的龙芯与X86架构的异构组合。可以预见,明年的Top500中,异构计算必将成为舞台上的主角