Fermi不仅是GPU 十问NVIDIA首席科学家
2009年9月30日至10月2日,NVIDIA公司在美国加州圣何塞市举办GPU技术大会(GPU Technology Conference,GTC)并首次公开了其新一代GPU——Fermi架构。2009年10月27日上午,带着对Fermi架构的种种问题,我们对来京参加CUDA卓越中心授权仪式等一系列活动的NVIDIA公司首席科学家Bill Dally先生进行了专访。值得一提的是,我们是对Bill Dally先生进行一对一专访的仅有的两家国内IT媒体之一。
Tesla(特斯拉)是NVIDIA公司高性能计算产品的统称,这个源自著名物理学家Nikola Tesla(尼古拉·特斯拉)姓氏的称呼其实也是我们熟悉的G80/GT200架构的名字,而新一代GPU架构Fermi(费米)实际上也是采用一位著名物理学家Enrico Fermi(恩里科·费米)的姓氏命名的,要知道Enrico Fermi负责设计建造了人类历史上公认的第一个核反应堆,以此给新架构命名,看来NVIDIA公司也要在视觉计算领域发动一场“核裂变”了。
关于Fermi在高性能计算市场的问题
问:对于高性能计算用户来说,Fermi架构能给他们带来哪些好处?如何去帮到他们?
Bill Dally答:首先,优化的双精度浮点运算可以直接提升GPU的计算能力;其次,ECC容错技术更加适用于数据中心的应用;另外,很多并行计算都需要GPU片载内存以外的缓存结构来提供协作。
问:数十倍甚至是数百倍效能的提升确实能把高性能计算用户吸引到GPU平台上,不过CPU也是在进步的。关键在于应用GPU平台需要你们(NVIDIA)更多的介入,客户方面缺少相关人才,您对此如何评价?
Bill Dally答:关于GPU和CPU的问题,我想说CPU所增加的线程数量在并行计算面前也是捉襟见肘的,而Fermi就不一样了,它有512个核心。关于应用人才的问题,我们也正在通过诸多途径让更多人使用CUDA工具进行编程,比如在大学里开设CUDA的相关课程。
问:我们认为CPU和GPU之间的竞争不仅仅是两种技术架构的竞争,也不仅仅是NVIDIA、AMD以及Intel这三家公司之间的竞争,而是代表了两条产业链之间的竞争。虽然在GPU产业链上NVIDIA和诸多软硬件厂商都有合作,但是CPU产业链也已经高度成熟,您对此有何看法?
Bill Dally答:我并不否认CPU产业链是要更成熟一些的,不过我对GPU产业链的发展同样持乐观态度。对于串行计算的CPU来说,核心数量的增加和运算能力的提升远不如并行计算的GPU来的容易,加之像是Adobe这样的软件领导厂商也已经采用CUDA,GPU的竞争优势就更大了。
问:没有人会否认NVIDIA在GPU并行计算方面的领导地位。当然,我们也不能忽视ATI的流处理技术,毕竟推动这个技术发展还是需要整个行业来支持,您对此有何看法?
Bill Dally答:NVIDIA之所以在并行计算方面走在前面,是因为我们在这里投入了大量的资金来做研发,无论是在硬件方面还是在软件方面。当然,要推动整个并行计算发展,还是要有一个标准和第三方软件开发商的支持。 #p#page_title#e#
问:GPU并行计算目前在中国还算是“新生事物”,相对集中在一些科研院所和高等院校的项目上,而在实际生产生活中商业化、市场化的案例并不算多,吉星吉达公司在石油领域的案例算是一个代表,您能不能向我们介绍一下GPU并行计算在欧美国家的普及情况?
Bill Dally答:我比较同意GPU并行计算在中国处于初级阶段的说法,不过在石油、天然气、水利等能源行业的应用算是开了个好头。在美国,很多金融企业以及汽车厂商都会采用GPU并行计算来做数据分析和设计工作。而个人用户也会用它来做视频的剪辑、编解码等等。相信随着GPU并行计算技术越来越成熟,相关的应用也会覆盖到更多的领域上。
问:Fermi架构更多的考虑了GPU在并行计算上的设计,它已经不再是图形处理器那么简单。那么,Fermi架构在NVIDIA公司GPU的发展历史上甚至说整个计算机行业的发展历史上又会处于一个什么样的位置呢?
Bill Dally答:我想说Fermi架构是一款达到了我们预期的产品。当然,它也不可能是完美的,它同样还有进步的空间。不过就现在看来,无论是在图形处理还是在并行计算上,Fermi架构都可以让高性能计算和个人用户的工作变得更高效。
关于Fermi在个人消费类市场的问题
问:现在CPU制程和架构隔年就会更新一次,那么GPU会不会也遵循这样的规律?
Bill Dally答:其实GPU的每一次更新换代都可以带来50%左右的效能提升,像是Fermi架构甚至可以达到70%,而CPU每一颗核心的效能提升幅度也就是在10%左右。更重要的是,GPU是并行处理器,是传统的串行处理器(CPU)所无法取代的。
问:和把大部分晶体管都用在缓存上的CPU不同,GPU主要还是以逻辑电路为主,这势必会造成对芯片制程和晶体管数量的依赖,我们的问题是Fermi架构在实现性能突破的同时,在功耗方面又会有怎样的表现?
Bill Dally答:虽然Fermi架构512颗的核心比上一代产品多出了很多,不过实际上两者的功耗是差不多的。再退一步讲,在单位功耗上,GPU的计算能力要远比CPU大的多,或者说要完成同样的计算量,GPU的功耗也要低很多,因为它是并行的。我们有一些很好的技术来控制功耗,因此并不需要担心这些。
问:从以前的PCIe 1.0,到现在的PCIe 2.0,再到以后的PCIe 3.0,GPU一直都是通过PCIe总线来运作的,那么什么时候会出现新的界面来承载GPU的工作?
Bill Dally答:我们的确有在研究一些潜在的总线方案,但问题是我们现在只能控制总线的一端,而另一端则是由CPU厂商所控制的。当然,这件事并不是由一家公司控制的,PCIe总线是一个组织所制定的标准,我们也身在其中,我们当然也希望在未来能够有更好的界面问世。
问:Fermi架构的一大改良就是优化的双精度浮点运算,其实之前在这个方面上,NVIDIA和ATI做的都不是很好,而Fermi架构的单精度和双精度之间的比值已经达到了2比1,那么以一颗512核心的Fermi芯片计算,它究竟能给出多大的双精度浮点运算能力?
Bill Dally答:我们上一代GPU单精度和双精度之间的比值还是8比1,而Fermi架构已经可以做到2比1了!当然,具体的计算能力还要视产品的最终频率而定,因此现在还没有一个准确的数字,不过这个数字肯定是相当可观的。
问:Fermi架构能够给消费级市场带来怎样的好处?也就是说NVIDIA的GeForce和Quadro产品。
Bill Dally答:Fermi架构肯定是会被投放到我们不同的产品线上的,先是高性能计算的Tesla产品,然后是娱乐级的GeForce产品以及工作站级的Quadro产品。当然,Fermi架构本身的强大是不会变的,因此无论你把它投放到哪条产品线上,它所带来的好处都是显而易见的。
问:NVIDIA公司有没有把GPU支持Windows操作系统提到议事日程上来?
Bill Dally答:对于Windows操作系统的支持,我们还没有太多的计划,我们更关注的是异构计算。我们从来不会说GPU就要好过CPU,不过我们坚信在并行计算上我们的GPU肯定要比CPU更加出色。现时对于一台PC来说,CPU加上GPU的异构计算无疑是很好的方式,让CPU去运行操作系统,而并行计算就交给GPU去做。 #p#page_title#e#