为科学计算而生!NVIDIA全新Tesla解析
NVIDIA公司发布GPU计算产品的新家族——NVIDIA® Tesla™,全新Tesla品牌既不同于个人娱乐消费级的GeForce,也不同于专业图形渲染的Quadro,它是专为通用计算而生的,凭借强大的流处理架构将科学计算性能提高到新的巅峰!
NVIDIA三大GPU品牌,相同的架构在不同领域扮演重要角色
如今的GPU拥有数十倍于CPU的浮点运算能力,如此强大的实力仅仅用来渲染3D图形是莫大的浪费。NVIDIA在GeForce 8一代启用了全新的流明引擎架构,庞大的流处理器阵容奠定了坚实的硬件基础。随后NVIDIA便开始致力于通用计算CUDA(Compute Unified Device Architecture,统一计算设备架构)的开发,驱动和软件方面日渐成熟。
由于产品定位不同,为GPU开辟了一个全新的应用领域,因此NVIDIA发布了一个新的品牌——Tesla(特斯拉)。Tesla是一位拥有700多项专利的著名科学家,交流电和无线电的创始人,变压器和交流电动机的发明人,提出了低损耗高压电传输的概念。高中物理课本中磁感应密度的单位就是特斯拉!
三款Tesla产品
NVIDIA此次发布的Tesla品牌下目前共有三款产品,分别是Tesla GPU运算处理器,Tesla桌面超级计算机和Tesla GPU运算服务器。下面就对他们进行详细的介绍。
Tesla GPU运算处理器C870可以看作之前的NVIDIA Quadro专业卡的通用计算版本,使用GeForce 8系列GPU,1.5GB显存,拥有518Gflops的浮点运算能力,售价约1499美元。
Tesla C870
外观和普通的8800GTX有些相似,但Tesla不需要输出接口,只负责数据处理 Tesla C870的硬件规格和这块Quadro FX 5600基本相同
我们都知道,专业显卡和游戏显卡其实并无本质区别,GPU架构硬件规格相同,频率也不会有很大落差。主要区别就是专业显卡经过严格的测试和认证,做工用料无比奢华,保证长期高负荷运行不会出现故障,另外专业显卡的驱动也有别于普通驱动,它能够让显卡在作图软件中效能提升数倍以上!
专供科学计算的Tesla也是同样的道理,NVIDIA新开发的CUDA开发软件才是通用计算的精髓,经过NVIDIA的不懈努力,在配套驱动和软件的支持下,GPU可以在非图形领域发挥出超高浮点运算能力的优势。Tesla C870单卡就能达到每秒5000亿次的能力,而两片Tesla C870就可轻松达到每秒万亿次的恐怖实力!
Tesla桌面超级计算机D870革新自NVIDIA去年发布的QuadroPlex图形处理子系统,内部安装两块C870通用计算显卡,3GB显存,拥有超过1Tflops的运算能力,售价约7500美元。
Tesla D870和去年NVIDIA发布的Quadro Plex系统类似,相当于外置图形工作站,它将图形子系统独立了出来,在一个小型的机箱当中安置了两块Tesla C870,并辅以专用的供电和散热措施,用户安装、使用和维护都非常方便。
专用的数据传输接口,走PCI-E总线
当然,外置图形系统需要通过专用的数据通道和服务器主机相连,NVIDIA提供了一块特殊的子卡用来传输PCI-E X16信号。
我们可以把Tesla D870和Quadro Plex看作是一套完整的外置显卡解决方案,这套系统最多可以安装两块C870通用计算处理器,达到1GFlops级别的运算能力! #p#page_title#e#
Tesla GPU运算服务器S870则是一台全新的标准1U服务器,内部安装四块C870通用计算显卡,6GB显存,运算能力超过2Tflops,功率最高可达800W,售价约12000美元。
Tesla S870是套全新的系统,1U规格的机箱内可以容纳四块C870通用计算显卡,整套系统采用了一体式的散热方案,妥善解决了四颗GPU的散热问题和供电问题。
Tesla S870的工作原理与Tesla D870和Quadro Plex类似,也属于外置显卡解决方案,四块C870通用计算处理器组成了Quad SLI系统,将浮点运算能力提高至每秒两万亿次以上!
当然Tesla S870和Tesla D870还能够通过级连的方式组成更多GPU的集群超级服务器,用以代替传统的CPU服务器进行科学计算!
● NVIDIA Tesla通用处理器的前景展望:
一片Tesla C870通用计算处理器的运算能力相当于高端双核心CPU的10倍以上!而且GPU在流处理器方面的执行效率很容易达到90%以上,而CPU由于传统架构的限制想要发挥出60%的效能都很困难。因此GPU通用计算拥有更大的潜力!
A16.jpg
GPU的浮点运算能力和CPU不在一个数量级
GPU的架构更加适合通用计算
G80特殊的缓存式架构进一步提高了ALU浮点运算效能
Tesla S870(双GPU)和Tesla D870(四GPU)这两套独立的系统,其运算能力就相当于数十台甚至上百台普通服务器,无论体积、成本、功耗方面都有着不可估量的优势。如果用它们来组建超级服务器的话,只需更少的GPU就能达到同样的规模,性能上限也将大幅提升!