曙光PHPC生物计算解决方案
使用计算机系统进行科学计算和模拟已经成为现代生物研究最重要的方法之一。生物计算对计算处理能力有更高的需求,传统的工作站和PC机不能满足需要。而采购使用高性能并行计算机对很多用户来说存在问题,受到诸多因素的限制,如经费、机房条件、使用管理困难等。
PHPC100是曙光公司研制的最新高性能计算机产品,符合现在高性能计算技术和市场发展的趋势,可以解决诸多限制性因素,为生物计算用户提供适合的计算平台。
在详细分析的基础上,本文给出了基于曙光PHPC100的生物计算解决方案;通过生物计算领域两个典型软件:MPIBLAST和GROMACS在曙光PHPC100平台上的性能测试结果,佐证了无论是主要考验定点运算性能的MPIBLAST应用软件,还是主要考验浮点运算性能的GROMACS应用软件,在曙光PHPC100系统上都有着优异的性能表现。
1.生物计算用户需求
于多方面的原因,很多生物计算的用户还在使用工作站,乃至PC机作为计算平台,不能满足科研的需要。
事实上,几乎所有的生物计算用户对计算平台都有更高的需求,科研工作需要匹配较高性能的并行计算平台。但用户要购置并行计算机会遇到一些问题,这些问题很有代表性,体现了许多高性能计算用户的共同困惑,解决这些问题,提供适合的高性能计算系统解决方案是用户的切实需求。
用户的困难体现在:
经费有限
只有几十万,甚至十几万的预算,采购高性能并行计算机力不从心,如果采购低端的计算机,则性能、稳定性、易用性等没有保证。
没有机房
没有专用机房,采购了并行计算机无处放置;有的单位虽有中心机房,但计算机放置在机房里给使用管理带来诸多不便,受到很多限制,不能满足用户的要求。
供电问题
没有条件为高性能计算机专门配电,只能使用普通墙电。
噪音污染
办公室环境不容许计算机有很大的噪音,普通的机架式集群或刀片服务器都不可放置在办公室环境。有些用户在办公室划出一定区域使用玻璃墙隔离出来,以放置并行计算机系统,但其噪音仍然比较大,影响用户正常工作和身体健康。
性能效率低
并行计算机系统已经进入高效能时代,对用户而言,重要的是应用性能和产出率,理论性能相对而言并不重要。生物计算平台需要达到一定的性能,以取代工作站和PC机,满足科研对计算处理能力的需要,同时要保证高效率。
安装部署困难
高性能计算平台是相对比较复杂的系统,包括多种硬件,系统软件,并行中间件,应用软件等多个层次。系统的安装部署,以及必要时的恢复也比较繁琐,对于非专业人士更是如此。困难还体现在应用软件的部署和优化。
管理不便
很多用户对并行计算机的使用管理感到是一种负担,有时需要专门的系统管理员来管理并行计算机系统。管理不便给系统的正常使用造成隐患,并且会增加成本。
功耗较大
高性能计算平台是相对较大的系统,功耗相对较大,因此,功耗是用户最为关注的问题之一,往往会影响到用户的抉择。节能环保不仅可以为用户节省电费,也符合现代社会的发展理念。
TCO过高
在几年前,拥有并行计算机系统是相对奢侈的科研条件。现在虽然硬件价格下降较快,但计算系统的TCO仍然不低。TCO是综合成本,很多时候,采用某个方案或某种产品,可以降低某个点的费用,但却增加了其他点的费用,TCO并没有降低,甚至更高了。
解决以上问题,才可以使更多的用户使用到高性能计算机,促进高性能计算的普及。所以市场需要一种新的高性能计算机产品和方案,为用户提供理想的计算平台
2.曙光PHPC100
曙光PHPC100是曙光公司在2008年5月推出的新型高性能计算机产品,PHPC100是个人高性能计算机,也可以称为桌面高性能计算机。
曙光PHPC100具有以下特点:
· 是一种模块化、集群(Cluster)架构的高性能计算机
· 具有PC机、工作站、低端小型机所无法比拟的性能
· 无需专业的机房、供电设施、散热设施,可以和PC机、工作站一样,放置在办公桌的桌面附近,适合办公室环境 #p#page_title#e#
· 配置专用的软件包,可以实现软件的自动安装部署
· 具有良好的易用性,对使用者的门槛要求很低
· 管理简单方便,无需专门的系统管理人员
曙光PHPC100采用全模块化设计,背板连接,包括5个计算模块,最大支持10颗双核/四核处理器,采用20Gb Infiniband高性能网络和千兆以太网进行互联。
多台PHPC100可以互连,实现系统规模的可扩展,并有效保证用户投资。系统规模扩展后,每个计算模块仍然可以保持高速Infiniband网络连接,保证系统性能的可扩展性。
PHPC100支持WCCS2003、WHS2008、SuSE Linux、RedhatLinux、CentOS等操作系统,配备系统管理软件和应用软件包。
曙光PHPC100有如下优势:
· PHPC100是专业为HPC应用而设计的计算平台。
· PHPC100在硬件上采用模块化的设计方式,非常便于安装、管理和维护。同时在软件上,采用定制化的高性能计算系统软件环境,专业的高性能设计方便用户的使用和维护。
·采用低噪音、低辐射等办公环境设计,便于用户的使用。同时,通过管理软件和应用软件包,降低了用户的使用和管理难度。
·采用X86集群架构,易于保证和核心高性能计算环境的同构和兼容。PHPC100可以配置40个处理器核心,并可以通过多台PHPC100互连的方式实现扩展。
.PHPC100在生物计算中的应用
3.1适用性分析
受限于应用软件的性能可扩展性,并行计算平台并不是规模越大性能越好。根据统计,大多数生物计算应用软件的性能可扩展性在8-60,更多的进程并不能带来性能的提升。
单台PHPC100可以配置5个计算模块,达到40个处理器核心,可以满足大多数生物计算应用的需要。在有扩展需求的情况下,可将多台PHPC100互连,解决系统的可扩展性。6台PHPC100互连,可以实现240个处理器核心的并行处理,几乎可以满足所有的应用需要。
所以与其他计算平台相比,曙光PHPC100可以生物计算用户提供非常具有特色和优势的解决方案,适用在办公室环境,从而避开了需要专用机房等苛刻要求。
3.2生物计算软件包
为了提高系统的易用性,优化应用软件的性能,曙光PHPC100平台配备了高性能计算应用软件包。
软件包中包含了生物计算领域经常使用的多个应用软件,包括MPIBlast,Gromacs,NAMD,DOCK,Palm等。只需要菜单式操作,就可以实现这些软件在PHPC100上的自动安装部署,用户可以直接运行应用程序。
3.3推荐配置
曙光PHPC100计算机基于模块化设计,作为生物计算平台时,推荐配置如下:
3.4方案优势
1). 工作站的价格
PHPC100计算机价格相对较低,标准配置在二十万人民币左右,随配置的变化价格差异也比较大。较低的价格为普通用户使用并行计算机敞开了大门,可以进一步促进高性能计算的普及,从事生物研究的每个组织和个人都可以买得起PHPC100,用得起高性能计算机。
2). 高性能计算机的性能
PHPC具有高性能计算机的性能。PHPC首先是HPC,属于高性能计算机的范畴。事实上,PHPC100可以提供40个处理器核心,通过Infiniband网络互连,可以发挥出优异的并行处理性能,满足大部分生物计算应用的需要。多台PHPC100可以互连,实现系统的规模扩展,同时保持系统性能的可扩展。
3). PC机的使用环境
PHPC100属于个人高性能计算机,也可以称为桌面高性能计算机,可以同PC机一样在办公室环境使用,对机房、供电、制冷没有特殊的要求。PHPC100计算机噪音小,辐射低,从而保证了办公室环境使用的可行性。
4). 生物计算应用软件包
PHPC100配置了生物计算应用软件包,软件包中包括多种生物计算应用软件。软件包可以实现应用软件的自动安装部署,并做了针对性优化。在PHPC100平台上,用户可以直接运行应用软件,避免了软件安装部署以及配置优化的繁琐过程。
5). 易管理使用
PHPC100计算机配置了管理软件,简化了系统的管理维护,管理使用PHPC100计算机就像管理使用PC机一样方便。 #p#page_title#e#
6). 整体拥有成本低
使用PHPC100计算平台,用户不仅仅是降低了计算机的采购成本,而且节省了机房等基础设施费用,节省了工业专用空调等制冷设备。并且,PHPC100采用了环保节能设计,与其他计算机系统相比,能耗更低。PHPC100计算平台不需要专职系统管理人员,可以节省人力成本
4.性能分析
4.1分析方法
从计算特性上分析,生物计算的类型主要包括两类:
(一)高通量计算(定点计算)
基因序列比对、药物筛选等
计算任务相对独立,进程间无通信或通信量很小,要求充分利用系统的计算资源,使总吞吐量最高
需要较大的内存,较高的数据I/O吞吐量;较强的并发处理能力
(二)高性能计算 (浮点计算)
蛋白质三维结构预测、蛋白质-蛋白质相互作用、基因进化分析、分子动力学计算
利用大量资源共同解决一个任务,使求解时间最短
进程间通信密集,网络性能要求高
为了掌握PHPC100计算平台针对生物计算应用的性能表现,对两个典型应用软件做了性能测试,并和其他计算平台的性能测试结果做了对比。MPIBlast是高通量计算的典型代表,Gromacs是高性能计算的典型代表。
4.2MPIBLAST性能分析
(一)软件介绍
BLAST是现在应用最广泛的序列比对软件,用于基因序列的两两比对,由NCBI研制。MPIBLAST是NCBI BLAST的并行化实现,基于标准MPI并行环境,可以免费下载使用。
MPIBLAST软件的计算特点:
· 定点运算为主;
· 内存需求量大;
· MPI通信比较少,主要是网络文件系统的读写对网络性能有一定要求;
· I/O量比较大;
(二)测试平台
测试在3个平台上进行:
曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
曙光A950r-F胖计算节点,8个AMD Opteron8212双核处理器,主频2.0GHz
IBM P575小型机,8个Power5双核处理器,主频1.9GHz
(三)测试结果
使用MPIBLAST 1.4.0版本;数据库使用month.aa,库所占空间为106MB;查找序列的输入文件为F.joh_aa.fasta,查找1500个序列;
测试结果如下:
(四)结果分析
在曙光PHPC100上,MPIBLAST有着优异的性能表现; 单进程的搜索速度较快;多进程并行搜索时,达到了近乎线性的加速比;
2个节点的PHPC100的性能就高于1台A950r-F;一台曙光PHPC100(39进程)高于IBM P575(8路双核),而价格则大概为其1/5;
4.3GROMACS性能分析
(一)软件介绍
GROMACS是用于研究生物分子体系的分子动力学程序包。它可以用分子动力学、随机动力学或者路径积分方法模拟溶液或晶体中的任意分子,进行分子能量的最小化,分析构象等。GROMACS最初是设计为生物大分子如蛋白质、核酸、脂类等物质的计算、分析服务的。由于其在非成键作用力的互相作用方面具有极强的计算能力,很多研究机构也用其来计算、研究非生物的大分子系统,如聚合体等。
GROMACS是开源软件,最初由荷兰的Groningen大学的Department of Biophysical Chemistry开发。可以免费使用,有基于MPI的并行版本。
并行GROMACS软件的计算特点:
· 计算密集型的程序,浮点运算量很大;
· GROMACS程序对内存的要求很小;
· MPI通信频繁,对互联网络性能要求高;
· I/O量一般,在REMD模式下稍大
(二)测试平台
测试在3个平台上进行:
曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
SUN4600胖计算节点,8个AMD Opteron8214双核处理器,主频2.2GHz
IBM P575小型机,8个Power5双核处理器,主频1.9GHz
(三)测试结果
GROMACS使用源代码编译,版本为GROMACS-3.3.1;fftw为使用源代码编译,版本为fftw-3.0.1;测试中采用默认优化参数。使用gcc编译器,测试算例为gmxbench中的d.dppc,原子数目为121856,模式10ps;
数据为程序运行最后输出的real time,单位为s;
结果分析 #p#page_title#e#
曙光PSC平台发挥了出色的浮点计算性能;
· 1套曙光PSC的性能为1台SUN 4600(8路双核)的3倍;
· 1套曙光PSC的性能优于1台IBM P575;
案例分析
曙光服务器用户体验中心成为PHPC100计算机在生物领域的第一个用户。
曙光服务器体验中心是综合性的用户体验平台,许多生物计算的用户在体验中心做应用软件的性能测试。PHPC100部署到体验中心后,作为生物计算平台达到了很好的效果。系统部署简单,放置在值班区的办公环境使用,经过多项测试的验证,PHPC100计算机性能出色