峰值14万亿次 生命科学浮点运算需求高涨
日前,采用刀片架构的浪潮天梭10000在北京生命科学研究所上线运行,这套高性能计算系统峰值计算能力超过14万亿次,成为我国生命科研领域浮点计算能力的新高峰,相比原有系统,作业运行时间减少了50%以上,有效提高了该所的科研效率。
性能与需求的“超车”比赛
生命科学作为一门在农业、医药、环保等领域有着广泛应用的实验科学,对高性能计算有着高度依赖。无论是蛋白质模拟还是海量基因数据的收集、筛选与排序,都离不开具有强大运算能力的高性能计算平台。而在我国生命科学飞速发展的背景下,高性能计算在生命科研领域的应用也正在迈上新的水平。
组建于2003年的北京生命科学研究所,是我国政府在新世纪推动生命科学技术快速发展的重要战略布局之一。与国内传统科研院所不同,北京生科所采用与国际接轨的管理和运行机制,以全球一流的科研人员为班底,进行原创性的生命科学的基础研究和人才培养。目前,该所已经成立了包括10位诺贝尔奖获得者在内的24位国内外知名专家组成的科学指导委员会,在《细胞》、《科学》、《自然》等国际一流学术刊物上发表高水平论文数十篇。其雄厚的科研实力在国际生命科学界占有一席之地。
与其在体制探索和业务创新上的“大跨步”一脉相承,北京生科所在构建硬件计算平台方面也走在了业界的前列。2008年初,北京生科所引入了被称为“中国45nm四核第一单”的浪潮天梭TS10000高性能计算集群。这套包含102个计算节点的高性能计算系统采用了当时最先进的Intel 45nm四核处理器,浮点运算能力达到6.5万亿次,将蛋白质模拟等作业的运行效率提升了几十倍,以前需要几天时间的任务,该系统几小时就能完成。
对于一年前引进的这套计算系统,科研所的相关负责人给予了高度评价,平台运行一年来一直运行稳定,从未出现任何技术故障,同时浪潮还提供了免费的技术咨询和机房迁移服务,这些对于该所科研效率的提升起到很大的作用。但由于业务量的不断加大,平台的运算能力逐渐接近了瓶颈。据该负责人介绍,系统建成以来,这套天梭高性能系统一直处于饱和状态,经常同时运行100-200个作业,300-400个作业在排队,科研所决定在该系统的基础上进行扩容。
优中选优 用性能说话
在系统招标初期,该所要求各投标厂商先期提供设备进行测试,目前实验室的主要应用有用于分子对接的DOCK软件,以及蛋白质分子模拟软件CHARMM等。其中CHARMM是一个被广泛承认并应用的分子动力学模拟程序,主要用于生物大分子的模拟,包括能量最小化,分子动力学和蒙特卡罗模拟等,测试方案是用生命所最常用的软件Charmm对各家机器进行Benchmark测试,并根据实际运行时间和IO能力进行综合打分,以作为评标参考。
北京生命科学研究所作为浪潮的老客户,浪潮对其应用非常熟悉,技术团队从方案和部件本身都做了精心的准备。大规模的集群系统,功耗和密度是每一位用户面临的巨大问题,方案首先选择了高密度、低功耗的NX7100DB刀片服务器作为节点,在7U空间内集成10个刀片,支持冗余千兆以太网和infiniband交换技术,性能强劲;同时,浪潮技术团队从硬盘I/O、硬件系统、软件环境等多个层次进行了数十次测试优化工作,其中针对硬盘的优化和测试,就高达20次,对操作系统的验证,达到近20个不同版本,最终采用了Redhat Linux AS5.0操作系统,并对其参数进行了大量优化工作,方案搭建完成后,浪潮方案开发实验室采用支持OpenMP的Intel编译器,高性能数学库,VTune等性能调优工具围绕CHARMM等客户应用软件做了进一步的优化工作,将系统性能值进一步提高了30%以上。
结果在由生科所主持的CHARMM以及系统I/O性能测试中,浪潮在4家厂商送测的5款产品中以绝对优势胜出,在同处理器配置下两项成绩高出平均水平20%以上,实测系统I/O速度高达87.5MB/S,浪潮天梭高性能 #p#page_title#e#解决方案一举胜出。
高密度 高性能 生命探索新引擎
基于NX7100DB刀片服务器的浪潮天梭TS10000高性能计算系统具有高密度、易维护、易扩展等特点。该集群在有限的空间内部署了100个计算节点,能够提供多达800颗计算核心,峰值计算能力达到7.5万亿次,计入已有的102节点,峰值能力达到14万亿次,成为生命科学领域的第一个浮点高峰。100个刀片节点,仅占用10个机箱空间,实际部署不到3个机架。随机配送的浪潮天梭监控管理软件针对服务器节点的运行状态,实现实时监控和管理,发现故障时在控制台端向管理员报警,为系统管理员提供了一个统一、集中、可视化、跨平台的远程管理环境。
生命科学研究所的相关负责人表示,他们的研究方向涉及生命科学、计算化学等多个领域,对高性能设备具有很强的依赖性,科研进度受平台性能影响很大,浪潮天梭的上线使得计算效率提升了一倍有余,这对他们抢占生命科学前沿领域具有重要意义。