石油勘探与高性能计算深度应用
扩展阅读1:了解高性能计算与石油勘探的关系
高性能计算与石油勘探,都是蕴含着很强专业性的词汇,虽然大众对于石油勘探还有一些了解,但对于高性能计算与它的关系,就不是很清楚了。因为高性能计算的出现,似乎总是有尖端科研等字眼相伴,而谈到石油勘探,在人们的印象中更多浮现出来的,则是石油公司的野外勘探人员背着各种专用设备,通过一系列地质勘探的方法来侦测,甚至是预估所探测地区的地层中是否存在石油,而后在这个区域内打上几口试验性的油井,以验证其预估是否准确。在这个过程中,好像并不需要高性能计算的手段。
其实,人们认识中的这种石油勘探作业方式,早就已经过时。这种方式通常使用的是传统的地质学方法和地球化学方法来勘测,其结果是很不精确的。由于油田在地下并不是以所谓“油海”的形式存在,而是由一个个彼此隔离的“葡萄串”组成的,因此在不够精准的勘测结果面前,人们只能多钻井进行尝试,而且只有将油井钻到一个储有石油的“葡萄”顶部,才算是大功告成。然而,钻井的费用是非常高昂的,每打一口油井,其花费往往都会达到上千万甚至是上亿元,为提高石油勘探的能力和效率并降低其成本,石油企业很快就开始在勘探中采用了更为先进的地球物理方法,尤其是地震波法。
所谓地震波法,简而言之就是用炸药在地面激起人工地震波,这种地震波可传入地下深处,并在碰到不同形态的地质构成时形成不同的反射波,这些反射波经地面的检波器收集、转变成电子信号后可存储为数据,通过对这些数据进行计算处理,人们就能清晰地摸拟还原出勘测区域的地下地质构造,并找到那些存有石油或天然气的岩层的精确位置。由于地震波法勘探收集的数据通常都以TB计,甚至在近年来海洋油气勘探所采集的数据都已开始向PB的规模发展,这些海量数据的处理只有借助高性能计算机,才能在最短的时间内完成,以实现最佳的勘探效益。
扩展阅读2:石油勘探领域的核心高性能计算应用
目前与地震波法石油勘探相关的高性能计算应用软件,按计算性质可分为地震资料处理(seismic processing)和油藏模拟(reservoir simulation)两大类,另外业内人士还将计算可视化(computation visualization)作为单独的一类工作站应用加以归类。
目前石油企业在勘探业务中使用的高性能计算应用软件
为石油行业客户广泛应用的商用地震资料处理软件,现阶段主要有Paradigm的Geodepth和Focus、Western Geco的Omega、CGG的GeoCluster,这些应用均为支持大规模集群运算的并行版本。目前国内自主开发的这一类软件主要是采用PSTM叠前时间偏移和PSDM叠前深度偏移的算法,如中国石油东方地球物理公司(BGP)自主开发的GeoEast、中国石化南京石油物探研究所开发的iCluster等。
在油藏模拟类的应用软件方面,目前在全球范围内较为知名的有Landmark的VIP/Nexus和Schlumberger的Eclipse,国内自主开发的相关产品主要有大庆研究院的PRBS并行黑油模拟。
利用高性能计算摸拟油藏分布图
从应用的特点上来看,地震资料处理是典型的浮点计算密集型应用,以求解数据密集的波动方程为主要计算模式,因此对浮点计算能力要求较高,对内存带宽的占用中等,对大量炮集的处理需要良好的多核扩展性。不同于在算法上以频谱计算为核心的地震资料处理软件,油藏模拟对计算平台的要求是需要支持稀疏矩阵方程的迭代求解,对内存带宽的要求非常高,并需要大缓存支持,因此这类软件可归为对内存带宽高度敏感的计算密集应用。
扩展阅读3:英特尔的百亿亿级高性能计算愿景
2011年6月20日,在当时举办的国际超级计算大会(ISC)上,时任英特尔公司副总裁兼数据中心事业部总经理的施浩德(Kirk Skaugen)向与会者分享了英特尔计划在2011-2020这个十年期的末期实现每秒百亿亿次浮点计算性能(ExaFLOP/S)的宏伟愿景。
施浩德在详解该愿景时指出,高性能计算( #p#page_title#e#HPC)市场增长潜力巨大。在二十世纪80年代,高性能计算机的性能为GigaFLOP/s(每秒十亿次浮点运算),而今天最快的高性能计算机的性能已经是它的数百万倍了。反过来,这也增加了市场对用于高性能计算领域的处理器的要求。据英特尔预测:到2013年,全球性能最强的前100套高性能计算机将使用总计100万颗处理器。到2015年,这个数字有望再翻一番;到2011-2020这个十年期的末期,预计这一数字将达到800万颗。英特尔还预测:2015年时,全球高性能计算机500强(TOP500)排行榜上排名第一的系统在性能上将有望达到每秒十亿亿次浮点计算,2018年时,它将越过每秒百亿亿次浮点计算的标杆,而到2011-2020这个十年期的末期时,地球上最快的计算机的性能则有望超过每秒4百亿亿次浮点计算。
施浩德表示,要实现这一愿景,不仅需要行业与政府的通力协作,还需要采用英特尔® 集成众核(Intel® Many Integrated Core,Intel® MIC)架构所开创的新方法。管理互联网共享数据的爆炸性增长、寻求应对气候变化的解决方案、管理不断增加的自然资源(如石油和天然气)开采成本以及应对各种各样的其他挑战,都需要更多的计算资源,而这些资源只能依靠越来越多的高性能超级计算机来提供。
扩展阅读4:认识英特尔的平衡计算理念及相关创新
英特尔公司认为,要推动高性能计算的快速可持续发展,除要提供专为高度并行化应用优化的集成众核架构产品外,还需要平衡计算理念及相应产品技术创新的支持。而所谓平衡计算理念,就是指整个数据中心的IT设备(包含服务器、存储设备、网络设备)就相当于一个智能的大脑,担负计算任务的服务器就如同其专门判断和处理信息的神经元;存储设备则是可以收纳海量信息,并随时准备接受访问和更新的记忆细胞,而网络就是连通所有这些神经元和记忆细胞的神经连接,惟有三者在性能和功能上尽量实现平衡,才能实现最无缝的配合,以及1+1+1>3的应用效果。
目前英特尔平衡计算理念的最佳实践载体,就是于今年三月上市的英特尔至强处理器E5产品家族。针对财务分析、媒体内容制作和高性能计算等计算密集型应用,该产品家族不但通过创新的微架构设计,例如对英特尔® 高级矢量扩展指令集 (Intel® AVX)实现了比上一代至强处理器5600产品家族提升高达两倍的性能,而且由于在业内率先在处理器中集成支持PCI Express* 3.0标准的I/O控制器,以及在处理器中内置了英特尔® 集成I/O(英特尔® IIO)和英特尔®数据直接I/O(英特尔® DDIO)技术,以及在平台层面以英特尔® 万兆位以太网控制器X540来提供低成本、低功耗的板载局域网(LOM)功能,至强处理器E5平台还为开放架构存储设备和网络设备的性能的提升及功能的丰富化奠定了坚实基础,为产业界推出下一代存储和通信系统,与先进的服务器搭配以迈向平衡计算带来了更强的助力。
扩展阅读5:高性能计算与云计算
业界对于高性能计算未来是否会与云计算融合,或者高性能计算应用负载是否会迁移到云计算平台的探讨早已开始。但很多的高性能计算用户对于打造高性能云的设想却一直存有疑虑,其原因就在于云计算平台虽然扩展更为方便,管理更为简单,资源分配更为灵活,但用于实现这些优势的基石——虚拟化技术,却不免会带来额外的性能开销,并可能形成新的性能瓶颈,这对于渴求更高性能,并将这些性能全部用于加速自身高性能应用负载执行效率的用户来说,是难以接受的。
然而,有助于推进平衡计算理念和实践的英特尔至强E5平台却在这个阻隔高性能计算与云计算的障碍上打开了一个缺口,带来了一个契机——得益于更强的计算性能、更强的系统内部及对外I/O能力,对于万兆位以太网的支持以及在硬件辅助虚拟化技术上的革新和升级,基于至强处理器E5产品家族的服务器系统已能够显著降低虚拟化技术产生的性能开销,例如整个数据中心或某个集群系统实现网络的虚拟化后,对其网络带宽和延迟带来的不利影响。 #p#page_title#e#
来自美国国家航空航天局(NASA)的“试验”就见证了这一趋势的可行性。它针对传统高性能计算集群系统实现扩展时面临的复杂性和成本过高,以及在作业安排上不够灵活的问题,专门推进了名为Nebula的,基于云的基础设施即服务(IaaS)环境,来寻求源于云计算技术的解决方案。这个环境的核心技术基石,就是英特尔架构服务器、万兆位以太网技术以及OpenStack开源软件项目。
英特尔积极参与了这个项目,与NASA的性能工程师密切配合,致力于充分发挥英特尔架构平台上的虚拟化技术的性能潜力,以验证架构在云上、基于虚拟化环境的高性能计算系统与传统“裸机”形态(即非虚拟化)的高性能计算系统相比,是否会产生性能开销或其他干扰性能的因素。而测试的结果则表明,在英特尔架构平台所提供的单根I/O虚拟化技术和所支持的万兆位以太网技术的助力下,Nebula环境在MPI性能基准测试中给出的网络传输吞吐率和延迟测试成绩,已经超过了“裸机”方案。这初步证明高性能计算应用走向开放架构的云计算平台或环境是可行的,虽然还有一些技术问题有待解决,但采纳应用平衡的计算平台,无疑将是此后相关验证或尝试工作继续前行的重要支柱。
扩展阅读6:英特尔集成众核架构及英特尔至强融核产品线预览
2012年6月18日,英特尔公司正式宣布未来所有基于英特尔® 集成众核架构(英特尔® MIC 架构)的产品将采用全新品牌——英特尔® 至强 融核™。第一代英特尔至强融核产品家族(代号为“ Knights Corner”的协处理器)将于 2012 年年底推出,届时它将成为英特尔至强处理器 E5-2600/4600 产品家族的重要补充,并为高度并行的工作负载带来全新性能。其第一代产品将主要用于高性能计算( HPC)市场,而未来的英特尔至强融核产品还将满足企业数据中心和工作站的需求。
英特尔至强融核协处理器的主要优势在于具备出色的易用性,能够充分利用在英特尔架构上使用的常见编程模式、技术和开发者工具。由于它能够更充分地利用并行 CPU 代码,软件公司和 IT 部门将无需重新为其开发人员提供与加速器有关的专用编程模型的培训。
除了兼容 x86 编程模式外,英特尔至强融核协处理器还能够适用于专为高性能计算优化且高度并行的独立计算节点。它可以独立于主机操作系统来运行自己的基于Linux的操作系统。这一特性将可以为实施无法采用其它 GPU 技术的集群解决方案带来更大的灵活性。
英特尔至强融核协处理器将采用创新的22 纳米 3-D 三栅极晶体管制程技术,可在 PCI-e插卡形态下集成超过 50 颗内核和支持最低 8GB容量的GDDR5 内存。此外,它还具备支持512b SIMD 指令的特点,可在单个指令控制下同时处理多个数据元素,从而能显著提升性能。在去年使用 DGEMM 进行的协处理器现场演示中,英特尔进行了使用单颗“ Knights Corner”协处理器提供超过 1 TeraFLOPs(每秒 1 万亿次浮点计算)双精度实际性能的展示。而在 2012 年国际超级计算大会上,英特尔使用行业基准测试工具Linpack (Rmax) 1展示了同样超过 1 TeraFLOPs 的卓越性能。相比之下,在 1997 年,ASCII RED* 高性能计算机采用超过 9,000 颗英特尔® 奔腾® 处理器才突破 了1 TeraFLOPs 性能大关。
虽然英特尔至强融核协处理器计划于 2012 年下半年推出,但英特尔宣布首个基于英特尔至强融核协处理器的集群已经投入使用,并在2012年6月发布的最新的第39届全球高性能计算机500 强排行榜上位列第150位,具备了每秒118万亿次浮点计算的卓越性能。 #p#page_title#e#
英特尔至强融核协处理器已获得了广泛的行业支持,包括 Bull*、Cray*、戴尔*、惠普*、IBM*、浪潮*和 NEC* 在内的 44 家制造商已承诺将推出采用该款协处理器的系统。
扩展阅读7:英特尔软件工具助力真实应用负载性能调优
不论是旨在推进平衡计算的至强处理器E5,还是专为高度并行化应用负载开发的至强融核新品,其性能的充分发掘和释放都离不开英特尔一系列软件开发与优化工具的支持,这些工具,也是英特尔在高性能计算市场上强大竞争力的重要组成部分。
这些工具包括了VTune™性能分析器、英特尔®编译器(Intel® Compilers)、Intel® Thread Checker、Intel® Performance Libraries、Intel® Threading Tools、Intel® Cluster Tools等,它们可以帮助高性能计算应用软件开发商或最终用户分析自己的高性能计算系统及应用软件特性,并最大限度优化其高性能计算机软硬件系统,发掘其最大性能潜力。世界领先的石油服务公司斯伦贝谢(Schlumberger)技术服务副总裁Jim Brady指出,“通过与英特尔的紧密合作和其行业领先的软件使用工具,我们很好地优化了我们的软件的扩展能力的性能。因此,我们的石油和天然气客户可以更好地理解液体流动和地质因素,更迅速,更确性,高效地推动能源勘探的发展。”
以这些工具为基础,英特尔公司还推出了“真实应用负载计划”,来帮助用户针对其真实的应用负载,而非通用的基准测试软件来进行调优,从而帮助他们从自己的系统上获取最大化的收益。截止目前,英特尔中国高性能计算团队已经和一些国内用户合作优化和测试了一系列真实应用负责,包括复旦大学(VASP应用),中国海洋大学(WRF-ROMS应用),中科院生物物理所(EMAN,I3和NAMD应用),上海交通大学(KLAPS和CFD程序)等。目前该团队还提供了由16个节点至强E5服务器构成的,用于真实应用负载测试的基准集群环境。
扩展阅读8:英特尔架构系统在最新全球高性能计算机500强排行榜上的出色表现
在今年6月发布的第39届全球高性能计算机500强排行榜上,有74%的上榜系统采用英特尔架构,同时新晋该榜单的系统中有78%是基于英特尔架构。其中有多达45套系统是基于最近推出的英特尔® 至强® 处理器 E5 产品家族,这45套系统中又包括了3套拥有每秒千万亿浮点计算能力的系统。位于莱布尼茨超级计算中心(LRZ)的“SuperMUC”是其中最大的高性能计算机,具备每秒2900万亿次浮点计算能力(2.9 Petaflops),是欧洲计算能力最强的高性能计算机,也是基于x86架构的计算能力最强劲的高性能计算机。
从该榜单前10位的排名来看,共有4套基于英特尔架构平台的系统入围,其中2套采用了至强处理器E5产品家族。从应用领域来看,榜上所有的14套与石油勘探或地球物理应用相关的系统,都是基于英特尔平台构建。