高性能计算技术在地球物理中的应用
我来自中国石油集团咨询中心工程技术组。
我主要讲三点,第一点是介绍一下地球物理勘探与高性能计算的关系。
第二点说说地球物理高性能计算面临的问题。
地球物理勘探是地球上计算量和数据量最大的业务之一。一个图表示海上地球物理勘探的示意图。这个是陆地上的,是由于炸药导致的地震波,然后传到地下,有地面的接受器接收着。
这些采集的数据要经计算机进行处理,处理的计算量和数据量非常大,需要高性能计算机。我介绍一下东方地球地理公司,主要做地震勘探的。公司陆地地震勘探市场占全球陆地勘探市场的44%,居全球第一。综合实力位居全球物探行业前三位。公司研究院已经拥有的PC集群计算机计1.2万个CPU,2.2万核芯,另外还有7套大中型虚拟现实系统,320台各类工作站等先进设备,计算能力每秒200万亿次。1973-2008年,35年间计算能力提高了2亿倍。
在TOP500中的地球物理应用。这是2007年11月13日公布TOP500,按照应用领域分布排序,地球物理位于第二。我们在地球物理勘探的领域,在整个国际上的PC应用上还是占有一定的地位。
地震数据处理算法,有最小资源算法等等。我就不细说了。
有一个地球物理教授说,地球物理的历史和计算技术的历史不可分割的。
第一个问题我简单地介绍到这里。
第二个问题我简单说一下,地球物理高性能计算面临的一些问题。那么现在地球物理数据处理,都是用的cluster计算机提供的RAP是PAP的10%-15%。
下一代地震成像,RTM需要比较今天使用的计算机高出30倍的计算能力。地震解释工作历来主要应用工作站,近来有地球物理公司提出了高性能地学解释方案。据称高性能地学解释有几个好处:适应叠前解释和反演需要等等。
第三个挑战现在很多解释方法,包括像反演的方法。反演方法是将地震资料得到一些定量的参数,用来描述地下储层的岩性、物性和含油气性等的一项新技术。随机反映计算量巨大。
虚拟现实与解释自动化。在虚拟现实环境,从层位为基础的解释转向以体为基础。
最后我简单说一下国内外地球物理高性能计算应用研究动态。
第一是超级集群。
第二是高性能处理器的应用。
第三是并行文件系统。
超级集群的概念跟网格计算的概念紧密联系。超级集群是集群的集群。超级集群是基于网格计算的概念。超级集群要解决作业调度、集群间的问题。
还有多cluster环境PSDM并行化。这是以后的网格计算的发展框架。地震数据采集以后经过预处理,可能放在数据银行里面,经过几个cluster的地震成像,然后进行解释。这样可以对我们进行指导。
高性能处理器的应用,国内外地球物理界关注的几种新型的处理器,GPGPU通用图形处理器,GPU也叫显卡,原用于图形渲染,可用于提升数值计算能力。例如,频率域有限差分算法核心实现了比较CPU的8到16倍的加速。但也存在一些问题,编程较为困难,GPU初始化以及传送信息比较慢,还有当前的GPU存储器有限。
第二就是说Larrabee,“许多核”处理器架构,混合CPU和GPU。基于IA(Intel架构),当然有一些新的指令,比如说向量存储操作。这个还没有正式推出来。
第三是Cell处理器(IBM单元处理器),这对于地球物理程序员是一个全新的架构,每个单元由一个CPU和八个SPU协同处理器高速计算核组成。Cell处理器峰值性能十分吸引人。supercomputer-on-a-chip。国外正在探索逆时偏移利用Cell处理器。 #p#page_title#e#
第四种是FPGA RC(可重新配置),FPGA是现场可编程门阵列的简称,可比常规的CPU提高性能一个数量级。
德克萨斯A&M大学,利用FPGA建立了可重新配置的协处理器平台,称为SPACE(具有重配置引擎的地震处理加速器)。在单一FPGA中集成全流水线并行模块。
那么这四种处理器的应用前景,我觉得比较重要的要看到一个是持续速度能够达到多少。而且特别是跟以后的普遍使用的芯片比较怎么样。还有是不是容易编程,包括数据移动是不是比较方便。如果这个设备太特殊了,会不会有一些特殊的硬件风险问题。
最后我说一下并行文件系统,以后地球物理计算既是计算密集型,又是数据密集型。利用并行文件系统提升IO性能。一个是Lustre,还有一个PVFS2,GFS。利用高性能存储技术解决IO瓶颈问题。
预测计算机技术的未来是危险的,但是,无论将来科学计算的方向是网格计算,还是把图形渲染硬件应用于数值计算,地震成像将是这些技术的大用户。这是Stanford大学地球物理教授说的话。
但是现在面临一些挑战,地球物理计算机应用面临挑战,研发开发地震数据并行处理平台,充分利用高性能计算新技术,满足油气勘探需要。