高性能仿真计算集群(结构、流体、多物理场耦合)配置推荐2024v1
更新日期:2024年1月5日
更新原因:升级换代,调整如下:
(1)计算节点采用xeon第4代可扩展处理器,
(2)并行存储采用全闪存阵列,
整个集群从计算节点架构,网络低延迟,存储高性能并发IO,作业调度高频调用,无死角、无瓶颈
集群面临问题
经常听到客户反馈,某某分布式多机集群、某某云计算平台,在集群上做计算还不如普通电脑快,高性能计算集群做工程仿真计算效率很低,花了一大笔经费,经过一年多的方案论证、审批通过、采购、交货、使用,但集群性能表现很差
看似高性能集群的计算服务器、存储服务器、管理服务器、infiniband交换机等硬件设备放到机柜上,通过网络交换机全部连接好,系统、软件、开发工具也都安装调试正常了,HPC集群就OK了,真这么简单吗? 实际情况:
可能1 计算服务器硬件配置选型不合理,
可能2 并行存储服务器硬件配置有问题
可能3 作业调度方法存在问题
可能4 计算方式选择有问题,通过GPU计算更快,但确用CPU计算方式
可能5 网络io有问题,永远是满负荷
。。。
出现这些问题的原因,集群的配置方案往往是使用者想要一个“最先进、成熟的”集群计算架构,自己认为的一个方案,或者过度相信“丰富有经验的系统集成商”(大品牌,不用质疑),根据客户的预算,给出的高性能计算集群方案
使用者大部分是对软件熟悉,对工作计算任务熟悉,但因工作知识的局限性,可能对硬件配置,最新计算架构不是很精通,
集成商,大部分都是卖设备的,关心的是设备能否卖出去,对客户应用了解很少或不是很深入,因此这样两类人,在一起交流讨论仿真计算集群硬件配置方案,未来必然存在隐患。
那么一个合理、完美、高效的高性能计算集群方案的关键点都有什么?
首先 要根据客户的应用要求,跑什么软件,对这些软件特点进行分析
其次,根据掌握了应用情况,结合最新的硬件规格,分别给出计算服务器、GPU服务器、并行存储服务器、管理服务器、网络低延迟的交换机的对应方案,另外还要配备好一个高效的作业调度系统,这样这个集群方案更贴近仿真软件的计算要求,
关键点1 计算服务器用什么规格CPU、GPU、内存、硬盘,性能最大化?
关键点2 存储服务器,作为数据交换最密集的地方,最大的瓶颈,是什么?
不能忽略的情况:
如果不知道仿真数值模拟软件的不同求解器的特点,很可能计算服务器配置正常,软件运行正常,速度很慢,怎么回事?
如果不熟悉计算硬件架构,计算服务器的CPU频率高低无所谓,内存带宽无所谓,硬盘io无所谓,便宜就行,可能结果性能表现很差
如果不清楚很多软件已经支持GPU加速,求解过程得到10几倍的提升(用CPU就可以,或用最贵的GPU,也不快,什么情况?)
如果不清楚作业调度正确方式,按核调用,计算规模越大,分配更多核,速度就快?
因此,集群配置缺陷,将来必然面临并行计算效率低,性能表现差的问题,再加上作业调度软件问题或使用问题,集群运算效率自然好不到哪里。
(二)CX660高性能仿真计算集群
西安坤隆计算机公司,经过多年实际集群系统的应用软件运行和监测分析,我们可以给出从集群硬件配置和集群架构、作业调度全方位的满足不同仿真计算特点,通过采用最新CPU和GPU,以及合理硬件配置和高效作业调用,保证了集群的计算效率发挥到最大。
UltraLAB高性能仿真计算集群充分考虑应用软件的算法特点,保证整个集群每个环节,计算服务器或GPU超算服务器,并行存储服务器等集群配置架构,无死角、无卡顿、均衡,都能最大限度发挥各自的性能,
应用软件并行计算特点
应用种类
主要软件类
计算特点
计算设备
1
结构静力/动态仿真
Ansys
Abaqus
Ly-Dyna
有限元法,纯CPU计算
两个环节:
1 网格自动剖分—单核计算,高频才能加速
2 求解器求解—有限多核计算,调用合理的计算资源,加速
上述过程,反复迭代,直到收敛为止,
高频服务器
计算服务器
2
流体仿真
Fluent
有限体积法,CPU和GPU结合
计算服务器
GPU计算服务器
3
多物理场耦合
Comsol Multiphysics..
有限元法,纯CPU计算
高频+有限多核+大内存带宽
高频服务器
计算服务器
4
电磁仿真
HFSS、CST 、Feko..
频域类,有限元法,纯CPU计算
时域类,时域有限差分,GPU加速
高频服务器
计算服务器
GPU计算服务器
5
科学计算类
MatLAB
解释型高级语言工具,主模块单核计算为主,需要多核并行,要借助【并行计算工具箱】
计算服务器
6
CX660仿真集群系统介绍
CX660是采用intel xeon第四代可扩展处理器组成的集群,代表着目前最新的计算架构,求解更快、更高效。CX650集群系统是由【高频服务器】、【计算服务器】、【GPU超算服务器】、【管理与存储服务器】、【高性能低延迟交换机】、作业调度系统组成。
No
关键设备
配置规格
主要任务或功能
1
高频服务器
Xeon高频处理器/大容量内存/大容量高速固态盘/100G 高性能网卡
针对有限元仿真计算网格剖分单核cpu计算特点,面对多个计算服务器计算过程的并发网格剖分,通过配置超高频CPU,大大缩短同时多个网格剖分计算时间,从而加速整个求解计算
2
计算服务器
2颗xeon+16根内存+25G/56G 高性能网卡
针对基于CPU计算的仿真模拟计算的重要计算过程---求解器求解,配备最新2颗intel Xeon4代处理器,48核@高频+16通道内存带宽+低延迟网卡,打造理想高速计算架构,每个计算节点高频+多核并行计算+内存IO带宽最大化,在核数与频率、低延迟响应达到完美均衡。
3
GPU超算服务器
配备最新2颗intel Xeon4代处理器(32核@高频+16通道内存带宽)25G/56G 高性能网卡,
针对基于CPU和GPU异构超算,支持CPU仿真模拟计算,也支持GPU加速计算,
最新GPU(RTX A6000 48GB)单精度浮点算力40Tflops,可用于支持GPU求解计算,性能提升显著,例如Fluent求解,一块A6000卡算力(FP32 40Tflops)相当于44颗Xeon 银牌4316(累计880核)性能,
4
管理与存储服务器
双xeon(核数充足)/高速缓存盘(全闪存阵列)/并行存储/100G高性能网卡
承担高速并行计算的海量数据密集读写,提供最强大的并行读写存储架构
承担集群管理
5
PSS作业调度软件
基于linux环节
支持全面任务调度,支持多种计算架构,支持混合计算架构
一款成熟、高可靠、易管理的作业调度软件,保证多任务计算作业调度、监控
(三)CX660高性能仿真计算集群配置推荐
方案1 5个计算节点集群配置方案推荐
总核数:240核@2.8GHz ,
CPU算力 10TFlops
总内存容量 2.56TB
NO
货物名称
型号
数量
单价
小计
1
计算服务器
2颗Xeon金牌5418Y(48核2.8Ghz) /512GB DDR5 /1.92TB SSD/2U机架式/56G IB网口
5
62000
310000
2
管理与存储服务器
2*Xeon 银4316(40核@2.3GHz)/256GB DDR4/集成显卡/960GB SSD /23TB缓存盘(全闪存盘阵,读带宽20GB/s、写带宽11GB/s)/126TB并行存储/4U机架式/100G IB网口/27"4K图显
1
129900
129900
3
计算交换机
Infiniband 12口 56G/100G
1
38000
38000
4
管理交换机
16口千兆以太
1
1600
1600
5
服务器机柜
42U,含PDU机柜插座、托盘
1
6500
6500
6
KVM切换器
16口 VGA
1
1500
1500
7
管理软件
UltraLAB作业调度软件(5节点)
1
50000
50000
累计(人民币):
¥538,500元
总核数:480核@2.8GHz ,
CPU算力 21.5TFlops
总内存容量 5.12TB
NO
货物名称
型号
数量
单价
小计
1
高频服务器
Xeon W7-2475X超频处理器(20核4.8GHz)/512GB
DDR5 /7.68TB PCIeSSD/2U机架式/100G IB网口
1
77000
77000
2
计算服务器
2颗Xeon金牌5418Y(48核2.8Ghz) /512GB DDR5 /1.92TB SSD/2U机架式/56G IB网口
10
62000
620000
3
管理与存储服务器
2*Xeon 银4316(40核@2.3GHz)/256GB DDR4/集成显卡/960GB SSD /23TB缓存盘(全闪存盘阵,读带宽20GB/s、写带宽11GB/s)/126TB并行存储/4U机架式/100G IB网口/27"4K图显
1
129900
129900
4
计算交换机
Infiniband 36口 56G/100G
1
85000
85000
5
管理交换机
24口千兆以太
1
2100
2100
6
服务器机柜
42U,含PDU机柜插座、托盘
1
6500
6500
7
KVM切换器
16口 VGA
1
1500
1500
管理软件
UltraLAB作业调度软件(11节点)
1
110000
110000
累计(人民币):
¥1,032,500元
方案3 15个计算节点集群配置方案推荐
总核数:720核@2.8GHz ,
CPU算力 32.2TFlops
总内存容量 8.19TB
NO |
货物名称 |
型号 |
数量 |
单价 |
小计 |
1 |
高频服务器 |
Xeon W7-2475X超频处理器(20核4.8GHz)/512GB DDR5 /7.68TB PCIeSSD/2U机架式/100G IB网口 |
1 |
77000 |
77000 |
2 |
计算服务器 |
2颗Xeon金牌5418Y(48核2.8Ghz) /512GB DDR5 /1.92TB SSD/2U机架式/56G IB网口 |
15 |
62000 |
930000 |
3 |
管理与存储服务器 |
2*Xeon 银4316(40核@2.3GHz)/256GB DDR4/集成显卡/960GB SSD /23TB缓存盘(全闪存盘阵,读带宽20GB/s、写带宽11GB/s)/126TB并行存储/4U机架式/100G IB网口/27"4K图显 |
1 |
129900 |
129900 |
4 |
计算交换机 |
Infiniband 36口 56G/100G |
1 |
85000 |
85000 |
5 |
管理交换机 |
24口千兆以太 |
1 |
2100 |
2100 |
6 |
服务器机柜 |
42U,含PDU机柜插座、托盘 |
2 |
6500 |
13000 |
7 |
KVM切换器 |
16口 VGA |
2 |
1500 |
3000 |
|
管理软件 |
UltraLAB作业调度软件(16节点) |
1 |
160000 |
160000 |
|
|
|
|
|
|
累计(人民币): |
|
|
¥1,400,500元 |
上述所有配置,代表最新硬件架构,同时保证是最完美,最快,如有不符,可直接退货
欲咨询机器处理速度如何、技术咨询、索取详细技术方案,提供远程测试,请联系
UltraLAB图形工作站供货商:
西安坤隆计算机科技有限公司
国内知名高端定制图形工作站厂家
业务电话:400-705-6800
咨询微信号: