为什么UltraLAB深度学习工作站最快、性价比最高
目录
1 市场深度学习硬件配置严重缺陷
2 最合理深度学习硬件架构分析
3 UltraLAB 深度学习超级计算机完美配置推荐
(一)市场上提供的深度学习硬件配置有严重缺陷
深度学习太火了,卖深度学习的计算机、服务器、工作站,五花八门,到处都是卖家,到处都是专家,似乎,只要机器里能插GPU,插的越多性能越强,实际情况是:
反馈1: 为什么4块GPU机器,比人家2块GPU机器还慢
反馈2: 为什么同样8块GPU比人家8块GPU卡,还慢
反馈3: 为什么2块GPU卡,一个快一个慢
反馈4: 为什么这么多GPU卡,计算过程还是很慢
反馈5: 我的机器噪音巨大,无法放到办公环境,怎么在静音环境下运行
…
误区1:只要有足够多GPU卡,性能更强大
误区2:同样数量GPU卡,谁便宜、谁性价比更高,就最好选择
误区3:CPU核数,频率不重要,把钱砸到GPU上就行
误区4:硬盘和内存不重要,最重要的是GPU卡越多越好
…
困惑1: 上述反馈是什么原因造成的?
困惑2:市场谁家能给出更好的配置架构
问题来了,深度学习需要什么样的硬件配置才是最合理,最高效的
(二)深度学习硬件架构分析
首先一定从深度学习计算过程分析开始
上述图示,深度神经网络计算大致流程,下面通过深度神经网络计算环节,分析核心硬件配置理想要求
环节 |
主要操作 |
涉及硬件 |
瓶颈 |
配置推荐 |
1 |
数据调入 |
硬盘->内存 |
硬盘io是最大瓶颈 |
GPU和硬盘数量1:1 硬盘io越高越好 |
2 |
数据预处理 |
CPU(单核计算模式) |
计算量巨大 |
CPU频率越高,处理越快 |
3 |
内存->显存->计算 |
GPU |
计算量巨大 |
增加GPU,CPU核数大于GPU数量,内存比显存大 |
4 |
数据结果->内存 |
内存 |
||
5 |
数据保存 |
硬盘 |
硬盘io |
用SSD或多硬盘 |
常见计算机硬件配置上的低级错误:
1.为了省钱,硬盘用普通PC硬盘,寿命短,带宽低,或数量不够,
2. 为了节省,CPU用的最多的是Xeon E5 2620v(8核2.1GHz),频率太低,数据预处理太慢,成为整个计算的最大瓶颈,
3.为了把钱用到“刀刃上”—尽可能多配GPU卡,但是总显存比内存容量大,不合理,或者CPU核数低于GPU卡数,这些都会造成计算过程资源耗尽,数据来回从虚拟内存导入,计算变慢 #p#page_title#e#
(三)深度学习计算机、工作站最理想的硬件配置推荐
针对上述深度学习计算过程、低级配置错误分析,深度学习最合理硬件配置架构,保证整个机器是一台理想化异构超算系统,完美强大高效还静音
UltraLAB GXi/M图灵计算工作站是西安坤隆计算机公司2017年上半年推出的、目前市场上一款集多GPU超算、超高频率处理器、海量存储于一体、基于办公静音环境、应用于深度学习(机器学习、人工智能)的AI超级计算机系统。
和市面上深度学习计算机系统相比,显著优势:
- 拥有超高CPU频率,大幅加速深度学习预处理过程
- 支持最大4块(GX360i)/7块(GX480M)/9块(GX610M)GPU卡,单精度浮点100Tflops
- 拥有最大16个硬盘位,容量160TB,
- 完全处于办公环境(静音级)、不在被噪音所困扰
- 不需要专门的机房,不占过多空间,维护成本极低
- 完美的硬件配置和专业优化加速技术,保证整个机器系统高速高效运转
3.1 图灵计算工作站技术规格
机型 |
硬件配置规格 |
|||
CPU |
GPU |
最大内存 |
存储 |
|
GX360i |
单CPU架构 4核4.8GHz~5GHz |
最大4块 |
64GB |
并行存储 最大40TB |
GX480M |
单CPU架构 6核4.5GHz 8核4.3GHz |
最大7块GPU |
256GB |
并行存储, 最大180TB |
GX610M |
双Xeon架构 2*Xeon E5 2689v4 (共计8核3.5GHz) |
最大9块 |
1TB |
并行存储, 最大180TB |
3.2深度学习工作站硬件配置参考
(1) GX360i机型配置参考(超值型)
该机型特点:支持4块GPU卡,CPU频率高达5GHz,整体配置均衡无死角,满足深度学习训练硬件配置要求
NO |
CPU |
内存 |
GPU/总显存 |
单精度 |
系统盘 |
并行存储 |
平台 |
售价 |
1 |
7600K OC (4核4.8GHz) |
16GB |
2块GTX1080 8GB |
16Tflops |
256GB SSD |
1TB |
塔式 |
36500 |
2 |
7700K OC (4核4.9GHz) |
32GB |
4块GTX1080 32GB |
33Tflops |
512GB SSD |
4*1TB |
塔式 |
58500 |
3 |
7700K OC (4核5.0GHz) |
64GB |
4块GTX1080Ti 44GB |
45Tflops |
512GB SSD |
4*4TB |
双塔单电 |
69000 |
备注:含23”高清图显
(2) GX480M、GX610M机型配置参考(高性能型)
该机型特点:支持最大到7块(GX480M)或9块(GX610M)GPU卡,CPU的频率和核数达到最大均衡,每个环节保证达到最高性能,整体配置均衡无死角,满足深度学习训练对配置的要求
NO |
CPU |
内存 |
GPU/总显存 |
单精度浮点 |
系统盘 |
并行存储 |
平台 |
售价 |
1 |
6850K OC (6核4.5GHz) |
64GB |
5块GTX1080Ti 55GB |
56Tflops |
1TB SSD |
5*1TB |
双塔双电 |
94500 |
2 |
6900K (8核4.3GHz) |
96GB |
6块GTX1080Ti 66GB |
68Tflops |
1TB SSD |
6*1TB |
双塔双电 |
115000 |
3 |
6900K (8核4.3GHz) |
128GB |
7块GTX1080Ti 77GB |
79Tflops |
1TB SSD |
7*1TB |
双塔双电 |
128000 |
4 |
2*Xeon E5v4 (20核3.1GHz,睿频3.8GHz) |
128GB |
8块GTX1080Ti 88GB |
90Tflops |
1TB SSD |
8*1TB |
双塔双电 |
159000 |
5 |
2*Xeon E5v4 (20核3.1GHz,睿频3.8GHz) |
128GB |
9块GTX1080Ti 99GB |
101Tflops |
1TB SSD |
9*1TB |
双塔双电 |
169000 |
备注:含23”高清图显
总结
UltraLAB GXi/M是一款静音级、真正高性能GPU超算的深度学习训练计算机,比市面上的机器,更安静,性能更强大,适合科研、研究部门在安静的办公环境下运行。
此外,该机型用途极广,扩展能力强, 调整配置后,可为电磁仿真计算(CST)、量子化学/分子动力学计算(VASP、AMBER等)、超大屏拼接(8X9=72路视频拼接合成)、视频剪辑合成、指纹识别等应用,提供强悍的计算、图形生成能力
方案咨询
西安坤隆计算机科技有限公司
国内知名高端定制图形工作站厂家
业务电话:400-705-6800
微信