企业计算新动力 双核服务器横评
2005年四月份,AMD发布用于X86服务器的双核Opteron处理器的时候,Intel还在试图让Netburst微架构的单核心Xeon冲向4GHz,试图继续用主频来提升处理器的性能以拉大同竞争对手的差距。
两家公司在十字路口选择了不同的方向,结果大家都已经很清楚了,在此后的近半年的时间里面,无论是在双路服务器平台还是在多路服务器平台上,Intel始终无法提供可同双核Opteron处理器相抗衡的X86服务器产品——采用双核Pentium D处理器的“双核”服务器顶多是在单路服务器上表明一种姿态:我也有。此刻,两家公司在X86服务器上剑拔弩张的态势达到了前所未有的程度,“真假双核”的口水仗每天不绝于耳。显然,一个希望借助于千载难逢的机遇从此翻盘,另外一个则急需调整“航母”的航向,重新领先。
代号Smithfield的单路双核Pentium D处理器 |
然而双核或者多核技术并非去年才出现的新技术,早在2001年蓝色巨人IBM就发布了双核Power 4处理器,并且将其成功的产品化,先后应用于从p690、p670、p630、615p等p系列服务器中。即便是四核处理器也并不新鲜,去年Sun公司就推出了4核心32线程UltraSPARC T1处理器,IBM的Power 5/Power +也可以采用QCM或者MCM封装实现多核。只是这些产品大都应用在Unix服务器中,定位一般相对较高。此类服务器的销量远远低于X86服务器,其受关注度或者被普通用户了解的程度自然也低了很多。
服务器应用同普通的PC应用有着很大的不同,它面临的是大量的并行的任务。Sun在2003年开始倡导的高吞吐量计算 (Throughput Computing) 理念则是另外一个方向。Sun认为过去的几十年中,处理器速度的提升依然神奇的遵循着摩尔定律,但是内存速度却是每6年提升2倍。网络的普及也使得更多的计算任务是通过网络进行的,它的速度同样也远远低于处理器的速度。网络应用的效能更多的依赖计算单元整体吞吐量的执行,而非单个线程。
代号Paxville DP 的双核Xeon DP处理器
依靠频率竞争取得竞争优势的Intel在服务器领域也不愿意轻易放弃他的拿手好戏,凭借着Netburst微架构易于提升频率的特性,不断的提升着Xeon系列处理器的主频。直到Intel发现竞争对手突然调转方向——而且的确是一个正确的方向之后,才开始踏上双核之路。2005年10月10日英特尔正式发布了其第一款双核心Xeon处理器Dual-Core Xeon 2.8GHz,虽然只有一款,而且似乎是紧急从用于Xeon M(Paxville)处理器“借调”过来的,但是毕竟帮助英特尔从“无双”的尴尬境地走了出来。
代号Sossaman的双核Xeon LV处理器
今年的3月份,英特尔发布了代号为“Sossaman”的低电压版双核Xeon LV服务器处理器,包括2.0GHz和1.66Ghz两款。这是自从Netburst微架构应用到Xeon处理器以来,第一款非Netburst微架构的产品,它的TDP只有31瓦,是英特尔将类Core微架构在Xeon系列处理器上的初步尝试。
代号Dempsey的双核Xeon 5000处理器
5月23日英特尔公司在发布“Bensley”平台的同时,一口气发布了Xeon 5080、Xeon 5070、Xeon 5060、Xeon 5063、Xeon 5050、Xeon 5040、Xeon 5030和Xeon 5020等8款处理器,这些代号为Dempsey的双核Xeon DP处理器均配置了4MB L2缓存,其中每个核心独享2MB L2缓存。这也是Netburst微架构最后一次应用在Xeon DP处理器。
代号Woodcrest的双核Xeon 5100处理器 |
6月26日,距离发布Dempsey仅仅一个月的时间,英特尔又发布了代号为Woodcrest的Xeon 5100系列双核处理器,这款处理器采用了Core微架构,不但具有出色的性能,还具有极低的功耗,彻底的扭转了双核双路处理器市场的竞争形式。
代号Santa Rosa的双核Opteron 2000处理器 |
8月28日,AMD发布了Opteron 1000/2000/8000系列处理器,其中的Opteron 2000/8000系列处理器开始采用全新的Socket F接口,该系列处理增加了对于虚拟化的硬件级的支持,并且终于将所整合的内存控制器升级到DDR2内存控制器。根据IT168评测中心的测试,Opteron 2000系列处理器和Opteron 200系列处理器性能上并无提升,似乎此次产品升级,主要是为了更换处理器接口,为下一步推出四核处理器做好准备。
代号Clovertown的Xeon 5300处理器 |
11月14日,英特尔在继发布桌面四核处理器之后发布了代号为Clovertown的Xeon 5300系列处理器。根据英特尔公布的测试数据来看,Xeon 5355处理器相对于Xeon 5160处理器性能提升在60%左右,而我们对于同频率的Xeon 5320和Xeon 5120处理器的测试来看,很多应用中四核处理器的性能等于甚至大于同频的双路双核处理器的性能。
英特尔在短短的8个月中,针对单一产品线(双路服务器)发布了近16款处理器产品,可以说是前所未见的。也正是通过这种密集的、快速的产品发布方式,使得英特尔一下从没有双核产品的不利境地,重新的回到了业界领导者的位置上。
#p#page_title#e#
Intel Xeon 5100 VS. AMD Opteron2000
今年,用于双路服务器的处理器很有意思。Intel把在桌面处理器使用了一年多的LGA775封装移植到了Xeon处理器上(LGA771),并且开始将全新的Core微架构装了进去。AMD则采用了全新的以前从未用过的SOCKET F(LGA1207)封装,其核心却没有太多的变化。一个是老瓶新酒,另一个则是新瓶陈酿。
虽然市场定位相同,但是Opteron 2000系列和Xeon 5100系列在设计理念上有很大的不同,进行完全的对比并不容易。AMD Opteron处理器弃用了前端总线结构,利用直接连接架构(Direct Connect Architecture)高速连接处理器、内存控制器和I/O。直接连接架构的重要组成部分HyperTransport总线的应用更是使得Opteron处理器及其整个平台具有了良好的扩展性和灵活性。Opteron 2000/8000系列处理器最高支持3条cHT(coherent HyperTransport)链路,这中链路不仅可以作为双路服务器两颗处理器之间的通讯通道,还可以利用HTX扩展卡同集群内的其它服务器进行高速通讯。总得来看,Opteron系列处理器设计之初的着眼点就相当的高。
Xeon 5100系列处理器虽然换用了全新的Core微架构,但是依然沿用了前端总线结构,为了解决上一代Xeon平台前端总线存在严重瓶颈的问题,Intel此次为其运行平台Intel 5000系列芯片组设计了双独立总线结构(DIB),并且大幅度提升了前端总线运行频率——从FSB800MHz到FSB1333MHz。Intel 5000系列芯片组主要利用高带宽、点对点的PCI-Express总线技术来进行扩展,包括其南北桥之间的总线也是基于PCI-Express技术的,Intel体系中重要的I/O扩展芯片PXH也能通过这种总线进行扩展。
AMD Opteron处理器整合了内存控制器,这种设计的最大优点是可以有效的降低了内存子系统的延迟,但是也使得AMD平台在内存技术上无法太灵活。借着新一代Opteron处理器的发布,AMD才终于开始支持业界已经普通使用的DDR2内存。新的Opteron处理器整合了DDR2内存控制器,Opteron 1000最高可支持DDR2-800内存,理论上可以提供12.8GB/s的内存带宽,而Opteron 2000/8000处理器最高可支持DDR2-667内存,理论上可提供10.7GB/s的内存带宽。这相对于上一代Opteron是一个非常大的改进。
Xeon 5100系列处理器的内存控制器依然在北桥芯片中,最大的改进是开始支持FB-DIMM内存。Intel在现有的DDR2内存芯片的技术上,引入了串行技术,可以实现更多的内存通道。比如Intel 5000P芯片组最多可支持4通道配置,配合FB-DIMM 667MHz内存,可提供21.3GB/s的理论内存带宽,这使得Intel新Xeon平台更趋向于平衡。但目前看来FB-DIMM远非完美,单单是其居高不下的功耗就非常让服务器厂商头痛。
虚拟化也是今年X86服务器中的一个热点,这种技术可以帮助解决“一个台服务器,一个应用”所造成的资源(计算能力、存储能力、电力等)的浪费。Intel Virtualization Technology和AMD Virtualization均借助于硬件电路帮助提升虚拟化应用的效率。AMD强调的是其直接连接架构能够为虚拟化应用提供一个平衡的环境,从而提升AMD Virtualization技术执行的效率。Intel则是强调众多虚拟解决方案厂商的支持,目前VMware、Xen、Microsoft都已经提供了对于VT的支持。
系统对比 | AMD Opteron 2000系列 | Intel Xeon 5100系列 |
模块化/可扩展 | 支持 | 需要北桥 |
SMP | 双路四核 | 双路四核 |
直接连接架构 | 支持 | 不支持 |
双核技术 | 支持 | 支持 |
32bit计算 | 支持 | 支持 |
64bit计算 | AMD64 | EM64T |
HyperTransport技术 | 支持 | 不支持 |
内存控制器 | 整合于处理器 | 整合于北桥 |
硬件辅助虚拟化 | AMD-V | VT |
前端总线频率 | 1800-3000MHz* | 1066MHz/1333MHz |
前端总线带宽 | 14.4-24GB/s | 17-21.3GB/s |
最大处理器间带宽 | 8.0GB/s | 8.5-10.66GB/s |
内存类型 | DDR2 400/533/667 | FB-DIMM DDR2 533/667 |
最大双路内存带宽 | 21.2GB/s | 21.3GB/s |
最大L1 Cache | 64KB Icache/core 64KB Dcache/core |
32KB Icache/core 32KB Dcache/core |
最大L2 Cache | 1MB/core | 4MB(share) |
双路最大I/O带宽 | 32GB/s | 14GB/s |
SIMD指令集 | SSE/SSE2/SSE3 | SSE/SSE2/SSE3/SSE4 |
#p#page_title#e#
本次年度横评参测的14台服务器中,有9台服务器配置了Xeon 5100系列处理器,有2台服务器配置Xeon 5000系列处理器,有2台服务器配置了Opteron 2000系列处理器,只有1台服务器配置了Opteron 200系列处理器。
其中ASUS RS162-E4/RX、DAWNING I650r-F1、DELL PowerEdge 2950、Inspur NF190D、Inspur NF280D、TP320-5110均配置了双路Xeon 5100系列处理器,DELL PowerEdge 2950、Inspur NF190D更是分别配置了Xeon 5160和Xeon 5150处理器。令我们意想不到的是, HP、Lenovo都选择了配置了Xeon 5000系列处理器的服务器( Lenovo R520 G6、HP ProLiant DL380 G5)来参评,而且均配置了一颗处理器,因此在进行SPEC CPU2000、Web应用和数据库应用的测试项目中,大家会看到他们同其它的双路产品之间存在着明显的差异。 IBM X3650、Powerleader PR1510D、Powerleader 2700D也均配置了一颗Xeon 5100处理器,计算性能也较低。
我们收到了DAWNING A620r-F、IBM X3655、TongFang TR110-2160这三款采用AMD双核处理器的产品,华硕和新近加盟AMD阵营的DELL并没有送测AMD机型。
内存技术:并非完美的FB-DIMM
近年来从并行向串行转变的趋势非常明显,FB-DIMM内存技术也是其中之一,它采用了多条并联的串行线,将内存模组上的每个芯片同AMB芯片连接,然后整个内存通道中的所有内存模组也是串接在一起,这样的设计方式可以系统更加容易获得大容量、高频率的内存系统。Intel 5000系列芯片组开始支持FB-DIMM(fully buffered DIMM)内存,英特尔计划让这种新型的内存全面取代现有的ECC Register DIMM,因此在新的Intel 5000系列MCH的datasheet中我们发现它并不兼容现有的内存规范。
FB-DIMM内存的一般会包有散热片 |
Intel 5000P MCH支持36bit寻址能力,总共可支持64GB物理内存。MCH支持4个FB-DIMM内存通道,每个通道最高支持4个双bank FB-DIMM DDR DIMM。因此在非镜像模式下,MCH最高可支持16 DIMM或者最大64GB物理内存,在镜像模式下最大可以支持32GB物理内存。Intel 5000V MCH则仅支持2个FB-DIMM内存通道,每个通道最高可支持4 DIMMs,总共可支持8 DIMM,那么最高内存容量可达16 GB。目前上一代主流芯片组E7520 MCH最高可支持16GB DDR2内存或者32GB DDR266内存,在内存容量上并没有提高。
每个安装了DDR533 FB-DIMM内存的FB-DIMM通道的读取带宽为4.25 GB/s,所以4个通道最高可以提供17GB/s的内存带宽,这正好同FSB1066 DIB总线的带宽相匹配。FB-DIMM采用了非对称设计,其上行信号线为10bit,下行信号线为14bit,此时4通道FB-DIMM可以提供8.5GB/s的写入带宽。在双通道配置的Intel 5000V平台上,这些数字都将减半,读取带宽为8.5GB/s,写入带宽为4.25GB/s。
AMD Opteron 2000系列处理器最大的改变之一就是改进了内存控制器,开始支持已经是市场上绝对主流的DDR2内存。不过,AMD对于其内存控制器的细节透露的非常的少,我们只能比较笼统的了解它:其整合内存控制器设计不仅可以有效的降低了内存控制器的延迟,还能随着处理器数量的增加“线性”的扩展内存带宽。新的Opteron处理器整合了DDR2内存控制器,Opteron 1000最高可支持DDR2-800内存,理论上可以提供12.8GB/s的内存带宽,而Opteron 2000/8000处理器最高可支持DDR2-667内存,理论上可提供10.7GB/s的内存带宽。这相对于上一代Opteron是一个非常大的改进。
Intel 5000P所整合内存控制器 | AMD Opteron 2000所整合内存控制器 | |
寻址能力 | 36bit | 40bit |
可寻址容量 | 64GB | 1TB |
每控制器通道数量 | 4 FBD通道 | 2 DDR2通道 |
内存类型 | FB-DIMM 533/667MHz | DDR2 400/533/667MHz |
支持设备 | 可支持容量为256Mbit、512Mbit、1Gbit、2Gbit的内存芯片 | 可支持容量为256MB、512MB、1GB、2GB、4GB的内存模组 |
热冗余 | 支持 | 支持 |
镜像 | 支持 | 不详 |
x4 SDDC | 支持 | 支持 |
ECC | 支持 | 支持 |
不过,双路X86服务器应用实际会36bit(64GB)寻址的情况并不多,从服务器厂商所推出的产品可以看出这一点,大多的双路服务器最高可配置32GB内存(本次横评14台服务器中有9台),少数的双路服务器可配置64GB(本次横评中只有2台)。可以,两家厂商的内存寻址能力差异还无法在双路服务器的实际应用中体现出来。
AMD和Intel在系统结构上非常的不同,AMD将内存控制器整合于Opteron处理器内,Intel则依然使用传统的设计,将内存控制器整合在北桥芯片中。Opteron所整合的内存控制器具有128bit位宽,可支持双通道DDR2 667MHz内存配置,理论上最大带宽可达10.7GB/s,更重要的是双路Opteron系统中具有两个内存子系统,总共可提供21GB/s的内存带宽。Intel 5000P MCH则结合FB-DIMM DDR2内存,将串行技术引入了内存子系统中,每个MCH支持2个Branch,每个Branch包括两个FB-DIMM通道,总共可提供21GB/s的内存带宽。单单从简单的数字上看,两个系统是“半斤八两”。
通过我们对于最新的AMD和Intel服务器平台的缓存内存子系统的测试来看,AMD Opteron整合内存控制器的方案的确可以明显的降低内存访问延迟,对比基于Netburst微架构的Xeon平台可以明显的看到这一点,不过基于Core微架构的Xeon平台配合FB-DIMM内存子系统,在这个方面取得了很明显的进步,两者的延迟测试结果比较接近。
在RAS特性方面,AMD Opteron处理器的资料确认其支持单bit纠错和双bit侦错ECC,也能支持内存冗余功能,我们在一些生产AMD Opteron服务器厂商提供的资料中发现,该系统也能支持x4 SDDC,不过我们没有发现有资料显示其支持内存镜像。Intel 5000P MCH可支持内存冗余、内存镜像、x4 SDDC和ECC等特性。
还需要说明的是,FB-DIMM在理念上的确是比较先进,但是其功耗过大的问题的确是存在的,根据我们之前的测试发现,单条FB-DIMM DDR2-533内存功耗高达10瓦,而一般的DDR2内存的功耗只有2瓦多一点。配置了4-8条FB-DIMM内存的系统中,会又增加了除了处理器之外一个热源,这是服务器散热设计上一项新考验。
FB-DIMM内存和处理器位于不同的风道 |
FB-DIMM内存和处理器位于同一风道 |
在本次横评中的9款基于Intel Bensley平台的服务器中,ASUS RS162-E4/RX服务器、DELL PowerEdge 2950服务器、HP ProLiant DL380 G5服务器、IBM X3650服务器均将内存设计在单独的风道上,以确保FB-DIMM得到充分的散热,而其它的5款服务器中的FB-DIMM内存的散热要依赖于经过处理器“预热”气流。
#p#page_title#e#
SAS存储设备已经普遍应用
在服务器系统中,系统总线首先从并行PCI转向了串行PCI-Express,掀起了串行革命。存储子系统跟进的速度很快,目前包括LSI Logic、Adaptec在内的控制器厂商都已经推出了技术比较成熟、体系完整的产品线,并且获得了服务器厂商的广泛应用,主流的企业级硬盘厂商,比如富士通、日立、希捷和已经被收购的Maxtor也都推出了SAS硬盘产品。
在我们本次横评中9大品牌14台服务器中,有9台服务器支持SAS技术,只有3台服务器支持SCSI技术(同方超强TP320-5110和曙光I650r-F和A620r-F1),另外还有一台服务器选择了SATA接口的存储设备(同方超强TR110-2160)。需要说明的是,采用了SAS技术的服务器产品在实际使用和测试中并不一定会优于不采用的产品,但是可以明显的反映不同厂商的对于新技术的敏感程度以及跟进新技术的研发能力。另外还能看出不同厂商的市场策略的不同,比如IBM、HP、浪潮、联想他们显然不仅仅满足于市场份额的领先,更希望能够在技术上保持领先,从而获得长期的竞争优势。
在10款采用SAS存储设备的服务器产品中,有二款产品特别值得肯定。HP ProLiant DL380 G5、IBM X3655均采用了2.5英吋的万转SAS硬盘设备,相对于3.5英吋硬盘,它们的体积缩小了70%,从而可以在1U、2U和刀片服务器上容量更多数量的硬盘,在RAID应用中会更灵活。另外,2.5英吋硬盘的功耗只有3.5英吋硬盘的一半多一点,这符合讲求能效比“主旋律”。当然,支持3.5英吋SAS硬盘的服务器只要更换相应的背板和托架就可以安装2.5英吋硬盘,在实现上并无技术难度,成本是主要的因素。
在服务器SAS设备解决方案中,LSI Logic的产品占据了绝对的主流,在我们所测试的10台支持SAS设备的服务器中,有8台采用了LSI Logic生产的SAS控制器来设计服务器的存储子系统,其中的LSISAS1064和LSISAS1068芯片是板载SAS控制器的主力军,整合了ARM处理器,分别可提供4个SAS端口和8个SAS端口,可支持RAID 0/1/10等磁盘阵列模式。
HP ProLiant DL380 G5服务器基本型均配置具有256MB高速缓存的智能阵列P400控制卡,这款卡采用了LSISAS1078控制器,可支持RAID 0/1/5,但不支持RIAD 6和电池支持的高速缓存写入功能。浪潮NF190D和NF280D分别采用了LSI Logic MegaRAID SAS 8408E和LSI Logic MegaRAID SAS 8308E PCI-E控制卡,它们板载了256MB缓存,具有专用的IOP处理器,可支持RAID 0/1/10/5等磁盘阵列模式,并且支持电池支持的高速缓存写入功能。
IBM X3655/3650服务器的磁盘子系统的设计有些特别,它们均板载了ServeRAID 8k/8k-l RAID控制器,该控制器利用了板载Adaptec AIC9580W SAS控制器芯片,通过上图所示的插槽扩展了32MB或者64MB缓存,可支持RAID 0/1/10基本的磁盘阵列模式。根据我们测试,这种解决方案可以提供比普通的板载解决方案好的多的读取性能。
目前SAS设备的接口尚不统一,大部分的扩展卡上(比如LSI Logic MegaRAID SAS 8408E和HP 智能阵列P400控制卡)都采用了出现较早的遵循SFF-8484规范的SAS x4接口,而我们所评测过的所有的服务器所采用的板载SAS解决方案均提供了遵循较新的SFF-8487规范的SAS x4接口,这种接口的更紧凑一些,也被称为mini-SAS接口。
好在这些问题都是服务器厂商需要解决的,面对不同的接口,他们需要用不同的连接线连接SAS控制器端口和存储背板,而背板上都是提供了统一接口,用于直接连接硬盘。还有一个好消息是,大部分的厂商都已经表示今后会逐渐统一到mini-SAS接口上来,SAS向着成熟更近了一步。
#p#page_title#e#
英特尔I/O加速技术和TOE
去年参加我们服务器横评的十几款服务器中均配置了双千兆网卡,今年参测的14款服务器也没有例外的采用了双千兆网卡的配置。在网络应用非常普及的今天,服务器的网络接口是其同外界通讯的“咽喉要道”,否则服务器无法实时的接受外部的请求并且把处理结果发送出去。而在当今的网络应用中,还是以TCP/IP协议为基础的,在TCP/IP协议的应用过程中需要封装、解包,这些动作对于处理器而言并不是一个复杂的过程,但是却是会占用大量处理器时间,随着网络带宽越高,这个问题就会越严重。
伴随着英特尔Bensley平台的发布,英特尔同时把英特尔I/O加速技术作为一个很重要的概念来推广。概括的来说,英特尔I/O加速技术是一个着眼于整个平台用于移动数据、访问数据和降低网络I/O过程中系统开销的解决方案。英特尔I/O加速技术计划帮助服务器应用程序更快、更高效(占用更少的CPU周期)的获取数据。
英特尔I/O加速技术所涉及的方方面面 |
Intel I/OAT通过适度的中断、适度的内存访问、并行计算、数据移动和减少上下文切换等措施来降低系统开销。比如通过预取操作来提升内存访问和数据移动效率,直接访问子系统可用于卸载数据移动和异步拷贝,TSO(TCP segmentation offload)运算转移给网卡或者板载LAN控制器,并且在数据流和特定的处理器核心之间建立密切的联系。这些技术可以降低网络I/O过程中的CPU占用率,包括协议计算,并且明显的降低由于缓存未命中和Cache line bouncing所引起的CPU停滞。
在英特尔I/O加速技术之前,已经有多种用于解决同样问题的类似技术,比如应用比较广泛的TOE(TCP Offload Engine,TCP卸载引擎),这种技术一般通过网卡上的专用处理器协助处理部分或者全部的封包,借此来降低对于系统处理器资源的占用。
其实,英特尔I/O加速技术和TOE技术都是用于提升网络传输效能,同时尽量的降低了对于处理器资源占用的解决方案,只是英特尔把其提供的解决方案提升到整个平台的层面上。通过统计参加本年度14款的服务器的网络部件,我们发现英特尔I/O加速技术所面临的局势非常微妙:
在这14台服务器中,有3台服务器采用了AMD Opteron平台,因此这21%的产品肯定不支持英特尔I/O加速技术,在剩余的11台服务器中,只有3台服务器支持TOE技术,剩余的8台服务器全部支持英特尔I/O加速技术,从数量上看英特尔I/O加速技术毫无悬念的取得了占有率的领先。
然而,我们发现此次参测的DELL POWEREDGE 2950服务器、HP ProLiant DL380 G5服务器、IBM X3650服务器全部选择了TOE技术,而没有采用英特尔I/O加速技术。这三家厂商在全球服务器市场占据什么样的地位自不必说,而这三款产品也是各家厂商的主力机型。这样看来,英特尔I/O加速技术的推广之路还相当的漫长。
两种技术在实际应用的表现,我们以后将会通过对比评测的形式展示给读者,这里就不展开讨论了。#p#page_title#e#
9大品牌14款双核服务器规格一览
本次年度横评,我们邀请了在国内占据了主流地位的9家服务器厂商参与,最后一共征集到了14款产品:华硕ASUS RS162-E4/RX、曙光Dawning A620r-F服务器、曙光Dawning I650r-F1服务器、戴尔Dell PowerEdge 2950服务器、惠普HP ProLiant DL380 G5服务器、IBM System X3650服务器、IBM System X3655服务器、浪潮Inspur英信NF190D服务器、浪潮Inspur英信NF280D服务器、宝德Powerleader星核5系列1510D服务器、宝德Powerleader星核7系列2700D服务器、同方Tongfang 超强TP320-5110服务器、同方Tongfang超强TR110-2160服务器、联想Lenovo R520 G6服务器。
#p#page_title#e#
测试平台和测试方法
一般的评估服务器都采用RASUM评价体系或者RUMA评介体系,两者的内容非常的相似,RASUM为Reliability(可靠性)、Availability(可用性)、Scalability(可扩展性)、Usability(易用性)、Manageability(可管理性)的缩写,RUMA为Scalability(可扩展性),Usability(易用性),Manageability(易管理),Availability(可用性)。这些评估准则均是从长期的实践中总结出来的,符合这些准则的服务器产品可以更好的为用户服务。我们依据这些基本的准则结合我们的实际测试环境对于服务器的以下几个方面进行了评估。
一、性能评估
2005年度服务器横评之后,我们认为当时的网络实验室无法满足今后继续发展的服务器测试的需要。所以,2006年我们IT168评测中心又斥资几十万对于IT168网络实验室的服务器测试平台进行了大幅度的升级,为思科Catalyst4500千兆交换机(WS-X4013+ Supervisor Engine II-Plus和WS-X4548-GB-RJ45)增加了一个思科全千兆24口模块WS-X4424-GB-RJ45,可同时连接72个千兆铜缆设备和2个光缆设备。另外,我们还购置了29台DELL PowerEdge SC430塔式服务器和原来的32台主流配置PC一起为服务器测试平台的提供负载。
Catalyst4500千兆交换机 |
新增的部分Dell PowerEdge SC430服务器 |
#p#page_title#e#
在新的测试环境下,我们进一步完善了服务器性能测试方案:
-
SPECCPU2000 v1.2
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。
ScienceMark v2.0 Membench cienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
-
IOMeter 2004.7.30 IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
-
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
-
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
-
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
-
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
-
SiSoftware.Sandra.SP1 v2007 SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
-
WebBench v5.0 WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
-
NetBench v7.03 NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
-
Benchmarkfactory 4.6 大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
-
系统功耗监测 我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。
#p#page_title#e#
二、主要规格和技术验证
这个部分主要对于送测服务器的物理特性、硬件配置等等进行考察、评估,比如服务器机箱架构、规格尺寸、处理器型号/数量/主频、芯片组、内存型号和容量、磁盘控制器、硬盘型号、磁盘阵列、网卡型号和接口类型、散热设备、供电、扩展槽、IO接口、托架数量等等。此外还对于处理器技术(SMP技术、HT技术、EMT64、Dual Core)、内存技术(DDR、DDRII、FB-DIMM、双/多通道、内存镜像、内存热备、内存侦错/纠错)、磁盘接口技术(SATA、IDE、SCSI、SAS)、磁盘阵列技术(RAID 0、RAID 1、RAID 10、RAID 5)等等进行了全面的考查和验证。
三、服务器管理功能
决大多数的服务器厂商都会提供给用户服务器管理解决方案,我们对于不同的管理解决方案的具体组件、采用的协议、安全特性、维护和更新系统的能力、系统监测的项目、报警和日志的方式与方法、故障分析和修复等多个方面进行了考查。我们还对于厂商提供了服务器部署导航解决方案进行了考查,比如其所支持的操作系统的类型、支持本地部署的前提下还能否支持远程部署等等。
六、技术支持和质保
这个部分主要包括对随机文档、网站资讯、在线支持方式、电子邮件支持情况、电话支持情况以及上门服务的承诺都进行了对比。比如,内容丰富、图文并茂的随机文档会得到我们较高的评价,这毕竟是用户获得基本技术支持最基本、最及时、最有效的方案之一。而随着网络应用的普及,我们的考察重点也放在了在线互动、在线支持上。
2006年度服务器横评总评
根据前面的介绍,读者可以了解到,我们IT168评测中心对于服务器评估主要包括性能因素和非性能因素,它们分别占据总评50%的权重。
影响性能得分主要是厂商送测产品的配置,比如处理器性能越高服务器整体性能也越过,内存容量和频率也对于性能有影响,此外服务器的磁盘子系统配置的高低也对于测试结果有明显的影响。不同厂商此次参测的出发点并不相同,比如Dell和浪潮是本着展示其产品最佳状态而来的,所以他们送测的产品几乎是当前基于Benlsey平台服务器的最顶级配置,在性能测试中DELL PowerEdge 2950服务器以48.58的成绩高居榜首,而浪潮英信NF190D服务器则以46.24分成绩获得了亚军。还有的厂商的出发点比较务实,比如宝德1510D和2700D,虽然它们的性能得分看似不高,但是市场上主流产品的硬件配置大都会在这个水平上。
非性能因素则不仅仅包括送测服务器本身的设计,还包括了服务器配套的管理解决方案、技术支持方式和情况,特别是后两者不是单纯的给送测机型增加高端配件就能获得的,而是服务器厂商在较长时间内积累的效果。从我们的统计表格来看, IBM高举榜首,几乎获得了满分。联想、浪潮、DELL、HP都位于第二梯队也具有不错的成绩。宝德和华硕在这个方面也具有不错的表现。
综合评估则涵盖了上述两个方面的成绩,其中DELL PowerEdge 2950服务器、浪潮英信NF190D服务器、IBM System X3655服务器位列三甲。其中DELL PowerEdge 2950服务器依靠绝对顶级的硬件配置、出色的设计和完备的技术支持获得了第一名,但是其管理维护功能相对不够完美。IBM System X3655服务器的硬件配置非常的普通,因此性能得分较低,但是其出色的设计、顶级的管理管理功能和完备的技术支持使得也获得了第三名的好成绩。浪潮英信NF190D服务器则提供了接近于顶级的硬件配置,虽然设计比较普通,但依靠较为出色的管理功能和技术支持也获得综合成绩第二名的成绩。
#p#page_title#e#
综上所述,我们
授予浪潮英信NF190D服务器编辑推荐奖:
授予IBM System X3655服务器编辑推荐奖:
授予DELL PowerEdge 2950服务器最佳性能奖:
每瓦特性能或者说能效比也是今年非常流行的词语,我们测量了所有14款参测服务器处理器、内存、磁盘子系统工作在满载的情况下的服务器整体功耗,然后用性能评估得分比上服务器整体功耗得到了该款服务器的能效比。测试结果显示,浪潮英信NF190D服务器具有最佳能效比,为此我们
授予浪潮英信NF190D服务器最佳能效比奖:
按照以往横评的惯例,我们还会选出最佳性价比产品。首先,由于今天厂商送测服务器硬件配置差异巨大,因此实际价格也差异也较大,对比性价比困难较大。第二,部分参测厂商并没有能够按照我们的要求提供产品报价,或者报价同我们市场调查差异较大,也使得我们无法进行性价比的对比。因此,我们决定,本次服务器横评的最佳性价比奖空缺。