术业有专攻 Quadro FX380/FX1800评测
NVIDIA与AMD之间在桌面的竞争愈发激烈,转眼之间,Geforce系列显卡已经进入第十代阵营。与之相比,专业绘图领域的Quadro则是显得有些不温不火,AMD旗下FireGL系列显卡虽然也有不小的市场份额,但两家厂商的产品更显得泾渭分明,主攻平面与主攻3D设计各不冲突,简单来说,就是自己玩自己的。在这种情况下,NVIDIA在2009年上半年终于更新Quadro的产品线,Quadro产品线终于也进入第十代产品。NVIDIA Quadro更新的产品主要是针对台式机和图形工作站的FX系列,包括FX3800、FX1800、FX580和FX380。
实话实说,如果只是这种规格提升并没啥太大的惊喜,毕竟显卡架构升级都会带来性能提升,单纯提高多边形生成数量和速度意义不大,还没用等到显卡全部能力都得以发挥就可能从市场淘汰。真正值得欣慰的是NVIDIA将CUDA带入专业绘图领域,特别是FX380和FX580这种面向中低端领域的产品也保留通用计算能力,是一件值得高兴的事情。利用CUDA,显卡的性能能够发挥得更出色,而且在传统3D制图领域之外,向视频编辑领域进军。不过保留CUDA可能让FX系列产品对CX系列产品造成冲击,如何避免这种情况,是NVIDIA需要面对的话题。不过对消费者来说,CUDA出现绝对是利好的消息,不仅提升了显卡的附加性能,也延长了显卡的寿命。全部采用C语言作为编程语言的CUDA能够提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。#p#page_title#e#
关于显卡的做工,我们无需太过挑剔。与消费级的Geforce系列显卡不同的是,Quadro系列产品颇有些“山寨”的味道——没有夸张的散热器也没用鲜艳的PCB颜色,电感电容数量也不能压倒同级别的Geforce显卡。实际上由于显卡绝对属于NVIDIA的“原厂品质”,所以显卡做工论在专业级显卡身上并不适用,因为我们没有更多的同类型产品可供选择,想要玩专业,做的简陋也要忍受。
名称 |
FX1800 |
FX1700 |
FX380 |
FX370 |
CUDA并行处理器数量 |
64 |
32 |
16 |
16 |
显存容量 |
786MB |
512MB |
256MB |
256MB |
显存带宽 |
192bit |
128bit |
128bit |
64bit |
显存吞吐量 |
38.4GB/s |
12.8GB/s |
22.4GB/s |
6.4GB/s |
PCI-Express规范 |
2.0 |
2.0 |
2.0 |
2.0 |
精确度 |
FP32 |
FP32 |
FP32 |
FP32 |
输出接口 |
DUAL-LINK DVI+Dispalyport |
DUAL-LINK DVI |
DUAL-LINK DVIX 2 |
DVI X 2 |
TDP |
59 |
42 |
34W |
-- |
SLI/SDI |
NO/NO |
NO/NO |
NO/NO |
NO/NO |
除了架构改良之外,全新的380和1800支持更多特效,具体体现在: 30位色彩精度 30位色彩保真度(每种色彩10位)可实现数以十亿计的色彩变化,而非百万种色彩变化。在最大动态范围内呈现出丰富、绚丽的图像质量。 先进的色彩压缩、无失真Z坐标压缩(Early Z-Cull)技术 全景抗锯齿(FSAA) 最高32倍速全景抗锯齿大大减少了视觉混叠假象或锯齿摂现象,呈现出极其逼真的场景。 硬件3D窗口剪辑 硬件加速的剪辑区(窗口与帧缓存之间的数据传输机制)通过提高色彩缓存与帧缓存之间的传输速度,提升了整体图形性能。 支持HDMI 可将视频与音频传输到高清电视以及其它支持HDMI的设备上(通过HDMI转接器)。 最高工作站级应用程序性能 下一代架构在几何学以及填充率方面的提升高达两倍以上,能够为专业级CAD(计算机辅助设计)、DCC(数字内容制作)以及科学应用程序提供行业最高性能。 下一代顶点以及像素可编程性 NVIDIA PureVideo HD技术 通过在支持HDCP的平台以及HDCP电路上将高清电影解码加速与后期处理融为一体并整合到高清电影播放器中,为用户带来PC上的顶级高清电影体验。 本技术能够为所有视频格式以及精美的HD DVD与蓝光(Blu-ray)电影实现绝佳画质,同时保持极低的CPU占用率和功耗。 NVIDIA 统一GPU架构 业界首款统一架构能够动态地分配计算、几何、着色以及像素处理能力,从而实现优化的GPU(图形处理器)性能。 nView多显示器技术 NVIDIA nView 先进的显示器软件可实现最大灵活度,让用户能够选用单台超大显示器或多台显示器。该软件为最终用户带来了前所未有的桌面控制体验,提升了生产率。 符合PCI Express 2.0标准 数据传输速率提升一倍,最高可达每巷道5 GT/秒,双向总带宽高达16 GB/秒(每个方向8 GB/秒)。 支持OpenGL四方体缓冲立体 OpenGL 四方体缓冲立体为专业应用带来流畅和逼真的 3D立体体验。 两个DisplayPort数字显示器接口 两个DisplayPort接口支持超高分辨率平板显示器(最高2560 x 1600),可呈现出细腻逼真的惊人的图像质量。 一个双链路数字显示器接口 双链路TMDS发送器支持超高分辨率平板显示器(最高可达3840 x 2400 @ 24Hz),可呈现出细腻逼真的惊人的图像质量。 超静音设计 带来强劲性能的同时最大程度减少噪音,为用户营造安静的桌面环境。 统一的驱动程序架构(UDA) NVIDIA统一驱动程序架构确保了软件驱动程序向前和向后的兼容性。 由于所有NVIDIA产品均在相同的驱动程序软件下工作,因此简化了升级为NVIDIA新产品的过程。#p#page_title#e# 测试平台 名称 CPU Intel Core2 Duo 6750 主板 冠盟P45 内存 威刚DDR2 1066MHz 硬盘 希捷7200.12 1TB 显示器 DELL 2405 显示卡驱动 Quadro Driver Release 186 MAXTreme 名称 X380 X1800 9800GT Graphics 3.88 2.25 14.26 Hardware Shaders 6.23 4.37 9.98 CPU Render 4.14 4.12 4.73 没有安装MAXTreme驱动,FX系列显卡的运算能力就明显好于Geforce系列显卡,在安装之后,两者差距非常明显。凭借较高的核心运算能力和更高的贷款,X1800领先X380性能接近0.5以上,硬件顶点渲染能力差别比较明显,CPU之间的差距比较小。对比X1800和9800GT,可以看到专业卡与游戏卡之间的性能差别。 SPECapc for Maya 6.5 这个测试项目队线框、着色、纹理、高亮度纹理和纹理模块进行测试,测试过程中还会测试大纹理和多视点性能测试。SPECapc for Maya 6.5由30项单独的测试组成,其中的27项运行3遍。最终得分基于图形占70%,CPU性能占20%,I/O占10%。 Overall Scores X380 X1800 9800GT GFX 7.47 8.26 3.72 I/O 5.65 5.69 5.03 CPU 8.43 8.33 8.35 Overall 7.44 7.97 5.98 严格来说Maya2009的测试成绩更能放映X1800与X380之间的性能差距,但测试过程中,9800GT显卡频繁报错,导致测试成绩不具备对比性,所以只好继续使用MAYA 6.5的测试成绩。测试成绩可以看到X1800在显卡测试项目领先幅度接近10%左右。如果使用此款软件进行复杂的建模设计,X380也可以轻松完成项目。相比之下,Geforce 9800GT的性能差距相当明显,接近50%左右,整体性能差距也在20%左右。 SPECapc for SolidWorks 2007 SolidWorks 2007的测试项目中使用了大量形状不同的CAD和CAM solid模型,其中最大的模型由313万个顶点组成的发动机引擎,测试项目不仅可以考虑显卡带宽的吞吐量,也可以考验显卡顶点引擎的运算能力。测试项目包括8个测试项目: 考验IO吞吐量的密集型操作,考验整机性能的处理器密集运算,以及6个不同的图形测试。一个单一的数字得自全部8项测试标准化得分的几何平均数加权。当然,这些测试不是SolidWorks2007的全部,体验专业卡的特性就在于此,只有3D专业显卡才能够支持SolidWorks中的ReadView功能,通过硬件加速显示模型,这是其显卡不具备的功能。 X380 X1800 GTS250 Complete 157.30 168.89 159.23 Graphics 52.47 61.69 51.45 Processon 45.41 46.36 43.36 I/O 29.42 61.14 35.50 测试成绩让人感觉惊讶,专业卡不敌游戏卡。其实没什么好奇怪,GTS250本身就是面向中高端的产品,3D运算能力不俗,成绩落后X1800不足10%也属于正常。X380与GTS250以及X1800的差距并不明显,也就是说GTS250也可以使用在Solidworks2007的工作环境中。 SPECapc for Lightwave 9.6 LightWave 9.6的测试项目相当复杂,测试需要使用11个模型模型,模型大小从6.4万个模型到175万个多边形构成,通过构建多边形、移动多边形、缩放以及快速旋转测试3D显卡的整体运算能力。 X380 X1800 GTS250 Lnteractive 1.98 2.15 1.37 Render 3.56 3.56 3.57 Multiask 2.83 2.86 2.89 测试结果证明GTS250与X380和X1800之间略有差距,而且差距比较明显,特别是在Lnteractive的得分中,差距接近50%以上。在1900X1200的高分辨率下,专业绘图卡的性能优势比较明显。 SPECapc for UGS NX 4 由一个在发动机工业, UGS, 和SPECapc之间的合作努力完成。密集化的SUV(车身模型包含了超过30000个显示线条,变速箱模型包含了84000个显示线条。测试项目包括旋转、缩放)全景、前端、后端透视、预览等操作。测试项目记录图形、CPU、磁盘盒I/O操作结果,属于整个系统性能的复杂测试。
X380 X1800 GTS250 Total I/O 2.22 2.29 2.02 Total CPU 3.62 3.66 3.81 Total Graphics 6.12 8.34 4.27 Total 5.01 6.03 4.98
FX380的散热器,看起来很单薄#p#page_title#e#
128位精度图形管线
每个色彩分量(RGBA)都具备完整的IEEE 32位浮点精度,可在最大动态范围内实现上百万种色彩变化。 在着色、滤波、纹理以及合成方面树立了图像清晰度和画质的全新标准。 在视觉特效处理方面可实现前所未有的渲染图像质量。
改善了管线色彩压缩以及无失真Z坐标压缩(Early Z-Cull)技术,提升了有效带宽、渲染效率和性能。
兼容行业标准架构
兼容Intel/AMD的x86 32位以及64位微处理器架构以及Microsoft/Linux操作系统。
Cg高级图形着色器语言
Cg — 图形专用“C”语言 — 是一种开放标准的高级编程语言,这种语言能够利用可编程GPU的强大动力。 NVIDIA Quadro FX可编程图形管线利用高级着色语言来创造实时的逼真效果并将这些效果整合到3D模型、场景以及设计中。 想要在CAD(计算机辅助设计)、DCC(数字内容制作)以及科学应用程序中创造出实时、逼真的视觉效果,该语言是一种主要的途径。
高性能显示器输出
400MHz RAMDAC(随机存取存储器数模转换器)以及最多两个DisplayPort数字接口能够驱动市面上最高分辨率的数字显示器。
8K纹理以及渲染处理
能够从8K x 8K的表面采集纹理以及对这些表面进行渲染。 本特性有利于这些需要最高分辨率和最高图像质量的处理任务。
下一代顶点以及像素可编程性Shader Model 4.0
面向OpenGL以及下一代DirectX 10业界领先的专业应用程序,shader model 4.0参考标准可实现更高级别的性能与逼真效果。
Quadro FX GPU引入了无限长度顶点程序以及动态流量控制技术,消除了之前对着色器程序复杂度与结构的限制。 Quadro FX GPU能够实现实时图形系统从前不敢想象的复杂特效。
CUDA架构
NVIDIA CUDA 是 Quadro专业级GPU(图形处理器)的一种革命性并行计算架构,该架构在视频编码、图像处理以及精确物理效果等方面可实现巨大性能突破。
NVIDIA图形应用程序接口(API)扩展
NVIDIA为Linux以及Windows提供了一套标准图形API的扩展,让应用程序能够最大限度地利用最前沿的GPU功能。
NVIDIA高精度高动态范围(HDR)技术
在着色、滤波、纹理填充以及合成方面的超高浮点性能树立了图像清晰度与画质的全新标准。 在视觉特效处理方面可实现前所未有的渲染图像质量。
由于测试平台相同,I/O与CPU和汇总的成绩几乎相同,差距不大,只有显卡得分选项略有差别,X1800几乎领先GTS250接近一倍以上,在大量多线条的考核下,吞吐量与多边形生成能力有优势的GTS250甚至敌X380,可以充分专业绘图卡的优势所在。
SPECviewperf 10
Viewperf 10.0 是 SPECopc发布的大型 3D 图形测试工具,对大量图形设计软件进行综合性测试,其中包括 3dsmax-04、catia-02、ensight-03、maya-02、proe-04、sw-01、tvis-01、ugnx-01,分别对应 3dsmax、CATIA、EnSight、Maya、Pro/Engineer、Solidworks、UGS Teamcenter Visualization Mockup、UGS NX 等多个应用软件的对应测试项目。SPECviewperf 10与apc出品的测试软件不同,后者注重实战效果,必须安装终端软件才能运行Benchmark,而且测试得分评价系统相当复杂,SPECviewperf 10的测试比较简单,而且考察的是显卡的综合性能。简单理解如果SPECviewperf 10的得分领先比较明显,在设计方面的性能表现也就会越出众。
X380 |
X1800 |
GTS250 |
|
3DSMAX |
39.26 |
44.35 |
12.88 |
Catia |
47.25 |
52.55 |
8.81 |
Ensight |
30.54 |
47.44 |
18.27 |
Maya |
123.04 |
147.07 |
26.51 |
Proe |
40.90 |
45.11 |
9.70 |
SolidWorks |
61.62 |
100.02 |
17.30 |
Tcvis |
17.08 |
26.85 |
4.32 |
UGNX |
13.80 |
31.15 |
9.56 |
综合测试可以清楚显示游戏显卡与专业绘图卡在OpenGL模式下的差距。在常规的驱动下,X380的领先幅度非常明显,特别是在MAYA、ProE和SolidWorks领先接近3倍以上,特别是MYA的测试项目图形与此前进行Spec for MAYA 6.5的测试项目几乎相同,但性能差距在6倍左右。Tcvis与3DSMAX的项目性能差距接近4倍左右。
由此可见,在D3D渲染引擎下,如果不考虑超大型模型的渲染稳定性的情况下,游戏显卡也勉强应付较为复杂的渲染,但在OpenGL模式下,专业显卡的渲染性能绝非游戏显卡可以对比,即使不是一个级别的显卡,恐怕也难以匹敌。#p#page_title#e#
测试总结
由于我们没有找到FX370和FX1700进行对比测试,所以FX380和FX1800的测试成绩也没用直接的竞争对手,GTS250虽然规格高于FX380和FX1800,但在OpenGL的渲染模式中全面败阵。对大多数入门级消费者来说,或许一片价格低廉的游戏显卡或许也可以专业设计,但在超大型的模型面前,游戏显卡无法满足稳定性的需求,这是致命的死穴。举例说明,如果想要在3DS中渲染一个超过2GB的模型文件,Geforce系列显卡往往以死机告终,这不是显卡快与慢的问题,而是设计理念不同,正所谓术业有专攻。
对专业绘图卡的用户来说,并没有更多的选择空间,与FX370和FX1700相比,由于核心与架构进步带来的改良肯定是明显的,CUDA与全新的DX10渲染就是最大的吸引力,对入门级工作站来说FX380就是一个不错的选择。FX1800的售价性能更好,但售价也略高一些,对经常渲染更高规格的用户来说,X1800可以节省下更多的时间。此外还有一般游戏卡上暂时还很罕见的 DisplayPort 支持,对于需要这些特性的行业用户来说,Quadro FX 1800 是更理想的选择