迎接全新时代 AMD FirePro V4900、V5900、V7900 专业卡试用报告
AMD 收购 ATI 的同时也获得了 ATI 的专业卡品牌 FireGL 及其研发团队,让人感到高兴的是,AMD 并没有因为当时工作站显卡市场被 NVIDIA 占据了主要份额而在后来的资产重组中割舍掉 FireGL,相反的是,AMD 在原来的基础上对专业卡产品线进行了一定的扩充,而在今年,AMD 更是推出了基于 Cayman 体系架构的 FirePro 3D 产品线,这对 AMD 巩固、拓展市场份额有着重要的意义。
Cayman 架构对工作站有什么好处?
AMD 是在 2010 年年底首次引入 Cayman(开曼群岛)架构的,当时推出的显卡是针对桌面游戏的 RADEON HD 6900 家族,和以前的 Evergreen(常青藤)架构相比,Cayman 有一个改进之处使得它能够在工作站专业应用上较以往的产品有显著的性能提升。
Cayman 引入了上图的双几何处理引擎,能同时对两个几何图元进行变换和背面剔除,理论上它的几何处理能力是 AMD 以往同频 GPU 的两倍。
众所周知,现在的 3D 工作站软件在使用中很多时候都是做建模或者模型轮廓的微调,这也是最需要专业显卡性能的地方,以往的 GPU 只有一个三角形设置引擎,因此无论显卡的着色器、纹理单元飙升到什么程度,在遇到大量细小三角形的框线图时瓶颈往往还是卡在三角形设置引擎上。
NVIDIA 的 Fermi 架构 GPU 首次引入了多路三角形设置引擎技术,使得 Fermi 在执行几何操作的时候表现出了比上代产品惊人的提升。
Cayman 现在也引入了类似的双路三角形设置引擎,对于专业应用来说自然大有裨益。
除此以外,Cayman 架构实现了原生的 DisplayPort 1.2 支持,这为显卡提供了强大的高分辨率、高色深、多屏输出能力,以 FirePro V7900 为例,单槽卡的设计就能实现 6 屏输出,DP 可以直接实现 10 位或更高位的高色深输出,以 Photoshop 为例,只要在 Photoshop 中开启显卡加速以及在驱动中选上强制 10-bit 像素格式,就能在支持 10-bit DP 输入的高色深平板显示器上呈现色彩过度更平滑的画面(当然,图片本身也得是单通道 16-bit 以上的)。
FirePro V7900
Cayman 的专业卡版本架构代号是 Cayman GL,基于该架构 GPU 的最顶级型号为 FirePro V7900,采用的 GPU 代号为 Cayman Pro GL,拥有 1280 个流处理器,单精度性能是 1.86TFLOPS,同时支持双精度运算,只是双精度的性能是单精度的 1/4 即 0.464TFLOPS。
和游戏卡版本的 RADEON HD 6970/6950 不惜牺牲功耗而强拱频率的做法不同的是,FirePro V7900 的设计更加倾向工作站稳定先决的要素,卡上只有一个 6-pin PCIE 外接电源接头,散热器采用单槽设计,而卡体则是 ATX 全长设计,依据官方的资料 FirePro V7900 的典型散热是 150 瓦。
当然,FirePro V7900 的内核数也比 RADEON HD 6970 少一些,是 1280 个,而 RADEON HD 6970 是 1536 个,频率方面是 725MHz| 5000GT/s,相较之下 RADEON HD 6970 是 880MHz|5500MT/s。
FirePro V7900 采用了完全 Displayport 输出端子,好处是可以在单槽挡板上提供多达 4 个标准 DP 连接端子(根据需要,还能分路输出,最高可以达到连接 6 台独立显示器),如果用户采用的是 DVI 接口显示器,则需要搭配一个 DP->DVI 转接器。
FirePro V7900 支持 CrossFire 交火多卡并行处理,用户可以透过卡体前部上方的桥接端子实现多卡多路运行时的桥接。
作为顶级工作站卡,FirePro V7900 的布局、做工都非常精湛,例如确保大电流稳定输出的露厚锡布线、采用 CPL2-4 耦合电感实现多路输出、基于 VT1556MF 的数控变压芯片等。
FirePro V5900
FirePro V5900 采用的 GPU 代号为 Cayman LE GL,和 FirePro V7900 相比在功耗降低到 1/2(75 瓦),无需再连接 PCIE 外部电源,单纯靠 PCIE 插槽供电即可。
不过另一方面,FirePro V5900 的内核数量缩减到了 512 个,频率降低到了 600MHz,这意味着几何性能比 FirePro V7900 降低 17% 左右,单精度计算性能降低到 0.61TFLOPS(相当于 V7900 的 32%),双精度降低到 0.154TFLOPS。 #p#page_title#e#
此外,FirePro V5900 的内存规格是 256-bit GDDR5 @ 2000MT/s,这要比 V7900 的 5500MT/s 低不少。
因此,在定位上 FirePro V5900 主要保留了几何处理密集型应用性能,而通用计算性能则不是重点,这符合大多数工作站应用对图形卡的需求情况。
和 FirePro V7900 不同的是,同样基于单槽设计的 FirePro V5900 提供了两个 DP 接口和一个 DVI-DL 接口,无需转接器就能直接在 DP 和 DVI 接口显示器上使用。
FirePro V4900
在 AMD 的架构版图中,“Cayman”架构其实归属于代号“北方群岛”的产品波次,在这个产品波次中,还有像“Barts”、“Juniper”、“Turks”以及“Caicos”这几个从高到低的架构代号,这几个架构都是之前“常青藤(Everygreen)”的延伸,而非像“Cayman”那样有重大的几何架构改进,依然是每个周期只能实现单个几何图元的输入、输出处理。
当然它也是有一些小技巧,那就是可以把大的图元拆开成两个小的图元来处理,不过这是 Evergreen 时代就具备的几何处理特征。
FirePro V4900 采用的 GPU 就是“北方群岛”产品波次里的 Turks,游戏卡采用同级 GPU 的产品是 Radeon HD 6570 和 Radeon HD 6670。
FirePro V4900 的 GPU 和内存频率规格是 800MHz(480 内核)、4000MT/s(128 位 GDDR5),计算性能和带宽分别是 0.768 TFLOPS 和 64GiB/s。
和 V5900、V7900 定位中高端工作站应用不同的是,FirePro V4900 主要针对入门级高性能工作站市场,PCB、散热器等设计相对简单一些。
测试平台及方法介绍
处理器 | 英特尔 Core i7 2600K 3.4GHz Sandy Bridge 架构, 关闭 Turbo Core |
内存 | 4 x 4096MB Kingston HyperX DDR3-1600 - 共计 16 GB CAS 9, 9, 9, 27, 1T, DDR3-1600 |
主板 | ASUS P8Z68 Deluxe BIOS 0706 Z68 芯片组 |
硬盘 | 系统盘:美光 Crucial M4 128GB SATA 6Gbps |
操作系统 | Windows 7 x64 SP1 Intel RST 10.6 |
显示卡 | AMD FirePro V7900 2GB AMD FirePro V5900 2GB AMD FirePro V4900 1GB 催化剂 Pro 8.85(V4900 3dsmax 2011 使用 8.88) |
测试软件:
测试本体软件 | 测试脚本包 |
ACAD 2012 64-bit | Catalyst 2012 |
3ds max 2011 sp1 64-bit | SPECapc for 3dsmax 2011 专业版 |
Maya 2009 64-bit | SPECapc for Maya 2009 |
Revit 2012 64-bit | RBO Benchmark 2012 |
Lightwave3D 9.6 64-bit | SPECapc for Lightwave3D 9.6 |
Solidworks 2012 64-bit | 内建性能测试脚本 |
NX6 64-bit | SPECapc for UGS NX4 |
Viewperf 64-bit | SPECgpc Viewperf 11.0 |
我们采用 Windows 7 x64 SP1 作为测试平台的操作系统,虽然某种程度上还是比较新的系统,不过在我们的测试中并没有遇到什么问题,有部分测试甚至要求一定要用 Windows 7 x64,例如 SPECapc For 3ds max 2011 专业版。 #p#page_title#e#
测试时候的桌面分辨率为 2560x1600 32bit,关闭 Aero Glass 桌面特效,Windows 主题为经典主题。
由于我们使用的分辨率高于 SPEC.org 网站上公布的测试所采用的分辨率(一般为 1280x1024 或者较新的 LW3D 9.6 和 3ds Max 2011 采用的 1920x1080),所以我们的测试结果不适合和 SPEC.org 的测试结果对比,但是作为三款产品的单系统内对比完全没问题。
Autodesk ACAD 2012
Catalyst For AutoCAD 2012 测试运行截图
AutoCAD 是 Autodesk 公司的拳头产品,从 1982 年推出至今已经有 30 年历史(比 Windows 历史还长),作为一款针对入门级的计算机辅助设计软件,AutoCAD 在全球的市场占用率排名第一,从 AutoCAD 2007 版开始,Autodesk 为这款老牌软件引入了三维建模能力,还能采用 metal ray 引擎实现高品质的三维渲染,从 2010 版开始,引入了参数化功能和基于网面的建模能力,三维功能大大增强。
我们使用的 AutoCAD 测试包是来自 Catalyst Labs 的 Catalyst For AutoCAD 2012,这个测试脚本印象所及最早可以追溯到上个世纪,现在的 For AutoCAD 2012 版本测试脚本由三部分组成,分别是二维图形、三维图形和 CPU 。
三维图形测试主要是由上图这样的若干个方向盘赛在一起,进行旋转、缩放等操作,包括框线图、实体图等模型。
FirePro V4900 和最高端的 FirePro V7900 性能差距在 11% 的水平,这说明在 ACAD 2012 中两者的三维性能差距在伯仲之间,如果为了跑 ACAD 的话,价格低得多的 V4900 足以胜任。
备注:AMD 和 NVIDIA 现在都有提供 AutoCAD 的性能优化驱动(Heidi 驱动),但是在我们测试完成之际尚未看到有 AutoCAD 2012 的优化版本,所以这里测试结果都是 Autodesk ACAD 2012 内建的驱动。
Lightwave3D 9.6
FirePro 专业卡 Lightwave3D 9.6 性能测试运行截图
NewTek 的 Lightwave3D 最初是给 Amiga 电脑系统开发的三维创作软件,由于支持多种平台以及在早期有较高的性价比,在很长的一段时间里都获得电脑动画公司的青睐,在业界有较高的知名度。
SPECapc for Lightwave 3D 9.6 是由专业测试软件开发机构 SPEC.org 和 NewTek 公司合作一起推出的 Lightwave 3D 测试脚本,包含了 11 个场景,三角形数量从 6.4 万个到 1.75 百万个,测试脚本模拟了三维角色动画设置、建筑物审图、工业设计等。测试需要重复运行三次,然后在 Excel 中将测试结果汇总并得出最终的成绩,测试的项目分为三类,即互动操作、渲染以及多任务化。
SPEC.org 在一台配置为 Xeon 5130 2GHz、4GB 内存、NVIDIA Quadro FX570、Windows XP SP3 的上运行该测试脚本并将该测试结果定为基准分,这意味着如果你的系统运行结果为 2.0 话,性能就是该配置的两倍。
受到测试脚本的限制,虽然桌面设置为 2560x1600,但是测试脚本会把软件的主窗口缩小约为 1280x1024 的大小。
从测试结果来看,注重图形卡性能的互动操作测试结果并没有大的区别,最快的 FirePro V7900 只是比 FirePro V5900 快大约 5%,而 FirePro V4900 甚至比 FirePro V5900 略快一点点。
3ds Max 2011 sp1
和许多其他的中高端工作站软件不同的是,3ds Max (以及它的前身 3D Studio、3D Studio Max)自出道以来一直都是专注于 PC 平台上,横跨了 DOS、Windows NT 等多个时代,有大量电影的特技采用了 3ds Max,例如 2012、哈利比特、X-Men、变形金刚真人版、蜘蛛侠、钢铁侠、K-19 寡妇制造者、黑金坠落等等。
SPECapc for 3ds Max 2011 是近年来 SPECapc 旗下测试包一次非常特别的发布:需要付费购买,而且价格不菲——495 美元。SPEC 需要付费购买的解释是:以往 SPEC 开发的 SPECapc 测试包都是由业界公司支付开发费用的,但是近年来的产业合并导致来自会员费的收入减少使得 SPEC 不得不尝试新的收入方式。
三角形规模达到 3200 万的场景 #p#page_title#e#
和以往的 SPECapc for 3ds max 测试不同的是,这次的 SPECapc for 3ds Max 2011 有很大的不同,例如引入了三角形规模达到了 3200 万的场景(见上图),测试脚本的运行更加稳定可靠(收费后果然不一样,制作更认真了)。
SPECapc for 3ds Max 2011 分为正式测试和简化测试两种模式,正式测试需要系统配置有 16GB 以上的内存,不过即使是 16GB 内存,如果关闭了虚拟内存的话,依然会出现内存溢出的问题,所以我们的测试系统打开了交换页面文件。
正式测试需要运行所有测试项目 4 次,每次需时为 45 分钟左右。
SPEC.org 以一台配置为 2.0 GHz Intel Xeon 5130、4 x 4GB FB-DIMM DDR2 SDRAM (ECC)、NVIDIA Quadra FX 570、80GB Seagate 7200RPM 系统测试结果作为基准,定为 10 分,如果其他系统的得分为 20 就可以视作是两倍于基准系统的性能。
下面是部分测试场景的截图(由于测试需时,我们只是截取了其中一小部分):
从统计出来的数据来看,FirePro V7900 和 FirePro V5900 的差别比较明显,特别是在 Shader 测试,FirePro V7900 达到 FirePro V5900 接近两倍的性能。
在大规模场景方面,FirePro V7900 的性能是 FirePro V5900 的 1.27 倍,这个差距虽然不算很大,但也是比较明显的差别。
FirePro V4900 在大规模模型和 GPU 渲染测试中明显力不从心,不过在场景规模中等的互动测试中还算是中规中矩。
Maya 2009
三国演义里有“伏龙凤雏,得一可安天下”,如今风头无两的 Autodesk 可不仅仅是有 3ds Max,三维 CG 界的标杆性产品也可以称之为伏龙凤雏的 Maya、Softimage 都已经尽归其所有。
具有 Alias、SGI、Wavefront 血脉的 Maya 在出道之初是以惊人、灵活的建模能力而著称的,在影视和动画业界中有极高的口碑,作为一款高端工作站软件,它的用户群体可谓是相当庞大,有丰富的各种学习资料。
SPECapc for Maya 2009 是 SPEC.org 针对 Maya 2009 推出的测试脚本,由 5 个场景组成,测试透过 Maya 内建的脚本语言执行,包含有 40 个独立测试项目,例如动画、建模、渲染等,总共重复运行 4 次,录得的运行时间经过一个 .xls 文件整理后,除以参考系统的成绩,就是最终的测试结果。
参考系统的配置为 2.0 GHz Intel Xeon 5130、4 x 4GB FB-DIMM DDR2 SDRAM (ECC)、NVIDIA Quadra FX 570,该平台的得分为 1.0,其他平台上若测试得 2.0 表示性能为参考系统的两倍性能。
和 FirePro V4900 相比,FirePro V7900 在这里只是快了 10% 左右,这表明如果你是 Maya 用户的话,使用价格较低的 FirePro V4900 其实也是足够的。
Siemens NX6
FirePro 专业卡运行西门子 NX6 性能测试截图
目前在高端 CAD/CAM/FAE 领域的主要竞争产品有 Creo Elements/Pro(也就是以前的 Pro/E)、CATIA 以及西门子 NX,其中 NX 的历史最为悠久,可以追溯到 1969 年 United Computing 公司的 UNIAPT,经历过 UNI-GRAPHICS、Unigraphics 等名称的演进,到 2002 年的时候,Unigraphics 公司 和 I-DEAS 公司取 Next Generation 的含义将其重新命名为 NX,关于 NX 的历史,你可以到这个网站看看:http://www.plmworld.org/p/cm/ld/fid=209。
SPEC.org 提供了针对 NX4 的测试包,不过这个测试包经过修改路径后,也可以用在 NX6 上正常使用,我们也是直接使用这个测试包来测试。
根据 SPEC.org 的介绍,这个测试包的基准平台为 2.4GHz Intel Xeon、Intel 860 芯片组主板、Windows XP、2GB PC800 ECC、Quadro FX 1000、40GB ATA 100,当然,他们运行的软件版本为 NX4 并非我们的 NX6,当然我们运行的 2560x1600 分辨率也要远高于基准系统的 1280x1024,不适合于直接和 SPEC.org 网站上的测试结果对比。 #p#page_title#e#
三款产品的 NX6 图形性能同样没有大的区别,最快的 FirePro V7900 和 FirePro V4900 差别也就是 3% 的水平。
Autodesk Revit 2012
如果希望将建筑物项目信息(例如设计、施工、运营)有机地结合而不仅仅是画个图纸的话,那么类似 Autodesk Revit Architecture 这样的 BIM(建筑信息模型)软件就是不可或缺的工具。
Autodesk Revit 2012 是 Autodesk 的最新 BIM,支持 DirectX9 硬件加速,和旧版本相比有许多更新的地方,例如支持施工建模装配、概念化能效分析、并行化的轮廓计算,在 Autodesk 官方论坛上有专门的 Revit 讨论区。
我们采用的 Revit 2012 测试脚本来自 revitforum.org,名为 RFOBenchmark 2012,测试脚本由 VBScript 写成,执行很简单,双击 _RFOBenchmark.vbs 后,输入 RAC 和回车,脚本就会打开 Revit 2012 开始执行测试,测试由 5 个回合组成,测试项目包括了模型创建及视图输出、渲染、GPU 性能,我们这里主要看显卡性能,因此给出的也就是 GPU Benchmark 的结果,测试结果数值越小,性能越高。
FirePro 专业卡 Autodesk Revit 2012 性能测试运行截图
从测试结果来看,三款显卡的 Hidden Line 都是同一水平,不过 Rotate(旋转)操作的时候三款显卡都有不同的表现,基本上就是相差 15%。
Solidworks 2012
Solidworks 是针对中端市场的三维机械计算机辅助设计软件,在 1997 年被法国达索收购,到了 Solidworks 2012 发布的时候号称已经有 160 万用户。
从 Solidworks 2010 开始,Solidworks 就集成了一个性能测试插件,透过运行这个插件(其实是由一系列脚本外加一些不算很复杂的模型)就能获知系统的性能表现,测试结果为秒数。
从测试结果看来,三款显卡的性能表现不相上下,差距基本上是小数点后才能体现,所以如果你在为 Solidworks 选购专业卡的话,其实 FirePro V4900 足以胜任。
SPECgpc Viewperf 11
和主要开发直接在程序本体运行性能测试的 SPECapc 不同的是,SPECgpc 主要是做纯图形性能的测试,最著名(也是他们目前唯一)的测试程序是 Viewperf 系列。
和 3DMARK 不同的是,虽然也是所谓的人为合成类测试,Viewperf 采用的数据集是源自真实应用的,而模型和渲染参数则由独立软件开发商和图形用户选择出来的,相较而言更贴近真实应用下的性能。
Viewper 11 包含了 Catia、Ensight、Lightwave、Maya、ProE、SW、Tcvis、SNX 等 9 个项目,这些名称其实就是取对应软件的英文名,例如 SW 是对应 Solidworks,英文后面的数字代表 Viewperf 中它们的版本,SW-02 表示这是 Viewperf 的第二版 SW 测试。
Viewper 11的每个测试项目本身需要运行多种图元模式的测试,例如线框模式、实体着色模式等,经过汇总整理后的测试结果为每秒多少帧。
虽然 Viewperf 的不少模型都取自 SPECapc 里的测试包,但是 Viewper 由于脱离了本体程序,完全以图形操作为主,瓶颈更多的压在显卡上,所以在 Viewperf 上不同专业卡的性能区别会更加明显。
从测试结果来看,三款显卡在 CATIA-03、Ensight-04、Maya-03、SW-02、SNX-01 中都有较明显的区别:FirePro V7900 获得最快的帧率,其次是 FirePro V5900。在 Lightwave-01,FirePro V7900 和 FirePro V5900 性能相当,比 FirePro V4900 快 5% 左右,ProE-05 中三款显卡的性能可说是完全没差别,而在 Tcvis-02 中,FirePro V4900 比 FirePro V5900 略快,但是最快的依然是 FirePro V7900。
测试总结
从真实应用的测试结果来看,FirePro V7900、FirePro V5900、FirePro V4900 的平均性能差距不会超过 10%,而 Viewperf 11 的测试结果表明,FirePro V7900 的潜在性能优势大约是 30% 左右,很显然,FirePro V4900 在性价比上非常吸引入门级的工作站用户。
FirePro V7900 在相对旧式的工作站应用中的性能未必能显著抛离像 FirePro V4900 这样的入门级专业卡,但是在一些使用到着色器的应用场合,例如 3ds Max 2011 等需要复杂 shader 或者计算能力时FirePro V7900 具有不可动摇的性能优势。 #p#page_title#e#
FirePro V5900 是一款折中的产品,具有 FirePro V7900 一样的 Cayman 世代双几何流水线,在 3ds Max 2011 的大规模模型测试中虽然和 FirePro V7900 有一定距离,但是足以远远抛离 FirePro V4900。
三款产品的差别并不仅仅性能上,例如 FirePro V7900 能实现 6 屏输出(4 DP + 分路)以及支持 FrameLock,而 FirePro V4900 具备 2GB 内存而且无需外接电源,FirePro V4900 则当然是主打价格牌。
从产品线角度而言,AMD 在专业卡硬件和驱动等方面已经比以往有很大的进步,不过和 NVIDIA 相比,我们认为还需要在整体方案上作更大的努力,后者现在已经开始提供实时成品级光线追踪的 3ds Max 方案,AMD 不妨考虑收购一家渲染器公司或者小组,这样才能在未来的竞争中确保主动权。