AMD FirePro新品:计算+图形+VDI解决方案
AMD在国外宣布推出2款最新的工作站显卡——FirePro V5900和V7900。按照常规,我们认为和FirePro相关的大多还是在2D/3D专业显示方面,如:CAD/DCC(计算机辅助设计/数字内容创作)、虚拟现实(VR)/可视化、医疗图像/多屏显示、能源(地震数据可视化分析)等传统图形工作站应用的领域。现场演示解决方案部分详见本文第二页。
不过这次我们还获悉了FirePro与服务器相结合,组成GPU计算 + 专业图形 + VDI(虚拟桌面基础架构)的全新解决方案和应用理念。对应的内容我们将在本文第三页详细介绍,读者也可以点击这里的链接打开。
FirePro V5900/7900:几何翻倍?4屏门槛降低
前天,也就是全球正式发布的第二天,AMD联合其专业工作站显示卡亚太区唯一授权合作伙伴蓝宝科技(Sapphire),在北京举行了题为“蓝宝石AMD专业工作站显示卡,宽域之路迈向辉煌”的发布会。
在发布会现场的展区,AMD和蓝宝几乎摆出了正在销售的全线ATI/AMD FirePro(3D)、FirePro Multi-View(2D)专业显卡实物。本次的亮点无疑是FirePro V5900和V7900这两款新品,值得注意的是,从它们开始AMD工作站显卡正式放弃使用ATI的商标。类似的情况也出现在AMD FirePro 2270 2D/双屏专业显卡上,同时先前发布的ATI FirePro产品名称保持不变。
笔者在北京发布会现场拍摄的AMD FirePro V7900专业显卡实物
早在24日当天,就有同行编译了国外网站的相关报道,其中包括效果图、现场实物还有性能评测结果等,类似的信息我们就不过多重复。FirePro V7900虽然在显存带宽方面领先上一代产品V7800,不过流处理器数量和单精度浮点运算性能都处于劣势。那么为何它能够在SPECviewperf测试中领先呢?AMD宣称本次发布的2款显卡具备“GeometryBoost”(几何加速)特性,按照我们的理解,应该就是对应消费级显卡Radeon HD6950/6970等架构更新后增加了1个GPC单元(之前只有1个)。
在AMD业务总监Mr. Anirban Chakravartti先生的现场演讲中,也提到了Tessellation(曲面细分)性能的改善。我们知道NVIDIA Fermi架构中的高端产品具有4个GPC,并在某些专门的Benchmark中表现出明显优势。不过还是那句话,实际应用中的显示速度才有真正意义,无论是用Radeon/Geforce玩游戏(Direct3D),还是FirePro/Quadro进行设计工作和图形处理(更多针对OpenGL显示接口)。
使用2块AMD FirePro V7900组建CrossFire Pro,输出到4屏运行Autodesk公司的Demo演示(这里应该是播放的视频)
每一块单插槽宽度的FirePro V7900提供了4个可输出最大分辨率为2560x1600 @60Hz的DisplayPort显示接口,进一步降低了组建4屏Eyefinity宽域技术专业显示方案的门槛。要知道原有的V8800(4屏)和V9800(6屏)显卡的价格要高出不少,而且还都是双插槽宽度。
CrossFire Pro技术在这里的作用类似于NVIDIA的Qudro SLI Frame Rendering(SLI帧渲染),不是用来连接到8个屏幕,而是对单块显卡的输出进行加速。当然如果用户需要连接8个显示器,插两块FirePro V7900不使用CrossFire Pro就好了。
AMD FirePro和NVIDIA Quadro之间的对比:一块V7900显卡就可以连接3~4个显示器;而竞争对手的Quadro 4000则需要2块,带来了更大的功耗和成本。NVIDIA Quadro Mosaic技术最多可以在单一系统中使用4块显卡输出8个屏幕(NVS 420/450、AMD FirePro 2450/2460 Multi-View这些4屏卡还可以做到更多)。相比较而言,AMD Eyefinity单卡支持更多输出也许会遇到一个问题,就是当单卡显示复杂内容时的处理能力可能不足,不过我们也可以在V7900上只接2个甚至1个显示器啊。
AMD FirePro V5900实物:2个DisplayPort加上1个Dual-link(双链路)DVI最多可连接3个显示器,类似于部分Radeon消费级显卡,仍然超过NVIDIA只有单卡双屏的支持 #p#page_title#e#
FirePro V5900的显存容量从V5800的1GB提升至2GB,尽管流处理器数量、单/双精度浮点性能都明显低于后者,却由于前面提到的GeometryBoost技术在图形工作站应用中不落下风(至少从目前看到的Benchmark数值如此)。
CAD/DCC、医疗图像应用演示,S400同步模块
FirePro V5900安装在一台戴尔T1600工作站中,运行SolidWorks软件
笔者以前看到飞机模型的设计,比较多使用的是Dassault(达索)公司的CATIA软件,特别因为其在曲面支持方面的优势。不过随着SolidWorks被达索收购,数年之后出现上图这样的情况也不算意外。根据我们的经验,SolidWorks擅长的领域主要还是在相对于Siemens NX(原UGS)、Pro/E这些大型CAD/CAM软件而言,一些中小规模的机械、模具设计/制造等领域。当然每种软件都有各自的特点和使用习惯,另外根据功能的不同和多少(比如是否带有分析模块等),价格上也会有相应体现的。
VBO(顶点缓冲对象)是一个OpenGL函数,Dassault CATIA和SolidWorks两款软件中都有支持。AMD专业显卡在这方面与Dassault有一定的合作及优化,因此运行这些软件时能够大幅提升性能。当然这个前提是显示子系统成为瓶颈的时候,如果您的模型由于特征等原因“卡”在了单个CPU核心线程上,只有换用主频快、TurboBoost更高的处理器了。
SolidWorks对专业显卡性能的要求相对不算高,通常一块FirePro V3800/5800/5900足以胜任了。
ATI FirePro S400同步模块
ATI FirePro S400同步模块推出大约有2年的时间,其功能相当接近于NVIDIA Quadro G-sync II同步子卡。用途之一是将GPU显示刷新频率与外来同步源相锁定(Genlock,亦称同步锁相),如使用摄像机拍摄显示器或者投影机输出的画面,就可以避免由于刷新不同步而导致的异常闪烁(相信很多人在看电视时见到过)。还有一个重要的功能,就是将同一主机内部或者多个系统中GPU的刷新频率进行同步(Framelock,帧锁定),这在拼接输出大屏幕立体投影时相当重要,因为液晶快门眼镜的切换速度必须和保持每一路显示输出的刷新频率同步,这样才能达到理想的立体视觉效果。
每个FirePro S400同步模块最多支持4个GPU,哪怕是一块主板上的4块FirePro V7800/7900或者更高端的专业显卡。当然如果是双插槽显卡,需要选择Tyan S7025等同类支持的主板和对应的机箱、电源供电才能实现。NVIDIA Quadro G-sync II在一个系统中只能支持2块显卡,也就是说上图中那一排黑色连接器的数量减半了。
ATI FirePro V5800 DVI显卡同时输出ChiLin医疗视频 + MRI诊断图(右侧使用EIZO专业显示器竖屏显示)
ATI FirePro V5800 DVI是一款专门针对医疗图像应用专业显卡,从型号看出它带有2个DVI输出接口。V5800 DVI的特点是最大能够支持2560x2048 60Hz的数字分辨率(使用封包像素模式),可驱动两台5MP(五百万像素)的显示设备,并具备完整30-bit精度显示管线和每个RGB颜色分量8-bit、10-bit、16-bit HDR(高动态范围)渲染。
现场演示的Autodesk Mudbox 2012软件
Autodesk Mudbox 2012是一款数字雕刻软件,现属于欧特克公司传媒与娱乐产品线的一员。尽管笔者在IDF2011北京的报道中曾经提到,用于单路工作站的Intel Xeon E3处理器集成的HD Graphics P3000显卡得到了Autodesk AutoCAD、Inventer等软件的认证,但现在看来同样来自Autodesk的Maya、Softimage等使用传统OpenGL显示接口的DCC动画类软件等,仍然推荐使用AMD FirePro和NVIDIA Quadro独立专业显卡。
首款计算、专业图形、VDI多功能服务器解决方案
发布会现场我们还看到了一块“奇怪的显卡”,上面安装了散热片但没有风扇(被动式散热),并且只有一个DisplayPort输出接口。它是用于服务器上的GPGPU(通用计算GPU)卡吗?
#p#page_title#e#
在这块卡的背面,我们发现了右侧的“ATi STREAM TECHNOLOGY”logo字样,再加上黑色的PCB,让笔者想起了AMD的FireStream GPU计算加速卡产品线,目前的最新一代应该是FireStream 9350/9370。
然而该卡的型号标识却是FirePro V7800 2GB,显然它不是一块普通的V7800,那么这到底是何方神圣呢?
AMD同时还发布了专门用于服务器的FirePro V7800P,这个红色PCB的才是它的正式版本,发布会现场那块应该是比较早期的样卡
AMD宣称FirePro V7800P是第一款针对计算、专业显示和VDI应用的多功能服务器解决方案。下面我们来看看它的规格特性:
FirePro V7800P能够支持3种API:用于图形的OpenGL 4.1、DirectX 11(包括DirectCompute)和OpenCL 1.1通用计算标准。另外,它已经通过了戴尔PowerEdge M610x刀片式服务器的认证,可以组成完整的服务器解决方案。
记得笔者当年测试FireStream 9170(也可能是9150,记不太清了)时,发现它只具备Radeon游戏显卡的D3D性能,而没有像FirePro那样驱动层面上的OpenGL专业显示优化。其实NVIDIA Tesla C2050/2070通用计算卡的情况也是类似,因为所有这些的硬件可以说都是脱胎于消费级显卡。
进一步查看FirePro V7800P的规格,除了128GB/s带宽的2GB GDDR5显存之外,它的单/双精度浮点性能分别为2.0 TFLOPS和400 GFLOPS。为了保证正常的散热,V7800P安装所在服务器的位置需要10 CFM的风量。
CPU+GPU高性能计算应用早已不是什么新概念,从迄今为止取得最好Top500排名的天河一号A(NVIDIA Tesla方案,之前为AMD Radeon)到曙光星云超级计算机,从被动散热(用于服务器)的Tesla M系列到AMD FireStream。GPU在HPC服务器集群中带来的浮点性能提升人所共知,而FirePro V7800P为什么要把专业显示特性也加进来?用于VDI桌面虚拟化的意义又是什么呢?
FirePro V7800P,还有一款尚未正式发布的V9800P的“5大特性”:高性能/被动散热、针对Windows Server 2008认证、RemoteFX远程图形支持和VDI、革命性的浮点性能,还有CAD/DCC应用程序优化
目前流行的桌面虚拟化应用,无论是Citrix XenServer/XenDesktop还是VMware View,通常都是运行在标准服务器平台上,每台客户端显示的2D/3D?内容都是使用由CPU来仿真处理,效率不高之外显然无法胜任复杂一些的图形、视频应用,那么如何满足传统文字办公等之外的桌面虚拟化图形显示需求呢?FirePro V7800P这类产品可以说就是为此而产生的。
其实单就显卡而言,除了V7800P之外每一款FirePro都具备这样的功能,只是V7800P专门针对服务器环境而做出了优化(主要是散热部分)。
如上图示例方案,每一个通过网络连接到服务器的桌面客户端(可以是瘦客户机等)都能分享FirePro的专业显示和GPU计算性能资源。这可以由Windows Server 2008操作系统的RemoteFX技术来配合实现,相对于微软原来的RDP(远程桌面传输协议),RemoteFX能够提供更好的显示效果和网络带宽利用。
在以前,如果要远程操作(主机)位于数据中心内的专业图形应用,IBM/惠普和戴尔分别推出了刀片、机架式工作站,由于空间限制早期只能搭配移动版Quadro显卡,现在有的也可以支持标准专业显卡。但问题是每台工作站同一时间只能有一个用户使用,无法像VDI那样多用户分享硬件资源;另外IBM、戴尔的远程图形卡,惠普的RGS远程图形软件也都是要卖钱的。
现在随着技术的不断发展,GPU计算、图形工作站上的专业显示应用也可以通过VDI来虚拟化了,笔者2、3年前曾经有过的设想成为现实。不过话又说回来,Server OS本来就支持多用户,这里改善的主要只是远程图形传输环节吧?实际效果又如何呢?
最后,我们再简单提一下AMD针对移动工作站(笔记本)的FirePro M系列专业显卡。AMD在这方面有可能只是卖芯片,不过我们看到显存频率等规格也都列出了。 #p#page_title#e#