四维医学成像设备的架构设计
对所有最新或重新设计的医学成像系统来说,这些应用目标意味着需要最大的计算能力,以便在最短时间内提供最高分辨率的图像。这通常也意味着应最大化内核和线程数量以支持目标形状系数,因为许多成像算法是支持并行处理的。
但在决定使用哪种多核处理器之前,需要仔细考虑系统的可扩展性和可升级性。由于半导体和存储领域中器件性能和数据速率的飞速发展,能够方便地使用下一代器件或在系统中增加更多节点(当使用集群计算时)而无需重新设计和重新测试整个系统十分重要。如果你仅通过一次再编译便能成功,那你就太厉害了。
“解决方案的可扩展性是使用户能够在不同产品中复用软件和算法的关键。”Intel公司医疗部门经理Bob Ghaffari指出,“为使芯片架构能够满足从高端CT设备到低功耗便携式超声波产品的各种性能和功率要求,就必须采用可扩展的架构。”
|
设计的主要构建模块包括模拟前端、数字后端、图形显示渲染器以及具有可选网络功能的系统控制器等。 |
当试图确定需要采用多少内核和线程时,可以将数据通路视为处理瓶颈,因为数据的处理速度超过存储速度将是毫无意义的。如果使用本地硬盘,那么串行ATA(SATA)或串行连接SCSI可能就是制约因素。此外,如果需要将数据写到网络上的设备,那么网络连接(以太网或无线网络)则有一个已知的最大带宽。
对于选择处理器数量和类型以及如何有效利用它们,Intel公司提出了一些指导方针:首先确定电路板性能和外形要求;然后运行代码;接着不断优化代码,直到经过合理次数的设计反复后才停止优化;最后调整系统性能,如果性能达到目标,则完成了架构的选择,如果需要更高的系统性能,就需要增加用于加速卸载的外部器件。
从少量三维图像创建四维图像可能需要给每个病人准备约500MB~5GB的数据空间。随着分辨率和图像片数量的增加,这个数字肯定还要提高。考虑到每天的病人数量,能在快速中央服务器上存储所有病人数据,并使用本地PC来显示图像的瘦型客户机网络开始变得越来越有吸引力了。
当便携性成为必备性能时,基于MicroTCA架构的系统可能是最好的选择。MicroTCA可以在很小的外形尺寸下提供强大的计算能力、带宽和内置网络连接性能。同时,四维图像显示需要数千兆字节的临时存储器。设计工程师必须考虑图形存储器(如图形双倍数据速率(GDDR)内存)的容量、类型和速度。
设计的主要构建模块包括模拟前端、数字后端、图形显示渲染器以及具有可选网络功能的系统控制器(图1)。模拟前端执行数据采集和图像预处理功能,它们很大程度上依赖于可能需要使用一个或更多的DSP、FPGA或ASIC芯片的成像模态。数字后端包括图像重构和后处理模块,根据成像模态的复杂程度,该模块可能是一个简单处理器(GPU),或是一个(或更多)包含多核多线程功能的高级处理器(CPU/GPU)。对于图像处理和重构等苛刻任务而言,当需要最高的性能时,像Cell Broadband Engine这样的处理器可能更合适。
如果今后要用到多个内核,那就需要认真考虑与软件相关的选择,例如操作系统、消息传递接口、并行编程语言等。即使其它一些琐碎的决定(如使用哪种文件系统)也会变得十分重要,需要仔细考虑。