工业检测应用中可扩展的微处理器视觉系统的评估框架
简介
本文引用地址:http://www.amcfsurvey.com/article/85676.htm一般来说,在诸如机器视觉、目标自动识别等要求严格的工业和军事应用场合中使用的成像系统都需要有实时高性能的计算处理能力。一直以来,这些成像系统依靠着专有的体系结构和定制的组件实现各自的性能,但近年来高性能通用微处理器技术的进步已经使人们生产出了大量可应用于高性能处理系统的低成本元件。
高性能成像系统尤其是使用了可扩展的多处理器体系结构的系统的设计的一个普遍缺陷就是不能平衡好计算带宽和带I/O接口的存储带宽之间的关系。最近,带有大容量内部高速缓存和高性能外部存储器接口的微处理器的引入,使得设计一个计算和存储带宽之间得到平衡的高性能成像系统成为现实。
微处理器利用了板级存储器和I/O体系结构,使用这种微处理器及存储器的系统有一个重要性能。系统并不扩展存储器总线带宽,同样的,微处理器的引入一般不是为了改善性能,在提升了一些性能后它们会达到一个极限值。另外,I/O带宽在总体性能上发挥着重要的作用。
这篇文章的目的是为了引入一个框架,使得开发者能够选择一个能提供实时视觉应用场合所需要的性能和可扩展性的微处理器系统。在可编程成像系统的选择问题上,我们重点考虑下面三个方面:(a)系统是“本机”的还是采用协处理器模型?(b)哪种处理器在平衡应用中的处理和I/O关系上更具恰当性?(c)总成本是多少?为了更好的理解我们的假设,我们将对四种不同的处理器在元件检测应用中表现出的性能进行分析。
微处理器评估
为了体现各种具有尖端技术的微处理器的优点,我们选择了四种新型微处理器进行评估:Analog Devices公司的21160Hammerhead,Intel®(P3-450),Philips公司的半导体TM1300 TriMedia和德州仪器(TI)的C6701.你也可以使用这种框架评估其他的处理器。
下表给出了所选处理器的重要特性。假定各种处理器在测试计算性能时是相互独立的。集群模式设计将很快使总线达到饱和——也就是说增加额外的处理器并不能达到提升速度以提高计算性能的目的。做出这个假定是因为大多数多处理器为了达到可扩展性,其协处理器板已经独立开或采用本地存储器设计。唯一采用非本地存储器设计的是PⅢ-450,引入它是为了与其他处理器进行比较。
上表的性能参数在它们各自公司的文献中可以找到,它们是以优化了的汇编语言程序为基础的。除了Intel使用复杂指令系统计算机(CISC)外,所有的微处理器都使用了超长指令集架构(VLIW)体系结构。每个CPU的胶连逻辑成本体现了连接处理器与外在系统所需额外组件的成本。
应用描述:产品线上的元件工业检测
当产品经过检测站时,检测站检测产品的颜色和形状,然后,根据标准来判断是否接受这件产品。元件以任意角度安置在传送器上以供成像。检测算法检测连接颜色和形状的区域,并处理在这些区域内的数据,再把结果应用于神经网络识别器中。产品在快速驶下生产线的时候被检测。照相机以每秒30张的速度收集图像以确保在每张图像上有至少有50%交叠,从而确保每一部分至少有一次被完全显现。图像规格是512×512,24位彩色(RGB).
评论