基于轮廓分段的目标识别与定位算法研究文献综述
2020-04-14 19:44:32
机器视觉是机器人获取外界信息的一种方法,通过对图像的像素分布、强度以及颜色等信息的分析与研究,实现了对目标的识别、检测和测量等功能,最后把分析的结果给控制设备,然后开始后面的操作。
传统的打标系统中,利用导槽对产品进行位置修正,再通过激光打标机机打标。这种方式一种导槽只能对应一种需要打标的产品,在一条流水线上很难实现多种产品的打标。智能打标系统中,可以利用机器视觉技术对多种需要打标的产品进行识别与定位,一条流水线上可以任意摆放多种需要打标的产品,通过视觉处理得到产品的型号与位置信息,将此信息发送到激光打标机,激光打标机就可以正确的打标。其中关键的技术就是目标识别与定位,识别与定位的准确性直接影响打标系统的整体性能。机器视觉以其优良的精确性、客观性、可重复性和易于信息集成的特性,可以作为以上问题的解决方案,目标识别与定位是大部分机器视觉系统的基本要求。
目标识别要求机器视觉系统能够在多个不同类别的目标中找到特定类别的目标,包括相同类别的目标识别、不同类别的目标识别这两方面的要求。目标的定位指识别了目标所属的类别后,还需得到目标的位置信息。在目标发生线性形变而造成几何形状不同,即平移、旋转与尺寸变化时,识别算法必须能够给克服这种影响,把目标归为正确的类别。目标识别除了满足平移、选择和尺度不变性的基本要求外,往往还需要对一定范围内的非线性变化具有鲁棒性。非线性变化主要包括仿射变换、非刚性运动、遮挡和图像噪声导致分割错误等引起的形状变化。目前并没有一种通用的方法能够很好地同时处理以上非线性形变问题,对非线性形变目标进行识别一直都是目标识别领域的研究热点。
根据形状描述子的表达方式不同,目标识别算法可以分为基于形状轮廓的识别与基于形状区域的识别两种。基于轮廓的识别首先提取目标边界的一系列顺序像素点,像素点的顺序沿着边界排列。轮廓的形状描述符由提取的顺序像素点变换得到,不同的变换对应于不同的形状描述符。常见的基于轮廓的形状描述符有基于集合特征的描述方法、形状上下文、链码、傅里叶描述符、形状签名、多边形近似和曲率尺度空间等。基于形状区域的识别对形状中所有的像素点进行运算,得到某些关于目标的区域特征,不同的区域特征对应不同的形状描述符。常见的基于轮廓和基于区域的识别方法有各自的优缺点,前者只需处理边界点,运算的数据量较少,因此算法执行速度较快,但是当两个目标具有相同的轮廓,而边界内部信息不相同时,基于轮廓的识别方法就无法满足要求。基于区域的识别算法适用范围较广,其可以描述带有孔的复杂的形状,但是其需要处理目标的所有像素点,计算量远远大于边界点的计算,因此其实时性往往相对基于轮廓的识别方法较差。
基于目标形状轮廓的识别方法,根据一定的准则对形象间的相似程度进行描述。一般用数值来对两个形状间的匹配结果进行表示,这个数值称为形状相似度或者形状距离。根据对轮廓边界点所提取的特征不同,可以分为基于几何特征的描述方法、形状上下文、多边形近似、链码、形状签名、曲率尺度空间和傅里叶描述符等。
在三维空间中,当视线中的目标深度和目标距离相比十分小时,由于相机视角和位置的不同引起目标形状的变化可以近似等效为仿射变换。对于仿射目标识别,学者们提出了各种基于轮廓特征的仿射不变函数。在Hu提出矩不变量的基础上,Flusser等人提出了用于识别仿射变换下手写字符的仿射矩不变量。由于涉及到计算目标轮廓的高阶矩,基于矩不变量的特征描述方法具有很高的计算复杂度,而且对噪声也十分的敏感。部分学者利用主分量分析和独立分量分析提取描述轮廓特征的一组基函数,利用这组基所构造的仿射不变函数对噪声和目标的微小形变具有较好的稳定性。由于降维过程中涉及到计算轮廓参数的互相关矩阵,所以这类方法也具有很高的计算复杂度。Abert等人于1990年提出了仿射不变傅里叶描述子。它更关注目标的全局特征,而对局部特征或者细节信息的刻画不足,所以实际应用中对目标的区分能力相对较差。Wang和Teoh采用B-样条函数的曲率尺度空间实现了二维仿射目标匹配。它利用B-样条函数得到目标轮廓的连续曲线,从而产生曲率尺度空间图像来描述轮廓特征。与仿射傅里叶描述子相比,所提特征描述方法对噪声不敏感并且所需要参数较小。小波变换具有良好的时频分析特性,能够很好描述目标局部特征和细节信息。但是在小波尺度选择时,需要人为选择合适的尺度,在实际应用中还不成熟。康建玲根据形状的边长和面积比来动态确定轮廓点的采样点数,减少数据处理量,加快了识别匹配效率。杨亚飞将自学习的模型应用到形状匹配中,通过对形状相似度的学习,不断对原来相似度的阈值进行更新,提高了后续目标的识别率。黄国伟等利用主成分分析来对形状上下文的特征矩阵构成的协方差矩阵进行降维,有效地提高了识别效率和抗干扰能力。链码将二维图像转换为四个或者八个方向的一维链码序列,链码具有不同的形式,Freeman链码是常用的形式。顶点链码是将边界点中的凹点、凸点和连接点分别用不同的数值进行表示,从而描述形状轮廓。由于其在产生时需要对边界像素进行判断,因此其计算复杂度会比较高。Jongan等根据得到链码统计直方图,重新排列差分链码的直方图,然后将运算的结果用于检索。多边形逼近是以最小误差准则,以多边形对原始轮廓进行表示。王等将轮廓均匀分割为若干轮廓段,并基于此得到近似多边形,利用所得多边形的几何中心与前后三个顶点组成距离特征对形状进行表达。形状签名是指用某种一维函数对二维形状进行描述,Akrem,Volodymyr和Emillio分别对形状签名进行描述,在归一化处理后满足平移、缩放、旋转等不变性的要求,但是其对噪声敏感,形状的轻微形变度可能引起较大的匹配误差,因此非常依赖于预处理技术。常用的形状签名有质心距离、复数坐标、边界曲率、边界切线角度、弦长函数和三角形面积等。傅里叶描述符是最常见的变换域的方法,其对闭合轮廓进行傅里叶变换,由变换系数对形状进行描述,低频系数和高频系数分别对形状的整体特征和细节信息进行表达。Zhang先对图像进行坐标转换,然后在变换后的极坐标上应用2D傅里叶变换,并由极坐标上的傅里叶变换系数的幅值作为目标形状的特征描述符。曲率尺度空间由F.Mokhtarian在1996年提出,其被广泛应用于形状分析领域。CSS算法首先选取封闭边界的任意像素点为起点,对边界进行固定数目的均匀采样,然后使用可变参数的一维高斯函数对边界进行平滑,计算采样点处的曲率并找出曲率过零点,构造出一副尺度空间图,计算图中叶瓣最高点的对应的匹配代价,以最低的匹配代价作为两幅曲率尺度空间图的最终匹配。曲率尺度空间描述子计算复杂度较高,计算量大从而导致实时性不理想。田等通过子空间投影的方法,对特征空间进行降维,降低数据处理量,使得算法具有更换地实时性。
{title}
2. 研究的基本内容与方案
{title}一、一、基本内容
1、基于轮廓分段的思想,将识别算法分为粗匹配和精匹配两部分,形状间的相似度由这两部分的结果加权得到,识别算法对形状具有较好的全局和局部信息描述能力。
2、为了增强算法对噪声和非线性形变的适应能力,采取最小外接矩形的特征点提取方法,并以最小外接矩形的形心作为目标的中心,由此构造对形变具有较好鲁棒性的特征描述子。
3、为了加快匹配的速度,充分利用粗匹配中的扩展编辑距离矩阵和轮廓点的顺序信息,从总体上得到不同轮廓段之间的匹配关系,精匹配只需在匹配的轮廓段间进行,减少匹配次数,加快算法总体的运行速度。4、完成了目标识别后,以目标形状的最小外接矩形中心作为位置信息,采用匹配相似度最高的轮廓段计算旋转角度,得到目标的定位信息。