基于结构特征的空间目标识别算法

2024-05-09

基于结构特征的空间目标识别算法(精选8篇)

篇1:基于结构特征的空间目标识别算法

基于结构特征的空间目标识别算法

提出了基于结构特征的空间目标识别算法.卫星结构的对称性使得卫星的`一维距离像具有对称性,碎片结构的不对称性使得碎片的一维距离像不具有对称性,文中首先应用RELAX算法提取出目标的强散射中心的位置和幅度,然后根据模式匹配和对称性测度两种方法来检测强散射中心是否具有对称性,进而对卫星和碎片进行识别.经过计算机仿真实验,该算法取得了比较好的识别效果.

作 者:马君国 赵宏钟 李保国 MA Jun-guo ZHAO Hong-zhong LI Bao-guo  作者单位:国防科技大学ATR实验室,湖南,长沙,410073 刊 名:现代雷达  ISTIC PKU英文刊名:MODERN RADAR 年,卷(期): 27(7) 分类号:V474.2 关键词:模式匹配   对称性测度   空间目标识别  

篇2:基于结构特征的空间目标识别算法

基于轨迹特征的预警系统目标识别

文章针对弹道导弹预警系统目标识别任务的特点,通过分析弹道导弹和卫星目标间的运动特性差异,给出了预警雷达基于最小矢径这一特征区分弹道导弹和卫星的流程,并分析了弹道导弹射程、雷达测量精度、观测时间、采样间隔等因素对此流程的影响.仿真结果表明:利用最小矢径实现弹道导弹和卫星的.区分是可行的,而且此法对雷达测量精度要求不是特别高.

作 者:董洪乐 曹敏 黎湘 胡杰民 Dong Hongle Cao Min Li Xiang Hu Jiemin 作者单位:国防科技大学空间电子信息技术研究所,长沙,410073刊 名:空间电子技术英文刊名:SPACE ELECTRONIC TECHNOLOGY年,卷(期):5(3)分类号:V4关键词:预警雷达 最小矢径 弹道导弹 卫星

篇3:基于结构特征的空间目标识别算法

关键词:目标识别,二分搜索法,种子点,边界点

0 引言

机器人足球比赛是一项集娱乐、体育与科学研究为一体的比赛活动。它为人工智能、机器人学、多智能体系统等其它交叉或前言学科提供了一个理想的仿真和实验平台。机器人足球比赛系统包括4个子系统:视觉子系统、决策子系统、无线通讯子系统和机器人 (小车) 子系统。为了能在比赛中取得好的成绩, 必须让机器人能根据其所处的环境变化做出相应的决策, 所以视觉子系统在机器人足球比赛中占据着非常重要的作用。

1 识别的对象

在足球机器人视觉子系统中, 视觉子系统不能够直接识别出机器人对象, 而只能通过机器人小车顶部的颜色标记, 利用这些颜色标识的不同特征来识别每一个机器人。也就是说, 视觉子系统在机器人足球比赛中识别的对象是具有不同形状和颜色的色标块, 而视觉子系统的任务就是利用一定的目标识别算法计算色标块的位置信息和颜色信息, 并根据色标块的组合方案来确定机器人的位姿信息。本文提出了针对这些不同色标块形状的目标识别算法, 该识别算法主要用来对色标块的定位, 对于具体机器人小车的识别, 其依赖于具体的色标设计方案, 本文不加以讨论。

2 识别算法分析

在足球机器人的视觉识别中, 首先, 需要准确输出比赛场地中各个机器人和球的位姿信息;其次, 要求视频的捕获频率为30~60帧/秒, 并完成识别, 作出控制决策。因此, 识别速度快, 而且识别准确的目标识别算法是非常重要的。目标识别算法首先是对色标块中心的确定, 确定色标块的中心主要有两种不同的思想:一种是基于重心法的, 即识别色标块是通过像素信息来识别的, 那么色标块的中心就是构成它的所有像素点的中心;另一种是基于边界点的, 该思想认为色标块都是有规则的几何形状, 那么只要搜索出色标块的几个特殊的边界点, 就可以求出色标块的中心。本文讲述的一种二分搜索算法采用第二种思想, 并完善了边界点的搜索算法。

3 一种二分搜索算法

二分搜索算法根据色标块的几何特征, 借鉴了计算方法中解非线性方程和排序算法中的二分法原理, 算法分三步, 首先采用网格法, 确定种子点, 然后再以此种子点用二分搜索算法确定色标块的中心坐标, 最后进行区域背景颜色的填充。

3.1 确定种子点

本文采用网格搜索法来确定种子点, 如图1所示, 对所捕获的图像自上而下, 自左而右以一定的步长进行扫描, 找出与目标像素相同的点, 作为种子点。网格搜索重点是合理的选择步长, 如果步长太小, 会增加搜索的像素点, 导致搜索时间加长;如果步长太大, 可能会漏掉目标色标块;所以步长的选择, 必须使目标色标块至少落在一个网格点上, 并尽可能大。如图1给出了方形、等腰直角三角形、圆形、矩形等形状的色标块的步长的确定方法。

3.2 二分法搜索精确定位

找到图像中目标色标块内部一种子点后, 就可以从该种子点出发, 向外扩张逐像素点搜索其四个方向上的边界点。由于本视觉系统采用的颜色模型是RGB颜色模型, 在RGB颜色模型下, 同一色标在场地内的颜色信息的变化范围极其广泛, 生成一个完全的颜色信息表格需要长时间的反复采集填充, 且很难真正得到可以覆盖所有的信息的颜色库, 所以辨识结果常有空洞, 如图2所示:

以种子点S向右搜索, 遇到空洞点M时, 不能认为M点就是要找到的边界点, 因为从M点继续向右搜索时, 仍然有属于同一目标色标快的像素点。通过大量的反复试验, 虽然辨识结果会出现空洞, 但连续的空洞点数量一般不会超过三个。确定了寻找边界点的方法后, 我们接下来的工作就要精确定位目标色标块, 对于不同形状的色标块, 定位的方法也略有不同, 具体如下:

3.2.1 方形和矩形色标块的定位

以种子点M1出发搜索色标快的左边界点L1, 水平向右搜索其右边界点R1, 计算L1和R1的中点M2;再以M2为新的出发点, 垂直向上找左边界点L2, 以L2为出发点, 水平向右找有边界点R2, 计算L2和R2的中点M3;重复上述过程, 得到一个序列M1- (L1, R1) -M2- (L2, R2) -M3- (L3, R3) -……。由L1, R1距离的有限性, 则必存在一个i, 使得Li, Ri重合, 则该点就是所要找到的最上面的顶点A, 同样方法, 可求得最下面的顶点B, 过程如图3所示:

如果A点、B点的坐标分别为 (x1, y1) 、 (x2, y2) , 则中心点O的坐标 (x, y) 为:

3.2.2 圆形色标块的定位

以种子点M1出发搜索色标快的左边界点L1, 水平向右搜索其右边界点R1, 计算L1和R1的中点M2;以M2为新的出发点, 垂直向上找上边界点A, 再垂直向下找下边界点B, 计算A和B的中点O即为所求, 如图4所示。

如果A点、B点坐标分别为 (x, y1) 、 (x, y2) , 则中心点O的坐标 (x, y) 为:

3.2.3 等腰直角三角形色标块的定位

以种子点M1出发搜索色标快的左边界点L1, 水平向右搜索其右边界点R1, 计算L1和R1的中点M2;以M2为新的出发点, 垂直向上找左边界点L2, 再以L2为出发点, 水平向右找有边界点R2, 计算L2和R2的中点M3;重复上述过程, 得到一个序列M1- (L1, R1) -M2- (L2, R2) -M3- (L3, R3) -……。由L1, R1距离的有限性, 则必存在一个i, 使得Li, Ri重合, 则该点就是所要找到的最上面的顶点A, 如图5所示。同样方法, 可分别求得等腰直角三角形其他两个顶点B、C。

3.3 区域背景颜色填充

为已识别目标区域填充背景色, 可以避免在下一个网格种子点上对本区域进行同样的重复搜索。此外, 在机器人足球这类多机器人系统中, 由于机器人间的争抢碰撞, 存在多个机器人粘连的问题。由于本文中我们是从左上角开始, 按由左到右, 由上至下在网格点上顺序搜索, 这样在发生小车粘连的情况下, 按文中的小车定位方法, 最先搜索到的是左上方的第一个机器人小车, 在该小车定位后, 该小车顶部的色标快区域已被背景颜色填充, 这样就可以很容易地把发生粘连的两个小车分离开来。

4 目标识别算法的测试结果

11vs11比赛中我方十一个机器人的分布情况如图6所示。在处理速度方面, 利用改进了的目标识别搜索到十一个小车所需要的时间是19.7ms;而使用传统的目标识别, 搜索到十一个小车所需要的时间是28.3ms。很明显, 改进了的目标识别算法具有很高的运算和反应速度, 这无疑能在实际比赛中发挥不可忽视的作用。

5 结束语

在机器人足球比赛中, 能否占据时间上的主动, 先发制人, 往往是整场比赛的关键。经过改进了的目标识别算法, 具有较高的识别速度, 也具有较高的准确性和对抗性。这有助于整个系统发挥最大的效率, 在比赛中节省宝贵的时间, 更好地抓住稍纵即逝的进攻机会。

参考文献

[1]尹美林, 阳春华.足球机器人视觉研究的现状探讨[J].株洲工学院学报, 2005 (4) .

[2]徐大宏, 吴敏, 曹卫华.足球机器人视觉系统中彩色目标分割方法[J].中南工业大学学报, 2002 (4) .

[3]曹爱增, 石兴广, 刘峰, 等.机器人足球识别算法研究[J].济南大学学报 (自然科学版) , 2006 (3) .

[4]洪炳熔, 刘新宇.基于视觉的足球机器人系统[J].计算机应用研究, 2001 (1) .

篇4:基于结构特征的空间目标识别算法

摘 要:针对智能车辆的弯道检测问题,本文依据车道线灰度相似特性和摄像头成像几何关系提出了一种基于视觉检测弯道的方法。文中首先介绍了基于形态学处理的直线检测方法,其中着重介绍了应用形态学提取车道信息的方法和利用车道线宽度比例法分割图像的方法;然后详细介绍如何根据直线检测结果和真实车道线的重叠状态实现实线曲线的检测;最后重点介绍了融合实线检测结果、成像几何关系、车道投影特征和单目测距模型实现虚线车道线检测的方法。实验结果表明基于车道线投影特征、灰度相似特性和摄像头成像几何关系的弯道检测方法具有很强的鲁棒性和抗干扰性。

关键词:驾驶辅助;区域生长;成像几何;曲线拟合

中图分类号:U467.5 文献标识码:A 文章编号:1005-2550(2016)06-0065-07

Abstract: For detecting the curve lane on all intelligent vehicles,this paper proposed a visual detection method based on the gray similar features on lanes and the imaging geometry of a camera. Firstly this paper introduced a linear detection method based on morphological processing, which focused on the application of morphology to extract the lane information and the image segmentation depending on the lane line width ratio; Then introduced how to realize the detection of solid curve line according to the overlap state between the linear line detection result and the real lane line; Finally introduced the method for detecting the dotted lane line ,which was realized by the fusion of the solid line, the imaging geometry, the lane projection and the visual model. The experimental results showed that the detection method based on the lane line shape features, gray similar characteristics and camera imaging geometry had enough robustness and anti-interference.

Key Words: driving assistance; region growing; morphology; imaging geometry; curve-fitting

前 言

驾驶辅助系统通过感知车辆行驶环境,结合车辆本身的行驶状态来评估当前行车安全性,当存在安全隐患或危险即将发生时通过视觉、触觉、听觉中的一种或多种方式提醒驾驶员,当有必要时可以启动车辆控制系统以减轻甚至避免危险的发生。车道线检测是行车环境感知中的重要探测目标之一,也是提高其它探测目标如车辆、道路标识、静止物体等的准确性的常规且可靠的手段。利用视觉检测车道线是公认的通用方式。

目前成熟的车道线检测技术大多都是适用于直道的,而实际的行车环境中即便是在高速或高等级的道路上,弯道出现的概率也不低,且据国家交通部公布的数据,每年弯道路段事故数量占总事故数平均约10%,故弯道检测的必要性是不言而喻的。通过准确定位车辆行驶前方弯道车道线位置可以避免弯道上行驶时无意识偏离本车道,也可以排除本车道区域以外非避撞目标对车辆行驶前方障碍物识别的干扰,提高识别准确率,还可以直接判断车辆前方道路可行驶区域以控制车辆的转向换道、加速、制动避撞等动作。

弯道检测技术难以成熟应用的主要原因是因为弯道形状多变、道路模型多样、干扰多。现有最常用也是普遍认为最有效的弯道视觉识别技术是采用基于道路模型的方法,通过建立一个最适应的车道曲线模型,然后基于车道线边缘点分布进行模型参数解算。在特定的结构化高等级公路上检测效果较好,但不同道路工况、车辆颠簸与否条件下的弯道模型都不同,预设模型不能适用于弯道幅度和形状多变的行车环境,同时边缘点是模型参数求解的计算依据,车道线以外的边缘点会对曲线模型准确性造成影响。

针对弯道识别的需求和已有弯道识别技术存在的不足,本文提出了一种弯道识别方法,能够适用于弯道幅度和形状多变的行车环境且受车道线外干扰点影响小。技术方案框架如图1所示:采用已经验证可靠的识别算法进行直线车道线检测;根据直线检测结果与实际车道线的重叠状态判断当前行车环境是否是弯道且有实线,若是则依据车道线像素灰度的相似性检测实线一侧车道线,否则采用前述道路模型拟合的方法进行两侧车道线检测;在实线检测结束后融合实线分布状态、车道投影特征、单目测距模型实现虚线曲线的检测。

1 线性车道线检测

智能车辆视觉系统通过摄像头采集RGB图像,根据通用的R、G、B分量提取方法按照30:59:11的比例进行图像灰度化以减少计算量;使用形态学进行图像预处理以消除掉部分非目标信息,凸显有用的目标信息;进行灰度拉伸增强图像对比度,便于后续的图像分割;针对已经形态学预处理车道线灰度特征明显的特点,采用计算量小的宽度比例法进行车道线二值化将车道线从背景中分割出来;依据车道线形状特性使用sobel左右分区45°算子进行边缘提取;根据车道线在图像中的分布范围利用设定区域约束的霍夫变换实现最终线性车道线的检测。对图像的有效信息进行分析不难发现道路上的车道线一般位于整个图像的下方约2/3区域,上方其余区域是天空等非路面区域。为了减少计算量,增强车道线检测的实时性、准确性,本文的算法只对整个图像下方的2/3区域进行处理。

1.1 形态学处理提取车道线

形态学是以形态结构元素为基础对图像进行分析的数学工具,基本思想是用具有一定形态的结构元素去度量和提取图像中对应的形状,以达到消除图像中无关信息从而增强目标的可检测性和最大限度简化数据的目的。运用形态学可以从原图中将车道线特征提取出来,排除原图中大部分干扰因素。

采用尺寸较大的线性结构元对图像进行先腐蚀处理后膨胀处理可以将车道线及与其相似的特征从图像上去除,而将其它信息加以凸显。通过对比形态学处理前后的图像,从特征差异中提取出主要包含车道线信息的车道线特征图。再利用尺寸较小的3*3结构元对车道线特征图像进行先腐蚀后膨胀的处理以有效消除较小的干扰因素,如车道印迹。

1.2 车道线二值化

从图3b)中可以看出,图像本身信息已经简化,图像中目标相对单一,为了提高检测准确性并减少计算量,本文采用车道线宽度比例法实现车道线的二值化,其依据是车道线在图像中所占的宽度范围的可标定性。当摄像头安装角度固定时,车道线宽度的像素数范围即可通过MATLAB等软件进行确定,即车道线宽度所占像素数与图像总像素数比例范围Ф可定。根据经验和研究的可行性,我们一般将图像下方2/3区域分为两区,靠近图像底部的1/3部分为近视野区,其余部分为远视野区,如图4所示。显然在图像中近视野区的车道线宽度像素数多于远视野区的车道线宽度像素数,故在进行阈值分割时远近视野区使用不同的车道线宽度比例。

2 实线曲线检测

2.1 车道线缺口填充

由于光照或路面干扰影响,有的图像中实线车道线二值化后不连续,会影响实线一侧的检测,如图7a)圆圈标记处的缺口。形态学闭运算可以用来填充比结构元素小的区域内细小空洞、连接邻近区域并不明显改变其形状,利用形态学闭运算可以有效地对车道线上的缺口进行填充。

2.2 确定实线曲线检测的起始位置

实线一侧由部分直线和部分曲线拼接而成,在检测过程中直线部分保留前述检测结果,曲线部分采用基于局部灰度相似性进行检测,拼接的一个关键问题是正确如何确定直线和曲线的分离点来保证检测的鲁棒性,而该分离点在不同道路、不同行车工况和状态中是动态变化的,会随机出现在远视野区或近视野区的任何位置。车道线二值化图中实线一侧上像素值相同(均为255)且通过闭运算处理之后基本连续,从此特性出发,分析直线检测结果(图8a))和二值化车道线重叠状态(图8b)),在图8b)中从下往上逐个查找二者的不重叠像素点位置,并通过各位置邻近行、列特特征对比的约束条件确定分离点(图8c)中“X”标记处),分离点所在行即为实线曲线检测的起始行。

2.3 依据车道线像素灰度的相似性检测实线车道线

车道线二值化闭运算图中实线上灰度都是255,基于局部灰度相似性从图8c)中分离点“X”和其所在行开始往上对所有相连且灰度为255的像素点逐个进行像素合并,合并过程中将被合并的每行车道线边缘位置更新到前述记录的车道线位置数据PL[NUMLINES]或PR[NUMLINES]中直到完成实线曲线检测。当两侧均为实线时,到此即完成了弯道检测,效果如图10所示;当另一侧为虚线时(图9),还需要继续进行虚线检测。

3 虚线曲线检测

根据单目摄像头的投影特征,建立了行车环境中目标纵向分布位置在摄像头中的成像几何关系,如图11a)所示,与此对应的真实车道线信息在空间坐标中的位置模型如图11b)所示,目标成像效果如图11c)所示。其中图11b)和图11c)中下方的四个“X”点为虚线曲线拟合的参照点,在整个拟合中参照点一旦确定即不发生变化。标记“?”表示待拟合的点,即从拟合起始行StH行向上逐行开始的虚线侧的边缘点。

图11c)中第一行两个参照点是左右车道线直线检测结果与图像底边的交点,其像素位置即PL[0]、PR[0],(Dy0,δL0)和(Dy0,δR0)分别是两个参照点在空间坐标系中与摄像头安装位置的纵向距离和横向夹角;StH是左侧虚线拟合的起始行位置,其确定方法类似于实线上曲线部分与直线部分分离点的查找方法,即基于直线检测结果与实际车道线的重叠状态,但由于虚线一侧是不连续的,故查找方向是自上而下,PL[StH-1]和PR[StH-1]分别是此行上的两个参照点像素位置,(Dy1,δL1)和(Dy1,δR1)分别是这两个参照点在空间坐标系中与摄像头安装位置的纵向距离和横向夹角;m表示从StH往上各行的行位置,PR[StH-1]是此行上的实线上参照点像素位置,(Dy2,δR2)是此参照点在空间坐标系中与摄像头安装位置的纵向距离和横向夹角。

3.1 位置模型建立

3.2 虚线拟合

与虚线上各像素点有关联的数据包括三维空间中实线侧与虚线侧基本稳定的横向间距、图像中同一像素行上实线侧车道边缘点的像素坐标和该行距离摄像头的纵向距离,同时从图11b)和已建立的关系模型中可以看出这三个参数也是计算虚线侧位置数据PL[]的必须已知量,这三个参数中前两者均已已知,未知的参数Dy2需要计算。

4 算法分析与测试

4.1 测试结果

为了验证本文提及的方法的效果,在Visual C++ 6.0平台上完成了所提技术方案与基于道路模型拟合的对比实验。本车道两侧均为虚线时检测方法相同,故对比测试是针对的两车道高速或市区弯道公路工况。测试中道路预设模型为性能较好的回旋曲线模型,从测试中提取了三段连续的高速公路图像样本,每段连续图像分别包括了700帧图片,并从测试中分别提取了出现车辆颠簸的图像样本和路面出现干扰标识的图像样本。

从测试数据和效果可以看出:基于道路模型拟合的方法虽然在弯道形状与预设模型特征一致的工况中检测效果理想,但此方法不适用于弯道形状与预设模型不一致工况。而本文所提的技术方案从原理上考虑了算法工况适应性问题,具有较强的鲁棒性:当弯道的幅度和形状发生变化时,实线内部的灰度合并方向、起始位置会跟随车道线分布状态动态调整,故适用于弯道形状多变、路面不平坦的行车环境;且实线车道线的检测只在连通的实线内部进行灰度合并,而车道线以外的干扰通常不和实线车道线连通,故算法抗干扰能力强。

5 结论

研究的弯道识别算法与传统的分段直线模型、道路模型拟合方法相比,通过动态检测能准确判断弯道的起始位置和走向,搭建的车道位置模型能较好地拟合出弯道的真实形状和位置。通过大量道路图像的验证测试,本算法适用于弯道形状多变的行车工况,具有较强的鲁棒性。

参考文献:

[1]徐岩, 雷涛.XU Yan,LEI Tao. 基于形态学方法的车道线检测算法研究[期刊论文]-铁道学报2009(1).

[2]刘涛, 黄席樾, 周欣, 黎昱. LIU Tao, HUANG Xiyue, ZHOU Xin, NI Yu.高速公路弯道识别算法[期刊论文]-重庆大学学报2003(7).

[3]葛平淑, 徐国凯, 宫长明, 赵秀春. GE Pingshu,XU Guokai, GONG Changming, ZHAO Xiuchun. 基于特征点提取的弯道识别算法研究[期刊论文]-大连民族学院学报2014(1).

篇5:基于结构特征的空间目标识别算法

空中目标识别是现代防空作战的重要研究内容.本文利用不同类型目标产生的`多类型传感器的数据信息对目标进行识别.为了训练神经网络目标识别分类器,将遗传算法和BP算法相结合,提出了一种新的自适应遗传BP算法,利用这种神经网络来确定指标的权值.仿真试验结果表明,基于自适应遗传BP算法神经网络的识别是一种简单、可靠的目标识别方法,具有很好的目标识别效果.

作 者:马峰 李富荣 张安 MA Feng LI Fu-rong ZHANG An 作者单位:马峰,MA Feng(西北工业大学电子信息学院・陕西西安・710072;92635部队・山东青岛・266041)

李富荣,LI Fu-rong(海军航空工程学院青岛分院・山东青岛・266041)

张安,ZHANG An(西北工业大学电子信息学院・陕西西安・710072)

篇6:基于结构特征的空间目标识别算法

上述算法对整洁干净的人民币冠字号字符具有较高的识别率,但对严重污染磨损的人民币冠字号字符识别率却很低。现实中人民币在流通过程会有不同程度的磨损污染,这些算法很难满足实际应用要求。

1基于模板匹配和多结构特征的纸币字符识别算法

模板匹配与多结构特征识别字符算法流程分为定位分割、分类识别和验证纠错3个阶段,其中在分割部分提出了比通用的垂直投影法鲁棒性更强的基于字符轮廓的字符分割方法;在最关键的识别部分首先对经过多尺度缩放后的待检字符区利用模板匹配扫描确定3个候选字符,然后利用鲁棒性更强的区域密度特征矢量对候选字符进行最终筛选判定。

1.1定位分割

1)字符区域初选

如图1a是目前市面上销售的点钞机所拍摄到的50万像素的整幅人民币正面图像及本文使用x、y坐标轴正方向,号码位于纸币正面的左下方,位置固定,通过人民币图像区域和背景图像区域的灰度差确定纸币的边界。然后,根据号码在纸币中的位置关系分割包含人民币号码的图像子域,如图1b所示。

2)基于轮廓分割字符

准确定位出字符区域并对其进行单字符分割是识别号码前关键的一步。最常用的方法是垂直投影法,这种方法易受二值化后噪声的影响,尤其是对污染磨损的纸币字符的分割,容易定位偏上或偏下,为克服这一方法的缺点,本文提出了一种鲁棒性更强的基于字符轮廓的字符分割算法,具体步骤如下:

(1)对字符区自适应二值化。其中阈值本身是一个变量,自适应阈值T(x,y)在每个像素点都不同,计算像素点周围的b×b区域的像素值加权平均,然后减去一个常数c来得到自适应阈值,位于(xi,yi)处阈值计算如下

对图像进行二值化,即

效果如图2b所示对不同的严重污染磨损的字符都实现了较好的二值化提取。

(2)从二值化图像中提取明亮区域的外轮廓并初步排除较小噪声。根据像素值跳变对二值化图像明亮区域提取外轮廓,同时设定阈值,阈值为单个数字字符1轮廓像素点数目的1/2,当轮廓像素点数目小于阈值则排除该轮廓,最终筛选出的轮廓图像如图2c所示,然后,遍历各轮廓像素点的坐标确定各轮廓的外接矩形如图2d所示,各矩形用左上顶点坐标 (x,y),高h、宽w表示。

(3)根据冠字号字符之间的位置关系进一步排除较大噪声进而分割出最终的单字符区。如图2c所示的划痕和混入的背景图案不能通过步骤(2)设定阈值简单的排除掉,利用冠字号字符的相邻字符在水平方向上字符间隔相同和在垂直方向上位于同一水平的特点:(a)在y轴方向上统计各外接矩形水平中分线y坐标{y0,y1,··· ,yj,··· ,yn}及各矩形高度 {h0,h1,··· ,hj,··· ,hn},计算出水平中分线坐标的中位数ymid及高度均值have,遍历比较各矩形高度hj及水平中分线坐标yj,若不满足{|yj-ymid|<have/2}时则排除该外接矩形;(b)在水平方向上统计各外接矩形垂直中分线x坐标{x0,x1,··· ,xj,···, xn},按x坐标递增顺序排序,然后依次计算出相邻x坐标间隔 {d1,d2,··· ,dj,···,dn};(c)去夹杂,从间隔中找到中位数dmid,若满足{xj+1-xj-1<3/2×dmid,xj-xj-1<dmid,xj+1-xj<dmid}时则排除该外接矩形;(d)填补,纸币字符与划痕连在一起或者字符磨损严重经过以上处理都可能被排除掉,因此,在这需要进行填补, 若满足{xj-xj-1>9/5×dmid}则填补一个矩形,填补矩形宽为相邻两外接矩形宽的均值wave=(wj+wj+1)/2,高为相邻两外接矩形高的均值have=(hj+hj+1)/2,左上顶点坐标x=(xj+xj+1-wave)/2,坐标y为相邻两外接矩形左上角顶点y坐标的均值y=(yj+yj+1)/2,经过以上处理获得筛选后的字符区如图2e所示。

(4)按规则尺寸归一化并获取最终待检区。这里采用一种与通常所指的归一化不同的方法,处理如下:(a)在y轴方向上找到各个外接矩形水平中分线y坐标{y0,y1,··· ,yj,···, y10},求得均值yave,所有外接矩形尺寸调整则都以直线y=yave为水平中位线向上下方向延伸;(b)在x轴方向上找到各外接矩形的垂直中分线xj坐标,每个外接矩形分别以自己的垂直中分线x=xj向左右方向延伸;(c)各外接矩形以(xj,yave)为中心尺寸调整为预先人为统计的最大字符的尺寸,最终获得待检字符区,如图2f所示。

1.2分类识别

根据各字符轮廓数目将字符分类并对待检字符区进行改进的模板匹配扫描,确定最匹配字符及对应最佳匹配区和2个候选字符及2个对应最佳匹配区。

1)基于轮廓数目的分类

根据待检字符的内外轮廓数目总和将字符进行分类识别,字符轮廓数目可分为:3轮廓、2轮廓和1轮廓。3轮廓:B, 8;2轮廓:A,D,P,Q,R,0,4,6,9;1轮廓:C,E,F,G,H,I,J,K, L,M,N,S,T,U,V,W,X,Y,Z,1,2,3,5,7。每一类中的字符只需要与自己所属字符类中的字符模板进行匹配识别与验证。步骤如下:

(1)对单个待检字符区进行自适应二值化处理获得二值化图像;

(2)筛除噪声轮廓,仅提取字符区二值化图像中所有明亮区域的外轮廓,计算所有轮廓上像素点个数,找到轮廓序列像素点数目最多的那个轮廓为字符轮廓;

(3)对(2)中筛选出的字符提取内部轮廓,按内、外轮廓数目之和将待检字符归类。

2)将分割的单个字符进行多级缩放获得n张不同尺寸的待扫描图像。

模板匹配法对字符尺寸要求较高,模板图像的尺寸固定,待扫描图像中字符的尺寸与模板尺寸越接近则匹配度越高就越能被正确识别,对分割出的单字符区按新定义的规则进行多次缩放,使得在放大与缩小过程产生的多个待检字符区中会有一个待检字符区中的字符尺寸能够极限接近模板尺寸,同时,缩放能对变形的字符进行校正,从而更好地解决纸币褶皱变形造成的错误识别问题。

规则:字符宽高比为1 ∶2,为了同时达到等比例调整字符尺寸和纠正变形字符2个目的,缩放既有按宽高步长1 ∶2等比例缩放,又要有非等比例缩放。针对50万像素的点钞机算法为例,使用的字符模板尺寸为12×22,通过1.1节定位分割出的单字符区尺寸为14×26,一方面,对字符宽和高分别以1个像素和2个像素为步长进行等比例缩放,得到13×24、14× 26、15×28三张待扫描图像,另一方面进行非等比例缩放得到图像尺寸13×25、14×25、14×27、15×27,最终,将14×26的单字符区图像按上述规则进行尺寸调整获得7张图像{Pi,i=0, 1,2,⋯ ,6},尺寸依次为:13×24、13×25、14×25、14×26、14× 27、15×27、15×28。

3)进行模板匹配扫描获得3个候选字符

单个待检字符区图像通过尺寸调整获得n张待扫描图像 {Pi,i=0,1,2,··· ,n-1},依次用待检字符所属分类中的模板对n张待扫描图像{Pi,i=0,1,2,··· ,n-1}进行遍历扫描,计算出对应每个模板的最佳匹配值及相应匹配区域,筛选出匹配度最接近的3个字符作为候选字符,具体步骤如下:

(1)利用单个模板对单张待扫描图像进行模板扫描计算并比较出最小方差。设图像PT为待检字符所属分类中的一个模板,尺寸为M×N,待扫描图像Pk(0≤k≤n-1),尺寸为Lk× Wk(Lk>M,Wk>N),匹配过程是将模板PT在待扫描图像Pk上滑动,计算PT与其覆盖下的待扫描图像Pk的子图像Pkx,y的方差Dk(x,y)

其中,(x,y)为模板左上角顶点在待扫描图像中的坐标, 其中0≤x≤Lk-M、0≤y≤Wk-N ,方差越小说明模板与相应图像越接近,对图像Pk完成模板扫描,总共获得(Lk-M+1)×(WkN+1)个方差值,比较计算出最小方差Dk并保存获得该最小方差的模板位置坐标(x,y)。

(2)依次用(1)中的模板图像PT按照步骤(1)所讲过程完成对n张待扫描图像{Pi,i=0,1,2,⋯ ,n-1}的扫描计算,对应n个待扫描图像得到n个方差{Di,i=0,1,2,⋯ ,n-1}及与n个方差值对应的坐标,从n个方差比较获得最小方差值DT和与该最小方差值对应的坐标,以该坐标为左上顶点在相应的待扫描图像上切割出尺寸为M×N的图像即为与模板PT对应的匹配区域。

(3)经过过程(1)、(2)可以得到单个模板PT对应的最小方差DT和匹配区域,依次用待扫描图像所属分类中所有模板按照(1)、(2)步骤完成模板扫描计算,例如,若待检字符区被归为2轮廓分类中,对应着2轮廓分类中的字符:A,D,P,Q, R,0,4,6,9共有9个模板,计算过后,对应着9个模板就有9个最小方差和与方差对应的9个匹配区域。

(4)将(3)得到的所有模板的最小方差按递增顺序排列, 提取获得其中3个最小的方差和与之对应的3个匹配区域, 最小方差对应的那个模板字符就是候选字符,3个最小方差对应着3个候选字符。

1.3验证纠错

1)提取区域密度特征矢量过程

(1)排除噪声的影响,对匹配区域去噪:模板扫描过程使用的是灰度图像,提取的匹配区域也是灰度图像,如图3a所示,尺寸为M×N,对匹配区域自适应二值化处理,二值图像中亮点像素值为255,暗点像素值为0,如图3b所示; 统计各个孤立亮点区域的像素点总数,以样本中数字字符1的像素点总数的一半为阈值,将所有亮点总数小于阈值的孤立亮点区域像素值重新赋值为0,去噪效果如图3c所示。

(2)统计密度特征矢量:根据字符结构特征,将去噪处理后的字符图像划分为等间隔对称的n块区域。以本文实验过程为例,分割提取的匹配区域图像的尺寸为12×22,将匹配区域对称的划分为以下9块:1区为0≤x≤3∩0≤y≤6;2区为4≤ x≤7∩0≤y≤6 ;3区为8≤x≤11∩0≤y≤6 ;4区为0≤x≤3∩7≤ y≤13 ;5区为4≤x≤7∩7≤y≤13 ;6区为8≤x≤11∩7≤y≤ 13 ;7区为0≤x≤3∩14≤y≤21 ;8区为4≤x≤7∩14≤y≤21;9区为8≤x≤11∩14≤y≤21;依次统计1~9区各区亮点总数,1区中亮点总数对应特征向量中元素d0,2区亮点总数对应特征向量中元素d1,直到9区,组成9维特征向量d={d0,d1,d2,d3, d4,d5,d6,d7,d8}。

2)验证规则

(1)设对最匹配字符的匹配区域提取的区域密度特征矢量为d={d0,d1,d2,...,dn-1},对应该最匹配字符的标准区域密度特征矢量为di={di0,di1,di2,...,di(n-1)},统计特征向量所有位置满足条件|dij-dj|≥delta的元素总数nd,其中0≤j≤n-1,delta为允许的矢量中单个元素与标准矢量元素之间的最大误差,设N为特征向量中允许超出误差范围的元素的最大个数,当nd≤ N,则认为最匹配字符就是待扫描图像中字符,为最终识别结果,若nd>N,则提取下一个候选字符匹配区域的区域密度矢量,按同样的方法与该候选字符的标准区域密度特征矢量进行比较验证,直到满足nd≤N,则认为候选字符为最终识别结果,每个候选字符的验证所参考的标准区域密度矢量都与候选字符对应。

(2)若经过(1)验证,3个候选字符都不满足匹配条件, 则令N=N+1,继续进行(1)的验证,若依然没有满足要求的候选字符,则认为纸币过度磨损无法识别,在该字符位置输出空格,实验结果统计中认为识别错误。

2算法测试与性能分析

本文使用两种实验样本:1)从点钞机公司制造的高速纸币清分机扫描得到的大量50万像素纸币图像中随机抽取200张未经区分的一般纸币图像;2)从大量样本中挑选出的严重污染磨损、褶皱变形的53张50万像素纸币图像。

利用标准的模板匹配法和本文算法分别对样本1)和2)进行识别,标准模板匹配法流程为首先进行垂直投影分割,然后对分割的字符尺寸归一化,最后进行模板匹配识别,两种字符识别算法对两个样本识别效果如表1和表2所示。

可以看出,本文算法对样本1和样本2识别率都高于标准模板匹配法,尤其是针对样本2严重污染磨损的字符识别率更是远远高于标准模板匹配法的识别率,具有非常强的鲁棒性,而时间只是略高于后者。

3结论

本文提出了一种将模板匹配与多种字符结构特征相结合的人民币冠字号字符识别算法,其特点在于:1)在分割部分提出了比通用的垂直投影法分割率更高、鲁棒性更强的基于字符轮廓特征和字符间位置关系的分割方法;2)对待检字符区进行多级不等比例尺寸调整获得多个待检字符区,有效的解决了字符褶皱变形造成的误检问题;3)具备纠错功能, 在最关键的识别部分不是直接判定最匹配的模板为最终识别结果,而是利用改进模板匹配法获得多个候选字符,然后利用鲁棒性更强的区域密度特征矢量依次对候选字符进行最终筛选判定。实验结果表明,本文算法能较好地解决现有人民币冠字号字符识别算法对严重污染磨损的人民币冠字号字符识别率低的难题。

摘要:针对现有人民币冠字号字符识别算法对严重污染磨损的人民币冠字号字符识别率低的难题,提出了一种将模板匹配法与多种字符结构特征(字符轮廓、区域密度)相结合的人民币冠字号字符识别算法。通过定位分割、分类识别、验证纠错3个步骤完成字符的识别,实验结果表明,该算法具有较高的识别率和较强的鲁棒性。

篇7:基于结构特征的空间目标识别算法

收稿日期: 20130927

摘要: 特征点匹配在图像检索、三维测量、模式识别等技术中起着重要的作用。使用MATLAB软件剪切图像并细化线结构光光线条纹。经理论分析SURF算法优缺点,提出了一种基于SURF算法特征点提取的改进算法。用C语言编写改进后的特征提取算法,通过MATLAB软件实验对比两种算法的特征点提取结果并且编写程序实现后期的特征匹配。实验表明:该算法基本满足双目视觉立体匹配的要求,对于线结构光三维测量技术具有重要的理论意义和实用价值。

关键词: 结构光; 双目视觉; 立体匹配算法

中图分类号: TP 391文献标志码: Adoi: 10.3969/j.issn.10055630.2014.02.015

Research on matching algorithm based on

structured light binocular vision feature

LIU Yu, LIU Chanlao, SU Hai

(School of Optoelectronic Engineering, Xi’an Technological University, Xi’an 710032, China)

Abstract: Matching feature points play an important role in image retrieval, dimensional measurement and pattern recognition technology. By using the MATLAB software shear thinning line structured light image and light stripes, and through theoretical analysis of the advantages and disadvantages of SURF algorithm, this article proposes the SURF algorithm which based on feature points extraction algorithm. Through C language improved feature extraction algorithm, MATLAB software experimental comparison of the two algorithms feature point extraction results and preparation program features the late match. Experiments show that the algorithm basically meets the requirements of binocular vision stereo matching, and linear structured light for threedimensional measurement technique has important theoretical significance and practical value.

Key words: structured light; binocular vision; stereo matching algorithm

引言双目立体视觉是利用双目摄像机模拟生物的视觉特征,获取物体表面的三维信息,从而还原物体外表面的几何形貌。如今,基于双目立体视觉的技术,结构光三维测量技术作为一种快速、便携、高精度的三维测量技术,在工业设计、航空等领域均得到了广泛的应用,已成为一种成熟的三维数据获取和质量评价与控制手段[1]。在结构光双目视觉技术中,由于不同视觉所获取信息的不完备性和不同应用中的复杂性,立体匹配成为立体视觉技术中最重要也是最难以处理的问题之一[2]。现今,立体匹配方法有多种。特征的选取跟图像的内容有关,对结构光匹配目前常用的是相位匹配方法,但是相位匹配一般是针对核线平行而言,虽然将空间域转化为时间域,可同样存在邻域奇异性,匹配误差较大[3]。基于区域立体匹配方法,可以得到稠密的视差图,其缺点是在低纹理区域或纹理相似区域容易造成大量的误匹配,边界模糊,视差图效果不理想[46],计算量大,运算时间较长。基于特征点的立体匹配方法,能够精确的匹配,视差效果明显,但是只能获得稀疏的匹配点,所以仅能勾勒物体的大致轮廓,不能呈现物体的细节部分,也不能得到稠密的视差图[7]。针对特征匹配只能得到稀疏点数的缺点,本文提出了一种改进的特征点提取算法,在不影响匹配速度的情况下,匹配更多的特征点对,并且有效地减少了误匹配率。光学仪器第36卷

第2期刘瑜,等:一种基于结构光双目视觉的特征匹配算法研究

1立体匹配关键技术双目立体匹配的方法是从左右视角两个摄像机拍摄同一物体的两幅图像中找出被测元件表面同一点在不同图像中的对应点,进而求出各个点对应的视差,再由视差信息和投影模型还原出原始物体形貌的深度信息[89],最终得到三维表面形貌。因此,图像的立体匹配是三维重建的关键环节,也是立体视觉尤其是三维重建的重要研究内容。关于立体匹配方法研究重点具体有两方面:算法鲁棒性和计算速度。(1)算法鲁棒性:三维重建过程与投影过程是互逆的,图像经三维投影到二维空间,三维的深度信息丢失。从二维图像恢复至三维模型,对应匹配点可能会出现一对一或多对一的情况,导致唯一性失效,此外成像过程中如噪声、遮挡、光照变化等干扰都会造成匹配误差。可以通过对原有算法改进或引入新算法来提高准确性。(2)计算速度:立体匹配是在左、右两幅图像中搜索对应点对的过程。所以,提高计算速度需要解决搜索策略问题如极线约束[10]的使用可以将二维搜索降到一维搜索;视差约束也可以通过降低搜索范围方式提高计算速度。2特征点匹配算法的改进特征匹配分为特征点的提取和特征点的匹配两个过程。首先对两幅图像分别提取特征点,根据特征点的相似程度匹配特征点对,并根据各自点的灰度信息得到匹配视差图。因此,特征点提取的准确程度和数量直接影响后期的匹配,从而影响整个立体匹配的精度和效率。所以,如何快速有效地提取特征点是本文重点解决的问题。根据本实验采集5组图片(任选一组左右视图如图1所示),将三线激光器投影到被测物体表面,CCD采集得到左右两幅图像。本文通过对图像进行预处理,减少图像噪声以及测量环境对光条中心提取的不良影响。(1)图像剪切:首先为了确保图像处理速度,在进行结构光光条图像处理时,只剪切包含光条在内的一小部分图像进行处理,而不是对整幅图像都进行处理,如此可以大大地减少运算量,提高检测效率。(2)图像滤波:为了抑制噪声、改善图像质量,要对图像进行滤波处理。本文采用中值滤波能较好地去除孤立噪声点,如图2所示。

2.1基于SURF算子的特征点提取常用的特征点检测方法有Harris角点检测,SUSANA,HessianLaplace,强角点检测等。但是它们缺点是不能适应图像的尺度变化,对于不同尺度的图像,无法建立相应特征点的关系。SURF是一种尺度不变和旋转不变的特征点检测算法,具有速度快,鲁棒性好的特点,针对特征点对的提取数量较少这一不足,本文通过算法上的改进,来提高匹配效率。

nlc202309040401

图1原始图像对

Fig.1Untreated images图2图像预处理

Fig.2Preprocessed image

SURF算法就是利用积分图像的加减运算来实现图像与高斯二阶微分模板的卷积运算,积分图像是由Viola和Jones[11]提出,很大程度上简化了计算时间。积分图像中任一点(i,j)的值ii(i,j),用原图像左上角的任一点(i,j)相应的对角线区域灰度值的和表示,ii(i,j)=∑i′≤i,j′≤jp(i′,j′)(1)图3SURF算子提取效果图

Fig.3SURF operator extraction effect image式中,p(i′,j′)表示原始图像点(i′,j′)的灰度值,ii(i,j)可以用如下迭代式计算得到,S(i,j)=S(i,j-1)+p(i,j)(2)

ii(i,j)=ii(i-1,j)+S(i,j)(3)式中,S(i,j)表示一列的积分,并且S(i,-1)=0,ii(-1,j)=0。需要积分图像时,只需对原始图像的所有像素扫描一遍。用MATLAB软件对滤波后的图像进行处理,结果如图3所示。

2.2基于SURF算法的改进由于结构光光学条纹能实现图像对的立体匹配、还原三维结构,因此需要快速地提取结构光条纹,才能提高立体匹配的匹配速率。通过对图像的剪切和中线条纹提取,可在很大程度上降低后期立体匹配时间,进而提高匹配效率。(1)均衡化与二值化由于结构光光条图像正是属于待测对象(结构光光条),与背景有较强对比度的图像,所以二值化对结构光光条图像是特别有效的,它能有效地分离光条目标区域与背景区域,减少计算量,提高处理速率。在二值化之前需要突出感兴趣的部分,因此提前进行直方图均衡化,将灰度值低的感兴趣部分显现出来,提高处理精度。得到图像对如图3所示。(2)细化与骨架提取利用MATLAB函数库中的细化函数对图像进行细化与骨骼提取,得到单像素的细线条纹,为后期匹配减少了运算量,缩短了匹配时间,提高匹配速率。经过图像预处理后得到立体图像对,对图像二值化结果如图4所示,使得对比度得到明显改善,再通过细化后得到的图像对能够较好地满足后期立体匹配的要求,如图5所示。

2.2.1约束条件由于立体匹配是寻求同一空间景点在不同视角下投影图像的像素间的一一对应关系,因此立体匹配的实质就是在某一匹配准则下的最佳搜索。由于同一物体在不同视角下的图像会有差异,而且场景中的很多因素,如光照条件,物体几何形状和物理特性、噪声干扰等,都被综合成单一的图像中的灰度值。为解决这一问题,通常引入各种约束,将匹配限制在平滑解空间范围内。其约束条件如下:(1)极限约束:当给定一点,它的匹配点一定出现在所对应的极线上。如图6所示,L1为点P2对应的极线,L2为点P1对应的极线,L1和L2互为极线。

图4二值化后立体图像对

Fig.4Binarized stereo image pair图5条纹细化后立体图像对

Fig.5Thinning stripe stereo image pair

图6双摄像机成像模型

Fig.6Dualcamera imaging model(2)唯一性约束:指左图像中的任何点在右图像中最多一个点与之匹配,也就是说,无论是参考图像还是目标图像,任何点都不能同时匹配两个点。(3)顺序约束:对于相似深度的表面,对应的特征点一般以相同的次序落在极线上。(4)最大视差约束:视差范围约束指参考图像某个点的对应点只能在一定的范围内搜索,也就是说,两个匹配点横坐标相差必须小于某个最大视差阈值。

2.2.2算法描述本文基于SURF特征点提取过程,首先选取3个正确的匹配点对,下一步的改进提取算法如下:(1)对左右两幅图像分别取第i个基准点(xi,yi);(2)对左右两幅图像分别取第i个基准点(xi,yi);(3)得到新的基准点(xi,yi+3);(4)对两点(xi-10,yi+3),(xi+10,yi+3)间所有像素点进行遍历,判断该像素点灰度值是否大于200,若是,则提取该特征点坐标(xj,yi+3),保存该特征点并将该特征点作为新的基准点;(5)重复执行(2)(3)步,直到左右图像都遍历结束;(6)对得到的左右图像特征点点集合进行逐个对比,若同时满足xi左-xj右≤3且yi左-yj右≤3则匹配成功,则得到的(xi左,yi左),(xj右,yj右)为匹配成功的特征点对。根据上述改进算法,编写C程序,对图像处理,提取到34个特征点对,由于此方法提取得到的是特征点相对于原始图像的坐标,因此,其坐标数据显示结果如图7所示。图7改进SURF算法的特征点提取坐标示意图

Fig.7The diagram of the improved SURF algorithm coordinates of the feature point extraction图8W窗口内像素灰度和的计算

Fig.8W window pixel grayscale and calculations

图9特征点匹配算法流程图

Fig.9Feature point matching algorithm flowchart

图10改进SURF算法的特征匹配视差图

Fig.10Feature point matching algorithm floechart

2.3特征点的匹配根据这几个约束条件根据选取映射函数,对映射值取值,再判断映射点是否满足条件,满足后,根据双线性插值对图像进行插值,将插值之后和原始图像进行组合,得到匹配视差图。求窗口W内的像素灰度值时,W的大小可通过积分图像的4个相应点(i1,j1)、(i2,j2)、(i3,j3)、(i4,j4)的值计算得到,如图8所示,即窗口的像素灰度和与窗口尺寸无关。窗口W内的像素灰度和为:∑w=ii(i4,j4)-ii(i2,j2)-

ii(i3,j3)+ii(i1,j1)(4)通过该算法,结合改进的SURF算法提取到的特征点对,设置匹配算法流程如图9所示,在MATLAB图形处理软件中,采用C语言编程实现。处理得到特征匹配的视差图,如图10所示。3实验及结果分析结合MATLAB软件,对经过预处理得到的图像进行SURF特征点提取匹配得到29对特征点,再选取其中匹配正确的特征点对10对设为基准,再根据匹配约束条件共选取得到34对特征点,并与相应的SURF测量结果比较(见表1)。从测量结果可以看出,改进后的SURF特征点提取算法运行时间较SURF特征点提取匹配时间增加了0.12 s。 但是误匹配率却降低了约36.5%,匹配成功率得到了明显改善。通过对多幅图像对试验验证,匹配时间增加为0.2 s左右,而误匹配率均降低为40%左右,因此该方案具有可行性。由于前期对图像的剪切和结构光线细化结果中,大量减少了特征提取图像的像素数,从而缩短了整体匹配的运行时间。因此,本文对于匹配算法的改进中,又进一步完善了基于改进SURF算子的特征匹配算法。表1特征点提取算法实验结果比较

Tab.1Feature point extraction algorithm experimental results

特征点提取方法提取特征点对数误匹配对数误匹配率/%匹配时间/sSURF特征点提取291862.072.19SURF算法的改进34926.472.23

nlc202309040401

4结论本文基于线结构光双目视觉立体匹配技术,分析了特征匹配算法的优缺点,通过实验验证了SURF算子匹配方法对于线结构光的适用性,并且在特征匹配过程中,针对SURF特征点提取算法存在的缺陷做了进一步的改进,提高了匹配的精确性。通过对原始采集到的图像进行试验,表明了本文的方法基本可以达到预期匹配结果的要求,从误匹配率和匹配时间上都得到了较好的改善,对三维测量系统,具有重要的理论意义和较高的使用价值。参考文献:

[1]史玉升,李中伟,钟凯,等.结构光三维测量技术在模具设计与制造过程中的应用[J].航空制造技术,2009,48(20):4850.

[2]桑瑞娟,张华,胡旭,等.一种改进的区域双目立体匹配方法[J].传感器与微系统,2012,31(8):5859.

[3]穆绵,刘缠牢.一种光学元件面形三维重建的算法研究[J].光学仪器,2013,35(2):4651.

[4]王月梅.双目立体视觉中图像匹配算法的研究[D].西安:西安电子科技大学,2009:3355.

[5]李云飞.双目立体视觉中的稠密匹配算法研究[D].杭州:浙江大学,2011:3144.

[6]郭铁芹.双目视觉立体匹配致密匹配算法的研究[D].西安:西安电子科技大学,2010:3545.

[7]周秀芝.面向深度提取和形状识别的图像匹配[D].长沙:国防科技大学,2006:1437.

[8]BRADSKI G,KAEBLER A.学习OpenCV[M].于仕琪,刘瑞祯,译.北京:清华大学出版社,2009:129132.

[9]CONZALEZ R C,WOODS R E.Digital image processing[M].2nd ed.New Jersey:Pearson Prentice Hall,2008:280300.

[10]SONKA M,HLAVAC V,BOY R.图像处理、分析与机器视觉[M].北京:人民邮电出版社,2003:1453.

[11]VIOLA P,JONES M.Rapid object detection using a boosted cascade of simple features[C]∥ Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Kauai:IEEE,2001:38.

篇8:基于彩色特征的道路识别算法

关键词:特征提取,道路识别,彩色图像

随着科学技术的发展,自动化技术越来越得到研究者的重视,其中比较典型的便是无人驾驶技术,对无人车的研究也是当今比较热门的话题,如无人公交车已经投入到了人们的日常生活中。这些技术的核心就是自动驾驶系统,自动驾驶技术离不开道路检测系统,目前,随着私家车的不断普及和推广,研究道路检测的主动安全性尤为重要。目前已研发出的系统比较有代表性的如意大利帕尔马大学的ARGO系统、美国卡内基-梅陇大学的NAVLAB系统、德国慕尼黑联邦国防大学的Va MP系统、美国加州伯克利大学的PATH系统等等。这些系统所需要的关键技术便是道路检测。在日常城市生活中,人们上下班大多都是行驶在结构化道路上,因此针对结构化道路的研究是非常有必要的。

1 道路检测的基本算法与流程

道路检测的算法有很多种,有基于模型的算法、基于单目视觉的算法、基于小波变化的算法、基于神经网络的算法等等,不同的算法可以解决不同的问题,其用法和原理也不相同,研究人员可以根据研究的需要选择不同的算法。

根据人们的驾驶常识,本文首先定义两个假设,第一,道路颜色的变化是渐变的,不存在突变情况;第二,汽车驾驶的方向为前方。受到光照和视觉的影响,本文首先对图像进行预处理即图像的分块采样处理用以获取每个区域中的颜色灰度值,通过数理统计求出每个区域像素值的范围,确定范围之后,根据像素点是否在此范围中来进行像素点的筛选,在此范围中的像素点置为255即白色,不在范围中的像素点置为0即黑色,在统计完之后便形成了一个黑白相间的图像,在此图像上道路和周围的区域有着明显的区别,其算法流程图如图1所示:

下面以一日常生活中的城市道路为例,如图2,来展开对三层特征提取的研究。

2 图像的采样处理

在对道路进行识别之前,需要先做一下预处理。通过观察图像,可以看出路面、植物、建筑物、天空之间的像素值是不同的,为了从这些物体中识别出道路,取图像的前半部分,如图3所示,这样可以减少建筑物的影响。由于受到光照的影响,道路从前到后的颜色是不一样的,也就是亮度值不同,所以需要对图像中的路面进行分块采样以分别求出每个分块部分的亮度值,然后再整合在一起。根据图2的特征,大致可以取三块进行采样。块的大小通常为20*20的正方形比较合适。如图4:

3 像素点的统计

图像采样之后,需要对小块中的像素点值进行统计,以确定道路区域每个层像素值的范围。首先用imhist函数作出每个采样小块的直方图,如图5所示,由于是有三个分量,所以得到的是三个分量的直方图,通过直方图不难得出在直方图中的像素点值大部分的分布是比较集中的,但是也可能会出现出距离中心值比较远的部分,这时需要对其进行去除,以免对下一步的工作产生影响。对每个区域的所有像素点的RGB三个分量分别计算均值和方差,其计算公式为:

其中,为在点上颜色分量m的值,Em为颜色分量m的均值,Dm为颜色分量m的方差。

观察直方图可看出这些像素值的分布和正态分布类似,所以像素的取值范围大体上可以用来表示。

4 道路区域的识别

在经过上述几步处理完之后,道路区域每一小块每一层像素的范围已确定。首先,针对每一个小块的R、G、B三个分量,需要同时满足这三个分量的范围才是此小块对应于图像上道路区域的点,此过程可以用一个“&”来完成;其次,针对整个图像来讲,只要满足三个小块中的一个要求便是所要求的道路区域,此过程可以用一个“|”语句来完成。

5 实验结果分析

在程序执行完之后得到的图像如图6所示。值得说明的是,二值图(也即二进制图像)也是黑白图,但是此处的“二值图”和传统意义上的二值图有所区别,正常的二值图是通过设定阀值将一个图像转换为二进制图像,且图像是单层的,阀值以上的置为1,其余的置为0。

从图6可以看出,受到植物建筑物等的影响,图像有斑点和噪声,会有部分的干扰,为了解决这个问题使图像的道路显示的更为明显,采取中值滤波以去除图像中的斑点和噪声,其处理结果如图7所示。

从图7可以清晰的识别出道路区域以及道路标志线的位置这两个对于自动驾驶系统至关重要的部分。初次之外,为了体现出本算法的优越性,笔者在此特意用了图像的二值分割技术,二值分割技术是基于二值图进行图像的分割,不同的阀值可以得到不同的处理效果。设定三个不同的阀值分别为0.5、0.3、0.15,其处理结果如图8所示。本算法和二值分割一个最大的不同就是二值分割得到的图像是单层,而此算法得到的图像是三层。

6 结束语

上一篇:房地产企业财务状况分析下一篇:朱德义走访公安民警检查煤矿安全工作