车牌识别中字符识别

2024-05-04

车牌识别中字符识别(精选十篇)

车牌识别中字符识别 篇1

字符识别的特征提取主要有结构特征提取方法和统计特征提取方法两种方法。车牌字符, 包括汉字、英文和数字, 有其特殊的结构特征, 如笔画、拓扑点、结构突变点等等, 这些结构特征可区别性强、稳定性好, 可以作为特征用来进行分类。这种以字符图像的自身结构作为提取特征, 与设定好的模板进行相关计算, 得到与字符相似度最大的模板, 从而判断其所属的类别, 称为结构特征提取方法。另外一种方法是统计特征提取方法, 这种方法, 需要对整个字符图像进行变换, 在大量训练集样本中估计统计特征的分类情况、设定分类器, 然后根据识别器的分类曲面进行分类判别。

1 字符的结构特征提取方法

结构特征提取方法的基本思想是把字符图像分割简化为若干基元, 如笔画、拓扑点、结构突变点等, 与模板对比, 观察必要的基元是否存在, 不可以有的基元是否出现, 从而判断所属的类别。在字符识别的早期, 这种方法得到了广泛的应用, 如何得到以基元表示的结构信息是结构特征提取方法的重点。目前为止, 主要有根据骨架、轮廓和笔画得到结构基元的方法。在这里面, 最常使用的是将字符细化得到骨架作为结构基元。

中轴变换 (medial axis transform, MAT) 是一种用来确定物体骨架的细化技术, 中轴变换具有边界B的区域R的MAT是这样确定的。对每个R中的点P, 我们在B中搜寻与它最近的点, 如果对P能找到多于一个这样的点 (即有2个或以上的B中的点与P同时最近) , 就可认为P属于R的中线或骨架, 或者说P是1个骨架点。理论上讲, 每个骨架点保持了其与边界距离最小的性质, 所以如果用以每个骨架点为中心的圆的集合, 就可以恢复出原始的区域来。具体就是以每个骨架点为圆心, 以前述最小距离为半径作圆周。它们的包络就构成了区域的边界, 填充圆周就得到区域。或者以每个骨架点为圆心, 以所有小于和等于最小距离的长度为半径作圆, 这些圆的并集就覆盖了整个区域。

图1是一些区域和它们的用欧氏距离算出的骨架。由图 (a) 和图 (b) 可知, 对较细长的物体其骨架常能提供较多的形状信息, 而对较粗短的物体则骨架提供的信息较少。注意, 有时用骨架表示区域受噪声的影响较大, 例如比较图 (c) 和图 (d) , 其中图 (d) 中的区域与图 (c) 中区域只有一点儿差别 (可认为由噪声产生) , 但两者的骨架相差很大。

基于骨架的结构特征提取方法, 在保持字符特征的基础上, 大大简化了字符的表达, 减少了字符的信息量, 但它也有自身的缺点, 它过多的依赖于图像的细化质量。当图像中有墨点或粘连的框线时细化常常会产生拓扑结构上的变化。

轮廓可以反映字符图像的结构, 提取方法简单, 结果确定, 是一种较好的数据信息源。轮廓提取的方法, 是在提取字符骨架的基础上掏空内部点, 我们首先按从上往下, 从左往右的顺序找到其第一个黑点, 也就是0点, 然后找其点的各方位的点, 每个点都与0点相比较, 如果所有值都相等, 那么这个点就为此图的内部点, 就去掉此点信息, 将此点的值设为1, 然后重新寻找新的内部点, 如果不是所有的都相等, 那么直接寻找下一个点信息。轮廓相对于骨架, 带入了更精确的位置, 也节省了细化的运算量, 但它易受到笔画宽度和断线的影响。并且预先设定的规则中有很多涉及位置参数, 适于质量较好的图像。

另外, 字符的局部笔画特征是很重要的标志性特征。可用于区分“由”与“田”, “于”和“干”的局部差异。

结构特征提取方法的缺点在于难以摆脱字体变形及噪声的影响。字体变形对结构的影响几乎无规律可循, 因而容易造成规则库的片面性。即使能够得到较为全面的规则库, 也存在规则的灵活应用问题, 这些问题严重影响系统性能。因此, 仅靠模板的机械性匹配句法和规则的推理方法是远远不够的。

2 字符的统计特征提取方法

统计特征提取方法是通过选取同一类字符中相对稳定的分类性能好的共有统计特征作为特征向量, 包括字符的位置特征、笔画特征、水平投影直方图和垂直方向投影直方图特征、矩特征等等。字符经过频域变换或其它变换后得到统计特征, 然后在大量训练集样本中估计统计特征的分类情况, 设定分类器, 最后根据识别器的分类曲面进行分类判别。大量字符的统计特征经过提取和分类后形成关于字符原型知识, 构成识别字符的模板信息, 存储在识别系统中。在识别时首先提取相同的统计特征, 然后与识别系统存储的字符原型知识匹配比较, 根据比较结果确定字符的最终分类。

统计特征包括全局特征和局部特征。全局特征包括字符欧拉数特征、外围轮廓特征、方向链码、周边面积等, 局部特征包括网格特征、线段梯度、线段方向长度、笔画密度等。全局特征对平移和旋转具有不变性, 对局部变化不敏感, 抗干扰能力强, 但容易忽视某些重要的局部信息无法正确区分相似字, 计算代价也较大;局部特征区分相似字的能力较强, 但是无法适应不同的书写风格。

3 结构方法和统计方法的比较

结构方法和统计方法各有利弊, 结构方法的优点是对细节的变化比较敏感, 能够较好的分辨出结构上的细微的差别, 在区分字形相近, 结构上有细微差别的字符时, 通常会比较有效。缺点是鲁棒性较差, 对噪声比较敏感, 容易受到干扰, 而且由于对字符结构特征的描述要占用大量的存储资源, 因此, 算法在实现上相对复杂、识别速度也比较慢。统计方法的优点是对噪声不敏感, 有较好的鲁棒性和稳定性, 缺点是对细节上的细微差别反映不灵敏, 不能很好地区分字与字之间的一些细节上的差异, 无法对字符进行细分类。在实际的应用中, 我们应该结合结构方法和特征方法的优点, 特征提取在保证系统识别的稳定性和准确率的同时, 也要兼顾好系统的识别速度和处理时间, 处理好速度和识别率之间矛盾。

摘要:本文对车牌识别中的字符的结构特征提取方法和统计特征提取方法做了概述, 并对二者进行了比较, 分析其二者各自的利弊。

加油站车牌识别 篇2

利用先进的监控技术,例如高清、智能、车牌识别等技术,构建一套全面防范、重点加强、资源共享的安防系统,有效加强对加油站人员的管理,直观及时的反映重要地点的现场情况,增强安全保障措施,已经成为现阶段加油站建立现代化管理系统的重要选择。

需求分析

根据当前加油站的运行管理和安防报警的要求,加油站联网监控系统需满足以下需求:

·管理人员可以实时了解加油站的工作情况;

·管理人员可以实时了解加油站的交易情况;

·管理人员可以实时监视加油站的各个重点部位,比如油库区和金库等;

·系统需具备报警接口,加油站报警时可以实时传递报警信号到总监控中心,并可以设置多种报警联动机制,实现视频监控与报警的结合;

·监控平台软件需支持语音对讲和广播,能够扩展实时指挥、培训和视频会议等功能。

设计思想

对加油站的监控系统实现半公开管理。一方面,加油站管理人员可以通过前端视频了解加油站进出车辆情况、收费情况、设备运行情况以及加油站工作情况,实现对加油站的远程管理。另一方面,当有警情发生时,相关人员可以即时查看到现场实时视频。

对于重点区域如油库等部位,采用智能分析技术,通过智能跟踪的方式,实现油库区的安全防范监控。

对于加油站进出口管理,可以采取两套解决方案:

1、使用强光抑制型摄像机,保证晚上也能够看清车牌信息;

2、使用高清摄像机,配合LED频闪灯,增加车牌识别功能;

3、该功能可以辅助加油站对加油车辆进行统计分析,方便加油站针对老客户搞一些回馈活动。

报警与监控系统建设以加油站为基本实战单位,在各上级监管单位建立二级报警与监控分中心,在省公司设立总监控中心,实现对前端所有设备和系统的统一管理和控制。各级领导可以通过网络分控对系统进行管理。

监控中心是一个监控系统的核心管理部分,是利用计算机网络多媒体技术开发的整合式集中智能监控管理控制应用平台(包括监控系统管理模块、WEB服务模块、报警模块、数字视频转发模块等),汇接了全省各加油站图像监控系统,将所需的视频、音频、数据以数字形式通过网络进行传输和共享;并根据授权进行远程调阅、查询,由开放的接口实现互联、互通、互控及其它多种应用,为全省各级领导决策、指挥调度、调查取证等,提供及时、可靠的监控图像信息。系统设计

运用先进的计算机技术、网络技术、数字压缩技术、网络传输与安全技术,以加油站为监控网点,加强监控点、网设、监控系统管理应用平台等系统建设以及相关应用机制建设,基本建成覆盖面广、系统完整、功能强大的网络报警和视频监控系统。

系统整体架构

系统整体上划分为三个部分:包括省级监控中心,地市级分控中心和加油站部分。在前端每个加油站采用硬盘录像机作为系统接入的主要设备;在加油站省级管理单位设置集中监控、管理平台;在其他管理单位设分控中心或客户端。

加油站的建设

加油站是各种信息的采集点,是整个系统是否具备实用性的关键所在,只有采集到有效的信息,才能使整个系统发挥作用。根据加油站的防范需求,每个加油站需要建设多个视频采集点,对加油站进出口、加油站加油工作区、加油站便利店、加油站售卡处、加油站财务处(保险柜)、加油站的油库区等部位进行覆盖。

针对上述防范区域,系统将可采用不同的前端设备以满足不同的防范需求:加油站进出口:需要看清进出车辆的车牌号码和进出人员的面部特征;加油站加油工作区:需要看到加油区的整体工作状况;加油站便利店、售卡出、财务处(保险柜):需要看清交易人员的面部特征、交易情况等;加油站的油库区:需要对进入油库区的人和车进行智能跟踪,详细记录油库区内人和车的运行轨迹和各种状态。

加油站点位设计

进出口监控:加油站进出口是外部人员和车辆进出加油站的唯一通道,是加油站防范重点部位。点位设计应该满足人员面部特征和车辆牌照信息能清晰呈现的需求。由于加油站均为24小时运行,需要考虑晚上的光线环境,尤其是进出口处车头灯对摄像机的影响较为严重。

鉴于以上两点,加油站进出口采用日夜型强光抑制彩色摄像机,摄像机具备分辨率高(彩色540TVL、黑白600TVL)、低照度(彩色0.003Lux、黑白0.0003Lux)及强光抑制等特点,能够满足进出口防范需求。

针对加油站出入口,系统还可以采用高清摄像机,配合LED频闪灯,实现车辆牌照识别功能。采用的高清摄像机内置视频触发模块、抓拍模块和拍照识别模块,避免了增加额外的设备,减少工程成本和施工难度。

加油工作区监控:加油工作区是外来人员及车辆的主要活动场所,点位设计应满足该区域的全覆盖。加油工作区一般面积比较大,可以采用枪机对角安装进行大面积覆盖,再加装球型摄像机对枪机盲点进行补充。同时,球机可以对加油区的工作细节进行捕获。枪机采用低照度彩色摄像机,球机采用智能中速球。

便利店、售卡处、财务处(保险柜):以上三个地方均是发生钱物交易的地方,点位设计需满足清晰记录交易人员特征及交易情况的需求。便利店、售卡处、财务处均为室内安装,采用高解彩色半球摄像机,外观美观,分辨率高(540TVL),满足监控点需求。

油库区:油库区为加油站防范的重中之重,油库区一旦发生问题,后果不堪设想。

点位设计采用智能分析技术,能够对进入油库区的人员和车辆进行跟踪捕获,清晰地展现人员及车辆的运行轨迹及各种状态。

油库区采用自动跟踪高速智能球,通过智能分析技术,清晰完整的记录油库区的人和车。并要求球机具备自动跟踪、运转速度快(水平540°/s、垂直400°/s)等特点。

加油站报警设计

本监控系统设计预留报警接口,可在加油站重点防范部位加装报警探头或者报警按钮,实现报警信息的自动采集或手动触发。

报警点位设计:财务室、保险柜安装三鉴探测器和手动报警按钮;售卡处和便利店安装手动报警按钮;同时支持视频检测报警。

加油站中心设计:加油站中心主要是前端摄像机的汇聚中心,系统采用硬盘录像机作为汇聚核心设备。通过硬盘录像机对前端视频进行编码存储及网络上传。同时,硬盘录像机也可以接入前端报警信号,实现报警联动及报警上传等功能。

监控中心建设

监控中心是整个系统的管理核心,能够对前端设备和用户进行统一的管理和控制。监控中心设在省级销售管理公司,主要是系统平台软件、承载服务器及应用客户端的部署。

分控中心建设

分控中心为系统的区域管理中心,能够对区域内的前端设备进行管理和控制。区域监控中心设在各地市销售公司,主要是系统应用客户端和承载计算机的部署。

系统平台建设

本系统平台是一套定位于监控专网环境下的网络集中监控系统。整个软件平台按分布式系统方式设计,各组件各司其职、相对独立,又构成一个有机的整体。由中心服务模块、存储服务模块、流媒体服务模块、电视墙服务模块、报警服务模块、客户端模块(分配置和操作两类)组成。各服务模块的物理承载形式为Server,构成中心服务器、存储服务器、流媒体服务器、电视墙服务器和报警服务器,客户端模块的物理承载形式为高性能PC,构成配置客户端和操作客户端。

本系统中的控制、管理、服务均由中心服务器、存储服务器、流媒体服务器、电视墙服务器和报警服务器实现,形成报警与监控管理控制应用平台。远程网络监控采用B/S(浏览器/服务器)和C/S(客户端/服务器)模式。其中,监控中心、分控中心采用C/S模式,在计算机上安装客户端软件,可根据权限划分,实现对其管辖范围内的前端设备远程管理设置、图像浏览录像和回放;领导和有关人员电脑访问采用B/S模式,使用IE浏览器登录服务器,能远程浏览图像、控制设备。

平台构成

监控平台软件分管理中心(ServerControl)、监控中心(ControlCenter)与控制中心(即客户端)三部分。

监控中心提供视频安防监控系统的功能服务,包含集中存储服务、高清解码服务、流媒体服务、报警服务等。控制中心是一个用户进行监控交互的客户端软件。加油站监控报警联网系统的建设方案浅析

2011/7/4/9:7来源:安防知识网

管理中心包含一个服务程序和一个数据库,对各监控中心服务模块、控制中心用户、前端设备(高清IP摄像机)实施有效管理,管理数据记录在数据库中。

监控平台软件支持分布式组网,可组建多个监控中心。监控中心之间可形成一个树形结构,最高级别的监控中心可以管理各个分监控中心,上级监控中心可以按权限实时监看下级监控中心管理的监控点。

系统管理功能

车牌识别中字符识别 篇3

关键词 智能交通系统 车牌识别技术 应用研究

中图分类号:TP391.41 文献标识码:A

随着全球经济的快速发展,人们的物质生活质量逐步加深,促进了公路交通事业的快速发展,随之而来的机动车辆与日俱增。由于城市空间有限,面对巨大的城市交通压力,仅依靠发展交通设施已不能解决现已存在的交通拥挤、环境污染、交通事故频发等问题。为了缓解这一压力,利用高科技手段,建立完善的道路网络缓解道路交通增长的需求,智能交通系统应运而生。车牌识别系统作为智能交通系统的核心组成部分,在道路交通管理、交通事故与机动车盗窃现象的抑制以及维护公共安全等方面发挥着重要的作用,因此车牌识别系统已成为现代交通工程领域中研究的重点和热点问题之一。

1车牌识别系统在智能交通中的发展历程

随着交通事业的不断发展,车牌识别技术日趋走向成熟,并开逐渐应用于交通、公安、路政、停车场、安防、门禁、智能小区等许多领域。车牌识别系统简单的说是一种以特定目标为对象的专用视觉系统,它能够从一幅图像中提取分割并识别出车辆牌照,运用先进的图像处理、模式识别和人工智能技术,通过对图像的采集和处理完成车辆牌照的自动识别,识别结果可按需求分别包括车牌的字符、数字、牌照图像,以致牌照颜色、坐标、字体颜色等。

2车牌识别系统的研究现状

车牌识别技术起源于上个世纪末,ARGUS的车牌识别系统的识别时间约为100毫秒,通过ARGUS的车速可高达每小时100英里。还有Hi-Tech公司的See/Car?system,新加坡Optasia公司的VLPRS等。

国内不少学者也在进行车牌识别方面的研究,实验室方面,西安交通大学的图像处理和识别研究室、上海交通大学的计算机科学和工程系、清华大学人工智能国家重点实验室、浙江大学的自动化系等在车牌识别方面有各自独立的研究,并取得了一定的成绩。中国科学院自动化所的刘智勇等发表文章,他们在一个3180的样本集中,车牌定位准确率为99.4%,切分準确率为94.5%。北航的胡爱明等利用模板匹配技术开发了一种应用于收费站的车牌识别系统,其识别正确率能达到97%以上。华南理工大学的骆雪超、刘桂雄等提出了一种基于车牌特征信息的二值化方法,该系统对效果较好的车牌的识别率能够达到96%。清华大学的冯文毅等利用一种光电混合系统进行车牌识别,系统能够通过硬件来完成车牌识别的全过程。黄志斌等将基于串行分类器的字符识别应用于车牌识别系统中,对车牌识别系统中的分类器进行了详细的研究。目前比较成熟的产品有中科院自动化研究所汉王公司的汉王眼,香港亚洲视觉科技有限公司的慧光车牌号码识别系统等等。

根据IMS研究显示,截止2012年底,全球车牌自动识别市场已经扩展到了3.5亿美元左右。2011年车牌识别达到了年增长率6.9%的成绩。随着市场的发展和用户需求的不断变化,车牌识别保持着快速的发展。车牌自动识别技术算法有了很大的提升,从应用情况来看智能化算法与摄像机完美搭配,能够解决道路交通上遇到的不少难题。

尽管车牌自动识别机会比比皆是,但是其挑战仍然存在。以美国为例,车牌形式各种各样,形状、图片和字体也没有统一的规范。一点车辆可跨国驶入,监控系统面对其他国家或区域的车牌信息时,具体的语言文字也有所不同,摄像机算法必须更为复杂和精准。尽管识别技术已达到炉火纯青的地步,但是目前车牌识别阿拉伯语仍具有很大的挑战。毫不夸张地说,这些字母的难度高于中国的草书。

3车牌识别系统可提升的空间及发展

车牌识别系统集中了光电、计算机、图像处理、计算机视觉、人工智能、模式识别等关键技术。随着信息化时代的不断发展,住宅、小区、停车场等需要保安人工监控的地方都将使用车牌识别系统,减少了许多人为因素造成的疏忽之处。也能扩展到犯罪车辆、肇事车辆、被盗车辆的辨识和拦截,交通流量监测等领域,为人们出行的安全和便捷提供了保障。一方面,车牌识别系统本身是一个全数字化的智能系统,以此为技术基础,可以衍生出一些其他功能。另一方面,由于环境因素、车牌自身因素以及拍摄角度等问题,尽管世界上很多研究机构和公司专门从事这方面的研发工作,高可靠性、高性能和高识别率的车牌识别系统还待开发。

参考文献

[1] MD.Tanvir Learning Algorithms for Artificial Neural Networks,Proc. 10tb Informantion Engineering Senimar June 2001.

[2] GuyonI.Applicationofneuralnetworkstocharacterrecognition[J].InternationalJournalofPatternRecognitionandArtificialIntelligence,1993,7(4):721.755.

[3] 杨大力,刘舒.基于神经网络的车牌汉字识别方法[J].中国人民大学公安学报,2009,5(3):56-57.

基于MQDF的车牌字符识别 篇4

在车牌自动识别系统中,完成车牌的定位和字符的切分后,将对切分后的字符图像进行识别。目前常见的字符方法主要有基于模板匹配的字符识别方法、基于神经网络的字符识别方法、基于统计学习的字符识别方法[1]等。基于模板匹配的字符识别根据字符与模板的相似度大小来确定最终的识别结果,算法简单、成熟,但其自适应不强,对于字符有断裂、污染、粘连等情况容易造成误判。而基于神经网络的字符识别具有良好的容错性、自适应和学习能力,但样本训练的收敛速度较慢。基于统计学习的字符识别方法提取字符的特征,设计分类器进行分类识别,常用的分类器有SVM[2],特征匹配等方法,具有较高的识别率,但识别时间较长。本文提出了一种基于统计模型的改进的二次分类函(MQDF)分类器的车牌字符识别算法。该方法便于设计和实现,具有很好的鲁棒性和较高的识别准确率,而且识别时间短。

1 基于MQDF的车牌字符识别

1.1 MQDF分类器

本文中采取改进的二次分类函数 (ModifiedQuadratic Discriminant Function,MQDF)作为字符分类器。其原理如下:设各个类别的先验概率相同,且满足李雅普诺夫中心极限定理,所以各类样本概率分布可以用高斯分布来近似,那么根据贝叶斯准则可推导得到二次鉴别函数为最优分类器。MQDF[3]是Kimura等在QDF基础上提出的,对QDF进行K-L变换,并且用常量来代替小的特征值来改善计算速度和分类的正确率。

根据Bayes规则[4],后验概率为:

Ρ(ωi|x)=Ρ(ωi)p(x|ωi)p(x)i=1,,Μ(1)

在式(1)中,M是类别的数目,P(ωi)是类ωi的先验概率,p(x|ωi)是类ωi的概率密度函数,p(x)是联合密度函数,且p(x)独立各类别。式(1)作为类别辨别函数等价于:

g(x,ωi)=p(x|ωi)P(ωi) (2)

假设每个类的概率密度函数是一个多元高斯函数:

p(x|ωi)=1(2π)D2|i|12exp[-(x-ui)Τi-1(x-ui)2](3)

在式(3)中ui和∑i分别为类ωi的均值和协方差矩阵,Dui的维数,将式(3)带入式(2),整理得QDF为:

g0(x,ωi)=(x-ui)Τi-1(x-ui)+log|i|(4)

通过K-L变换,对协方差矩阵对角化:

iiΛiϕiΤ (5)

在式(5)中,Λi=diag[λi1,…,λiD],λij(j=1,…,D)是∑i的特征值(按降序排列);ϕi=[ϕi1,…,ϕiD] ϕij(j=1,…,D)是∑i的特征向量(降序排列),ϕi是标准正交阵(ϕiϕiΤ=1)。

将式(5)代入式(4)得:

g0(x,ωi)=[ϕiΤ(x-ui)]ΤΛi-1ϕiΤ(x-ui)+log|Λi|=j=1D1λij[ϕijΤ(x-ui)]2+j=1Dlogλij(6)

对于小的特征值用常量δi代替,MQDF为:

g1(x,ωi)=j=1k1λij[ϕijΤ(x-ui)]2+j=k+1D1δi[ϕijΤ(x-ui)]2+j=1klogλij+(D-Κ)logδi=1δi{x-ui2-j=1k(1-δiλij)[ϕijΤ(x-ui)]2}+j=1klogλij+(D-k)logδi(7)

在式(7)中,k为主要特征向量数。以上利用欧式距离不变性:

dE(x,ωi)=x-ui2=j=1D[ϕijΤ(x-ui)]2(8)

参数δi是Kimura等在文献[3]中提到或者取小的特征值的均值。

在有限的样本集中,由于各种各样的不稳定的噪声,训练QDF分类器通常会影响类的特征值,从而影响分类器的鲁棒性。所以在MQDF中,通过用常量代替小的特征值,不仅分类效率提高,而且分类速度加快和参数使用的内存也减小。

1.2 基于MQDF的车牌字符识别

首先建立各自字符的样本库,然后对所有的样本用MQDF方法训练,得到各类字符的特征文件。待识别的车牌图像经过预处理和字符分割后, 将单个字符经归一化后的字符送到MQDF分类器, 通过MQDF进行运算, 即可得到分类结果。最后,对各个子分类器的识别结果组合,即可得到整个车牌的识别结果。

1.2.1 车牌字符归一化

在字符识别前,对切分的字符进行归一化到40×20,如图1-2所示。

1.2.2 特征提取

对于单个灰度字符,提取8个方向的梯度直方图特征[3]。如图3所示。

本文实验将归一化后的字符划分为8×4个子区域,方向为8个方向,总共256维特征。

2 实验结果和分析

为了对比识别效果, 利用SVM[2]、Euclidean Distance[5]与之对比。

2.1 实验数据

本文的实验样本取自实拍的不同角度不同场景的2142幅标清车牌图像,切分了14553个不同车牌字符。训练样本为8007个字符,测试样本为6546个(2806个字母、2839个数字、901个汉字)。样本包括所有的数字、字母(除I,O以外)、“云”、“粤”、“苏”总共37类。本实验使用的软件环境是Visual Studio 2005、OpenCV 2.3.1、libsvm-3.12[6]。

2.2 实验对比

2.2.1 实验一

字符归一化后,将字符图片划分为8×4、4×4、4×2、2×1四种网格,获得256、 128、64、16维特征。对于MQDF,k=4、16、32、64,对应的δiλ¯5λ¯17λ¯33λ¯65。对于SVM,svm_typeC_SVC,kernel_typeLINEAR。分别对训练样本和测试样本进行训练和测试。如图4-5所示。

通过实验观察到,对于测试样本和训练样本,MQDFSVMEuclidean Distance识别率更高,在低维特征空间尤为明显,是因为Euclidean Distance完全学习了噪声所致。在测试样本中,对于高维特征空间,MQDF略高于SVM,是由于MQDF用合适的常量代替小的特征值,抑制了噪声,而C_SVC学习了一定范围的噪声。MQDFSVM变换范围小,鲁棒性比Euclidean Distance高。

2.2.2 实验二

如图6所示,在64维特征空间,当k>=55时,识别率下降,是由于特征值按降序排列,后面的特征值和特征向量为不稳定的噪声;当15<k<55时,识别率稳定在95%以上;当k<15时,识别率较低是由于所取特征值表示的信息不充分。

2.2.3 实验三

通过实验一,取k为64,δi取λ¯65。根据车牌号码规则,训练四个分类器,对测试样本进行测试。结果如表1所示。

通过表1可知,对于数字、字母、数字和字母、汉字,MQDF识别率比SVM略高,是由于MQDF采用pseudo_Bayesian估计,利用了先验信息,并且合适的常量代替小的特征值,抑制了噪声,而SVM学习了部分噪声。MQDF识别的时间更短,由于SVM采用1v1投票识别策略。

3 结束语

本文提出的基于MQDF的车牌字符识别算法,识别率高,识别时间短,但是MQDF的特征文件比较大(本实验256维特征空间的MQDF特征文件为12.1MB,SVM的特征文件为5.82MB),对于内存有限的设备需要利用LDA或者PCA进行降维、压缩特征文件。MQDF对于不同的特征维数的识别率以及k和δi的选择有待进一步研究。

摘要:文中提出了一种新的基于MQDF的车牌字符识别算法,该算法在QDF的基础上进行K-L变换,并且用常量代替小的特征值改善计算速度和分类的正确率。该方法基于统计模型和中心极限定理,便于设计和实现,广泛应用于手写体识别,具有很好的鲁棒性和较高的识别准确率。用2142幅白天、晚上的蓝牌、黄牌车牌图像做实验,实验结果表明,对于数字、字母、汉字字符,平均识别率达到98%以上,具有较好的应用前景。

关键词:多元高斯分布,李雅普诺夫中心极限定理,字符识别,MQDFSVM梯度方向

参考文献

[1]Kim KK,Kim KI,Kim JB,et al.Learning-based approach,for li-cense plate recognition[J].Proceedings of IEEE Signal ProcessingSociety Workshop,2000(2):614-623.

[2] Cortes C, Vapnik V. Support-vector network[J]. Machine Lear-ning, 1995(20):273-297.

[3]Kimura F,Takashina K,Tsuruoka S,et al.Modified quadratic dis-criminant functions and its application to Chinese character recogni-tion[J].IEEE Trans.on Pattern Analysis and Machine Intelli-gence,1987,9(1):149-153.

[4] Duda R O, Hart P E. Pattern Classification and Scence Analysis[M]. New York: Wesley,1973.

[5]Danielsson P E.Euclidean Distance Mapping[J].Computer Graph-ics and Image Processing,1980(14):227-248.

车牌识别系统安装说明书 篇5

随着车辆的普及,瀚天根据当前形势研发了车牌识别系统。车牌识别系统的安装成为很多工程商关注的话题,如何使车牌识别更好的发挥其作用,依据现场情况做好车牌识别系统的安装和调试是必须要了解的,瀚天门控小编依据安装师傅多年的安装经验总结了以下几点标准,希望对您有所帮助。

一、瀚天车牌识别系统如何在安全岛施工

安全岛主要用于设备安装,以及防水、防撞。一般做在出入通道中间。【根据现场的实际情况来做具体的施工方案】

宽度:如岛上同时放置岗亭的话,一般在1200MM-1500MM;如果安全岛只是安装设备,宽度约在60MM-80MM左右,设备固定位置距离安全岛边缘100MM左右。

长度:安全岛的长度约在5000MM-6000MM左右。高度:安全岛一般应高出地面150MM-200MM。

没有安全岛时,要做设备基础,设备安装的地方为水泥地面时,(与安全岛一样)以星型50M左右打一个Φ10X100规格的膨胀螺栓。地面不低于5M,并预埋、固定设备线管,位置正确后就可以浇灌混凝土了。如果安全岛做在有坡度的地面,用水平仪找平,呈阶梯状。

安全岛设备安装注意事项:如果道闸对开时,2个设备基础高度应在同一水平线上。设备基础和安全岛表面抹灰处理:横平竖直,整齐美观。如果贴砖就不用抹灰。

二、布管与穿线

1、水泥地面开槽深度:线管放置后上部表面距离地面不低于4M,2管间有1M的缝隙,以便于水泥浇灌后,车辆过压线管无动弹,路面结实不损坏管线。

2、土壤地面开槽:深度大于10M,管面距离地面不低于5M;转角处用弯管器弯曲成型、直通接头连通;不允许使用三叉接头,直角接头;线管内所穿导线面积不超过内孔截面的50%。

3、防水处理:埋设管道深度不少于10M,进入机箱设备后预留5M左右;管与管连接处刷胶水后连接;强电,弱电分开铺设;对有强磁干扰的场所,采用镀锌钢管做接地处理。

三、地感线圈施工

一般规格:1M*2M【大型车辆由实际情况确定】

使用0.75铁氟龙线,绕线4-5圈。引出线不低于50编/M双绞。一般尽可能多。用沥青填充线圈与线槽间空隙。

1、设备安装:智能道闸用Φ12的膨胀螺栓固定,开关机身不得摇摆,且运行平稳。

2、防撞柱:稳固。竖直、整齐、美观。

3、减速带:与车道协调,安装在车牌识别触发线前1.5米左右。

四、瀚天车牌识别一体机安装距离来车车牌5米左右设置抓拍线。车牌与相机的侧角尽量小于30度,侧角大于30度会影响车牌识别效果。如果从左右两边来车,不能在识别区域内车辆摆正,则加装一个辅助相机,这样无论车辆从那边来,只要车头对着相机就可以抓拍。

基于CUDA的快速车牌字符识别 篇6

车牌识别系统(LPR)是现代智能交通系统的重要组成部分。它运用计算机图像处理技术辨认出拍摄的车牌图像,进而确定车辆信息。其中,字符识别是车牌识别最重要的一个环节,一个车牌识别系统的优劣主要由两个关键指标来衡量:识别准确率和识别速度。在现代社会,随着交通工具速度的提高和数量的增加,实际需求常常对识别速度提出了更高的要求,例如在高速公路上实现无停留收费时,需要在车辆快速通过摄像头的瞬间识别出车牌字符。

根据车牌信息的特点,字符识别实质上是一个分类问题, SVM[1]因其良好的泛化能力以及解决高维数据的能力而被广泛应用,然而,SVM在实际应用中也有两个先天不足:

第一,处理大规模训练样本时,将耗费大量运算时间。由于标准支持向量机的训练时间复杂度是Ο(n3)[2],运算时间对训练样本数量的增长非常敏感。针对这个问题,Platt 提出了SMO算法,将二次规划(QP)问题转化为一系列的能够得到解析解的QP子问题,大大加速了SVM训练过程。文献[3]改进了SMO,通过将大数据集分解成若干小数据集的办法使其适应多CPU并行计算, 文献[4]提出了基于多处理器系统的SVM迭代分解技术,大大节省了训练时间。随着GPU并行计算技术的发展,近年来人们尝试使用廉价的GPU来提高SVM训练速度。文献[5]提出了一个利用CUDA技术的SVM解决方案——cuSVM,获得相对于LIBSVM 9-35倍的提速,但是cuSVM只能处理两分类问题。本文在其基础上进行扩展,用于解决车牌字符识别问题。

第二,SVM解决多分类问题存在困难。经典的SVM只给出二分类算法,而车牌识别以及大部分的实际应用都是多分类问题。一般通过二分类SVM的组合来解决这个问题,主要有一对多组合模式、一对一组合模式和SVM决策树[6]。另外,结合其他算法,构造多个分类器的组合也是常用的一种解决方案。

一直以来,很多对于SVM的研究都是围绕着这两个SVM的不足之处进行的。本文选择在实际中有着重要意义的车牌识别问题作为研究对象,利用GPU加速技术提升车牌识别的识别时间。另外,作为重要的实验方法,本文模拟实际情况,得到字符倾斜、模糊、油渍(字符经处理后部分残缺)等情况下的图片,加入到训练数据集中。

图1是一个典型的车牌识别过程[7]:车辆检测阶段检测采集到的视频信息中车辆的图像;车牌定位阶段从车辆图像中定位出车牌图片,并从中分割出来;字符分割阶段将完整的车牌图片按照字符分割成7块独立图片;字符识别阶段识别出分割后的各个字符图片所代表的汉字、数字或者字母;最后,车牌识别系统输出识别的结果。本文的研究主要针对字符识别阶段的加速途径问题。

1 CUDA

CUDA是NVIDIA公司针对其基于GPU的产品而引进的一个平台,拥有一套适用于GPU计算的开发环境。CUDA的基本思想是开发多线程并行,这些线程能够在硬件中被动态地调度和执行。在CUDA编程中,程序员不能直接操纵处理器,但是可以通过CUDA提供的线程模型,指定某个线程处理哪些数据、某个线程块由哪些线程组成,用户程序员处于编程模型之中,当编译器将程序编译完成后,便对应到并行线程执行模式中了。

GPU线程以网格(grid)方式组织,每个grid包含若干个线程块(block),每个线程块在目前的硬件架构下最多可包含512个线程。一方面,各block独立并行执行,block之间无法通信,也没有执行顺序,这样就可以在核心数不同的GPU上完成相同的任务,只是拥有更多核心的GPU可以在更短时间完成。另一方面,在同一个block内的线程可以实现通信,在执行时,每个block映射为一个协作线程阵列(CTA),同一个CTA中的线程必须被分配到同一个共享存储器(SM),从而实现线程之间的通信。作为CUDA最重要的创新之一,这种特性可以显著提高执行效率,并大大拓展GPU可以适用的范围[8]。

2 SVM多分类算法及二次规划问题的分解

2.1 支持向量机模型

给定一组训练数据(x1,y1) , … , (xm,ym),xiRn, yi∈{-1,+1},训练一个SVM分类器,对新样本作出尽可能正确的划分。实质就是找出两类的最优分类超平面ωx+b=0,等价于求解如下问题:

minw,b,ξ12ωΤω+ci=1mξi(1)

s.t.

yi(ωTϕ(xi)+b)≥1-ξi

其中,ξi≥0是分类的松弛因子;c>0是一个常数,控制对样本错分的惩罚程度。

该问题可以转化为它的对偶问题:

minα12αΤQα-1Τα(2)

s.t.

yTα=0 0≤αic

其中αi是拉格朗日乘子;1是全1向量;Qm×m的核矩阵,且Qij=yiyjK(xi,xj)。

K(xi,xj)≡ϕ(xi)Tϕ(xj)是核函数,比较常用的是高斯核函数:e-λxi-xj‖2。

SVM分类器训练完毕后,得到分类函数:

Ιx=sign(i=1myiαiΚ(xi,x)+b)(3)

2.2 SVM解决多分类问题

SVM是一种典型的两类分类器,它只回答属于正类还是负类的问题。决策树模型将多分类分解成一个个二分类问题。各个二分类问题可以设计为CUDA上的并行处理,如图2所示。

2.3 二次规划问题的分解和求解

关于SVM训练过程的分解,特别是问题解的稀疏性,在文献[3]中有过探讨,可以归结为一个二次规划问题的求解。通常情况下,二次规划问题需要预计算整个核矩阵。随着训练集的增长,预计算越来越不可避免,完整的核矩阵也越来越大,很难装入内存。SMO算法将整体的二次规划问题分解为一系列二元的二次规划子问题,其中工作集的选择是训练过程分解的重要步骤。cuSVM对SMO的改进基于文献[9]介绍的利用二阶工作集选择的启发式方法,其主要思想是利用二阶信息达到快速收敛,相对于简陋的一阶算法,二阶启发式方法每次迭代所耗费的资源较一阶算法稍多,但极大地减少了迭代次数。

SMO算法是一个迭代优化算法。具体算法如下:

(1) 初始化使得α1=0,迭代计数器r=1,且KKT优化条件向量:

fi1=j=1myjαj1Κ(xi,xj)-yi=-yi(4)

(2) 当停止条件式(10)满足时,停止迭代。否则,根据二阶启发式方法选择两个工作集,序号分别为ihighilow

(3) 根据文献[10]的方法,在每一个迭代步骤中,算法首先选取两个待更新的向量,此后分别计算它们的误差项,并根据上述结果计算出αilowr+1αihighr+1,将αilowrαihighr更新为将αilowr+1αihighr+1

(4) 更新KKT条件向量:

fir+1=fir+(αilowr+1-αilowr)yilowK(xilow,xi)+

(αihighr+1-αihighr)yihighK(xihigh,xi) (5)

(5) rr+1,转到步骤(2)。

算法终止条件:

Iup={i:0<αi<C}∪{i:yi<0,αi=0}∪

{i:yi<0,αi=C} (6)

Iup={i:0<αi<C}∪{i:yi>0,αi=C}∪

{i:yi<0,αi=0} (7)

bhighstop=maxiΙup(-yifir)(8)

blowtop=miniΙdown(-yifir)(9)

bhighstop-blowstop<τ (10)

时算法终止。τ是算法所设置的阈值。

3 实验结果及分析

3.1 数据集

本文的车牌图像数据来自实地拍摄收集,并且对这些图片进行预处理、车牌定位、字符切割、灰度化和二值化等处理。调整图片大小为15×30。以每个像素点作为一个维度,每个图片转化为450维向量,得到表1和表2的数据集。因实验需要,本文还扩展了上述数据集。仿照实际中可能出现的车牌非常规形态,对上述数据集进行旋转、去角和模糊处理,成倍增加数据量。

(1) 训练图片数据集

含汉字(全国27个省市自治区的简称)、字母(除掉I和O以外的24个大写字母)、数字(0-9)。

(2) 预测数据集

汉字、数字、字母、汉字与字母组合。

3.2 环境参数

实验采用NVIDIA GTX 460型GPGPU显卡,该显卡拥有336个CUDA 核和1GB显存。CPU使用Intel Core i3-2100,3.1GHz。内存大小为4GB。实验操作系统为Windows 7。选择CUDA4.0版本和Visual Studio 2008作为编程环境,使用CUDA C编程语言。

3.3 实验结果

实验主要研究CPU和GPU环境下的性能对比,因此主要计算时间加速比(即同一个任务在CPU和GPU环境下运行消耗的时间的比率)。实验选择LIBSVM作为CPU环境下的对照实验组。随机的选取数据集中一部分图片作为训练集,分别训练cuSVM与LIBSVM模型。在模型建立后,从预测数据集中选一组图片进行预测,cuSVM相对LIBSVM的加速比如图3所示。

由图3可知,在训练样本数量(<5 000个图片)时,cuSVM的加速效率并不明显。随着训练样本数量增加,cuSVM的加速比也越来越高,当训练样本数达到50 000以上时,cuSVM对车牌识别的加速效果将有数十倍,能够很好地满足实时性的需要。

由表3可知,对于同样的数据集,cuSVM的训练效率和预测效率远高于LIBSVM,而准确率相差不大。因此,基于cuSVM的车牌字符识别系统相对于传统的单线程方法更加有效。

在样本数较少时,由于数据从内存传输到显存以及结果返回的时间占了很大比例,所以此时加速比不高,甚至低于只使用CPU环境的LIBSVM的速度。但是随着样本数增加,数据传输时间占用比例越来越小,加速比也就上升了。另外,当训练样本数从600上升到12 000时,预测准确率反而下降,是因为本实验中由于扩大数据集规模需要引入的扩展样本是图形变换得到的噪声样本。

4 结 语

本文利用CUDA技术对SVM分类方法进行加速,使之能够并行地运行在GPU上,并将cuSVM应用在车牌识别系统中的字符识别领域。实验表明,相对于单线程的运行在CPU上的LIBSVM方法,cuSVM方法应用于车牌识别能够带来1-30倍的训练速度提高和50-72倍的预测速度的提高。下一步的工作将研究CUDA模型中grid、block规模对性能有何影响,车牌识别的其他过程如定位、分割等也可以尝试使用CUDA实现加速,特别是对系统性能瓶颈阶段的加速。

参考文献

[1]Vapnik V N.An overview of statistical learning theory[J].IEEETrans Neural Network,1999,10(5).

[2]陈丽,陈静,高新涛,等.基于支持向量机与反K近邻的分类算法研究[J].计算机工程与应用,2010,46(24):135-137.

[3]John C Platt.Fast training of support vector machines using sequentialminimal optimization[M]//Advances in kernel methods:support vec-tor learning,MIT Press,Cambridge,MA,USA,1999:185-208.

[4]Gaetanno Zanghirati,Luca Zanni.A parallel solver for large quadratic programs in training support vector machines[J].Parallel Computing,2003,4(29):535-551.

[5]Austin Carpenter.cuSVM:a CUDA implementation of support vector classification and regression[OL].Nvidia Coperation,2009.htttp://patternsonascreen.net/cuSVM.html.

[6]Hsu C W,Lin C J.A comparison of methods for multiclass support vec-tor machines[J].IEEE Trans Neural Netw,2002,13(2).

[7]丁兆坤.车牌识别技术研究[D].沈阳:东北大学,2004.

[8]张舒,褚艳利,等.GPU高性能运算之CUDA[M].北京:中国水利水电出版社,2009:16-22.

[9]Rong-En Fan,Pai-Hsuen Chen,Chih-Jen Lin.Working set selection u-sing second order information for training support vector machines[J].J.Mach.Learn.Res,2005,(6):1889-1918.

车牌识别中字符识别 篇7

车牌自动识别技术是智能交通系统的一个重要的领域。一个典型的车牌自动识别系统包括车牌定位、车牌字符提取和车牌字符识别三大部分。其中,字符识别是整个系统的核心,字符识别的准确性和识别速度直接关系到该系统是否能够得到实际应用。传统的字符识别方法,如模板匹配、神经网络等,模板匹配法为了提高识别率需要使用大的模板或多个模板进行匹配,而识别的速度则随之降低。神经网络法的识别率很大程度上依赖于训练样本的数量,在小样本训练条件下,识别的率相对较低,且网络结构较复杂。

支持向量机(Support Vector Machines,简称SVM)是由Vapnik等人于1995年根据统计学习理论提出的一类新型机器学习方法,能够有效地解决小样本学习、非线性及高维模式识别等问题,在模式识别、回归分析和概率密度函数估计等方而得到了广泛的应用[1]。最近几年,研究者将SVM应用于车牌识别中,如文献[2][3],在无特征提取的前提下,利用SVM进行识别,虽然取得较高的识别速度,但识别率不高。

2 SVM的基本原理

SVM是统计学习理论中最年轻的部分,主要用于解决有限样本情况下的模式识别问题。它的基本思想是在样本空间或特征空间,构造出最优超平面使超平面与小同类样本集之间的距离最大,从而达到最大的泛化能力。

SVM算法描述如下[4]:

1(1)设已知训练集T={(xi,yi),∧,(xl,yl)}∈(X×Y)l,其中xi∈X=Rn,yi∈Y={1,-1},i=1,2∧,l;

(2)选择核函数K(x,x′)和惩罚参数C,构造并求解最优化问题:

得最优解a=(a1,∧,al)T;

(3)选择a*的一个小于C的正分量a*,并据此计算

(4)求得决策函数:

SVM的基本思想可以概括为:首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优线性分类面,而这种非线性变换是通过定义适当的内积函数实现的。根据泛函的有关理论,只要一种函数满足Mercer条件,它就对应某一变换空间的内积,此函数称为内积函数或核函数。核函数的种类有很多,常用的有以下几种:

(1)多项式核函数:K(X,Xi)=[(X·Xi)+1]q,q为多项式的阶数。

(2)径向基(RBF)核函数:K(X,Xi)=exp(-|X-Xi|2/δ2),这是一种径向基分类器。

(3)Sigmold核函数:K(X,Xi)=tanh(v(X,Xi)+c),得到的SVM是一个两层的感知器神经网络。

目前,核函数种类以及核参数的选择依据尚没有定论,一般情况下,都是通过大量的试验来获得较优的参数。值得一提的是,由于径向基核函数对应的特征空间是无穷维的,有限的样本在该特征空间中肯定是线性可分的,因此径向基核函数是最普遍使用的核函数。

3 基于字符特征与S VM的车牌字符识别

我国车牌标准格式为:X1X2·X3X4X5X6X7,其中X1是各省、直辖市和自治区的简称,X2是英文字母,X3X4是英文字母或阿拉伯数字,X5X6X7是阿拉伯数字,X2和X3之间有一小圆点。针对车牌字符的排列特征,为了提高车牌整体的识别率,可以设计4个分类器来进行车牌字符的识别,即汉字分类器、数字分类器、英文字母分类器、数字+字母分类器。根据车牌中字符的序号,选择对应的分类器进行识别,然后将识别结果按字符序号进行组合,就得到了整个车牌的识别结果。在识别之前,首先要对车牌字符图像进行预处理,然后进行特征提取,把提取的特征向量作为分类器的输入进行训练或识别。

3.1 车牌字符图像预处理

在字符识别前必须对字符进行预处理,以有利于后续的字符识别。对已经切割好的车牌图像,可采用灰度变换、倾斜校正、快速二值化算法对其进行处理,再利用直方图投影分割出单个字符。分割后的单个字符图像的尺寸大小一般都不一样,由于车牌字符的高与宽的比值固定为2:1,则本文经过大小归一化处理后,变为32x16像素的字符点阵,黑底白字,并且规定黑色像素的取值为0,白色像素的取值为1。实验结果表明,32x16的字符点阵在保持车牌字符基本特征的情况下,减少了计算量,取得较好的识别率与识别速度。

3.2 字符特征的选取

经过上面一系列的处理后,各个车牌字符变成了大小相同,排列整齐的字符。接着就要从分割归一处理完毕的字符中,提取最能体现这个字符特点的特征向量。特征向量的选择和提取非常重要,直接影响到识别分类器的设计、性能及其识别结果的准确性,因此,特征向量的选择和提取是一个关键。特征向量的选择和提取方法多种多样,主要有逐像素特征提取法、骨架特征提取法、垂直方向数据统计特征提取法、13点特征提取法、弧度梯度特征提取法等多种方法[5]。

本文针对不同的字符采用了不同的特征向量提取的方法。由于汉字字符的结构较复杂,横竖笔划多,所以采用能较好反映字符整体形状分布的垂直方向数据统计特征提取法,即自左向右对图像进行逐列扫描,统计每列白色像素的个数,形成16个特征,然后自上而下逐行扫描,统计每行的白色像素的个数,形成32个特征,最后形成一个48维的字符特征向量。对于数字与字母,结构较简单,采用13点特征提取法,首先把字符平均分成8份统计每一份内白色像素点的个数作为8个特征,然后统计水平方向中间两列和竖直方向中间两列的白色像素点的个数作为4个特征,最后统计所有白色像素点的个数作为第13个特征。

3.3 字符识别的SVM算法实现

3.3.1 分类算法的实现

SVM首先是被提出来解决两类分类问题的,如何将两类分类方法扩展到多类别分类是SVM研究的重要内容之一。车牌字符识别显然是一个多类分类问题。用S V M来解决多类问题,现在研究者已经提出了多种方法,主要有四种:一对一、一对多、SVM决策树法、多类SVM。其中一对多方法简单且容易实现,所以本文采用了一对多的策略构造多分类器来识别车牌字符。

一对多方法的基本思路[2]就是把某一类别的样本当作一个类别,而其他类别的样本当作另一个类别,这样就转化成了一个两类问题。假设多类别分类问题有m个问题类别S={1,2,…,m},训练样本为{(xi,yi),i=1,2,.,n},其中yi∈S。一对多方法就是构造m个SVM子分类器,在构造第j个分类器时,将属于第j类别的样本数据标记为正类(输出为+1),不属于j类别的记为负类(输出为-1),然后进行训练。

对于车牌中的汉字则需构造50个SVM;数字需要构造10个SVM;对于字母就要构造26个SVM;而对需要数字和字母混合识别的字符就要34个(去掉字母I和字母0)SVM。但对于一种字符的某个(一类)字符,如字母中的“A”,对于它的分类仍然是一个两类SVM。

3.3.2 各种参数的选取

通过实验对比来确定各种参数的选取。此实验采用实拍的25副车牌图像,从其中的15副中取出单个字符进行SVM训练,余下的10副用于测试。

(1)核函数及参数的选择

核函数的选择有很大的灵活性,本文采用惩罚因子C=100,分别用2种不同的核函数进行实验(如表1),实验表明,选用核函数对结果的识别率影响不大。为了提高系统的识别速度,降低系统的运算量,本文选择了RBF核函数(δ2=0.1)。

(2)惩罚因子的选择

参数C作为惩罚因子,直接影响着分类器的推广能力,反映在特征空间,在边缘上的支持向量依照惩罚因子C可不同程度地偏离边缘;随着C的降低,支持向量偏离边缘的程度减少,反之,随着C的增大,支持向量偏离边缘的程度也增大[6]。本文,选取RBF函数作为核函数(δ2=0.1),分别取不同的惩罚因子C=1,C=10,C=100,C=1000和C=10000进行实验(表2),将得到的平均SV个数、平均识别率的结果作一比较,得出:随着C的增大,识别率都趋于稳定值,同时平均SV个数减少,当惩罚因子C=100时,识别率取到最大值98.74%。本文选择惩罚因子C=100。

4 实验结果与分析对比

4.1 训练样本的选取

本次实验采用实拍的100副车牌图像,从其中的60副中取出单个字符进行SVM训练,余下的40副用于测试。每副车牌图像中的所有单个字符图像均经过预处理,并归一化为32 x 16的字符点阵。根据每个字符在车牌中的位置,编上序号1-7。然后对于序号为1的即汉字进行垂直方向数据统计特征提取,对于其余字符均采用13点特征提取,将特征向量作为分类器的输入。

4.2 实验对比

为了对比识别效果,本文采用RBF核函数:C=100,δ2=0.1,用几种不同特征提取法进行SVM分类识别,其结果见表3。

实验结果表明,有特征提取相比于无特征提取的平均识别率都要高,平均识别时间也相差不大。本文的字符特征向量提取法,其识别结果在平均识别时间上虽与另外两种相差不大,但在平均识别率上要高一些,综合效果较好。

5 结束语

SVM是一种新的模式识别方法,它是一种专门研究小样本情况下机器学习规律的理论。本文通过实验对比,结果表明,将不同的车牌字符分别提取特征,然后用SVM来进行分类训练和识别,在平均识别时间与平均识别率上均取得较好效果。

对于SVM的参数选择很重要,但到目前为止,还没有一个统一的选择标准,都是通过实验来确定,如何更好地来选择参数,将是下一步研究需要解决的问题。

参考文献

[1]BURGES C J C.A Tutorial on Support VectorMachines for Pattern Recognition[J].Data Mining and Knowl-edge Discovery,1998,2(2):121-167.

[2]黄凡,李志敏,张晶等.SVM在车牌字符识别中的应用[J].电工技术,2007,(10):56-58.

[3]陈来荣,冀荣华,徐宇.基于支持向量机的车牌字符识别[J].公路交通科技,2006,23(5):126-129.

[4]邓乃扬,田英杰.数据挖掘中的新方法一支持向量机[M].北京:科学出版社,2004.

[5]胡小锋,赵辉.Visual C++/MATLAB图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.

基于BP网络的车牌字符识别系统 篇8

车辆牌照是汽车唯一的管理标志, 通过它可以检索车辆的各项重要信息, 实现车辆控制、运输安排、停车管理、自动收费和事故处理等功能。车牌识别技术大体上由图像实时采集、图像预处理、车牌定位、字符分割和字符识别五个核心部分组成, 其中字符识别是VLPR的关键技术, 直接影响车牌的识别率。神经网络技术以其强大的分析能力、容错性、鲁棒性和非线性映射能力, 目前以广泛应用在汽车牌照的字符识别中。本文提出了一种基于BP神经网络算法的车牌字符识别方法, 提高神经网络的收缩效率, 提升车牌识别速度和识别率, 并通过实验来验证本文提出方法的优越性。

2 车牌识别系统介绍

车牌自动识别系统由图像采集计算机、车体感应器和识别软件组成, 采集到的汽车图像需进行预处理, 然后对车牌进行定位分割、特征提取及分类字符识别。其示意图如图1所示:

3 BP神经网络技术

神经网络是由一个或多个神经元组成的信息处理系统。BP算法的学习过程是由正向传播和反向传播两个过程组成。在正传播过程中, 输入信息从输入层、经隐含层逐层传递、处理, 每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望输出, 则转入反向传播过程, 将误差信号沿原来的连接通路返回, 通过修改各层间连结权的值, 逐次地向输入层传播, 再经过正向传播过程, 这两个过程的反复运用能使误差不断减小, 直至满足要求 (如图2) :

4 基于神经网络的车牌识别系统

基于神经网络的车牌识别系统包含前期处理如车牌定位、车牌字符分割和字符识别。在车牌定位阶段, 我们采用边缘检测的方法, 快速定位可能是车牌的备选区域, 分析出车牌位置, 之后我们抽取字符特征, 在车牌字符识别阶段我们采取神经网络学习机制识别车牌字符。其结构图如图3所示:

5 各模块的实现

5.1 车牌定位

(1) 边缘检测

对车辆图像的边缘检测采用的是Sobel算子边缘检测法, Sobel边缘检测用水平和垂直的梯度卷积作用于同一副图像, 它们是:

(2) 车牌区域的定位

在得到图像的边缘之后, 就可以依据该图对车牌区域进行定位, 我国车牌采用统一标准:长440mm和宽140mm;车牌字符有:35个汉字、25个大写英文字母以及10个数字组成。民用车牌有大型车辆黄底黑字, 小型车辆蓝底白字两种。

分析车牌位置的主要工作是对全图进行扫描, 找到每行可能的车牌区域起始点和终止点, 由此得到车牌的上下左右边界, 由于拍摄角度等问题之后再做倾斜校正。

5.2 车牌图像预处理

由于光学系统失真、曝光不足或过量、遮挡、相对运动和天气等原因, 对车牌识别造成一定难度, 故要对拍摄的照片进行预处理。

(1) 滤波处理

图像中存在噪声, 采用wiener2函数对图像进行滤波, 在Matlab中的调用格式为:Wiener2 (l, [A, B], noise) , l表示输入的图像, [A, B]表示卷积使用的领域大小, noise是噪声强度。

(2) 灰度化和二值化

拍摄的彩色图像包含很多信息, 占用较大的存储空间并且影响系统的处理速度, 需将彩色图像变为灰度图像, 以加快处理速度。人眼对颜色的敏感度:绿色最高, 红色次之, 蓝色最低, 灰度化的经验值为:

具体的Matlab实现如下:

5.3 字符分割

车牌定位后, 直接从整个车牌图像中识别单个字符是困难的, 然而单个字符识别相对简单。因此在字符识别前应对字符进行分割, 形成七个单个的字符。

采用竖直投影法分割字符, 采用向场方法去掉周围非车牌字符区域, 通过水平分割去掉车牌边框, 然后通过竖直方向的投影图分割字符图像。

5.4 基于神经网络的字符识别技术

BP神经网络算法分为两个阶段:误差传回和权值修正, 一个监管机制通过调整神经元之间的权值来训练网络, 直到网络收敛。

第一步是通过网络前传送输入数据:

其中:P是输入向量;W是权重矩阵;b为神经元基数以及M是神经网络层数。

第二步是通过网络回传误差敏感度:

其中t是相应的目标输出。

我们将车牌中包含的字符通过BP神经网络进行训练, 在实际应用时, 由于图片拍摄不清晰, 或者车牌遮挡等原因, 识别系统的表现并非完全正确。在这种情况下, 我们可以扩大样本训练数据库, 并通过训练BP神经网络, 已达到更高的识别率。

6 实验结果和结论

车牌识别中字符识别 篇9

关键词:车牌字符识别,两级分类器,SVM,局部特征,特征融合

目前,车牌识别系统(License Plate Recognition,LPR)在高速公路不停车收费、电子警察等交通管理系统中得到了广泛的应用,LPR作为智能交通系统的一个重要组成部分,已成为广大学者研究的热点。LPR主要包括车牌定位、字符分割与字符识别等4个部分。其中,字符识别是整个系统的关键环节之一。目前字符识别的研究主要有模板匹配方法、神经网络方法、支持向量(Support Vector Machines,SVM)方法。模板匹配方法简单,实时性强,但由于光照等原因造成有噪声低质量图像的识别率较低,文献[1-2]针对该问题提出了改进的方法,但效果仍不理想;神经网络由于具有良好的适应性、容错性和学习能力被广泛应用于车牌字符识别,文献[3-6]针对该类方法易陷入局部假饱和与局部极值等缺点做了相应的改进,使得神经网络能够减少陷入局部极小点的机率,但其收敛速度较慢,在对车牌字符识别时很难达到较高且稳定的识别率;而SVM在解决小样本、非线性及高维模式识别中具有适应性强和效率高的特点,且具有良好的分类和泛化能力,文献[7-8]将其用于车牌字符识别,取得了较好的效果。由于车牌字符中的类数量相对较多且存在形似的字符,文献[9-10]提出两级分类的模式,能有效解决形似字符的错分类问题,但上述方法过于依赖阈值设置的优劣,智能化程度不高,且对噪声的适应性不强。鉴于此,本文提出两级SVM分类器模式,第一级采用字符整体的各网格比例作为分类特征,第二级采用字符局部网格的垂直投影、水平投影方差和比例进行特征融合作为分类特征。实验结果表明,该方法相比模板匹配、神经网络和同类的分级识别方法具有较高的识别率和更快的执行速度。

1 两级SVM分类器模式

采用两级SVM分类器模式,第一级为一个总SVM分类器,针对车牌字符中所有的字母(A~Z,除I和O)和数字(0~9)共34类,按照字符整体特征提取算法实现分类;第二级由5个分SVM分类器构成。将车牌字符中的形似字符分为如下6组:①组,{0,C,D,G,Q};②组,{2,Z};③组,{4,A};④组,{5,S};⑤组,{8,B};其他字符编为⑥组,若判别第一级分类结果中存在①~⑤组中的形似字符,则按照该字符所属组别对应的局部特征提取算法提取特征,并采用相应的SVM分类器实现二次分类。两级SVM分类器模式的字符识别流程如图1所示。

2 整体特征提取算法

提取简单而有效的图像特征是获得高性能识别系统的关键。由于车牌字符笔画的规则性,在第一级SVM分类中,采用网格特征的提取方法,能较好地体现字符在图像中的特性,且具有特征维数小的特点,从而保证了实时性。具体提取方法如下:

1)将分割获得的二值化字符图像进行相应的校正,并采用最小矩形的方法提取字符的上、下、左、右边界,并分别拓展5个像素。

2)将图像归一化到90×50大小并划分成M×N(本文取10×5)个网格,则每个网格大小为m×n(本文取9×10),如图2所示。

3)计算各网格中字符笔画像素占相应网格的比例

式中:I(i,j,k)为第k个网格的二值图像函数;R(k)为对应求取的比例特征。则整幅图像的M×N维特征向量为

3 局部特征提取算法

网格比例特征在第一级SVM分类中,已能获得较好的识别率。但由于前期预处理过程中带来的噪声等情况影响,对于本文前述的形似字符而言,单一采用的字符所有区域的网格比例作为特征易出现误识别,此时就有必要进行二次分类以确保识别的准确率。

3.1 形似字符特征提取区域选择

形似字符是指字符笔画的横、竖、撇、捺和带笔画弧度情况在图像中大部分区域体现相似,而在少部分区域具有明显不同,因此本文摒弃相似区域,仅选择最能区分形似字符的局部区域提取特征。将图像重新划分为5×5的网格并采用Canny算子取轮廓的效果如图3所示,将网格按照从左至右、从上至下的方式编号为1~25。形似字符各组字符的笔画特点相异区域(由白色矩形框标记)示意图如图4所示,各组字符的局部笔画特点分析与对应特征提取区域选取如表1所示。

3.2 形似字符特征提取

每个网格中像素水平和垂直投影的方差能较好地体现笔画的特征:横线(竖线)中的像素在垂直(水平)投影中变化较均匀,方差较小,而在水平(垂直)投影中方差则相对较大,而撇、捺和带弧度笔画在垂直和水平投影中相对横、竖变化均匀,方差则较小。因此上述两种特征的结合能较好地表征笔画的各个特性。

设图像划分成M×N个网格,每个网格大小为a×b,则图像网格的字符笔画像素垂直投影方差计算为

式中:Pv(i)为第p个网格中第i列的垂直投影;AVGv为该网格垂直投影的均值;Vv(k)为对应网格求取的垂直投影方差。

水平投影方差计算为

式中:Ph(j)为第q个网格中第j行的水平投影;AVGh为该网格水平投影的均值;Vh(k)为对应网格求取的水平投影方差。

各组按照表1各组对应的特征提取网格号,分别提取其垂直投影方差的特征向量为

同样方式分别提取各组的水平投影方差和比例特征向量Fh①~Fh⑤,Fr①~Fr⑤,按组分别将垂直投影方差特征向量、水平投影方差和比例特征向量特征融合后,获得各组最终的特征向量表示为:①组,F①′=[Fv①,Fh①,Fr①],共45维;②组,F②′=[Fv②,Fh②,Fr②],共30维;③组,F③′=[Fv③,Fh③,Fr③],共30维;④组,F④′=[Fv④,Fh④,Fr④],共30维;⑤组,F⑤′=[Fv⑤,Fh⑤,Fr⑤],共18维。

4 实验结果与分析

为验证本文方法的有效性,在CPU为Intel(R)Core(TM)i3-380M(2.53 GHz),内存为2.30 Gbyte的硬件条件下,采用MATLAB软件平台,针对交警部门违章抓拍的车牌字符图像,将本文方法和采用模板匹配、神经网络作为参比模型的分级识别方法,用文献[9]、文献[10]所提的同类识别方法进行仿真实验对比。样本总数为4 554幅,其中训练样本为1 323幅,测试样本为3 231幅。

各种方法的总体识别情况如表2所示,本文方法的识别率达到99.44%,均优于其他4种方法,表明本文方法在分类模型的选取和两级特征提取方法的有效性,平均识别时间为23.45 ms,能满足实际的工程应用的技术要求。

为进一步说明本文方法在形似字符识别中的有效性,采用各种方法对2 592幅形似字符样本进行识别实验对比,由于文献[9]、文献[10]与本文所提形似字符不尽相同,表3中所列为各方法形似字符取并集后各字符的识别率,标记“×”表示对应字符在该方法中不属于形似字符,无可比的识别率。表3结果表明本文方法在各形似字符中识别率均比其他方法高,特别在“2”,“S”,“8”,“C”,“4”,“A”中取得100%的识别率,仅在“Q”的识别率偏低,均被误判为“0”,通过分析,在误判的测试样本中表征“Q”特性的“突出笔画”部分(17~19网格)大部分缺失是导致误判的因素。文献[9]、文献[10]方法在大部分特别是“5”,“D”,“B”,“L”形似字符中识别率相对较低,主要在于这两种方法的二级分类均属于非智能方法,分类效果过分依赖样本质量和阈值的选取。通过分析误判样本,文献[9]的骨架法、灰度统计法、边界距离法和文献[10]的弯曲度、交点数统计等特征提取方法,在样本存在少量噪声的情况下,均对分类效果有较大程度的影响。而本文的特征提取是考虑形似字符在局部上笔画整体的变化程度,对于噪声具有一定的容错性,且采用的智能SVM分类方法具有较强的适应性。因此该方法在形似字符的判别中具有一定的鲁棒性。

5 结束语

本文提出一种采用两级SVM分类器的车牌字符识别方法,第一级由一个SVM分类器构成,提取字符图像整体的各网格比例组成特征向量实现对所有字符的识别。将形似字符分组,分别对应一个第二级分类器,针对一级识别结果中的形似字符做进一步识别,通过提取局部相应网格中字符轮廓的垂直、水平投影方差、比例组成特征向量,由相应SVM分类器实现。将本文方法和采用模板匹配、神经网络作为参比模型的分级识别方法以及文献所提的同类分级识别方法进行仿真实验对比,结果表明本文方法在形似字符的识别率和总体识别率方面均优于其他方法,具有一定的鲁棒性,且识别时间能满足实际的工程应用的技术要求。

参考文献

[1]马俊莉,莫玉龙,王明详.一种基于改进模板匹配的车牌字符识别方法[J].小型微型计算机系统,2003,24(9):1670-1672.

[2]陈斌,游志胜.车牌号码松弛模板匹配方法[J].计算机应用,2001,21(8):154-157.

[3]BASU&nbsp;J&nbsp;K,BHATTACHARYYA&nbsp;D,KIM&nbsp;T&nbsp;H.Use&nbsp;of&nbsp;artificial&nbsp;neural&nbsp;network&nbsp;in&nbsp;pattern&nbsp;recognition[J].International&nbsp;Journal&nbsp;of&nbsp;Software&nbsp;Engineering&nbsp;and&nbsp;its&nbsp;Applications,2010,4(2):23-34.

[4]VILLEGAS&nbsp;O,BALDERRAMA&nbsp;D&nbsp;G,DOMINGUEZ&nbsp;H&nbsp;O,et&nbsp;al.License&nbsp;plate&nbsp;recognition&nbsp;using&nbsp;a&nbsp;novel&nbsp;fuzzy&nbsp;multilayer&nbsp;neural&nbsp;network[J].International&nbsp;Journal&nbsp;of&nbsp;Computers,2009,3(1):31-40.

[5]李会明,张仁津.基于改进BP网络的车牌字符识别方法研究[J].计算机工程与设计,2010,31(3):619-621.

[6]郭荣艳,胡雪惠.BP神经网络在车牌字符识别中的应用研究[J].计算机仿真,2010,27(9):299-301.

[7]吴进军,杜树新.SVM在车牌字符识别中的应用[J].电路与系统学报,2008,13(1):84-87.

[8]高珊,刘万春,朱玉文.基于SVM的车牌字符分割与识别方法[J].微电子学与计算机,2005,22(6):34-36.

[9]万燕,刘伟.基于低质量图片的两级车牌字符识别算法[J].计算机应用与软件,2012,29(11):281-284.

车牌识别中字符识别 篇10

关键词:粗糙集理论,车牌字符识别技术,研究

粗糙集是一种关于数据推理分析的理论, 是刻划不完整、不一致与不确定性的一个数学工具, 能够充分有效地识别分析出不确定性、不完整性等各种不完备的字符信息。目前, 在国内外这种粗糙集理论已成为最活跃的信息科学研究领域之一, 广泛地应用于各模式识别、多语言识别、数据分析、人工智能及各种信息智能处理等领域中, 并取得惊人的成果[1]。在车牌字符识别技术中, 依据字符特征及属性运用粗糙集理论对知相关识进行约简, 再利用粗网格特征对字符的整体形状与分布进行反映。但这种网格的划分较困难, 若划分太细则特征维数会因过多而产生冗余, 甚至会把关键的分类特征淹没掉;若划分太粗则字符的特征维数较少, 其分类能力也就相对较弱。因此, 选择合理的字符网格特征是车牌字符识别技术系统中一个至关重要的技术步骤[2]。

1 提取字符粗网格特征

1.1 汉字特征

通常提取粗网格特征的方法是先将待识别字符的大小与位置进行归一化处理为点阵, 分成nn个等网格, 然后统计各网格中的黑 (或白) 像素数量, 从而得到nn维的网格特征向量。粗网格特征属于局部特征, 其统计特征优点是易提取、好理解, 较适用于字型变化小、数量有限的字符;而缺点:因特征维数较多而导致抗干涉能力相对较差, 且运算时间长。

1.2 模糊数学特征

粗糙集适合处理定性数据或者概念类对象, 而汉字点阵中提取到的特征数据过于离散化, 所以必然要进行归一化或泛化处理。为了使运算简约, 本文根据实际的车牌情况, 采用模糊数学法对字符特征进行泛化, 划分为五个语言等级变量:少、较少、中、较多、多;并分别用五个数值表示, 即1、2、3、4、5。本文选取了80个车牌, 并对上面的的80多个汉字进行统计分析, 从而将这些数量特征转换成语言变量。

2 字符识别技术

2.1 约简算法

采用属性递减的约简算法, 它不用验证条件属性的每个子集。可从条件属性的全集出发, 逐步减去条件属性集合中的不会对决策表系统的信息造成损失的那些无用属性。当属性递减时, 可先对剩余属性逐一进行测试, 假如去掉的属性不会改变条件属性集合的依赖性, 那么则可删除一个对其依赖性最小的属性[3]。此算法的时间复杂性应取决于循环求取的次数。

2.2 识别流程

简约后的粗糙模糊神经元网络可分为四层。其主要是基于实际粗糙集理论的工作过程来进行的强化设计, 其本质是一个利用模糊神经元网络而实现推理的系统。

第一层为输入层, 该层神经元的个数为n, 代表约简后的属性数量。

第二层为模糊化层, 任意一个输入分量的离散区间都可定义为一个模糊集合, 再分别计算这n个输入分量, 每个输入分量所属于的各模糊集合的隶属曲度值均在[0, l]之间。

第三层为推理层, 这层的每一个神经元都代表一条模糊规则, 其作用是匹配模糊规则的前件, 进而计算出规则适用度。

第四层为输出层, 本层的神经元表示输入对象的类别。

字符识别算法公式如下:

a.取一待识车牌字符为本次运算样本, 由约简后的集合属性值组成输入向量;

b.送入已划分的网络, 计算输出层的各神经元的输出值;

c.计算神经元网络输出值与样本类别的理想输出距离;

d.设当输出距离为最小理想值时, 即可算出字符识别的类别。

3 结果

80幅车牌图像共计560个字符, 其中有汉字12个、字母14个以及数字7个均被误识, 另有2幅车牌的定位和分割并不成功, 导致14位的字符识别失败, 因此, 本组车牌字符识别的成功率为91.6% (513/560) 。

4 讨论

利用粗糙集的基本原理对知识进行约简, 简约后的车牌字符提取到的粗网格特征集的结果要明显少于一般网格特征的维数和决策规则。本技术的主要思路是在提取字符的粗网格特征时尽量保持其分类能力的稳定性, 然后提出一种有效选择车牌字符网格特征的改进算法, 这既减少了字符识别时的运算工作量, 又有效避免将主要有用的特征分类沉没, 进一步提高了字符的识别率。

粗糙集最典型的特点和优势就是具有极强的定性分析能力, 可以直接根据给定问题的相关描述集合开始出发, 并且可以从给定问题的不确定性和不可分辩性来确定近似值域, 进而找出给定问题中的隐含知识以及揭示出问题的内在规律[4]。

综上所述, 本研究中主要通过将粗糙集、神经网络和模糊逻辑三者的相互结合, 提出了一种创新型粗糙模糊神经网络识别器, 根据粗糙集获取的技术知识进行构造模糊化后神经网络, 可以有效提高车牌字符识别的抗干扰性及识别成功率。

参考文献

[1]王波, 刘丰年.基于粗糙集的快速车牌字符识别技术[J].国际IT传媒品牌, 2010, 31 (10) :44-48.

[2]高伟, 刘喜平.基于粗糙集的车牌字符识别方法[J].山西大学学报, 2005, 28 (3) :252-257.

[3]贺光, 李永忠.基于粗糙集理论和模糊SVM的车牌识别技术研究[J].计算技术与自动化, 2010, 29 (4) :86-89.

上一篇:多元交互式英语教学下一篇:智能挖掘