纸币处理模块

2024-05-09

纸币处理模块(精选三篇)

纸币处理模块 篇1

本文主要利用图像变换中的仿射模型, 来对纸币图像进行校正, 利用大津法来对图像进行二值化, 实现目标图像和背景图像的分割。

1基本原理

1.1大津法 (OTSU)

大津算法也称为最大类间差法, 简称为OTSU, 该算法是由日本学者大津于1979年提出的, 是一种自适应的阈值确定的方法。它是按图像的灰度特性, 将图像分成背景和目标两个部分。

记M*N图像G在 (i, j) 点处的灰度值为f (i, j) , 图像的灰度级为m, 不妨假设f (i, j) 取值为[0, m-1], 记p (k) 为k的频率, 那么:

假设选取灰度值t为阈值来对背景图像和目标进行分割, 此时背景与目标分别为:{f (i, j) t}和{f (i, j) t}, 然后求出背景图像和目标图像部分所占的比例以及灰度均值, 然后根据大津法算法计算出图像的最佳阈值Threshold Value[8]

找到灰度图像最佳阈值后, 将图像按下面的规则二值化分割:

式 (8) 中:G (i, j) 表示经过二值化分割后的图像。大津算法是一种全局动态二值化算法, 不受图像的亮度和对比度的影响。

1.2仿射变换

仿射变换是一种二维坐标之间的线性变换, 它具有一些特性, 一是图形中的直线经过仿射变换后任然是直线, 另一个是变换前后二维图形上的点相对位置保持不变。仿射变换可以通过一系列的平移、翻转、缩放、旋转、错切等复合变换来实现, 每个仿射变换可以由一个矩阵A和一个向量b给出, 它可以写作A和一个附加的列b。一个仿射变换对应于一个矩阵和一个向量的乘法, 而仿射变换的复合对应于普通的矩阵乘法, 只要加入一个额外的行到矩阵的底下, 这一行全部是0除了最右边是一个1, 而列向量的底下要加上一个1。

因此, 放射变换均可以用一个3×3的矩阵来表示, 其最后一行为 (0,0,1) 。该变换矩阵将原坐标 (x,y) 变换为新坐 (x′, y′) , 这里原坐标和新坐标皆视为最末一行为 (1) 的三维列向量, 将原列向量左乘变换矩阵得到新的列向量:

1.3双线性插值

原始图像经过仿射变换后, 像素点发生了偏移, 需要通过插值处理来还原原始图像在目标图像中的像素。比较常用的方法如双线性插值。

双线性插值, 顾名思义就是两个方向的线性插值复合起来。该算法是利用了需要处理的原始图像像素点周围的四个像素点的相关性, 通过双线插值算法计算得出的。对于一个目的坐标, 通过图像变换得到其在原始图像的对应的浮点坐标 (iu, jv) , 其中i, j均为非负整数, u, v为[0, l]区间的浮点数, 则这个像素的值f (iu, jv) 可由原图像中坐标为 (i, j) 、 (i1, j) 、 (i, j1) 、 (i1, j1) 所对应的周围四个像素的值决定, 即:

其中f (i, j) 表示源图像 (i, j) 处的像素值, 以此类推, 这就是双线性内插值法。

2纸币校正与冠字号定位提取

2.1纸币的倾斜校正

点钞机内部装有图像传感器, 在纸币进出点钞机的同时, 图像传感器会采集纸币的扫描图像。并将连续的图像信息转化为数字形式, 即对连续图像的离散化, 将整个图像划分为微小矩形区域的像素点。本文主要是针对灰度级为256级, 格式为“bmp”位图格式, 大小为800411的纸币扫描图像来进行相关图像处理, bmp格式的源图像如下图所示:

从图中我们可以发现纸币图像并不是“正着”的, 而是有一定的倾斜, 这是因为通过点钞机图像采集装置获取的纸币图像信息, 是在点钞机高速运转下获得的, 因此, 扫描得到的图像就会有一定的倾斜。

在对纸币图像进行倾斜校正时, 需要知道仿射变换的变换矩阵M。因此, 在已知最终校正后目标纸币图像顶点坐标的情况下, 可以通过检测纸币源图像的边缘直线。检测边缘的方法可以利用纸币图像边缘像素灰度值的跳跃性特点来实现。纸币图像与背景相差很大, 背景是黑色, 而纸币图像的边缘呈灰白色, 因此人民币边缘的像素灰度值过渡急剧, 存在明显的灰度差, 根据这一差异, 可以通过遍历图像中的像素点来找出纸币边缘的特征点。

当找到纸币四个边缘的特征点后, 采用直线拟合的方法来拟合出图像边缘的四条直线, 然后通过直线的相交来求出纸币图像的四个角点坐标, 然后根据这四个角点坐标, 联同校正后目标顶点坐标来解方程求出仿射变换的变换矩阵M。最后, 对整个图像利用求出来的仿射矩阵M来进行仿射变换, 对纸币源图像进行初步地校正。最后, 为了避免像素偏差, 利用前面提到的双线性插值的方法, 对初步校正后的图像像素点进行插值处理, 实现纸币图像的倾斜校正。

2.2冠字号的定位提取

纸币经过上一节的校正处理后, 为了能够进行冠字号的定位和提取, 需要对其进行二值化处理。二值化图像是指整个图像中像素灰度值只有白 (灰度值为255) 和黑 (灰度值为0) 。这里利用前面提到的大津法二值化来处理图像。

经过二值化处理后, 需要将纸币上含有冠字号的部分图像分割出来, 由于纸币的大小固定, 那么冠字号的大致区域可以确定, 可以首先对冠字号进行粗定位, 截取包含冠字号的一小部分图像, 然后进行像素点的水平投影和垂直投影方法确定冠字号边界[9], 从而实现冠字号的精确定位。

3实验结果与分析

根据纸币校正和冠字号定位提取的方法, 在Visual Studio2013平台上, 编程实现了各部分的相关图像处理。对图3.1所示的源图像进行倾斜校正, 源图像的灰度级为256, 图像大小为800 × 411, 定义倾斜校正后纸币的顶点坐标为

A (100, 50) 、B (100, 358) 、C (700, 50) 、D (700, 358) 。

首先通过边缘检测, 找出像素跳变的特征点, 然后拟合出了纸币的上下左右四条直线:

纸币上边缘拟合的直线:y0.067x73.63

纸币下边缘拟合的直线:y0.077x298.75

纸币左边缘拟合的直线:y7.85x497.75

纸币右边缘拟合的直线:y7.96x5403.45

从拟合得到的直线可以看出, 在误差允许范围内, 上下、左右的直线是近似平行的, 所以利用这些直线可以求得源图像的四个角点为A' (53.57, 77.23) 、B' (25.10, 300.69) 、C' (663.65, 118.21) 、D' (634.81, 347.94) 。利用这四个源图像角点坐标和目标图像的四个顶点坐标, 可以解方程得到仿射变换矩阵为:

然后利用仿射矩阵M对整幅图像进行倾斜变换, 通过插值处理后得到校正后的纸币图像如下图:

接下来利用大津法对图像进行二值化处理中, 求得的最大阈值为149, 即把灰度值大于149的像素点的灰度值置为255, 使其显示呈白色, 把灰度值小于149的像素点的灰度值置为0, 使其显示呈黑色。最后通过水平和垂直投影的方法, 定位冠字号所在区域, 并提取了二值化后的冠字号图像, 如下图所示:

4结束语

本文主要围绕纸币倾斜校正、冠字号二值化处理与定位的相关算法进行了研究, 对点钞机采集的纸币图像进行了相关的预处理与分析, 编程实现了各个算法。实验结果表明本文所使用的利用仿射变换来实现纸币的校正, 以及大津法二值化的方法是准确和有效的, 为纸币的其他后续处理, 例如字符分割与识别奠定了良好的基础。

参考文献

[1]李培华, 肖莉娟.基于Mean Shift的相似性变换和仿射变换目标跟踪算法[J].中国图像图形学报, 2011, 02:258-266.

[2]Liu D, Yu J.Otsu Method and K-means[C]//2009Ninth International Conference on Hybrid Intelligent Systems.IEEE Computer Society, 2009:344-349.

纸币处理模块 篇2

相位模块IGBT故障原因分析及处理

交流电动轮卡车的相位模块是由IGBT组成的.,相位模块发生故障后,更换该模块价格昂贵,如果设备停用又会造成企业经济损失.本文针对屡损相位模块的交流电动轮卡车,进行长期跟踪和检测.并通过对卡车DC/AC电路的驱动电路的深入研究,分析其原因,提出故障处理的方法.

作 者:席宝平 作者单位:内蒙古神华集团准格尔能源公司设备维修中心,内蒙古,准格尔,010300 刊 名:中国科技博览 英文刊名:ZHONGGUO BAOZHUANG KEJI BOLAN 年,卷(期): “”(1) 分类号:U472.42 关键词:逆变电路   相位模块   IGBT   故障诊断  

语音信号模块化预处理技术探究 篇3

语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特性的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。

(l)时域分析方法

语音信号的时域分析就是分析和提取语音信号的时域参数,是一种比较直观的分析方法。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理与分类等,其实现简单、运算量也较小。

(2)频域分析方法

从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等。常用的频域分析方法包括傅立叶变换法等。因为语音信号是一个非平稳过程,因此适用于周期、非瞬变或平稳随机信号的标准傅立叶变换不能用来直接分析,而应该用短时傅立叶变换进行频谱分析,相应的频谱称为“短时谱”。

(3)同态分析

同态分析实现了将卷积关系变换为求和关系的分离处理,即解卷。对语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成与识别等。

(4)线性预测分析

线性预测分析的基本思想是:由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。现代语音编码的声道模型参数估计大多都基于线性预测分析方法。

二、语音预处理模块分析

实用语音预处理系统主要包括噪声消除系统、电平控制系统和回声控制系统等。噪声消除系统的作用是检测并降低语音信号中的背景噪声,提高语音的纯净度;电平控制系统则能稳定信号传输电平,使双端或多端语音的音强与音质维持在一定的水平上;回声控制系统则针对扩声系统中回声所引起的正反馈放大现象,采用自适应滤波等方法进行回声对消,也起到提高语音纯净度的作用。

下面介绍语音预处理的几个重要模块。

2.1自动电平控制

对于经过通信传输或者放大系统的语音信号幅度经常发生很大波动这种现象,ALC系统通过实现一种优化语音信号电平的方法,提高语音质量。自动电平控制(Automatic Level Control,ALC)与自动增益控制都是为了把信号电平调整至最优值,但前者主要用于语音信号处理上;传统AGC则是连续地调整系统增益以控制传输信号幅度。

ALC系统是建立在语音激活检测(VAD)基础上的实时调整语音信号电平的技术。首先,根据语音信号的短时平稳性,将语音信号分段处理。利用语音帧之间的相关性,计算出当前帧与相邻帧的长时功率值,再与预设值作比较得到增益值,用这个值调整当前帧的电平。由于人的语音信号是不连续的,存在非语音帧的情况。如果不考虑语音帧和静音帧的分类,直接计算增益值,就会将噪音信号帧作为参考计算进去。但背景噪音与语音信号间没有必然的相关性,这样直接计算反而会引起语音信号的不稳定。

所以在自动增益控制之前加一个VAD检测部分,先将语音信号分成两类,语音帧和静音帧。再以归类为语音帧的信号作为参考计算长时功率值与一个标准值进行比较调整。如果遇到静音帧则可忽略,利用其前一个语音帧作为下一个语音帧的调整参数。调整趋势图如图1,结构图如图2。

参考文献

[1] 王炳锡.变速率语音编码.西安:西安电子科技大学出版社,2004.

[2] 陈克安,曾向阳,李海英编著.声学测量.科学出版社,2005.

[3] 刘海滨.非平稳环境下基于人耳听觉掩蔽特性的语音增强,信号处理,vol.19,No.4,2003.

[4] 蔡凌云等.自动增益控制技术应用.电子工程师,2002,28(4):22-23,37

上一篇:“课题·小组”教学法下一篇:工程项目管理策略