视频序列图像

2024-05-05

视频序列图像(精选八篇)

视频序列图像 篇1

智能交通系统ITS (Intelligent Transportation System) 以及智能交通管理技术成为了研究热点, 车辆跟踪是基于视频技术的智能交通检测系统中最关键技术之一, 也是计算机视觉研究领域的一个重要课题[1]。视频车辆跟踪的目标是从图像序列的每帧中得到各运动目标的运动状态, 比如车辆在图像中所处位置、高宽、速度和加速度等。已有的车辆跟踪方法主要包括基于模型的跟踪[2]、基于活动轮廓的追踪[3]、基于区域的跟踪[4]和基于特征的跟踪[5]等4类。本文提出一种基于区域的质心匹配跟踪方法, 并通过引入搜索连通域的方法改善质心跟踪稳定性。

1车辆跟踪算法

车辆跟踪算法通过目标车辆的外接矩形对车辆进行标识, 对已经出现在检测区域内且进入跟踪状态的车辆均对其跟踪窗口赋予固定标识。通过质心匹配的跟踪算法是一种常用的简单跟踪方法, 但是它却存在一些很明显的缺点, 诸如:质心跟踪运动目标的稳定性差、跟踪精度不高、实时性差、易出现目标丢失等问题。所以, 在实际应用中往往将其与其他算法相结合, 从而改善质心跟踪算法的跟踪效果。本文通过质心匹配跟踪目标车辆, 如果跟踪失败我们通过搜索连通域的方法实现目标的连续跟踪。

前期经Vi Be (Visual Backgroud extractor) 算法[6], 得到视频图像序列的前景图, 而在视频图像中车辆的高度及宽度均在一定阈值范围内, 对每帧图像的前景图搜索轮廓, 如果高宽满足在设定的阈值范围, 则认为对应轮廓矩形为车辆目标。接下就得对检测到的车辆目标进行跟踪, 已知前一帧已检测的车辆目标对应的外接矩形及质心, 要找到目标在当前帧的位置, 如果我们搜索当前帧整幅图像, 耗时一定很长。本文采用局部范围搜索的方法:

搜索区域为:

其中, (X, Y) 为前一帧目标外接矩形即跟踪窗口左上角坐标, (X1, Y1) 为当前帧搜索区域左上角坐标, H为前一帧目标的高, W为前一帧目标的宽, H1为当前帧搜素区域的高度, W1为当前帧搜素区域的宽度, a1、a2、a3、a4为阈值, 可以通过手动设置。

在当前帧中, 在上面求得的搜索区域中查找轮廓, 滤除长宽不在阈值范围内的轮廓, 剩余轮廓中必然有一个是目标在当前帧的位置, 我们通过质心匹配的方法寻找该轮廓。

车辆质心定义为:

式中:N为车辆拥有的像素点个数, xi为像素点的横坐标, yi为像素点的纵坐标。

根据 (2) 式求目标前一帧所处质心A= (x, y) 以及目标当前帧对应搜索区域中搜索到的满足高宽条件的轮廓的质心B1= (x1, y1) , B2= (x2, y2) …, Bi= (xi, yi) 。如果|x-xi|<m且|y-yi|<n (m, n为两个阈值) , 则认为质心Bi对应的轮廓为目标在当前帧的位置。

上面基于区域的跟踪方法通过质心匹配实现目标跟踪, 由于阈值选取非最优, 可能导致目标中途跟踪丢失, 我们常见的解决办法就是通过Kalman滤波[7]、粒子滤波[8]等预测算法对目标在下一帧的位置进行预测来找到目标位置, 但是这些预测算法在复杂的交通条件下稳定性差, 实时性也差。所以引入了连通域搜索的方法, 该方法简单易行且实时性好。

对于实时视频图像序列, 每两帧时间间隔比较小, 近似认为目标在相邻帧间运动变化缓慢, 在前景图像提取稳定的前提下, 同一目标前后两帧位置区域必然存在重叠像素, 本文提出的改进算法便是通过对这些重叠像素进行处理实现目标的连续跟踪。

如果质心匹配失败未跟踪上目标, 通过下面算法实现目标连续跟踪:

1) 以目标在前一帧的跟踪窗口为基准, 搜索当前图像帧中此窗口中的每一个像素点, 如果为前景像素点 (即公共像素点) 则以该像素点为种子结点搜索连通域。有多少个重叠像素我们就会搜索到多少个连通域。

2) 不考虑多目标粘连情况下, 取搜索到的最大轮廓作为目标在当前帧位置。

2车辆跟踪实验和结果

本论文在实验平台Visual C++6.0及Opencv1.0下实现, 通过Direct Show捕获视频流数据, 所使用的视频帧率为每秒24帧。我们采用基于区域的质心匹配跟踪结合连通域搜索的方法对运动车辆进行跟踪的部分实验结果如图1, 其中, 除检测区域中运动目标高宽范围采用绝对阈值外, 其他阈值均采用相对阈值, 取前一帧目标外接矩形的宽的倍数。

图1-1、图1-2为连续两帧的前景图, 图1-3、图1-4为此连续两帧的跟踪图。在上面的实验结果中每辆车都有一个特有标号, 在跟踪过程中相同车用相同的数字来标识。通过跟踪技术, 在第977帧认为标号为8、9的车辆和上一帧标号也为8、9的车辆分别为同一辆车。同时, 第977帧, 从前景图可以看出新增加了一块运动区域, 它即为新增加的车辆的前景, 在原图中将其标为10号。

为了阐述本文提出的方法的性能和效果, 本文提出的方法与仅用质心匹配跟踪方法进行了比较实验, 实验结果如表1所示。

实验在车流较少和实验场景较简单的情况下进行, 通过比较实验证明采用本文提出的基于区域的质心匹配算法结合连通域搜索的方法, 算法简单, 跟踪精度、稳定性及实时性显著提高。

3结语

车流量检测、交通车辆车型分类及交通事件检测均是以车辆检测和跟踪为基础, 本文提出的车辆追踪算法主要是基于区域的质心匹配算法结合连通域搜索的方法。通过实际的道路视频序列对该算法进行实验, 实验结果表明该算法具有较好的跟踪效果, 并能够保证跟踪的稳定性及实时性。

摘要:首先对现有的基于视频序列的车辆跟踪技术进行了研究, 提出了一种质心跟踪算法, 并通过引入连通域搜索增加了该算法的稳定性。实验结果表明, 该算法能够十分有效地实现车辆的跟踪, 并能保证跟踪的稳定性及实时性。

关键词:视频序列图像,车辆跟踪,连通域搜索

参考文献

[1]张敬磊, 王晓原.交通事件检测系算法研究进展[J].武汉理工大学学报, 2005 (2) :30-34.

[2]凯特J, 渡边T, 托加S, 等.一种基于HMM/MRF随机框架的车辆跟踪[J].IEEE智能交通系统, 2004, 5 (3) :142-154.

[3]钟Y, 杰恩A K, 乔利M.基于可变模型的目标跟踪[J].IEEE模式识别与机器分析, 2000, 22 (5) :544-549.

[4]胡伟明, 肖雪娟, 谢丹, 等.基于三维模型的车辆跟踪的交通事件预测[J].IEEE车辆技术, 2004, 53 (3) :677-694.

[5]Tissainayagam P, 苏特D.基于图像序列点特征的目标追踪[J].模式识别, 2005, 38 (1) :105-113.

[6]Barnich O, Van Droogenbroeck M.Vibe:一种基于图像序列的通用背景提取算法[J].IEEE图像处理, 2011, 20 (6) :1 709-1 724.

[7]Kalman R E.A new approach to linear filtering and Prediction problems[J].Transaction of the ASMF:journal of basic engineering, 1960 (1) :35-45.

视频序列图像 篇2

大唐电信集团基于最先进的图像智能技术研究成果推出的视频摘要网络平台,可以有效地解决各类视频图像应用系统所普遍面临的视频图像回放查看慢、图像信息提取困难、图像数据的非结构化特点与信息系统集成应用困难等技术难题。

1 技术原理

基于原始视频图像,对图像的背景和活动目标进行分离,产生一个由静态背景和动态目标(也称物件)组成的图像信息数据库,以时间浓缩的形式对背景与动态目标进行重新组合,达到缩短视频录像回放时间的目的。

具体浓缩的比例根据场景复杂度和用户设定而定,通常可以实现将24小时视频浓缩到15分钟左右的处理效果,在某些活动目标相对较少的场景,如飞机起飞跑道,可以将24小时的视频浓缩到1分钟,浓缩比可达1000多倍。

视频摘要主要包括目标识别和数据合成两个主要处理过程(如图1所示)。其中目标识别过程主要包括四个步骤:提取背景,提取物件,追踪物件和追踪群组;数据合成过程主要包括两个步骤:群组排序和单帧合成。

最终生成的视频数据可通过结构化图像信息文件形式或视频摘要数据流的形式进行存储,实现对视频数据的结构化存储,方便用户进行查询和检索。

2 主要功能

主要功能包括:视频摘要处理、摘要及原始图像管理、摘要参数配置、处理任务资源管理及系统管理,以及开放接口等。

视频频摘要处理,主要包括视频实时数据及路线数据获取、格式适配转换、摘要处理、图像信息结构化分析、信息标识、摘要参数设置等功能。 摘要视频及原始图像管理,主要包括图像合成、摘要视频播放、原始录像回溯、视频特征搜索、语意检索、视频图像片段截取、数据输出与转发等功能。

3 四大技术特点

一是能大幅提高海量视频图像资源查看效能。对海量视频录像或实时图像进行视频摘要处理,能够大幅度的提高录像倒查的效率,减少人力、物力的投入。

二是视频关键特征搜索。运用视频特征,如运动方向、目标颜色、所处区域等搜索过滤功能,能够进一步对提高查找关注案事件图像片段的效率,准确定位事件发生时间,快速挖掘关注事件。

三是结构化视频图像数据保存。对视频图像的摘要分析,并进行结构化处理和结构化保存,在大幅度提高查看效率的同时,又能大幅度的减少存储空间,实现对时间和空间的双重高效利用。

四是集中授权、分级控制、分布式处理。与虚拟化服务的云计算技术相结合,实现视频摘要分析处理的分布处理和集中应用管理,提高图像摘要处理的效率和综合应用能力。

4 技术应用方向

海量视频图像数据化

适用于将视频图像信息转换为文本数据信息、从原始视频录像提取有价值视频数据等视频图像的结构化处理,使视频图像数据与其各类信息业务系统形成深度融合应用。

批量数据内容搜索

适用于各类视频图像资源的实时摘要处理、视频录像摘要分析、视频图像存储数据资料的浓缩、视频图像内容特征过滤与语义分析、视频目标识别与智能检索等应用领域。

公安图侦实战应用

在公安图侦实战应用领域,视频摘要技术可以大幅缩短案事件图像的回放查看时间,可以快速定位目标视频和目标对象,可以标识和过滤关注目标,导出关键性视频图像证据片段,将图像进行结构化处理后与公安警综、大情报等案事件侦查信息系统形成无缝对接和智能应用,有效提高公安侦查业务的科技水平,减轻警务公安人员的劳动强度和工作压力。

5 实战案例

以近期引起社会广泛关注的长春盗车掐死婴儿案件为例,虽然案发城市建有大规模的视频监控系统,但是面对案件可能相关的海量视频,全部通过人工检索方式查找嫌疑车辆的效率低下,即使警方动用了大量人员参与录像查看,仍未能及时查找到有效信息。在此案件中传统大规模视频监控系统暴露出了严重的缺陷,也引起了社会各界对其实战能力的广泛质疑。

视频摘要网络平台在设计过程中充分考虑了公安部门的实战需求,与大规模视频监控系统的结合将有效解决现有系统视频图像回放查看慢、图像信息提取困难等问题,具体应用过程如下:

(1)调取案发地点周边所有道路附近的视频监控录像作为原始视频资源,时间范围设定在案发前30分钟至案发后2小时,假定共有可用图像1000路,则原始视频资源时长为1000(路)×2.5(小时)=2500小时。

(2)获取被盗车辆外观信息,如车辆颜色、车辆型号、外形尺寸范围、车牌号、前风挡玻璃粘贴物颜色大小等可视特征。

(3)将被盗车辆外观信息作为检索条件输入视频摘要网络平台,由平台根据这些检索条件对原始视频资源进行自动处理,快速检索出包含类似被盗车辆的视频片段并以视频摘要数据流的方式存储,为提高处理速度可采用由多台服务器构成的云计算平台进行分布式联机检索。

(4)由多名侦查员对少量视频摘要数据流进行人工查看,锁定重点可疑车辆,并将分析出的通行时间范围、可能通行方向作为检索条件再次输入视频摘要网络平台,将已有视频摘要数据流作为原始视频源进行二次检索,输出更精确的视频摘要数据流。

(5)再次人工查看,逐步锁定嫌疑车辆,通过视频摘要网络平台过滤出其所有运行轨迹,作为有效破案线索。

(6)除了对录像进行摘要分析,还可以将锁定的嫌疑车辆特征信息输入视频摘要网络平台,对该车辆可能通行路线上的实时监控画面进行同步分析,有符合特征车辆通过时系统将自动报警提示,在第一时间自动锁定嫌疑车辆。

检索速度对比

以首次录像检索为例,假定将全部录像浏览一遍。

采用传统人工检索方式:由200名警员同时查找可疑车辆信息需要2500÷200=12.5小时。

采用视频摘要网络平台:单台服务器对24小时原始视频资源的处理时长约为10分钟,假定基于30台服务器构成的云计算平台联机检索,2500小时原始视频资源处理时间约为2500÷(30×24÷10)=34.72分钟,摘要数据量可压缩到原始视频资源的百分之一左右,即25小时,由200名警员同时查找可疑车辆信息需要7.5分钟,即以视频摘要网络平台完成首次录像检索所需全部时长为34.72+7.5=42.22分钟,相比人工检索方式,节约时间11.8小时。

在紧急事件、重大案件发生时,时间就是生命、每节约一分钟都是十分珍贵的,节约11.8小时意味着有更多的机会挽救生命、制止犯罪、防止事态扩大,事实证明视频摘要网络平台可实现对传统大规模视频监控系统性能的巨大提升,具有重大的实战价值。

图像识别技术的商业化应用

2012年8月,韩国SK集团旗下的SK电讯率先将面部识别技术应用于户外广告领域。据了解,SK电讯是通过在新一代数字户外广告牌上按照高清摄像头,扫描和拍摄周围10米内的面孔,分析数百个从面部提取的特征,进行性别(男/女)和年龄(幼儿/儿童/青年/中年/老年)分类,进而通过中央服务器对数据进行统一处理,将关注广告牌的消费者性别年龄数据提供给广告商。该服务可以大大提升广告曝光和到达的精确度、测定广告效果,从而帮助广告商改进升级广告内容,加强传播效果。

目前,SK电讯正积极进行图像分析技术的系统开发,包括海岸、山地等偏远地区的监控系统、车栽红外线摄像头等,希望将图像分析技术向安保、汽车、医疗等更广阔的产业领域普及。

视频序列图像 篇3

1 岸基MTD雷达视频回波特点分析

如图1所示,动目标检测雷达的视频回波与非相参VTS雷达有很大不同,由于在信号处理机中零速通道采用了超杂波检测,其视频回波主要表现在没有大面积的固定杂波,但有大量的零散杂波点和小面积杂波片区,与目标非常接近,信号处理机难以区分;而当海情较高时,会出现大面积由杂波点组成的杂波区,单帧点迹数多达10000个,雷达显示出现不流畅的现象,表明雷达数据处理过载。

在某海关岸基监视雷达中,共划分了9个速度通道(速度门),其中第9速通道为零速通道,对雷达实采原始数据(共17帧)进行统计分析,结果如图2—4所示。

由图2可知零速通道目标和杂波的数量远远多余其它速度通道中的目标与杂波数量,这与直观理解也是相符的。因此,在对数据进行处理时,首先考虑对第9速度通道中的数据进行处理。

由于信号处理机实时只能处理扫描线上的目标点迹,对径向点迹的相互关系可以做出判断,根据“距离厚度”剔除少量杂波,而对方位上点迹的邻接关系不能做出判断,对于扫描帧间的关系更是无能为力。

事实上,雷达原始视频回波可以看作随时间连续变化的序列图像,可以针对单帧图像像素间空间的统计关系以及帧间的时间统计关系,借用图像处理的方法作进一步处理,滤除杂波,改善视频。

2 序列图像处理方法

处理前首先要将信号处理器输出的点迹数据扩充成一幅完整的图像。因为每一帧输出的点迹数是不同的,必须按照距离和方位分辨率将单元像素扩充成一幅图像,没有输出点迹的单元填充为零。

2.1 多图像平均法

采用MTD体制对图像处理是非常有利的,因为它可将一幅视频回波按照速度通道划分成若干幅不同的画面,可以分别采用不同的图像处理方法和参数设置进行处理,然后再合成。处理直观理解和通过直方图统计表明,杂波主要分布在零速通道和邻近的1号通道。

由于海杂波存在相关性,对于一个C波段雷达来说,当它以低仰角观测海面时,海杂波相关时间约为1.6ms~15ms的强相关延伸至2s左右的弱相关,由于海杂波的强相关时间小于波束驻留时间,在这个时间段内收到的任何多个脉冲都是相关的,脉冲积累不会改善信杂比,即使采用了频率捷变进行频率去相关,但实际效果并不理想,这与文献[1]中提到的论点是吻合的。

由于雷达天线以15s/r的速度扫描,海杂波在相邻两帧是去相关的,因此在零速通道的视频回波图中,可将海杂波视作不相关的噪声,采用三图像平均法,可以有效滤除噪声。为了不降低数据率,采用流水的方法进行平均,计算机同时存储顺序三帧图像,第1、2、3帧作平均输出,然后第2、3、4帧做平均输出、接下来第3、4、5帧做平均输出,这样依次进行,既做了平均,又保持了数据率。如图5所示,前三帧数据做平均之后得到的图像,选定的数据为距离40-50公里,方位0-30度。

只在零速通道的求各帧视频回波的时间平均,巧妙地回避了多图像平均法对运动图像处理的局限。

2.2 中值滤波法

中值滤波法是局部平均法的一种[3]。对目标图像的平滑处理采用中值滤波法便于实现、计算,速度较快,结果也比较令人满意。

局部平均法是用某像素领域内的各点灰度级的平均值来代替该像素原来的灰度等级。通过邻域都取成N*N方形窗口。窗口沿水平和垂直两个方向逐点移动,从而平滑了整幅图像。图像经平滑处理后可使噪声方差减少M倍。但是,简单的局部平均会使图像模糊,特别是交界处轮廓不清晰。为了能保持轮廓边缘的清晰度而又可达到某种程度的平滑,就需要用局部中值来代替局部平均值。若令[f(x,y)]代表雷达一次回波直角坐标系下的图像阵列,f(x,y)的数值代表幅度等级,那么中值滤波后得到的图像则是[g(x,y)],其中g(x,y)是以(x,y)为中心的N*N窗口所框住的各像素的幅度中间值。中值滤波是一种非线性变换,通过中值滤波可以降低灰度值,扩大杂波与目标之间的灰度区别,为阈值分割创造条件。

标准的中值滤波可以有效地滤去离散的杂波点,但通过对比分析多幅图像发现,由于目标RCS的起伏,有些目标会在某一帧点数较少被认为是杂波被滤除,这就给后面的跟踪处理带来的麻烦。这里我们借鉴了彩色序列图像运动跟踪处理的方法,对于序列图像动目标跟踪来说,由于目标姿态变换以及遮挡等因素的影响,选定的目标在每一帧分割出的像素都是变化的,这就给动目标跟踪带来了困难,但对于彩色图像来说,无论被跟踪的目标像素如何变化,其颜色是基本不变的,据此可实现连续稳定跟踪。目标回波起伏类似上述情况,但不管目标如何起伏,其多卜勒频率在两帧之间(15s内)不会有大的变化,由此来约束中值滤波,可防止目标被滤除。

图6和图7分别为第一帧雷达视频回波数据在距离40-50公里,方位0~30度之间的中值滤波前和中值滤波后的图像。由图可见,经上述方法处理后,散点噪声明显减少,且目标数据仍然保留。证明了本文算法的有效性。

2.3 数学形态学

在岸基雷达目标检测中,由于海杂波的影响,即使经过一系列的信号及数据处理,有些杂波信号仍然会被当作目标保留下来,而目标较弱的部分会被当作杂波信号被滤除掉,造成杂波信号残留以及目标信号分裂,影响后续的目标检测工作[4]。因此,在进行目标检测之前,需要对阈值检测和中值滤波后的雷达信号进一步的处理。主要实现以下两个功能:

(1)进一步消除信号强度较高的杂波的干扰;

(2)将分裂的目标合并,形成完整的目标。

由于雷达实时性的要求,在消除杂波和合并目标时,需要在很短的时间和很少的信息下实现上述功能。

数学形态学是一门建立在集合代数基础上,用集合论方法定量描述几何形状和结构的一门新兴的数字信号处理方法和理论。具有严谨的数学结构,简明的基本观念和解决面向“形态”问题的快速运算。非常适合信号的几何形态分析和描述,在岸基雷达中可根据雷达目标几几何特征的先验知识,设计合适大小的结构元素和相应的运算操作,实现多种行之有效的滤波操作,完成目标检测工作之前的杂波消除和目标合并工作。

形态学研究目标几何形状的基本思想是利用一个结构单元,对目标数据进行探测,保留主要形状,删除不想干的形状(如噪声、毛刺等),当结构单元在目标数据不断移动时,便可考察目标各个部分之间的相互关系,从而了解目标的结构特性,并进行相应的处理。

形态学的滤波算法有很多种,组合起来可以实现目标分割,特征提取,噪声消除以及边界检测等形状与结构的分析与处理。在本篇文章中,主要采用的是形态学中的腐蚀、膨胀和开启、闭合运算。

开运算操作是先腐蚀后膨胀运算,可以消除噪声和杂波,实现多个物体连通区域的分割,平滑轮廓,且总的位置和形状不变;闭运算是先膨胀后腐蚀运算,可以消除空洞,连通紧邻区域,具有填充作用,总的位置和形状也不变。可根据雷达数据分析和先验知识,选择合适的滤波形式。在此,我们选择用3*3的全向结构单元进行闭合运算。得到的结果如图8所示,可以看出形状更优化了。

3 结语

随着计算机硬件技术的迅猛发展,计算机CPU处理能力以及显卡GPU图形显示能力得到了极大的提高,雷达视频回波显示完全由纯软件方法实现已成为现实。本文提出的利用图像处理的方法处理雷达视频回波的工作取得了不错的效果。除抑制杂波外,图像处理技术在弱小目标检测及跟踪上大有可为,如何有针对性的选择相应的图像处理方法还有待深入研究。

参考文献

[1]Merrill I.Skolnik.左群声,徐国良,马林,王德纯等译.雷达系统导论[M].北京:电子工业出版社,2006.

[2]刘赟.雷达回波图像的补偿与优化[J].雷达与对抗,2009,4,51-53.

[3]章毓晋.图像工程[M].北京:清华大学出版社,2007.5.

视频序列图像 篇4

1、序列的定义

序列是指按照一定的次序排好的对象或事件。

2、序列摄影的定义

序列摄影是指按照一定次序拍摄运动中的主体的一连串动作, 最终将其呈现在一张照片上的摄影术。一张序列摄影图片包含的信息量远远大于普通的单一照片, 这种摄影形式适合用来表现运动状态。

为什么序列摄影适合用来表现运动状态呢?首先, 序列摄影描绘的是一个运动状态。其次, 序列摄影可以在一张照片上展现出一段动作的分解再集合。再次, 因为眼睛的虚动效应使得人在观看序列摄影时产生一定的运动效果。

这种描绘运动的摄影艺术不难令人联想到同样描绘运动物体轨迹的、倡导同时并置原则的未来主义摄影——追求在静止形式中表达运动和速度的摄影流派。最具相似性的就是琼恩·米利 (Gjon Mill, 1904-1984) 在1942年采用多次曝光手法拍摄的《走下楼梯》的裸体摄影。这幅摄影作品就是从著名的法国画家马塞尔·杜尚 (Marcel Duchamp, 1887-1968) 的《走下楼梯的裸女》中得到启发而创作完成的。该作品运用频闪闪光灯进行拍摄, 真实记录了裸女走下楼梯的连续过程, 用摄影的方法揭示了肉眼无法看清的瞬间。这种通过频闪表现人体再抽象的摄影作品, 也是一个个真实人体的组合再现。这种摄影作品无时无刻不充斥着神秘却又迷人的节奏韵律。

二、节奏的定义

1、节奏的本意

节奏指均匀的、有规律的工作进程, 源于音乐领域, 在音乐艺术中, 节奏是指在时间轴上声音所产生的松紧、快慢、强弱的一种规律和现象。在音乐的三大要素节奏、旋律、和声中, 节奏产生的最早, 《书经·舜典》中就有“击石拊石, 百兽率舞”的记载。目前, 节奏广泛应用到众多领域, 而与之关系最为密切的仍然是艺术领域, 这其中包括非动态艺术和动态艺术, 非动态艺术为造型艺术、三维立体艺术等;动态艺术有影像、动画等。

2、节奏在造型艺术中的含义

艺术作品借助艺术手段——节奏, 以把握表现对象的运动形态, 凸显运动对象的力度和速度, 并抓住其有规律性的重复、交替动作。

在造型艺术中, 静态节奏是动态节奏在二维空间中移位和联想的结果。而这种结果很大程度上又取决于欣赏的时间性所带来的积极的、开放的艺术思维。随着视线焦点的移动, 节奏通过点、线、面等元素的反复呼应和对比整合加上构图、运动等要素展现出来。艺术家还通过主次、疏密、承接、呼应、让揖, 开合、向背、俯仰等对立统一因素将物象结合成艺术整体。而这些因素显示出符合一定审美规律的格局与韵律, 形成构图上的结构节奏。

节奏所特有的规律与变化通过画面中的这些组成成分的相互作用表现出来。

3、节奏在摄影艺术中的含义

在摄影艺术中, 线条的曲直、光线的强弱、色彩的冷暖、影调的明暗、画面的虚实构成视觉上的节奏。

而具体的画面中, 整体的疏密关系, 色调关系等构成整个画面的节奏, 使画面产生秩序性的变化。

三、序列摄影的过程

摄影师一般使用三种拍摄技巧表现运动:一是静止的照相机与运动的主体物、二是摇摄的照相机与运动的主体物、三是移动的照相机本身。序列摄影采用第一种——静止的照相机与运动的主体物拍摄技巧完成。

1、前期准备与拍摄

拍摄前, 摄影师需要测量现场光的强弱, 预计拍摄效果, 从而判断快门速度、光圈大小、感光度 (ISO) , 以达到理想效果。摄影师需要构思拍摄动作, 对一系列动作将要占用的空间进行大致测量, 确定拍摄主体与相机的距离, 提前完成对焦与构图。

拍摄过程中, 为确保每张照片的曝光量相同, 摄影师需要采用手动挡进行拍摄;为确保在一连串动作的完成时间里得到足够多的、连贯的图像, 摄影师需要采用连拍模式进行拍摄;为确保得到稳定的图像, 摄影师需要架上三脚架进行拍摄。由此完成一组曝光量相同的、连贯的、稳定的, 但在相同场景下动作不同的图像。

2、后期处理

在后期处理中, 需要选择其中一张照片 (一般选择动作开始或结束的那一张) 作为底图。将其余一连串的动作通过抠图的方法分离出来, 然后按照时间顺序将它们拼合在选定的底图上, 形成一张完整的照片。

这样一张序列摄影图片就大致完成。

四、关于节奏在序列摄影图片中的思考

节奏在音乐艺术中是指在时间轴上声音所产生的松紧、快慢、强弱的一种规律和现象, 而这些要素在制作序列摄影时则可以分别对应拍摄主体的布局、曝光时间以及明度。

1、拍摄主体的布局兼顾统一性和多样性

既然最终的呈现效果都需要经过抠图而表现, 那么不妨考虑对于相同的动作进行多次拍摄。在最终处理画面时可以有针对性的选择图片, 有设计的拼合与罗列拍摄主体, 而非按照曝光顺序均匀的排列。过度的统一较为单调、过度的多样又过于杂乱。当我们将图像的统一性和多样性有效的搭配在一起, 就可以创作出既排列有序又生动多样的画面效果, 而往往这些图片在一定程度上也较为容易产生情感共鸣。

2、拍摄主体的曝光时间参差变化

既然最终的呈现效果是一张记录连贯动作的图片, 那么不妨通过改变曝光时长 (例如增加曝光时间用以得到一些模糊的、记录动作轨迹的单一图像) , 从而完成最终的序列摄影图片。因为不太清晰的图形, 它的运动属性往往更加明确, 而凭借曝光时长不同的组合, 静止与运动的相互作用, 通过清晰与模糊的图像的叠加, 动与静的结合, 增强照片的节奏感。

3、拍摄主体在明度上的差异

明度的节奏和运动性具有一定的相互作用。虽然通过虚动现象可以促成一定的运动效果, 但是运动性也可以通过人的常识和情感的加工, 从明度的变化上加深理解。序列摄影作品如果加上透明度变化, 例如从动作开始到动作结束透明度的依次增加, 可以加强拍摄主体运动的方向性, 同时通过不同拍摄主体的透明度叠加也可以增加照片中的层次变化。

五、总结

通过比对节奏在音乐艺术中的含义, 可以发现拍摄主体对于序列摄影还是有着诸多变化的。在布局上, 只要有设计的排列拍摄主体, 就容易得到有序却生动的画面效果;在曝光时间上, 只要改变曝光时长, 就容易得到动与静相得益彰的节奏效果;在明度上, 只要选择性的改变拍摄主体的透明度, 就容易得到极具指向性的运动效果。通过对这些因素的思考, 可以发现不论在前期准备与拍摄过程中还是后期处理上, 都可以加以变化得到既排列有序又生动多样的序列摄影作品。

参考文献

[1]曹方.视觉传达设计原理[M].南京:江苏美术出版社, 2005.

基于通信图像序列的步态识别 篇5

“步态识别”,作为第二代生物特征识别技术,主要是针对含有人走路姿态的运动图像序列进行分析处理以达到识别个体的目的。而“第一代生物特征识别”,则是利用人与生俱来的先天特性或后天行为习惯,如指纹、虹膜、人脸、笔迹等来进行个人身份鉴定。

也许有人会提出疑问,为何能从人的步态达到识别个体的目的?

确实,步态不像人脸那么形象具体,但是步态却好似笔迹一样有着个体的独有性。从生物力学的角度来看,人的步态是一种包括人体肌肉和关节的综合运动。由于人与人之间的体重、比例、姿势、习惯等差异,所以其步态参数也就不尽相同,即步态的远距离识别决定于几百个运动学参数(如关节的角度、速度、角速度、加速度等)。以上领域的研究是步态识别作为一种生物认证技术的科学依据,而Johansson早期的物理心理学实验H中也得出了相关的结论。

作为新一代生物特征识别技术,基于通信图像序列的步态识别具有其独到的优越性:步态可以在不为人知的情况下秘密获取;可利用视觉监控技术实现远距离非接触性的检测、分类和识别;由于改变步态会引起行走不便,因此步态难以伪装———具有非接触性、非侵犯性、易于感知、难于隐藏、难于伪装等优点。

2 技术实现及应用范围

视频监控系统在我们的日常生活中随处可见,例如小区及学校宿舍出入口,政府机关,企业仓库监控等。这些系统,均是通过安装摄像机来提取视频图像,再由电缆光纤等传送到主机电脑上以实现人为监控的。而实际上由于摄像机分辨率或摄像角度等的原因,很多监控视频图像都不能准确地达到识别个体的目的,而此时“步态识别”的远距离检测识别特性则可以更好地解决此问题。

由上可知,“基于通信图像序列的步态识别”可以通过人机通信系统来提取视频图像序列,而一个完整的步态识别过程还需要包括运动对象步态轮廓提取, 对步态轮廓进行特征提取与描述, 特征分类识别这几个步骤。

我们结合生活实际可以拟出一个完整的步态识别系统,如图1所示。首先通过摄像机设备记录下行人的步态视频,再传送至主机将其进行预处理,提取出行人的二值通信图像序列步态轮廓;其次,通过各种方法提取特征;然后,将这些特征与已有步态数据库中的特征数据进行匹配,分类识别;最后,识别个体给出结论(如有需要还可以进行判断是否需要预警)。

基于通信图像序列的步态识别融合了计算机视觉、模式识别与视频/图像序列处理等多项技术,它在监控防盗、医疗诊断、门禁系统等多个领域具有相当高的经济价值。在当代复杂的社会背景下,步态识别在一些敏感场合更是充分体现出其重要性和应用前景,如军事基地、政府机关、科研重地等。既保证了保安人员的安防工作,又增强了国防及民用设施的反恐防暴能力。

3 国内外研究概况及研究进展

步态识别技术近年来正受到各国各界的大力关注,如美国五角大楼利用步态识别技术的反恐工作和美国国防高级项目署DARPA制定的HID (Human Identification at a Distance) 计划。在国际上有许多知名大学和研究机构如英国南安普顿大学、美国麻省理工学院、卡基梅隆大学等在HID项目的驱动下广泛开展了步态识别研究工作,而在国内进行的关于生物识别技术的研究项目,影响较大的有归国博士谭铁牛领导的中科院自动化所,和王亮、胡卫明提出的基于统计主元分析的方法。

以上是对各国研究概况的描述,具体从技术研究现状来看主要有以下几个方面:Yoo等人应用人躯结构的段状统计特征,进行躯体的拓扑分析,提取人体的运动外轮廓;Little与Boyd使用的步态特征为The Shape of Motion,目的是计算运动图像的光流,从中获取频率和特征来识别个人;Cunado等人即考虑人行走过程中双腿的运动情况,用链接的钟摆模拟腿部的运动变化,又从腿的摆动过程中提取腿部倾斜角度的变化特征;Lee用多个椭圆表示躯体的不同部分,将人体模型化,然后提取椭圆的质心位置、离心率等参数用于识别;王亮提取运动人体的外轮廓,计算人体质心,然后计算运动过程中轮廓上每个点与质心的欧氏距离作为人的步态特征。

4 实验过程及分析

通过对各种步态识别研究资料的学习,结合图1所示的基于通信图像序列的步态识别系统,我们进行了如下实验。从图像序列的获取到个体识别,其主要步骤有获取视频图像,提取分析图像序列,运动目标分割,特征提取,特征处理和识别分类。

1) 获取视频图像:我们可以通过DV或摄像机获取视频资料(即通信图像序列)。

2) 运动目标分割:将图像序列传送到电脑,通过matlab7.0软件平台从序列图像中将变化区域从背景图像中提取出来。我们首先利用统计平均法构建背景图像,然后选定阈值运用背景剪除法(利用当前帧图像与背景图像的差分运算进行运动检测的一种方法),从图像序列中快速有效地提取人体的轮廓,获得其对应的二值图像。如图2所示。

3) 特征提取处理和步态识别:特征提取与表达可以分为基于模型的方法和基于特征的方法两种,它是步态识别过程的重要步骤。我们选用基于特征的方法,直接从图像序列中提取特征数据来做识别,该方法不需要提前建立模型,而是直接对待研究的对象提出假设,然后用图像序列中目标移动所产生的时空模式的各类统计值,从步态中提取特征参数。在提取了步态特征之后,就要将待测序列的特征与样本特征进行比对完成最终的识别任务。由于在此实验过程中受条件限制,无法获得足够数量的行为标本来进行比较和识别,所以在识别阶段我们仅从数据上进行了理论分析。

通过以上过程的实验了解到,其数据分析易受光照、摄像机角度、复杂的地势和背景条件所干扰,且当今用于分类识别的数据库样本数目相当有限。

总的来说,基于通信图像序列的步态识别技术作为一门实用性极强的前沿科技,正处于其发展的初级阶段,仍有待于我们不断地去开发研究。

摘要:步态识别是当代前沿技术, 在安全监控和医疗等领域有着广阔的应用前景, 该文立足于提取图像序列的人机通信系统, 对步态识别技术背景和研究现状作了详细阐述, 并描述了实验的相关实现过程与困难。

关键词:步态识别,特征,提取

参考文献

[1]王亮, 胡卫明, 谭铁牛.基于步态的身份识别[J].计算机学报, 2003 (3) .

[2]程琼, 韦琳.步态识别方法分析与研究[J].湖北经济学院学报, 2007 (11) .

[3]赵黎丽, 侯正信.步态识别问题的特点及研究现状[J].中国图象图形学报, 2006 (2) .

[4]程琼, 周炳松, 付波.步态识别系统设计[J].湖北工业大学学报, 2008 (10) .

[5]薛召军, 靳静娜, 明东.步态识别研究现状与进展[J].生物医学工程学杂志, 2008 (10) .

[6]任继钢.步态识别综述[J].攀枝花学院学报, 2008 (12) .

[7]袁海军, 文玉梅, 李平, 等.采用不变矩傅氏级数表示的步态识别[J].中国图象图形学报, 2008 (12) .

[8]齐美彬, 王倩, 蒋建国.非规范视角步态识别研究[J].仪器仪表学报, 2008 (10) .

[9]韩旭, 刘冀伟, 么键, 等.一种改进的步态识别方法[J].电子器件, 2007 (8) .

[10]顾磊, 吴慧中, 肖亮.一种基于多区域侧影面积的步态识别方法[J].模式识别与人工智能, 2008 (10) .

[11]王柱, 马樱, 李勃.一种快速步态识别方法[J].计算机时代, 2007 (11) .

多视频序列间的配准 篇6

技术简介:

目前图像到图像的配准已经得到很好的研究和广泛的应用。然而, 所有的图像配准的方法都有两个内在的缺陷: (1) 图像到图像的配准受限于要配准的图像各自包含的信息, 这里的信息指的是帧内图像在空间上变化, 用以描述场景的视觉表现; (2) 当图像是一个动态的场景中一系列静态图像时, 仅当两幅图像是同时拍摄时, 二者之间的配准才可行。然而, 摄像机几乎不可能以如此高的时序精度完成同步。

国外科学家提出一种序列到序列的配准方法 (区别于图像到图像的配准方法) 。这种序列由多个无需校准的摄像机记录, 它们或者静止, 或者联合移动, 具有固定 (但未知) 的内部参数和相对的摄像机间的外部参数。

技术优势:

1. 传统的图像间配准所存在的模糊性 (比如因各图像间缺乏足够的相同视觉信息造成的模糊性) 往往通过序列间的配准就能解决;2.对视频序列在时序上的配准在计算时能够实现很高的子帧配准率;3.在时序和空间上对视频序列的配准和信息整合, 产生了许多新的视频上的应用, 而在仅用图像间配准时, 这些应用是不可行的。

应用领域:

基于图像序列的运动目标检测研究 篇7

随着计算机硬件和软件技术的发展,计算机视觉技术受到了越来越多的关注,例如:进行瑕疵检验的机器,每天可以检查上百万根电灯灯丝和很多织物;计算机利用摄像信息能够自动驾驶汽车;战场上自动高炮系统对高速飞行物进行定位与跟踪[1,2];人机交互方面,计算机可借助人的手势、唇语、躯干运动、表情测定等了解人的要求并代替人执行指令等[3]。在计算机视觉技术中,基于视频图像序列的视觉技术是最为重要的,因此也成为人们目前研究的重点和难点。

在实际工程领域,能否将运动目标从视频图像序列中准确地检测出来,是运动估计、目标识别及行为理解等后续处理效果的关键[4]。为了实现运动目标的检测,很多学者进行了大量的相关研究,并提出了许多相关的运动目标检测算法。

1 序列图像特征分析

1.1 运动目标特征分析

依据实际工程经验,在一个实时采集的图像序列中,其包含的运动目标具有大量有用信息,可归类为以下几个典型特性:

(1) 相邻帧间的目标几何形状连续性。由于在本实验中,各帧图像兼的时间差在20 ms以内,因此认为相邻帧间的目标形状是不变的,即使有变化,也是逐渐发生的,具有一定的连续性。

(2) 背景与目标间的纹理和灰度分布区别较大。不论背景多么复杂,一般目标上总会有一定的区域纹理和灰度分布与周围环境有差别[5]。

(3) 目标具有明显的运动特性。这是运动目标的重要特征之一,在序列图像中,相邻帧间的目标所在位置相对于周围背景是有变化的。

1.2 背景特征分析

与运动目标特征不同,图像中背景的一个典型特征是背景特征具有帧间连续性,即实时序列图像的相邻帧间的背景应该是相同或相似的[6]。如果摄像机保持不动,则相邻帧的背景是大致相同的;如果摄像机处于连续运动中,则相邻帧间背景应该是相似的,仅仅是在位置上发生整体偏移。利用目标与背景的这些区别,可以提出一种在复杂背景下的运动目标提取方法。

2 复杂背景下的运动目标提取

根据前面分析的运动目标与背景的特性,可以得出,每帧图像中一般都是背景占据大部分区域,而运动目标相对于背景是一个小的区域集合。对于实时采集的序列图像来说,相邻帧间的图像的静止和移动背景应该是相同或相似的,而其不同之处则是运动目标,因此本文主要针对动态背景下的情况进行讨论[7,8]。

动态背景目标检测是由于摄像机相对背景移动或旋转,导致图像中的背景和物体都发生了运动,增加了运动目标检测的难度,这是现在运动目标检测的研究重点。

本文针对动态背景下的目标提取问题,采用一种基于相位相关和差分相乘相结合的运动检测方法,算法框图如图1所示。首先用相位相关算法配准由于摄像机运动导致的图像背景旋转、缩放和平移量,然后用连续图像差分相乘的方法分割出运动目标的轮廓,最后用形态学图像处理方法填补运动目标中的小空洞,并滤除残留的孤立噪声点。

2.1 相位相关法

(1) 图像平移量计算

假设图像f2(x,y)与f1(x,y)在x,y方向上的平移量分别为x0,y0,即:

f2(x,y)=f1(x-x0,y-y0)(1)

将式(1)进行傅里叶变换:

F2(u,v)=F1(u,v)e-j2π(ux0+vy0)(2)

f1(x,y)和f2(x,y)的互功率谱为:

F1*(u,v)F2(u,v)|F1*(u,v)F2(u,v)|=e-j(ux0+vy0)(3)

从式(3)可知,f1(x,y)和f2(x,y)的互功率谱的傅里叶变换为二维脉冲函数δ(x-x0,y-y0),因此通过找出δ函数的位置就可确定平移量x0和y0。

(2) 图像缩放及旋转角度量计算

假设图像f2(x,y)是f1(x,y)以 σ参数进行缩放,经逆时针旋转θ0,并平移(x0,y0)后得到的图像,两者之间的关系为:

f2(x,y)=f1[σ(xcosθ0+ysinθ0)-x0,σ(-xsinθ0+ycosθ0)-y0](4)

式(4)经傅里叶变换后满足:

|F2(u,v)|=σ-2|F1[σ-1(ucosθ0+vsinθ0),σ-1(-usinθ0+vcosθ0)]|(5)

从式(5)可看出,幅值谱与平移量(x0,y0)只和旋转角度θ0和缩放因子σ有关。因此将原图像f1(x,y),f2(x,y)做傅里叶变换,即可计算出旋转角度θ0和缩放因子σ[9]。

利用旋转角度θ0和缩放因子σ对图像进行相关的旋转和缩放变换补偿,然后根据上式计算目标在不同时刻内的平移量(x0,y0),最后完成图像的配准,具体流程图如图2所示。

2.2 运动目标提取

差分相乘是在动态背景配准的基础上,只保留了中间重叠部分的运动物体区域,排除了背景噪声的影响,因此具有很强的抗噪声和抗干扰的能力[10]。

将图像序列经相位相关法进行配准后,运用帧间差分的方法进行目标提取。假设f1(x,y)和f2(x,y)是配准后的图像,帧间差分后,通过设置适当阈值得到运动目标图像f12(x,y),如式(6)所示:

f12(x,y)={1|f1(x,y)-f2(x,y)|>Τ0(6)

由于图像中的背景微小变化、光照变化和图像配准误差等影响,使得二值图像中运动物体以外的很多像素点位置的值也不为零,即存在噪声点。必须有效滤除这些噪声点才能准确检测出运动目标,考虑到连续多帧差分二值图像检测出的运动目标之间必然存在运动重叠区域,而噪声点分布是随机的,所以用多帧差分二值图像相乘的方法可以有效排除噪声点,精确检测出运动物体。

3 试验及结果分析

根据上文介绍的算法,在Matlab 7.1环境下进行仿真验证,摄像机在采集的上下位置出现微小抖动,文中选取第30,31帧作为源图像进行处理,图像大小均为640×480,图3为在摄像机的视场范围内为出现运动物体的场景,图4,图5所示为连续相邻两帧的场景图像。

为配准处理的便捷,首先将当前帧图像和参考帧图像做相与运算,去除相同的背景信息,保留不同的信息(即目标信息),并将目标周边作以标示,缩小两幅图像配准处理的搜索范围。由于运动目标为球类物体,因此以其在图像中的外接圆作为标示。从图6中可观察出,第30帧图像和第31帧图像在垂直方向上出现了移动,经傅里叶变换后计算得到平移量为(3,32),差分相乘运算后得到最终图像如图7所示,仅剩下检测出向右下方运动的目标。

从实验结果可看出,由于傅里叶变换中,高频决定了图像在过渡区域的灰度级,如噪声和边缘,而低频主要决定了图像在平滑区域的总体灰度级,因此在本文计算平移量时对图像作以高通滤波,从而突出图像的边缘部分,提高图像配准的精度和目标提取的准确度。

4 结 语

本文提出了一种相位相关算法计算出帧间图像的平移量,完成配准过程,然后利用差分相乘算法完成运动目标的检测的方法,实验证明该方法可以在摄像机移动情况下实现目标的检测,并且相位相关法由于只利用了图像的幅值谱和互功率谱信息,从而减少了整体算法对图像内容的依赖。实验结果表明该方法具有较高的可行性。

参考文献

[1]代科学,李国辉,涂丹,等.监控视频运动目标检测减背景技术的研究现状和展望[J].中国图像图形学报,2006,11(7):919-927.

[2]章毓晋.图像处理和分析基础汇[M].北京:高等教育出版社,2002.

[3]PETROU M,BOSDOGIANNI P.数字图像处理疑难解析[M].赖剑煌,冯国灿,译.北京:机械工业出版社,2005.

[4]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3):1-16.

[5]RITTSCHER J,KATO J,JOGA S,et al.A probabilisticbackground model for tracking[C]//Proceedings of Euro-pean Conference on Computer Vision.Dublin,Ireland:EC-CV,2000:336-350.

[6]JULIER S J,UHLMANN J K.A new method for the non-linear transformation of means and covariance in filters andestimators[J].IEEE Transactions on Automatic Control,2000,45(3):477-482.

[7]Birbhanu Sohall Nadimi.Phycial models for moving shadowand object detection in video[J].IEEE Transactions onPattem Analysis and Machine Intelligenee,2004,26(8):1079-1087.

[8]LIPTON A,FUJIYOSHI H,PATIL R.Moving targetclassification and tracking from real-time video[C]//Proc.of IEEE Workshop on Applications of Computer Vision.Princeton,NJ:IEEE,1998:8-14.

[9]MARGRIT Betke,ESIN Haritaoglu,LARRY S Davis.Re-al-time multiple vehicle detection and tracking from a mov-ing vehicle[J].Machine Vision and Applications,2000(12):69-83.

视频序列中运动目标检测与跟踪 篇8

关键词:运动目标检测,运动目标跟踪,边缘检测

0 引言

伴随着对视觉机理不断深入的认识以及现代计算机技术迅速的发展, 计算机技术被越来越多的应用到图像处理领域, 由此产生了计算机视觉[1]。

计算机视觉主要包括运动目标检测、目标提取、目标识别与跟踪几个模块, 其中目标检测部分最关键。对运动目标检测的一些经典的方法有:基于统计、学习的方法, 基于光流场的方法, 背景差分法[2]。

基于统计、学习的算法检测到的运动目标比较准确, 但计算复杂, 计算量大, 不适于实时处理。光流场的方法能检测出独立的运动目标, 对于变化的以及复杂背景情况都有较好的效果, 并且不需要预知场景信息, 其缺点是大多数算法很复杂并且计算量很大, 应用到实时检测系统就需要有特殊的硬件支持。背景差分法能够比较完整的检测到运动的目标, 缺点是对于光照和其他的外部条件引起的环境变化很敏感, 常常会将目标的阴影区域错误地检测为其自身的一部分。并且随着时间流逝, 实际场景的多种因素都会发生变化, 背景必须得到实时更新才能准确检测出目标。本文的目标检测部分采用图像差分法, 计算量小, 算法简单, 适用于实时性要求较高的图像处理系统。

1 常用的目标检测算法分析

1.1 背景差分算法

背景差分法通过当前图像与背景图像作差分就能检测出运动目标。背景图像是由背景中的一幅或几幅图像取平均值得到, 运动的区域是根据当前图像和背景图像作差的结果进行判断, 若差分值大于某一阈值T, 则判定此象素点在运动目标上[3]。该算法的公式表达如下:

其中:b (x, y) 为背景图像, (x, y) 为当前图像, (x, y) 为检测结果, T为阈值, k为帧数。

该算法计算量小, 能够得到比较精确的运动目标信息。根据实际情况确定阈值并进行处理后, 所得结果就直接反映了运动目标的形状、位置、大小等信息, 适用于背景己知的情况, 其关键是如何获得场景的静态背景图像。缺点是外界的干扰容易影响最终的检测结果, 外界的干扰如光线的变化, 或是背景中有物体突然发生移动等。

1.2 帧间差分算法

帧间差分算法将连续两帧图像中的对应像素点的像素值相减, 得到一个差分值, 用预先设定好的阈值与这个差分值进行比较, 如果阈值小于差分值, 则认为对应位置处有运动目标。

为了对运动目标进行更精确的检测, 文献[4]提出了一种基于三帧差分的算法。

该算法分为2步:

(1) 设为连续三帧图像, 通过相邻两帧图像的差分得到两个差分图像m1, m2, 该算法的公式表达如下:

(2) 将上一步中差分后得到的图像m1, m2进行运算, 得到三帧的差分图像m3, 该图像是运动目标在中间帧的三帧交叉部分

帧间差分算法比较适合于检测不停运动的目标, 当运动目标出现短暂停留时, 连续两帧图像不存在偏差, 所以此时就检测不到运动目标了, 所以目标做不连续运动时就不那么适用了。

2 边缘检测的背景差分算法

基于边缘检测的背景差分算法源于背景差分法, 可以精确地从背景中提取出运动目标, 不会像帧间差分法会因为运动目标运动速度的快慢而出现检测到的目标过小、过大或空洞等现象。光线的变化易于影响背景差分算法的检测结果, 而对于基于边缘检测的背景差分算法没有影响, 对于背景中有物体突然移动的情况, 也能有很好的效果对运动目标进行准确地检测。

基于边缘检测的背景差分算法对背景图像与当前图像分别进行边缘检测再相减得到差分图像, 最终根据差分图像结果来提取运动目标。该算法计算量小, 执行速度快, 可以准确并完整地提取到运动目标, 在光线变化的情况下, 检测结果依然准确。

实现步骤如下:

(l) 使用高斯模型法建立背景图像b (x, y) 。

(2) 对背景图像b (x, y) 进行中值滤波, 边缘增强, sobel滤波和二值化, 得到背景图像运算后的图像B (x, y) 。

(3) 对当前帧图像进行步骤 (2) 中的操作, 得到当前帧图像运算后的图像F (x, y) 。

(4) 对步骤 (2) 、 (3) 中得到的图像进行差分运算得到D (x, y) =F (x, y) -B (x, y) 。统计D (x, y) 中值为l的点的个数, 如果该数值小于预先设定的阈值M, 表示检测到了轻微的目标运动, 这个结果可能是由于图像中物体的扰动 (如树枝的轻微摆动等) , 所以认为没有检测到运动的目标。如果该计数值大于阈值M, 则认为检测到了运动目标, 然后遍历图像D (x, y) , 找出像素值为1的点, 把当前图像f (x, y) 对应位置的像素值置0, 其它位置的像素值保持不变。阈值M的选取对于检测的精度有很大的影响, 如果M取值过大会检测不到目标的细微运动, 如果M取值过小就会检测到微小的扰动, 所以M值的选取应根据实际的场景, 进行多次实验取得最佳值。

(5) 更新背景b (x, y) , 转到步骤 (2) 。

通过以上五步便能对运动目标进行快速的检测, 并且能把运动目标的边缘信息完整地提取出来。

3 运动目标的跟踪

采用基于能量累积的运动目标跟踪的方法, 采用最小平均绝对差值的匹配的准则和1/8像素级的搜索方式, 即进行Wk和Wk+1的行、列方向灰度累积曲线匹配时, 以1/8像素为步长步进, 计算出所有匹配点绝对差值的累加和, 在其中找出最小累加值和其对应的步进长度, 找出的两个步进长度就分别是跟踪目标在行、列方向上的位移量。然后分别对W1、W2中的每一行、每一列的图像灰度值进行求和, 最后以1/8象素级分别对W1行、列灰度累积曲线和W2行、列灰度累积曲线搜索, 以最小平均绝对差值的方式进行最佳匹配, 求出最佳匹配时跟踪目标的位移量。

4 实验数据与分析

通过背景差分算法实现了运动目标检测, 并对其进行二值化和形态学滤波[5]等优化得到了较为良好的检测结果。

图1中a、b分别是第1帧的图像和第80帧图像, 第一帧为背景, c为背景差分得到的检测结果, d为检测到的目标。

采用基于能量累积的运动目标跟踪的方法对行人的跟踪, 能够自动检测到运动目标并进行跟踪。

5 结语

本文讨论了几种常见的用于运动目标检测的算法, 分析了这些算法的优缺点, 提出了一种基于边缘检测的背景差分算法, 实现了对运动目标轮廓快速完整的提取。采用基于能量累积的运动目标跟踪的方法实现了运动目标的跟踪。检测和跟踪都取得了良好的效果。

参考文献

[1]马颂德, 张正友.计算机视觉一计算理论与算法基础[M].北京:科学出版社, 1998:2-8

[2]施华, 李翠华.视频图像中的运动目标跟踪[J].计算机工程与应用, 2005 (10) :56-58

[3]Piccardi M.Background Subtraction Techniques:A Review[A].IEEE International Conference on Systems, Man and Cybernetics[C].2004, 4:3099-3104

[4]秦涛, 周泽魁.一种检测序列图像中运动目标的新方法[J].计算机应用与软件.2004, 21[5]:27-29

上一篇:信号发生器下一篇:绿化系统