特征提取与加权

2024-05-05

特征提取与加权(精选十篇)

特征提取与加权 篇1

人脸识别是当前非常热门的研究领域,在研究机构和实验室中理论及算法研究陆续取得重大进展的同时,把人脸检测识别技术从理论层次转移出来,让其服务社会是非常有意义的一种实践。

当前这方面的主流产品都是基于通用PC机和网络数据库,其体积、功耗大,性能不稳定,而且成本高,实现复杂。而本设计开发的基于ARM和RFIC的人脸识别安全认证系统,具有运算速度快、体积小、功耗低、方便做成嵌入式产品等特点,既可联网使用,也可单机运行,适合大、中、小等各级各类安全应用。

1 系统硬件平台设计

设计采用Samsung公司的嵌入式微处理器S3C2440A作为整个系统的核心,它基于ARM920T内核、主频400~503MHz,人脸特征的提取和识别等算法都是在S3C2440A中完成的。信息采集模块分为两部分:一是用于采集人脸图像的传感器OV7640,二是存储特征信息的Mifare1卡。处理器外扩展了两片32M的SDRAM和一片32MB+1024kB的NAND FLASH,用来提供处理人脸识别算法以及存储人脸特征数据所需的空间。同时系统通过显示屏LTS350Q1_PD1实现图像重现显示,并利用以太网控制器CS8900A实现以太网的接入。

硬件平台确定后,根据系统功能定制了一个Linux的操作系统,并完成硬件平台引导程序U-boot移植、Linux内核选择裁减移植、底层驱动程序编写等。

人脸识别系统分训练和识别两个过程。训练中,图像传感器OV7640将采集的人脸图像直接传输到S3C2440A芯片中,再由PCA算法进行特征提取,并将主要特征脸及样本的特征数据分别保存到NAND FLASH和Mifare1卡中,以便在识别阶段进行特征读取。识别阶段将OV7640采集到的人脸图像投影到特征脸空间,将所得到的特征数据及Mifare1卡中数据与存在FLASH的模板数据进行对比,找出最相近的作为识别结果。最后由Linux操作系统的系统调用函数来控制S3C2440A的LCD控制器及AC 97音频接口,实现信息播报和显示。

2 人脸识别算法研究

人脸识别系统包括两个主要的技术环节:首先是人脸检测与定位,即从输入图像中找到人脸,并将人脸从背景中分割出来;其次是对标准化后的人脸图像进行特征提取和识别。本文主要研究后者。

2.1 预处理

采集图像的过程中,由于采集系统本身(如采集卡、摄像头等)所固有的特性以及光照等外部因素的影响,会不可避免的产生一些干扰和噪声,而且采集图像时摄像机距离的远近、焦距的大小等原因将会导致人脸在整幅图像中的位置和大小不确定。以上因素都严重影响人脸识别的准确性,所以为了消除这些因素的影响,提高人脸识别效率,就必须进行预处理。

2.1.1 彩色图像转化为灰度图像

摄像头采集的图像一般都是彩色图像,彩色图像每个像素为3字节。1字节就足够完成人脸检测、特征提取与识别,所以为了减小图像所占据的存储空间和特征提取、识别过程的计算量,实验对采集到的彩色图像进行了灰度化处理。彩色图像转化为灰度图像的公式为gray=0.3×R+0.59×G+0.11×B。

2.1.2 中值滤波

中值滤波不仅可以除去孤点噪声,还可以保持图像的边缘特征,并在一定条件下克服线性滤波器带来的图像细节模糊。另外它对滤除脉冲干扰及图像扫描噪声非常有效。所以中值滤波比较适合人脸图像的消噪。其基本原理是用一个含有若干个点的滑动窗口,以窗口中各点灰度值的中值来代替指定点(一般是窗口的中心点)的灰度值。通过试验,本系统采用3*3的邻域窗口进行滤波。

2.1.3 直方图均衡化

直方图均衡化是通过变换函数将输入图像的直方图调整为具有“平坦”倾向的直方图,即使原图像灰度集中的区域拉开或使灰度均匀分布,消除了由光照及采集和成像设备固有特性等因素对图像造成的影响,使图像细节变的清晰,达到图像增强的目的。

2.1.4 灰度归一化

考虑到算法复杂度和执行速度问题,本文采用灰度值修正的方法进行光照归一化处理,根据变换前后的图像象素值的均值和方差修正每一个象素值。

2.1.5 几何归一化

几何归一化将有助于矫正因成像距离与人脸姿势变化造成的尺寸差异及角度偏斜。本文首先采用人脸图像中眼睛定位方法,以眼睛的坐标为基准,进行同比例缩放,得到符合要求的标准化人脸图像。

2.2 主成份分析(PCA)

PCA是模式识别中一种经典的特征提取方法,其目的是消除图像样本之间的相关性,将高维的图像样本投影到低维的特征子空间,同时保持原始图像中的绝大部分的信息。基于PCA的人脸识别过程如下:

首先,创建人脸图像训练集。假设人脸图像为二维M×N的图像,按从左到右,从上到下的顺序把人脸图像像素排列成一个列向量,因此一个M×N维的图像就可以表示为一个T=M×N的随机列向量x。若人脸图像的训练集有K幅图像,则分别表示{x1,x2,…,xk}。

其次,计算K幅图像的平均值向量。计算公式:

并求出每个人脸xi与平均人脸m的差值向量ai:ai=xi-m;i=1,…,K。然后,计算训练图像的总体散布矩阵St,可表示为:

其中,A=[a1,a2,…,ak],mi为训练样本集中第i个人的平均图像矢量;P为训练样本集中的总人数。

最后,为了得到特征脸,要计算总体散布矩阵St的特征值和特征向量。但由于散布矩阵的维数过高(M2N2),MAT-LAB运行时会报错,因为其超出所能处理的维数。所以本试验采用奇异值分解(Singular Value Decomposition,SVD)定理,通过求解ATA的特征值和特征向量获得AAT的特征值和特征向量。根据需要选取一部分构造特征子空间Wp=[u1,u2,…,ur]。

在识别阶段,设待识别样本为f,并将其投影到“特征脸子空间”求得投影系数

再将Ω与测试样本中的特征进行比较,我们可以确定该人脸图像的隶属关系。

其重建图像为:f'=WpΩ+m,我们可以设定一个阈值,若其小于设定的阈值,则可判定为非人脸图像。

2.3 LDA

对以均方误差为准则的脸部重建来说,PCA是一种最优的方法,但站在模式分类和辨识的观点来看,PCA则不一定能够取得最优的结果。LDA通过寻找最优的投影方向,使得所有样本在其上投影的类间散布矩阵最大,同时类内散布矩阵最小,从而使各模式在该空间有最佳的可分性。但对于人脸识别来说,LDA易出现小样本问题和过拟和问题。

3 实验结果与分析

本实验采用ORL(Olivetti-Oracle Reaearch Lab)数据库和Yale数据库进行仿真。ORL人脸库中包括40个人的400幅脸相,每人10幅。图像的分辨率为112×92,图像之间存在一定程度内的光照、表情、姿态以及其他细节(带与不带眼睛)的变化。Yale数据库中包括15个人,每人11幅图像构成。光照、光源、表情都有所差别,图像的分辨率为320×243。选取每个人前5幅图像作为训练样本,最后的5幅用作测试样本。

实验结果表明:

(1)由图四、五可见,随特征向量维数的增加,识别率不断提高。当维数达到一定值时,识别率趋于平缓。分析表一各组实验数据可以看出:q=40为最合理的特征向量维数,且最近邻分类器的性能要优于最小距离分类器。

(2)由O(ORL)+P(预处理)与O+NP(未预处理)两条曲线比较可知,当特征维数较小时,图像进行预处理相当于引入干扰和噪声,但当特征向量数目合理时,对图像进行预处理可以有效提高系统识别率。本系统所采用的预处理仅对光照强度进行调整,却不能妥善处理光源方向性的问题,因而对Yale库进行实验时,未经预处理比经过预处理的识别率高,如图四中Y(Yale)+P与Y+NP曲线所示。

(3)Yale数据库与ORL数据库相比,光照区别大,背景相对复杂,而且人脸的表情也夸张多样,每个人都有戴眼镜的图像样本。另外,Yale数据库样本的数量也远远少于ORL数据库。这些因素很大程度上都影响了系统的识别率,如图五所示。

4 结束语

本文详细介绍了基于ARM的硬件平台、预处理方法以及PCA进行特征提取和辨识的过程,并利用MATLAB进行算法仿真。实验结果表明本人脸识别系统性能优越,经过不断的完善和扩展,必将会在实际应用中发挥它的价值。

本文创新点:将ARM应用在基于人脸特征提取和辨识的安全认证系统中,提高了可靠性,加快了识别速度。

参考文献

[1]姜文瀚,周晓飞,杨静宇.基于小波和最近邻凸包分类器的人脸识别[J].微计算机信息,2008,(1):212-214.

[2]雷松泽.基于主元分析的人脸特征提取matlab实现[J].电脑开发与应用,19(11):20-21.

[3]罗昊,孟传良.基于特征脸和LDA的人脸识别[J].贵州工业大学学报,2005,34(1):72-75.

[4]蔡巍伟.基于PCA的人脸识别算法研究[D].杭州:浙江工业大学,2002,12(20).

[5]邓彬伟,黄松柏.浅谈嵌入式处理器体系结构[J].山西电子技术,2007,(4):86-87.

特征提取与加权 篇2

中国学生英语口语实词提取与生成特征分析

本文借助SFS语言分析软件,对英语专业四级考试口试第三部分对话的26个样本进行了分析研究.通过考察语速、停顿、实词生成等因素,以及它们之间、它们与等第之间的关系,我们认为实词提取与生成困难是造成不正常停顿的重要原因.在此基础上,本文分析了实词提取困难的`5大表现类型、19种表现方式;同时指出词汇生成中单词韵律也是影响口语整体效果的重要因素.

作 者:穆凤英 高薇 张云燕 Mu Fengying Gao Wei ZHANG Yunyan 作者单位:徐州师范大学刊 名:外语教学与研究 PKU CSSCI英文刊名:FOREIGN LANGUAGE TEACHING AND RESEARCH年,卷(期):37(4)分类号:H319关键词:实词 提取 生成 停顿 单词韵律

特征提取与加权 篇3

关键词:Flash动画;内容分析;特征提取

中图分类号:TP317.4

Flash动画主要以矢量图形为主,并且具有强大的交互功能,简而言之,这就是一种多媒体动画形式,当前形式,计算机网络技术不断普及不断跟进,多媒体教学形势盛行,Flash动画显然成为多媒体教学的一种极其重要的方式。但是,由于现今阶段对于Flash动画做出检索命令的工具甚少,分析研究一种较为快速的进行Flash动画检索命令从而有效获得所需信息成为急需解决的问题。

1 Flash动画结构及形成原理解析

1.1 对Flash动画存储结构的研究分析。Flash动画由三部分内容构成,包括文件头、文件主体、文件结束标记。其中文件头一般定义了文件的标志、大小、版本,另外还包含了舞台的大小、帧率以及帧数等这些基本的信息;文件主体的主要内容就是指由顺序排列的定义型标签和控制性标签,这两类标签分别代表的含义为,定义其文件组成元素一些参数信息和基本属性,控制元素表现出来的动态效果、属性的变化以及人机交互等;文件结束标记顾名思义,标志着这一Flash文件的结束。

1.2 对Flash动画运行结构的研究分析。Flash动画的运行结构,简而言之,就是指Flash动画播放出来的效果,表示其播放结构。一个相对完整的Flash动画从时间观念来讲,以帧为基本单位;从空间范围角度来讲,其单位为基本单位对象。总结来讲,按照空间与时间概念对Flash动画进行划分,可以划分为顺序结构以及层叠结构。顺序结构的基本单位为帧,场景由许多连续播放的帧构成,Flash动画由许多场景构成,这就是Flash动画播放的基本构造。Flash动画中,所有的帧都是连续播放的,继而不难理解每一个场景也是连续的,而且这也不难想象所有时间点一致的帧会被同时播放出来,结束之后将会紧接着播放下一个场景,连续播放直到最后的一个帧结束。另外,在同一时间点上,Flash动画的层数也是极有深度的,这有深度的所有层次上每一层都有很大空间放置许多对象,这些对象由于所属层次的深度值也就形成了不同层之间所有对象的上下层叠的关系属性,深度小的对象位于深度大的对象之下,默认底层深度值为0。

2 Flash动画的特征分析

2.1 Flash动画的基本特征。Flash的基本特征基本包括文本、按钮、图像、视频等这些元素的属性以及特征值,因而,针对Flash动画的基本特征,想要检索出内容特征,就必须出示提取出内容特征。其特征包括内部特征及外部特征两部分,内部特征是指文本、图像等元素的参数及其属性值,外部特征是指文件名及创建日期等外部属性。文本的表示方式为关键词及其功能;按钮则由所在帧号、功能、位置等表示;图像基于位置、大小及其效果、视频则由像素点、类型等来表示。总之,Flash动画的媒体对象不同于以像素点为基础的视频及图像的对象,是矢量格式的,可运用各种分析方法,合理科学的进行特征提取。

2.2 swf文件内容特征提取平台。Swf文件格式是开源的,阅读说明书后我们可以建立Flash动画内容特征提取平台,然后对其进行文件格式转换,通常转换为xml文件格式,以此作为评估标准,其原则是swf文件的内容提取平台提供出来的信息要与xml格式的标签相一致,这样才被认定为试验成功,再进一步提取Flash动画中元素的内容特征参数,建立Flash动画内容特征的索引库。第一,提取swf的文件头、文件版本、长度及舞台大小、帧率、帧数等文件头信息;第二,提取文件主体所包含的标签。Swf文件的内容特征通常用这几个参数来描述:长度和编码,帧号,帧的位置以及标签的类型。长度和编码表示的内容即其所占的字节数,单位毋庸置疑为字节;帧号指的是在整个Flash动画里某一帧所处的位置继而对其进行的编号处理;帧的位置表示的是当前帧所处的字节位置,同样以字节为单位;标签的类型指的就是标签的名称,通常以编码值进行标识。通过分析这些文件内容,提取出参数,将其放进Flash动画的特征索引库中,继而自然提高了检索的准确性以及检索效率。

3 Swf文件相关特征提取的研究分析

3.1 图像的信息特征提取。Flash文件一般支持jpg、bmp、gif等多种图像格式,其嵌入的图像一般都是经过压缩的,以此来减小动画文件的大小,其中包括有损压缩和无损压缩两种压缩文件,不同的需求采用不同的图像形式,如果对于照片没有很高的精度要求,就可以采用jpg的压缩格式,若是需要对于图表,截图等需要精准的图象显示就采用zlib格式,同时两种压缩文件都可以选择包含alpha通道的相关信息。Jpeg格式被广泛地应用于多媒体及网络之中,可以分为有失真压缩及无失真压缩,按编码顺序则可分为顺序式编码及递增式编码两种类型,这两种类型的编码通常分别按照“由左及右,由上到下”和“从模糊到清晰”的原则分次进行处理。

3.2 按钮特征提取。按钮在外观上可以看作是一幅矢量图,或者叫做位图,一般是规则的图形,类似矩形,方形或是其他多边形,也可能是框框架架或者线条,甚至还可以是看不到的透明形状,总而言之,按钮外观不受拘泥。其状态严格的分为三类,分别是弹起、按下以及指针经过。鼠标移动、单击以及键盘操作等动作是构成swf动画文件的重要部分,动作不同便执行不同的命令。通常而言,动作包括原件动作以及时间轴动作,时间轴动作一般贯穿整个Flash动画,直接添加到关键帧上,元件动作控制某个元件的效果及响应属性,包含在按钮、影片等元件的描述标签之中,触发元件则响应动作,二者相互配合来执行动作,使得动作的实施准确、有效。

3.3 动画内部对象特征提。Swf文件的特征提取通常被分为四个层面,其中包含有低级别内容特征、高级别内容特征、元数据以及文本注释。低级别内容特征一般包含的内容为各媒体对象及其特征,各媒体对象之间的关系及其编组等,具有可以自动提取的优点;高级别内容特征的目的为了解识别出对象内容,但基于当前Flash发展水平,尚且存在较大的技术阻挠;元数据包括的对象比较广泛,类似于作者、文件名等基本属性,但对于对象本身不做出解释或说明;文本注释正好对于文本内容作出解释,包括关键词和自由文本描述等,但是其存在的不足之处在于,应该将文本注释与其他媒体特征相结合使用,不应独立出来。另外,由于flash动画本身其内部的媒体内容具有很多特有特征及表达方式,所以,应当针对不同对象采取不同的提取方式及提取内容,然后采用合理的方式加以表达,例如对于文件中的字符,可以通过其形状解析得出,而视频、音频、图像等则需要先把数据提出,存为硬盘文件,再利用内容分析法提取其特征。低级特征提取的步骤如下:读取第一个标签内容,判断标签类型,采取不同的特征提取方法提取特征,根据特征添加到数据库中,读下一标签,判断是否为结束标签,选择循环或者结束。最后,针对Flash动画的特征,在进行特征提取时,运用不同媒体之间的内在关联协助进行特征提取,因为,基于不同的格式,其他类型的媒体或许对这类型更加容易解释等。如此一来,特征的提取就变得简单起来了。

高效准确的Flash动画检索将进一步促进Flash动画的发展和应用,使人们能够更容易获取所需资源,更加方便地应用于教学、娱乐、科研等各个方面,为人们的学习和生活提供更大的方便。

参考文献:

[1]马书文.浅谈Flash中常见的几种动画类型及应用[J].黑龙江科技信息,2014(05):49-50.

[2]王文军.浅谈FLASH动画的应用与前景[J].机械管理开发,2011(01):37-38.

[3]杨羽.Flash软件中的动画运用浅析[J].科技广场,2013(05):36-37.

作者简介:王珣,女,讲师,硕士,研究方向:多媒体软件,信息技术教育。

作者单位:渤海大学,辽宁锦州 121000

滚动轴承故障特征提取与应用研究 篇4

1 滚动轴承故障诊断技术的目的和意义

轴承在现代的生产中的应用, 具有举足轻重的功能地位, 严格意义上来说, 在缺乏轴承的情况下, 大部分机械将无法使用。同时, 轴承也是较为容易发生损伤的机械部位, 由于滚动轴承的作用机理, 其损伤的几率会更大。相关统计指出, 各类生产环境的差异, 造成机械损伤和故障的位置不同, 但是, 无论任何领域和环境, 因轴承损伤而影响生产的几率, 均高于30%。所以, 在机械生产的设备管理上, 合理的保证轴承质量, 是提升生产效率的根源。

滚动轴承的应用十分广泛, 但是在质量层面上, 却存在着很大的问题。通常某一类机械配件, 可以保证相类似的使用寿命, 仅有少部分远低于周期限制产品。此类则为残次品。而滚动轴承的使用寿命却无法计算, 甚至于难以确定幅度较小的区间。可以理解为, 在同样的生产环境以及设备所出产的轴承中, 无法保证每个轴承的使用寿命。例如, 一些滚动轴承可以长期承担工作, 且不会发生任何的故障, 而一些轴承在未达到使用寿命时, 却已经问题百出。所以, 在滚动轴承的维护和更替上, 无法以期限作为考量单位, 即不能够定时进行维护和替换。以免因过早替换而造成浪费, 或是替换过晚, 导致机械生产效率和精度下降。

因此, 滚动轴承的科学化管理, 必须要借助实时性的手段, 即借助计算机, 实现对滚动轴承状况的监控, 实时掌握相关信息, 并向管理者提供轴承的监测报告。在此类情况下, 生产单位可以在第一时间确定精度下降的滚动轴承, 以及时采取维修或更换等工作, 进而帮助管理和生产成本实现最优化控制。

2 滚动轴承的故障类型及产生原因

虽然滚动轴承在使用寿命上存在着不可控性, 但是, 一些客观因素对其寿命的影响, 却需要采取合理的防范机制。以下具体来看:

(1) 滚动轴承疲劳失效。轴承在工作中, 主要是依靠物理摩擦而实现功能, 所以, 生产行为本就对滚动轴承具备侵害性。持续使用时间过程长, 将导致轴承的物理疲劳效应, 进而降低生产的精度。另外, 载荷的问题, 也可能造成轴承故障, 例如载荷过大, 或是波动幅度较大等情况。

(2) 磨损失效。轴承的长期使用, 会导致表面出现压痕。这是一种典型的物理性伤害。而清洁工作不彻底、润滑不良、机械振动等情况发生时, 会加速轴承的磨损失效发生。

(3) 腐蚀失效。轴承的生产环境中, 可能会出现化学腐蚀因素。用于轴承表面遭到腐蚀, 其精度会首先下降, 逐渐削弱轴承的工作能力。

(4) 断裂失效。导致轴承断裂的可能性较多, 例如安装不合理、荷载控制问题、轴承的质量问题等。而轴承发生断裂, 意味着器械将无法继续使用。因此, 轴承断裂失效, 也是滚动轴承事故中影响最大的情况。

(5) 压痕失效。轴承出现压痕的情况, 与磨损失效类似, 其主要区别在于, 压痕失效多属于一次性物理伤害, 在其表面上, 呈现出明显的凹凸痕迹。造成该问题的因素有很多, 例如载荷过重等。

(6) 胶合失效。在滚动轴承缺乏清洁维护的情况下, 容易产生轴承表面的粘连, 最终造成轴承的撕裂。

综上所述, 造成滚动轴承质量问题的因素有很多, 但却可总结为两个方面:一是安装和维护问题, 由于安装不合理, 以及后期的持续维护不当, 容易造成轴承的问题;二是使用过程中, 缺乏保护认识, 例如载荷过大的情况, 进而导致滚动轴承损坏。

3 滚动轴承故障特征信息的提取

根据上文所述, 在滚动轴承故障管理上, 将以计算机作为主要手段, 进行实时的生产安全监控和信息反馈。因此, 笔者根据轴承主要信息变化, 确定轴承的生产状况。即, 确定故障信息的特征, 以便于降低信息提取的难度和成本。

在轴承使用过程中, 通常震动平率会稳定在一个数值之内, 此时可以确定轴承处于正常工作状态。而在接收到的震动信号后, 若出现多个谱峰, 便意味着轴承出现故常。因此, 需要记录轴承震动的频率, 并根据谱峰频率进行判断。结合该特性, 以轴承的震动频率作为确定其是否正常的标准, 需要在轴承信息采集中, 注意以下内容:第一, 由于环境的差异, 会造成轴承振动频率的不同, 而且信息采集为自动进行, 即实现自动识别过程, 所以, 需要进行记录初次采集信息, 并制定正常轴承运作样本;第二, 对信号所进行的小波包分解, 应结合计算机能力, 保证系统的运算负担, 以免因分解层数过多, 造成计算机系统崩溃, 甚至于导致基础参数错乱, 提高自动化信息识别的风险;第三, 进行小波包分解过程中, 需要采取Daube chi es函数。原因在于, 该函数更加适合滚动轴承的震动规律;第四, 以重复采用的方式, 进行包络信号检测, 并对对照样本采取同类分析手段, 以确保信息在最佳分辨率环境下生成。

4 结语

本文研究内容, 主要是采取自动化信号采集的方式, 更好的实现滚动轴承的维护和管理。鉴于轴承寿命的不稳定性, 以及商业发展对产品精度的基本要求, 对于轴承的管理, 必须采取实时监控手段, 确保在发生问题时, 进行第一时间的处理, 进而避免商业上的风险发生几率。而自动化信号采集中, 选择轴承振动频率作为参照目标, 可以最大化的节约信息实时采集成本, 并由此为工业生产的效率的发展, 提供切实有力的帮助。

参考文献

[1]胡爱军, 马万里, 唐贵基.基于集成经验模态分解和峭度准则的滚动轴承故障特征提取方法[J].中国电机工程学报, 2012 (11) .

特征提取与加权 篇5

冬小麦导数光谱特征提取与缺磷胁迫神经网络诊断

摘要:分别于返青期、拔节期、抽穗期和灌浆期采集不同磷素处理的冬小麦叶片原始高光谱数据;之后求取其一阶导数(一阶导数光谱)并进行小波去噪处理;通过分析原始光谱和一阶导数光谱对小同磷素处理水平的响应特征,确定敏感波长范围并提取四种吸收面积;将每个叶片磷素含量值对应的四种吸收而积的归一化值,作为样本空间样本点的位置坐标(4维样本输入矢量),对应叶片磷素含量的归一化值作为该样本点的目标输出,二者同时提交给径向基函数神经网络.结果表明:(1)冬小麦叶片原始光谱对叶片磷素含量变化反应敏感的.波长范围为426~435 nm和669~680 nm.(2)一阶导数光谱的敏感波长范围为481~493 nm和685~696nm.(3)训练后的径向幕函数神经网络模型能够学习和掌握样本点与目标输出之间的线性/非线性映射关系,并且具有一定的推广能力. 作者: 刘炜[1]常庆瑞[1]郭曼[1]邢东兴[2]员永生[1] Author: LIU Wei[1]CHANG Qing-rui[1]GUO Man[1]XING Dong-xing[2]YUAN Yong-sheng[1] 作者单位: 西北农林科技大学资源环境学院,陕西杨凌,712100西北农林科技大学资源环境学院,陕西杨凌,712100;咸阳师范学院资源环境系,陕西咸阳,71 期 刊: 光谱学与光谱分析 ISTICEISCIPKU Journal: SPECTROSCOPY AND SPECTRAL ANALYSIS 年,卷(期): ,31(4) 分类号: S127 关键词: 可见/近红外光谱 冬小麦 磷素营养 小波去噪 数值积分 径向基函数神经网络 机标分类号: TH7 O65 机标关键词: 冬小麦一阶导数光谱特征提取缺磷胁迫神经网络诊断Neural NetworkRadial Basis FunctionDerivative SpectraBased磷素含量波长范围小麦叶片样本点径向基函数神经网络磷素处理归一化值非线性映射关系神经网络模型敏感高光谱数据 基金项目: 国家科技支撑计划重大项目,国家自然科学基金项目,国家(973计划)项目 冬小麦导数光谱特征提取与缺磷胁迫神经网络诊断[期刊论文]光谱学与光谱分析 --2011,31(4)刘炜常庆瑞郭曼邢东兴员永生分别于返青期、拔节期、抽穗期和灌浆期采集不同磷素处理的冬小麦叶片原始高光谱数据;之后求取其一阶导数(一阶导数光谱)并进行小波去噪处理;通过分析原始光谱和一阶导数光谱对小同磷素处理水平的响应特征,确定敏感波长范...

特征提取与加权 篇6

关键词:脑机接口,脑电信号,小波包分析,支持向量机

1 引言

脑机接口(brain-computer interface,BCI)是一种不依赖于人脑的正常输出通路(即外周神经和肌肉),就可以实现人脑与外界(计算机或其他外部装置)通讯的系统。脑机接口的出现使得用人脑信号直接控制外部设备成为可能。对于一些脊髓或外周神经受损而中枢神经系统完好的残疾人可以通过BCI系统利用自己的运动想象实现与外界的直接交流(例如环境控制、轮椅控制、操作计算机等)[1,2]。

正常人的脑电波随人的意识水平呈现不同的节律活动,这些节律受不同的活动和思维影响,其波形很不规则,频率变化范围主要在1~30 Hz。Mu节律(8~12 Hz)产生于人脑的感觉运动皮层,和肢体运动有密切关系,而Mu节律又通常与14~26 Hz的beta节律相关[3]。肢体的真实运动或想象运动中伴随着由大脑运动皮层Mu/Beta节律的事件相关去同步化(event related desynchronization,ERD)和事件相关同步化(even related synchronization,ERS)引起的脑电能量变化[4]。利用Mu/beta节律的能量幅值变化规律对想象左右手运动信号分类,将C3、C4通道4~7 s时间段的信号幅度的平方差作为分类特征值,同时与支持向量机(SVM)相结合,进行运动想象脑电数据的分类,取得了较好的效果。

2 实验数据

实验数据来自“BCI Competition 2003”竞赛数据data seⅢ,采自位于C3、Cz、C4等3个电极的双导联方式记录的脑电信号,采样频率为128 Hz。有想象左手运动和想象右手运动2个类别。每次实验持续时间为9 s,所有实验数据由想象左、右手运动任务各70次的已知类别的训练样本和各70次的未知类别的测试样本组成。实验过程详见文献[5]。

3 EEG信号特征提取及分类

3.1 脑电信号预处理

脑电数据是采自于C3、Cz、C4等3个电极的双导联方式记录的信号,其中C3、C4电极位于大脑的初级感觉运动皮层运动功能区,最能反映受试者在想象左右手运动时大脑状态的变化[5],因此选择C3、C4通道的脑电信号进行想象左右手运动的分类,Cz作为参考电极。

和肢体运动有密切关系的Mu节律(8~12 Hz)产生于人脑的感觉运动皮层,通常Mu节律又与14~26 Hz的beta节律相关。据此对原始EEG数据进行8~28 Hz的数字带通滤波。采用椭圆数字滤波器,通带截止频率为8~28 Hz,阻带截止频率为5 Hz和30 Hz。

3.1.1 信号的频域分析

基于AR模型的功率谱估计是现代谱估计中最常用的一种方法。本文选用Burg算法对滤波后的EEG信号进行AR模型谱估计,其中模型的阶次选取为10。图1为想象左、右手运动实验基于Burg算法的AR模型谱估计图。如图所示,在8~12 Hz频带左右想象左右手运动对应的ERD/ERS现象清晰可见,在大约18~22 Hz左右也显示了想象左右手运动对应的ERD/ERS。因此,对想象左右手运动的脑电信号采用Mu节律和18~22 Hz的beta节律作为分类的频率段。

3.1.2 信号的时域分析

由相关生理知识可知,大脑两侧发生ERD/ERS是对称的,在想象左右手运动过程中,当大脑一侧运动感觉皮层出现ERD,则另一侧同时出现ERS,即两侧信号的能量会出现明显差异[6]。

根据能量的时域计算公式得第q点的能量为:

由实验数据的描述可知,在0~3 s受试者做放松准备工作,3~9 s做想象运动。由图2可得,想象左手运动时C3、C4两通道信号能量在4~6.5 s时间段差别较大,ERD/ERS现象比较明显;想象右手运动时C3、C4两通道信号能量在4~7 s时间段差别较大,ERD/ERS现象比较明显。

3.2 脑电信号特征提取

小波包分析方法是多分辨率小波分析的推广,它能为信号提供更精细的分析方法,将频带进行多层次划分[7]。

通过对信号的频域分析,在8~12 Hz、18~22 Hz的2个频带想象左右手运动对应的ERD/ERS现象较明显。选用Daubechies类db4小波对脑电信号进行2级小波包分解,对应的频带依次为8~13、13~18、18~23、23~28 Hz,分别重构第1、3个频带后叠加即可提取所对应的ERD/ERS现象较明显节律信号。分别对C3、C4通道重构的脑电信号选取其4~7 s内的信号求取其能量,C3、C4通道信号的能量差即为想象左右手运动分类的特征值。

3.3 分类器的选择

支持向量机是Vapnik等人提出的一类新型机器学习方法,它能够非常成功地处理分类和回归问题,在很大程度上解决模型选择与过学习问题、非线性和维数灾难等问题。

支持向量机通过使用非线性映射(核函数)将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,并基于结构风险最小化理论在特征空间中建构最优分割超平面[8]。

对线性可分训练样本:

其中,xi表示特征向量;y∈{-1,1}是类别标号。寻找最优分类面使2类样本正确分开且分类间隔最大,需满足约束条件[9]:

其中,w为分类面的投影向量;b为分类阈值。此时,分类函数为:

对于非线性问题,只需在最优分类超平面中采用适当的核函数,就可以实现某一非线性变换后的线性分类,将问题从原空间变换到一个高维的特征空间,此时相应的判别函数式也应变为:

其中,n为支持向量的个数;αi为拉格朗日乘子;K xiΣ·x≤为核函数。径向基核函数是SVM中常用的核函数,具有参数少、模型复杂度低等特点,有利于训练时参数的确定[10]。

针对想象左右手运动脑电信号的非线性的特点,选择径向基函数作为SVM的核函数实现对提取的测试集脑电信号特征值分类,在4~7 s时间范围内,分类正确率为87.14%,达到了BCI竞赛的水平(BCI竞赛中对此数据处理所得正确率的排名为:第1名89.29%,第2名84.29%)。

线性分类器的目的就是从高维特征空间里提取出最具有判别能力的低维特征,这些特征能帮助将同一个类别的所有样本聚集在一起,不同类别的样本尽量分开,即选择使得样本类间离散度和类内离散度的比值最大的特征。使用同样的特征值结合线性分类器分类,最佳分类正确率为83.57%。

通过比较2类分类器的分类结果可知,较好解决过学习、非线性等问题的支持向量机对处理脑电信号这类非线性信号具有更佳的效果。

表1为选取不同时域范围和不同分类器情况下测试集分类正确率的结果。

4 结束语

通过对滤波后的脑电信号进行时、频域的分析,分析出实验中运动想象脑电信号的ERD/ERS的生理特性的最佳时间和频率段。采用小波包分析法得到最佳节律,以C3、C4通道最佳节律能量差为分类特征值。采用LDA得到最佳分类效果为83.57%,SVM进行分类的准确率为87.14%,因此SVM更适合本实验的想象左右手运动的脑电信号分类。

本研究中的实验受试对象为健康人,因而,上述结果存在一定偏差。下一步将会针对真正的运动障碍患者(思维正常)的BCI问题进行深入研究,同时对基于Mu/beta节律的脑机接口系统对其他类型的脑电信号的分类研究的适用性、BCI在康复工程领域的应用与发展做进一步研究。

参考文献

[1]Virts J.The third international meeting on brain-computer interfacetechnology:making a difference[J].IEEE Trans Neural Syst RehabilEng,2006,14(2):126-127.

[2]高上凯.浅谈脑-机接口的发展现状与挑战[J].中国生物医学工程学报,2007,26(6):801-803.

[3]Pfurtscheller G,Da Silva Lopes F H.Event-related EEG/MEG synchronization and desynchronization:basic priciples[J].ClinicalNeurophysiology,1999,110(11):1 842-1 857.

[4]Birbaumer N.Breaking the silence:Brain-Computer interfaces(BCI)for communication and motor control[J].Psychophysiology,2006,43:517-532.

[5]赵慧.基于左右手运动想象的脑机接口研究[D].广州:华南理工大学,2007.

[6]Naeem M,Brunner C,Leeb R,et al.Seperability of four-class motorimagery data using independent components analysis[J].J NeuralEng,2006,3:208-216.

[7]周伟,桂林,周林,等.Matlab小波分析高级技术[M].西安:西安电子科技大学出版社,2006.

[8]Pfurstcheller G,Muller-Putz G R,Schlogl A,et al.15 years of BCIresearch at Graz university of technology:current projects[J].IEEETrans Neural Syst Rehabil Eng,2006,14(2):205-210.

[9]Penny W D,Roberts S J,Curran E A,et al.EEG-Based Communication:A Pattern Recongintion Approach[J].IEEE Trans Rehab Eng,2000,8:214-215.

特征提取与加权 篇7

1 实验原理

实验所搭建的为光纤型的实验平台,所用激光为632 nm的红色光,激光通过直径约10μm的光纤进行传输,水下声源在离水面35 cm左右的深度。

激光器产生的激光经分束器后分成两束,一路经过准直镜聚焦后照射到水面,信号发生器产生的信号经功率放大器放大后传到水下声源,这样从水面反射的光就携带水下声源的信息。反射光与参考光发生干涉后,干涉信号通过光纤传输到光电传感器。光电传感器将光信号转换为电信号,输出到示波器和计算机上,这样就可以直观地观察到干涉信号的波形。可以对时域的干涉信号进行傅里叶变换等处理,得到频域信号并分析。

2 实验结果与分析

将水下扬声器作为振源,放在水下35 cm深处。改变扬声器的振动频率和强度,来研究激光相干探测方法从水表面来提取水下振源的振动特征。实验中,扬声器分别以1 000 Hz、2 000 Hz和3 200 Hz的频率振动,输出电压为1 V在水下振动。图1为扬声器以1 000 Hz、振幅为1 V振动,激光相干探测水面的实验数据和频谱分析结果。

图1a给出水下振源以1 000 Hz振动时,激光相干探测从水表面得到的实验数据。

从实时的数据可以看出,在一个低的起伏信号上叠加了振动的信息。通过傅里叶变换做的频谱分析,结果如图1b所示,1 000 Hz的振动特征比较明显。

分析结果表明,水下振动的特征可以通过获取水表面的信息来获取,进一步证明该实验方法的可靠性。

改变水下振源的振动条件,分别以2 000 Hz和3 200 Hz的频率振动,输出电压为1 V在水下振动。实验数据和频谱分析结果如图2、图3所示。

图2a和图3a分别给出激光相干探测从水表面得到的实验数据。从实时的数据很难看出其振动的特征。借助于傅里叶变换做的频谱分析,结果如图2b和图3b所示。图中其振动的特征非常小,其振动的特征淹没在背景中。如何在实时获取的实验数据中提高目标的特征,这对实验探测提出了更高的要求。

3 信号特征的增强

通过实验观察和数据分析可知,当扬声器振动的振幅不变时,随着振动频率的增加,激光检测到的信号中振动的幅值减小。这是因为在能量不变的情况下,随着频率的增加,单位时间内振动次数增多,分配到每次振动的能量减少。从而在水面引起的振动减小,检测到的信号强度变弱。因此在增大频率的同时,增大声源的振幅。

从水表面获取水下振动的特征,容易受到水表面自然波动和高频噪声的影响。从图1~图3的实验数据可知,水表面的自然波动是一个低频变化,因此,选择一个合适的带通滤波器,可有效地减小水表面自然波动和噪声对特征信号的影响。通过滤波可以有效地将水表面自然波动信号和声信号分离开,从而实现水下声信号的提取和分析。

图4为振动特征微弱时,采用带通滤波处理,增强振动特征图。

图4a和图4b所示为输出电压为1 V,水下声源频率为1 000 Hz时的波形和傅里叶变换得到的频谱。从分析结果看出,虽有1 000 Hz的振动特征,但特征比较小。因此选择一个带通滤波器对实验数据进行滤波,结果如图4c~图4f所示,图4c是水表面自然波动的信息,对应的频谱分析如图4d所示,水面自然波动频率主要集中在200 Hz以下。



带通滤波的结果如图4e和图4f所示。图4e给出滤波后实验数据,振动间距均匀,符合特定频率的振动特征。频谱分析如图4f显示,在1 000 Hz处特征明显。因此过滤掉低频的水表面自然波动信号和高频噪声信号,可有效地增强目标的特征,有利于特征信号的提取。

4 结论

利用激光相干探测研究水下声场的振动特征,通过对实验数据的频谱分析和滤波,可有效地增强目标的特征,从而实现特征信号的提取和分析。

摘要:激光相干探测法从水表面获取水下声场的信息,通过水表面反射光与参考光的干涉,从干涉信号中提取水下振动的频率。采用频谱分析与傅里叶滤波变换的特征提取方法,可有效地增强信号里水下声场的振动特征。振源在水下35 cm处,分别以1 000 Hz、2 000 Hz和3 200 Hz振动,激光相干探测从水面实时获取信息。通过对实验数据的分析表明,激光相干探测可以有效地获取水下声场振动的信息,傅里叶变换滤波方法能有效地增强目标的特征。

关键词:光纤,水下声源,干涉,激光探测,滤波

参考文献

[1]曹增辉,郑田甜,孙腾飞,等.激光探测水下声信号的实验研究[J].光电技术应用,2014,29(2):17-21.

[2]Anthony D Matthews,Lisa L Arrieta.Acoustic optic hy-brid(AOH)sensor[J].J.Acoust.Soc.Am.,2000,108:3.

[3]宫彦军,江荣熙,李晓伟,等.利用激光从散射光中提取水下声信号的探测技术[J].烟台大学学报:自然科学与工程版,2003,16(1):38-42.

[4]孙金祚,江荣熙,戴振宏,等.激光-声-激光探测水下目标的理论和方法研究之一高能量宽频带光-声声纳源的光声转换效率研究[J].目标与环境特性研究,1998(4):34-42.

[5]戴振宏,孙金祚,隋鹏飞.水表面横向微波一维模型的理论研究[J].烟台大学学报:自然科学与工程版,2003,16(1):23-28.

[6]张晓琳,唐文彦,段海鹏.激光干涉法探测水下声信号[J].大连海事大学学报,2009,35(1):53-56.

特征提取与加权 篇8

定位是移动机器人最基本的功能之一,最早的定位研究成果主要是通过机器人的内部传感器,如码表、惯性仪等设施实现定位,但由于打滑、地面崎岖不平等原因造成的误差累积常常会导致定位结果不精确,不宜长时间单独导航。如果通过GPS定位或者利用我国的北斗导航系统定位,在有遮挡区域等信号不好的地方定位系统将失效,因此,人们开始逐渐采用外部传感器来辅助定位,比如红外和视觉传感器[1,2]。

视觉传感器因其丰富的环境信息如视觉、纹理、形状等备受关注,而且由计算机视觉理论可知,通过视觉系统便可准确识别出目标并判断出自身位姿。目前许多现存的方法中,大多采用人工设置路标,然后在机器人移动过程中对事先设定的人工路标进行匹配实现定位。但是随着研究工作的不断进展,人们逐渐将移动机器人的应用场景从室内转到了室外,此时许多特定情况下,人工设置路标是不现实的,所以自然路标就成为在户外条件下的首选方法。所谓自然特征就是指环境中已有的、非人工设置的、能够用以标识不同环境场景的特征对象。相对于室内大多结构化的环境,室外复杂的非结构化环境对移动机器人的定位和导航带来了相当大的挑战,同时,相对于室内,室外不断变化的光照条件和气候环境也是研究中的一大挑战。

基于视觉的自然路标需要提取其不变点,之后利用特征点匹配的方法判断和识别路标,从而实现移动机器人的定位。与GPS定位方法不同,基于特征的定位方法首先将原始的采样数据转换为相应的局部特征,在只需少量存储空间的情况下保存丰富而精确的环境信息。这类方法通常具有较好的鲁棒性,能满足相对复杂的应用,但在道路两旁有植被分布时,大多数特征点都集中于道路两旁的树木,而且提取的特征较为相似,这对后期的特征匹配和机器人定位带来了较大的影响。因此,如何剔除植被对自然路标提取的影响,将特征点尽可能均匀地分布到场景的建筑物中去,成为自然路标提取中的一大难题[3]。

目前已有的局部特征匹配算法主要有Harris,SIFT,SURF,ORB等[4,5],SIFT(Scale - invariant Feature Trans-form)算法由David Lowe在1999年提出,2004年完善总结。因其具有良好的尺度旋转不变性而受到广泛关注,但由于其运算速度较慢,影响了其在实时应用中的应用。Herbert Bay针对SIFT算法提出了改进的SURF算法[6,7],在速度上提升了一个量级,但是在一些实时应用中此速度依旧不够。直到2011年Willowgarage提出了ORB算法[8,9],可以满足大多数实时性应用。但是,ORB算法提取的特征点,在户外应用中,特征点分布都不够均匀,故本文采用基于曲率的算法来实现较均匀的特征点提取[10]。

1 基于曲率的特征点抽取

基于曲率的特征点抽取方法计算简单,提取出来的特征点具有旋转不变性,对噪声和亮度变化也都具有良好的鲁棒性,且特征点分布均匀,更重要的是可以提取定量的特征点。该方法主要通过灰度变化来判断是否是角点,当图像中某一点沿任意方向的微小偏移都会产生灰度的大量变化,则该点被认为是角点。设Ix为水平方向灰度的变化,Iy为竖直方向的灰度变化,那么角点就是Ix,Iy变化都很大的点,而边缘则是Ix,Iy中只有一个变化较大的点。设w(x,y) 是以 (x,y) 为中心的一个滑块 ,当其在任 意方向滑 动 [u,v] 时 ,产生灰度 变化E(u,v) 的计算方法如下:

而后根据泰勒级数计算出一阶到n阶的偏导数,最终可以得到一个矩阵公式:

再根据矩阵的特征值 λ1,λ2判断是否为角点,但实际操作中一般计算出角点响应值如下:

式中:k为系数值,一般取0.04~0.06,通过R来判断是否为角点,R若为对应的邻域的极大值就是角点所在位置。

邻域设置为3 × 3和8 × 8时基于曲率的特征点提取的效果图,如图1所示。

原本的基于曲率的特征点提取算法,判断一个点是否为特征点的依据是判断计算出的R是否在邻域内最大,若最大则为特征点。而这里因为一个点的不确定性主要取决于较小的那个特征值,若采用行列式的特征值来判断是否为特征点的话,只需较小的一个特征值数值大于预先设置的阈值,则该点便可以被认为是一个强角点[11],即此时:

若R大于预先给定阈值即为强角点,由于该算法对发现特征值的要求较低,可以抽取到一些不是特别明显的特征点,若实际应用中需要特征点均匀分布时,适当提高该算法的运算邻域,即可获得相对其他算法而言分布更加均匀的角点分布图,效果如图2所示。

图2(a)和图2(b)分别为极大值抑制区域为3 × 3和8 × 8的情况,可以发现当极大值抑制区扩大为8 × 8时,特征分布已相当均匀。

2 具有旋转不变性的二进制特征描述

二进制字符串描述符,相对其他算法减少了描述符的维度,从而减少了描述和匹配的时间。该算法首先对图像进行高斯滤波以降低噪声的影响,后在图像中选择一个局部 块p,大小为S × S像素 ,定义一个 τ 测试如下:

式中:u,v是形如 (x,y) 的二维坐标对;p(u),p(v) 是所在点的亮度。

由若干个 τ 测试的结果组成字符串:

式中 :n可以取128,256,512等 ,这里取512,其需要512 8 = 64B的存储空间。如何有效地选取特征点对接下来的运用影响很大,经实验证明,采用服从1 /25S2的高

斯分布,特征向量具有较好的分辨率,同时采用Ham-ming距离代替传统的欧式距离判断是否匹配,匹配时只需按位进行异或操作,大大缩短了特征匹配的时间。

BRIEF运算简单且所占内存较小,比较适用于一些实时应用,但该算法同样也存在一些缺点:易受噪声影响,未考虑特征方向,不具备旋转不变性,不具备尺度不变性。

为了让该算法具有旋转不变性以减少移动机器人在抖动过程中画面旋转对匹配结果造成的影响,通过质心算法计算出各关键点的方向,如下式所示:

得到特征点的方向为:

式中:(x,y) 为检测到兴趣点的坐标,之后将获得的 θ 以2π 30的尺标将其量化。在位置 (xi,yi) 上对任意n个二进制特征集,定义一个2 × n的矩阵:

用之前得到的 θ 校正S得到Sθ= SRθ,其中:

根据得到的方向再提取描述子g(p,θ)= f (p)|(xiyi)∈Sθ就具有旋转不变性了。

3 实验和结论

本实验在Win7系统下,利用vs2010和opencv2.4.10实现了基于曲率算法的特征抽取与二进制特征描述方法。实验硬件为AMD四核的A6-3420M APU 1.5 GHz,内存4 GB,显卡HD 7470M 1G。由于实现移动机器人定位所需的特征点对不多,故本文所有算法对每一幅图像检测到的特征点数设置上限为200,所使用图片采用录制视频中相近帧截屏获得,各算法实验效果如图3所示,实验数据见表1。

从实验结果来看,SIFT和SURF所获得的特征点分布比较均匀,但是在速度上和其他算法相比,慢了很多,不适用于实时性应用,速度最快的快速角点检测算法检测出的特征点分布较为集中,无法减少树木等对特征匹配的影响。

特征提取与加权 篇9

关键词:高分辨率,遥感,舰船,SIFT,特征提取,特征匹配

0引言

利用遥感图像对舰船目标进行检测和识别对水运交通、海上应急救助、渔业监测、非法入境监控等方面具有重要意义[1]。随着对地观测技术及相关光电技术的迅猛发展,遥感图像不论是成像质量还是分辨能力都随之取得了长足进步,光学遥感已经步入高分辨率时代,对舰船目标的判别也在从目标检测向目标识别的方向转变。

在舰船目标识别初期,主要利用舰船的形状特征、灰度特征和纹理特征等全局特征对舰船类型进行判别[2,3],随着光学遥感图像分辨率的进一步提高,舰船目标的细节特征更加清晰,充分利用舰船目标的局部特征将有助于舰船目标的精细识别。

尺度不变特征变换( Scale Invariant Feature Transform,SIFT) 是一种高效的图像特征点检测算法[4],已经成为最为经典的局部特征描述子之一, 在机器视觉和图像配准等领域取得了广泛应用[5,6],但是受遥感数据源的限制,其在遥感图像识别领域的应用鲜有报道。SIFT算法在高斯差分金字塔图像中寻找目标特征点,再以其为中心提取具有平移、旋转和缩放等不变性的局部特征向量描述子。通过将待识别舰船目标与样本目标图像的SIFT局部特征向量进行匹配,可以用于舰船目标的识别,主要包括特征点提取、特征点描述和特征匹配等步骤。

本研究基于SIFT算法对高分辨率光学遥感图像中舰船目标的局部特征进行提取与匹配研究,为舰船目标精细识别奠定技术基础。其中,高分辨率遥感光学图像舰船目标从Google Earth中截取。

1 SIFT特征点提取

在尺度空间中完成SIFT特征点的检测,能够使检测到的局部特征点具有尺度不变性。文献[7]证明高斯卷积核是唯一的线性变化核,因此尺度空间的定义为:

式中,G( x,y,σ) 是在尺度 σ 下的高斯函数卷积核,

σ 值越小,图像越清晰,则对应于图像细节信息; σ 值越大,图像越模糊,则对应于图像的概貌特征。

SIFT算法在某一尺度上检测特征点,首先将2个相邻高斯尺度空间的图像相减,得到一个高斯差( Difference of Gaussians,Do G) 的响应值图像D(x,y,σ) 。再对响应值图像进行非最大值抑制,在位置空间和尺度空间中对特征点进行定位。其中,

式中,k为常数,表示两相邻尺度空间的倍数,一般取

Do G通过高斯差分金字塔来构建,假设图像金字塔共O组,每组有S层,则下一组的图像由上一组图像降采样得到,对于每一组的S层图像而言,上一层的高斯滤波尺度都是下一层的k倍。

对特征点的搜索通过同一组内各Do G相邻层之间的比较来完成。每一个采样点要和它同一尺度以及相邻尺度下的所有相邻点进行比较,看它是否比这些点的值大或者小,以此寻找尺度空间的极值点。如图1所示,中间的检测点和它相邻的26个点进行比较,包括同尺度的8个相邻点和上下相邻尺度对应的18个点,以确保检测到的是极值点。

通过以上流程对尺度空间的特征点进行检测, 可以得到它所在的尺度和位置。但得到的位置比较粗糙,定位不是很准确。某些特征点的极值响应比较弱,且包括一些位于边缘处的特征点,需要进行消除。对特征点准确定位,可以通过拟和二次函数来精确确定特征点的位置,能够达到亚像素级的精度, 以此可以增强特征匹配的稳定性,提高对噪声的抗干扰能力。

2 SIFT特征点描述

对SIFT特征点进行描述主要包括特征点主方向和特征矢量2部分。

2.1特征点主方向

确定特征点的主方向,能够保证特征点的特征向量具有旋转不变性,可以利用特征点周围区域像素的梯度幅值大小及方向分布的特性得到。

具体计算方法如下: 对以特征点为中心的邻域进行采样,并统计邻域像素中每个梯度方向的累加值。用直方图对梯度统计结果进行显示,直方图的范围是0~360°,每10°代表一个方向,共计36个方向。在计算梯度方向直方图时,用一个参数为所在尺度1.5倍的高斯模板对各个梯度值进行加权,以降低距离特征点较远处的像素对主方向的影响,如图2中圆形所示,中心向边缘方向的权值逐渐减小。 对得到的梯度方向直方图查找其中的峰值,峰值所处的方向即代表了该特征点的主方向。

如果在梯度直方图中另有某个峰值的大小超过主峰值80%,则保留这个方向作为该特征点的辅助方向,以此可增强特征点主方向的鲁棒性。因此一个特征点可能会被指定具有多个方向,一个主方向以及一个以上辅方向。

图3显示为高分辨率遥感图像舰船目标切片中随机选取的100个特征点的位置、尺度和主方向,其中圆圈中心是特征点位置,圆圈半径表示特征点尺度,线段方向指示特征点的主方向。

2.2特征点特征矢量

为保证提取特征具有旋转不变性,将图像坐标轴旋转为特征点主方向,并以特征点为中心取一个16×16的区域。图4左图中,中央点表示当前特征点的位置,每个方格表示所在尺度空间中特征点邻域的像素点,箭头方向表示对应像素梯度方向,箭头长度表示梯度大小。

为避免由于特征点位置的微小变化导致整个特征描述子发生较大变化情况的发生,让远离特征点中心位置的梯度值影响尽可能小。通过对整个窗口进行高斯加权运算来实现,即用模板大小等于描述子宽度一半的高斯函数进行加权运算。如图4所示,圆圈代表高斯加权的范围,越远离特征点的像素,权值越小,对梯度方向的贡献也越小。然后将这个区域再划分为4×4个小区域,每个小区域的大小为4×4个像素,在每个小区域块中计算8个梯度方向的统计直方图( 如图4右图所示) ,箭头的长度表示该方向上所有梯度总和的大小。

对以上16个小区域块中的8方向梯度值按照位置进行排序,形成一个16×8 = 128维的特征向量, 该特征向量即为SIFT特征点的描述子,此时构建的描述子特征向量已经去除了尺度、旋转等几何形变因素的影响,然后将描述子的长度进行归一化,以进一步去除光照对特征描述的影响。

SIFT特征点的特征矢量描述结果如图5所示, 白色方框的大小表示特征点尺度,方框内箭头表示特征矢量。

3特征匹配

令一幅图像中的特征点描述子集为目标集{ qj} ,j = 1,2,…,m,另一幅图像中的特征点描述子集为基准集{ pi} ,i = 1,2,…,n。特征匹配就是对每个qj,在基准集中找到与其距离最近的pi,则qj和pi就构成一个特征匹配对<qj,pi>。

进行特征匹配的方法主要可以分为2种: 1线性扫描法,也称为穷举法,是将目标集中的点与基准集逐一进行距离比较求取最近匹配对,因此无需数据预处理,操作相对简单,但搜索效率偏低; 2建立数据索引,然后再进行快速匹配,可以大大加快检索的速度,但建立索引结构需要比较高昂的代价,如Kd-树( K-dimension Tree) 等[8]。相关研究发现,当需要匹配特征点数低于2 000时穷举法效率较高, 特征点数大于2 000时,Kd-树算法效率较高[9]。本文采用穷举法对舰船目标和舰船样本进行匹配,匹配结果如图6所示。2艘舰船虽然船上装载物品有所差异,但二者主体结构一致,属于同一类型舰船。

即使匹配对中2个数据点的距离最近,但由于误差的存在也并不意味着它们对应相同的目标区域,因此需要对匹配对进行筛选,剔除错误的匹配对。本文采用经典的随机抽样一致性RANSAC ( Random Sample consensus) 算法进行匹配对的提纯,它实现简单,性能良好[10]。

通常能够进行匹配的2幅图像存在透视变换关系,则正确的匹配对的变换关系应具有一致性。 RANSAC算法的核心思想是首先创建一个误差判断模型,然后随机抽取一定符合条件的数据( 本文是选择4组) ,通过误差判断模型反复地迭代、测试, 最终找到一个误差最小的模型,用来区分一致性数据和非一致性数据。图6经过匹配对提纯后的匹配结果如图7所示。

4结束语

基于SIFT算法对高分辨率光学遥感图像中舰船目标进行了特征点的提取与匹配研究。通过上述SIFT特征点提取、特征描述以及特征匹配,可以看出两舰船的匹配点提取准确,局部细节特征匹配精准,匹配对具有高度的一致性,因此可以利用SIFT算法进行待识别舰船目标和舰船样本的匹配,从而达到通过图像匹配进行舰船目标精细识别的目的。 本文的研究成果为舰船目标识别奠定了技术基础, 后期将在此基础上针对该算法应用中的鲁棒性、时效性、识别精度等问题继续开展深入研究。

参考文献

[1]陈韬亦,陈金勇,赵和鹏.基于Ecogniton的光学遥感图像舰船目标检测[J].无线电工程,2013,43(11):11-14.

[2]裴洪飞.航空图像中舰船目标识别技术研究[D].哈尔滨:哈尔滨工程大学,2010.

[3]于鹏.高分辨率可见光遥感图像舰船目标识别方法研究[D].长春:吉林大学,2011.

[4]LOWE D.Distinctive Image Features from Scale-invariant Keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.

[5]黄灿.基于局部特征的车辆识别[D].上海:上海交通大学,2010.

[6]王云飞.基于SIFT和归一化互信息的SAR图像配准算法研究[D].西安:西安电子科技大学,2014.

[7]LINDEBERG T.Detecting Salient Blob-like Image Structures and their Scales with a Scale-space Primal Sketch:a Method for Focus-of-attention[J].International Journal of Computer Vision,1993,11(3):283-318.

[8]王永明,王贵锦.图像局部不变性特征与描述[M].北京:国防工业出版社,2010.

[9]朱佳文,屈新原,高小伟.基于CSIFT算法的UAV影像配准技术研究[J].首都师范大学学报(自然科学版),2013,34(4):69-74.

特征提取与加权 篇10

随着互联网的迅速发展, 不断涌现各类多媒体应用, 人们获取信息的数量和途径也飞速增长, 网络图像目前已成为人们获取视觉信息的主要来源。然而, 网络图像数量的急速增长, 使得一些不法分子在交易网站或论坛上发布枪支图像, 从事一些军火贩卖等不正当手段。这些图像通常具有一定的煽动性和危害性, 对人们的身心健康成长会产生不可估量的危害作用。因此, 净化网络环境, 加强对网络信息的监控已成为一种强烈的社会需求。

通常枪支图像在图像内容上具有明显的特点, 比如这类图像中的枪支区域的颜色多数呈黑色或褐色, 纹理上相似度较高, 且形状多为条状的枪管和套筒, 中间有一扳机。因此, 利用枪支图像在形状特征上的显著区别, 可以有效地从大量的网络图像中将其鉴别出来。本文在充分挖掘枪支图像在形状特征上的特点的基础上, 提出了一种基于边缘检测技术与模糊聚类算法的面向枪支图像的特征提取与识别方法, 能够有效地利用枪支图像在形状上远胜于颜色和纹理的辨识度, 将枪支图像与非枪支图像快速地区别开来。首先, 利用边缘检测技术获得图像的Hu不变矩的七个特征值;然后, 将提取的特征值利用模糊聚类算法计算出两类图像各自的聚集中心;最后, 将来自于测试图像库和训练图像库中的图像进行基于Hu不变矩特征值和聚类中心的对比。

1. 相关研究介绍

有关边缘检测的研究工作, 先前的研究者已经做了大量的工作并运用到许多应用领域。例如:在文献1[1]中, 为了更精确地识别出医学图像中的肿瘤轮廓, 作者在传统的小波边缘检测技术的基础上, 提出了一种新的边缘提取算法。该方法能够较好地获得所需区域的精确轮廓, 为肿瘤的早期识别提供了依据。在文献2[2]中, 作者将边缘检测算法运用到污损条码的识别中。该方法通过分析常用边缘检测算法优点的基础上, 提出了一种改进的sobel算子, 并用它来对图像中的条码区域进行边缘检测, 能够达到快速、有效地识别出污损条码的目的。在文献3[3]中, 作者采用目标提取方法对遥感图像进行分析处理。该方法运用模糊聚类分析的模糊C-均值算法, 选择适当的正交彩色特征, 实现了对图像中目标区域的有效分割与快速提取, 为遥感图像识别与计算提供了可靠的基础。在文献4[4]中, 作者提出一种基于角点的特征提取方法来对蝶类昆虫进行识别。该方法首先利用边缘检测算子对鳞翅目蝴蝶图像进行操作, 然后通过用角点提取图像的纹理信息来获得蝶类图像的特征, 最终为蝶类图像的识别奠定了基础。

然而, 到目前为止, 可查阅的文献中有关枪支图像识别的文献较少, 因此本文在深入分析枪支图像在形状特征上的显著特点的基础上, 提出一种结合边缘检测方法和模糊聚类算法的枪支图像特征提取与识别方法, 旨在为今后从海量的网络图像中将枪支图像等不良图像进行有效过滤打下良好的基础。

2. 基于边缘检测和模糊聚类的特征提取与识别方法

2.1 Hu不变矩

Hu不变矩[5]是一种经典的特征提取方法, 它可以从中心矩和原点矩中构造出七个不变量, 具有平移、旋转和尺度不变性的特点。

假设目标区域D中的灰度分布为f (x, y) , (x, y) ∈D, 为描述目标, 将区域T以外的区域的灰度分布视为0, 于是目标的a+b阶区域原点矩和区域中心矩就分别变为:

中心矩和原点矩存在换算关系如下:

规格化的中心矩定义为:

利用上面的关系, 可导出下面七个不变矩函数式:

由于七个Hu不变矩函数式的变化范围较大, 常常出现负值, 因而在实际应用中采用的是取不变矩绝对值的常用对数的方法。

2.2 模糊聚类算法

模糊聚类算法 (Fuzzy clustering method, 简称FCM) 是一种用隶属度来表示数据点属于某个类别的程度的一种聚类算法。

在FCM中, n个向量Ax (x=1, 2, …, n) 分为b个模糊类别组, 求出每个类别组的聚类中心, 要使各类别组间的相似性达到最小。由于FCM采用模糊隶属度来进行划分, 因而每个给定的数据点属于哪个类别组的程度用0与1间的值来确定。包含隶属度值的隶属矩阵在归一化后, 每个类别组的隶属度和总是等于1。

以下是FCM中确定每类别组的聚类中心ci和隶属矩阵U[1]的具体步骤:

步骤1:为了满足一个类别组的隶属度和等于1的约束条件, 用值在0, 1间的随机数初始化隶属矩阵U;

步骤2:计算b个聚类中心bx, x=1, …, b;

步骤3:计算价值函数, 如果它相对上次价值函数值的改变量小于某个阀值, 或它小于某个确定的阀值, 则算法停止;

步骤4:计算新值, 返回步骤2。

2.3 实验结果与分析

我们从网络上下载了800幅与枪支有关的图像, 1500幅非枪支图像, 其中700幅枪支图像和1400幅非枪支图像用于训练过程;余下的100幅枪支图像和100幅非枪支图像用于测试过程。

训练过程的算法流程图和测试过程的算法流程图分别如图1和图2所示。

假设有一幅测试图像i, 令其Hu不变矩七个特征值与枪支类图像的聚类中心距离为la, 其Hu不变矩七个特征值与非枪支类图像的聚类中心距离为lb (本文采用欧式距离公式计算距离值) , 则可以通过计算la和lb之间的距离差值来获得图像i的识别结果。若lalb≤0, 则该图像识别为枪支类图像, 否则, 该图像识别为非枪支类图像。

图3和图4给出了两幅示例图像的识别结果。其中:图3中的图像得到的计算结果为-0.0203, 由于其值小于0, 则被判定为枪支图像;图4中的图像得到的计算结果为0.0239, 由于其值大于0, 则被判定为非枪支图像。

针对100幅枪支图像和100幅非枪支图像的测试结果如表1所示。

从实验结果可知, 本文中提出的方法获得了较高的正检率和较低的误检率, 能够有效地将枪支图像和非枪支图像区分出来。导致部分图像误分的原因可能是由于有些非枪支图像在形状上与枪支非常接近;而有些枪支区域的形状比较特殊, 有异于普通枪支的形状, 从而导致了误检。

3. 结束语

随着目前大范围净网活动的开展, 针对网络上各种不良图像的检测与过滤需求越来越迫切。从本文的工作来看, 在手枪图像识别研究领域中, 相对于图像的颜色、纹理特征等视觉信息, 利用图像中枪支区域的显著形状特征来加以鉴别显得更为直观、有效。

摘要:本文提出了一种针对枪支图像进行处理的特征提取以及识别方法。首先, 利用边缘检测技术获得图像的Hu不变矩的七个特征值;然后, 将提取的特征值利用模糊聚类算法计算枪支类图像和非枪支类图像各自的聚集中心;最后, 将测试图像库中的图像与训练库中的图像进行基于Hu不变矩特征值和聚类中心的对比。本文提出的方法能够将枪支图像快速、有效地识别出来, 以达到净化网络环境的效果。

关键词:枪支图像,边缘检测,Hu不变矩,模糊聚类,特征提取

参考文献

[1]王娅囡, 谷方, 杨厚俊.基于PET医学图像边缘检测算法的研究[J].现代生物医学进展, 2014, 05:965-968.

[2]胡大辉.边缘检测算法在污损条码识别中的应用研究[J].包装工程, 2013, 03:104-108.

[3]于辉, 徐军.彩色遥感图像目标提取方法研究[J].遥感技术与运用, 2003, 06:388-392.

[4]李海军, 徐凤生.蝶类昆虫识别算法的研究与分析[J].计算机应用与软件, 2009, 10:78-80.

上一篇:小学低年级写作教学下一篇:前牙即刻种植修复