医学图像挖掘

2024-05-08

医学图像挖掘(精选三篇)

医学图像挖掘 篇1

1 图像挖掘过程

由于图像挖掘研究尚处在初级阶段,相关的理论还不够成熟,就图像挖掘模型而言,虽然不少学者对此开展大量有益的探讨,但尚未提出通用性强的图像挖掘模型。一个图像挖掘系统应包含图像的存储、预处理、索引、检索、挖掘、模式评估和展示功能。目前较为典型的图像挖掘模型主要分为两种类型:功能驱动模型和信息驱动模型。无论是哪种图像挖掘模型,对图像数据库中的原始图像进行数据挖掘,一般要经过如图1所示几个步骤:

(1)图像数据库首先要经过预处理以改善其质量。

(2)经过预处理的图像然后进行各种变换与特征提取获得重要的图像特征。

(3)利用这些图像特征,使用数据挖掘技术发现有意义的模式。

(4)对由此产生的模式进行评价和解释,以取得最后有用的知识。

2 图像挖掘的方法与技术

2.1 图像预处理及图像数据知识表示

图像预处理是图像挖掘中的一个重要步骤,尤其是在对包含噪声、不完整,甚至不一致的图像数据进行挖掘时,更需要对图像进行预处理,以提高图像对象的挖掘质量,并最终达到提高图像挖掘所获模式知识质量的目的。图像数据预处理包括去掉无用数据和已被破坏了的数据,以及过滤掉数据中的噪音,并对畸变图像进行校正,使退化的图像得到复原,对大小不一的图像进行归一化处理等。

在图像数据变换阶段,首先选择合适的特征抽取工具,进行图像对象的特征抽取操作,形成原始的特征表征方式。图像的媒体特征易于获取,语义特征在对象识别和可视特征提取后通过人工注释或概念学习方式获得。最常用的图像可视特征描述:颜色、纹理、形状与空间特征。颜色是应用最广泛的可视特征。颜色特征通常用颜色直方图来表示,颜色直方图用于存放图像对象中每种颜色的像素的比例,具有平移和旋转不变性,是最常用的颜色描述。此外还有颜色矩和颜色集等;纹理刻画了颜色和密度分布的均匀性,包含了表面结构和其与周围环境关系的重要信息,表示方法主要有:共现矩阵法、小波变换法等。形状表示法主要有基于边界表示的傅立叶描述法、基于区域表示的不变矩方法,此外还有有限元FEM方法和小波描述方法等。

有时为了获取对象及其空间关系,还要用到对象识别方法。对象识别涉及到的关键技术有:图像分割、对象模型的表示及对象识别。识别步骤一般如图2所示:

图像分割传统算法有阈值分割法、边缘检测法、马尔科夫随机场、区域增长法、基于颜色和纹理的期望值最大化方法等。对象模型一般使用预先标记的对象的训练集,通过机器学习和数据挖掘找出该对象集合在相似度量下共有特征,作为其模型以进行对象模板匹配。对象识别问题可视为基于已知对象模型的监督标号问题,就是为图像的特定的一个或一组区域指定正确的标号。对象空间属性可采用关系拓扑集、相对位置关系向量集、距离关系矩阵集、空间方位图等方法表示。

在图像挖掘系统中,图像数据的维数可能很高,但其嵌入维则低得多。为提高模式的挖掘质量和效率,需采用维规约技术。主要方法是主成份分析法PCA和特征聚类法。

2.2 图像挖掘的方法

(1)图像相似搜索

图像挖掘需要从图像数据库中提取用于模式发现的图像数据集,需进行图像相似搜索。用于相似搜索的图像挖掘系统有:①基于文本的图像检索(TBIR)系统,此检索技术需要人工标引,因此耗时耗力,并且只能标引数量不大的图像集。②基于内容的图像检索(CBIR)系统,采用颜色、纹理、形状等低层可视特征或小波系数等对图像的标识进行相似检索。基于内容的检索通常有两种查询方法:①基于图像样本的查询,该方法找出所有与给定的图像样本相似的图像。②图像特征描述查询,该方法给出图像的特征描述或概括并把其转换为特征向量,与数据库中已有的图像特征向量相匹配。但由于图像具有多维特征,并且不同的用户对同一幅图像可能有不同甚至相反的观点,因此,基于内容的图像检索也不能很好地保证较高的查准率。③基于区域的图像检索系统(RBIR)系统,RBIR中的每个对象用其低层特征描述,图像用包含的对象作为特征来表示。

(2)图像关联规则

关联规则挖掘是传统数据挖掘中常用的技术,主要用于发现存在于大数据集中的关联性或相关性。关联规则挖掘是在大型数据库中发现兴趣趋势、模式和规则的典型方法。图像数据库中的关联规则与传统事务数据库中的关联规则相比有如下特点:①以图像的可视化特征、图像对象及对象的空间关系作为特征表示图像,并且图像中所包含的关系可以重复,如Osmar就给出了具有重复项的图像关联规则的定义;②图像中的关联关系更复杂,包含不同层次特征间的关系,如图像低级特征与语义特征、文本信息之间的关系;③涉及对象间的空间关联,如相交、包含、上、下、左、右等。现主要有两种挖掘方法,一种是针对图像本身的可视化特征之间的关联进行挖掘,如Multiedia Miner等,另一种则综合图像可视特征及相关文本信息进行挖掘,相对来说此类方法更加科学,但也更难实现。

(3)图像分类

基于内容的智能图像分类是从大型图像集中挖掘有价值信息的重要方法,可以通过将图像与不同的信息类别相关联实现图像的语义表示。通常在图像挖掘系统中将分类模块称为分类器,分类器主要有参数分类器和非参数分类器两种。图像分类的主要过程主要分为三步:①建立图像表示模型。对已进行类别标注的样本图像进行特征提取,建立每一图像属性描述;②对每一类别的样本集进行学习,建立描述预定图像概念集或类集的模型,如规则或公式。③使用模型对未标注图像进行分类判决和标注。图像分类困难在于低层可视特征和高层语义分类间的映射。常用的分类方法有:判定树、贝叶斯方法、神经网络方法。其它方法有:K—最近邻分类、遗传算法分类、粗糙集分类、基于关联规则分类等。图像分类现在面临的主要问题是如何通过图像的低级可视化特征将图像分到语义相关的类中。

(4)图像聚类

是依据没有先验知识图像的内容本身将给定的无类标签的图像集合分为有含义的簇,常用于挖掘过程的早期阶段。常用的聚类的特征属性是颜色、纹理和形状。目前已有许多可用的聚类算法:基于划分方法、基于层次方法、基于密度方法、基于网格方法、基于模型方法等。图像聚类的一般过程包括:①图像表示、特征抽取和特征选择;②建立适合于特定应用的图像相似度量;③图像聚类;④分组生成图像聚类完成后,需要领域专家对每个聚簇的图像进行检查,标注这个簇所形成的抽象概念。

(5)神经网络

是一个由简单的处理单元构成的大的并行分布式处理器,其中的每一个处理单元都有自然的存储经验知识和使知识可用的特性。神经网络具有容错性能,并且在模式识别和趋势预测领域有良好的表现。在知识有限的情况下,人工神经网络算法经常用于构造数据模型。尽管对于神经网络及其应用有很多研究工作,在图像挖掘领域它是新的研究方向:①用于图像分析的人工神经网络(ANN);②用于图像挖掘的基于模糊ARTMAP的神经网络。

2.3 解释与评估

对图像挖掘的效果要进行评价,查准率、查全率、正确率是通用的评价指标,这些评价指标是用相关的和正确分类的实例来定义的。正确的肯定(TP)和正确的否定(TN)是被正确分类的事例。错误的肯定(FP),是当结果被不正确的预测为YES而实际上是NO。错误的否定(FN),是当结果被不正确的预测为NO而实际上是YES。查准率、查全率、正确率用TP、TN、FP和FN来定义。

查准率=TP/(TP+FP),正确的肯定与所有肯定的比例。查全率=TP/(TP+FN),正确的肯定与所有客观肯定的比例。正确率=(TP+TN)/(TP+TN+FP+FN),正确分类数与所有分类数的比例。

3 结论与展望

图像挖掘是数据挖掘中一个新兴且富有挑战性的研究领域,大量的数字图像为图像挖掘技术提供了丰富的研究内容,但同时也提出了挑战。目前国外的图像挖掘已经开始应用于图像检索、医学影像诊断分析、卫星图片分析、地下矿藏预测等各种领域。国内也已开发出原型系统,相信随着相关技术的逐渐成熟,图像挖掘的应用前景将更为广阔。本文主要针对图像挖掘的关键问题图像挖掘技术进行了分析与回顾。图像挖掘的研究仍处在初期,许多问题有待于解决,比如下列问题应引起关注:

(1)图像挖掘的理论框架和结构模型与现有图像信息系统的集成。

(2)适合于图像挖掘的统一的图像表示模型和表示方法。

(3)图像预处理方法,包括特征提取、图像分割、对象识别、图像表示方法。

(4)高效和可伸缩的各类图像模式挖掘算法。

(5)加强图像与其它数据的集成挖掘,如文本数据、图形数据、视频数据、声音数据乃至综合多媒体数据。

(6)寻求数据挖掘过程中的可视化方法,使图像挖掘结果能够被用户理解,也便于在知识发现的过程中进行人机交互。

摘要:文章从图像挖掘的过程开始介绍了图像挖掘中的预处理技术、特征提取技术和图像挖掘技术等,最后对图像挖掘未来研究方向进行了展望。

关键词:图像挖掘,关联规则,图像分类,图像聚类

参考文献

[1]Michael C Burl et al.Mining for image content[C].In Systemics,Cyber-netics,and Informatics/Information Systems:Analysis and Synthesis,Or-lando,FL,1999-07.

[2]William I Grosky et a1.An Image Data Model[C].Lecture notes in Computer Science,2000:14-25.

[3]J Zhang et a1.An Information driven Framework for Image Mining[C].In:Proc of 12th Int Con on Database and Expert Systems Applications(DEXA),Munich,Germany,2001-09.

[4]曲文龙,李卫东,杨炳懦.图像挖掘技术研究.计算机工程与应用[J],2004,40(5):1-5.

[5]0smar R Zaiane et a1.Mammography C1assification By An Association Rule—Based C1assifier[C].In:Proc MDM/KDD 2002,Canada,2002-07.

医学图像挖掘 篇2

一、课程基本信息

课程编号:0904057 课程中文名称:医学图像处理

课程英文名称:Medical Image Processing 课程性质:专业主干课程 考核方式:考试 开课专业:生物医学工程 开课学期:7 总学时: 48(其中理论38学时,上机10学时)总学分:3

二、课程目的

本课程是一门专业基础课,目的是为了加强生物医学工程专业学生用计算机进行医学图像处理能力的培养。通过讲述bmp图像、锐化增强、图像分割、图像变换、图像的识别等内容,使学生了解医学图像处理所必需的基础知识,掌握医学图像处理的基本技能和实际应用的方法,为今后结合本专业开展相应的研究打下良好的基础。

三、教学基本要求(含素质教育与创新能力培养的要求)

本门课程分为理论学习和上机实践两个部分,要求学生掌握医学图像处理所必需的基础知识的同时,重点培养学生的实际应用能力。

1、对用计算机进行医学图像处理的重要性和特殊性有明确的认识。

2、熟悉bmp图像显示的方法和相应的程序设计。

3、熟悉图像的点运算、图像的代数运算、图像的几何运算的算法和相应的程序设计。

4、熟悉直方图增强、锐化增强、局部增强、伪彩色增强、平滑的算法和相应的程序设计。

5、熟悉基于边界的图像分割、阈值分割、基于区域增长或分裂的分割算法和相应的程序设计。

四、教学内容与学时分配

第一章

数字图像的形成和图像处理系统(4学时)数字图像的形成、图像处理系统的构成,不同成像技术产生的医学图像 第二章

图像的运算(6学时)

图像的点运算、图像的代数运算,图像的几何运算 第三章

图像增强(6学时,课程重点)

直方图增强,图像平滑,锐化增强、局部增强、伪彩色增强 第四章

图像的分割(6学时,课程重点、课程难点)

基于边界的图像分割、阈值分割,基于区域增长或分裂的分割、分割效果的评价 第五章

图像的表达与描述(4学时,课程难点)

目标外特性的表达与描述,目标内特性的表达与描述、目标特性描述的标定 第六章

图像变换(4学时)

傅立叶变换,傅立叶变换在图像处理中的应用 第七章

图像的识别(4学时,课程难点)图像相似性的测量,图像的特征,图像的分类 第八章

医学虚拟现实系统概述(2学时)医学虚拟现实系统的组成及其主要应用等 考试(2学时)

五、教学方法及手段(含现代化教学手段及研究性教学方法)

所运用的教学方法和教学手段有理论教学(课堂讲授)、使用多媒体教学、课堂讨论、上机实践等。

六、实验(或)上机内容

1、编写程序,对医学图像进行平滑处理

2、编写程序,对医学图像进行滤波处理

3、编写程序,对医学图像进行基于阈值的图像分割

4、显微医学图像分析

5、医学虚拟现实演示系统

七、先修课程

先修课程:程序设计基础(C语言)、大学计算机基础、计算机软件基础。

八、教材及主要参考资料

[1] 章鲁,顾顺德,陈瑛.医学图像处理[M].上海:上海科学技术出版社,2002.[2] 谷口庆治.数字图像处理[M].北京:科学出版社&共立出版社,2002.九、课程考核方式

平时成绩占20%,闭卷笔试占80%。

撰写人签字:

图像数据挖掘技术研究及应用 篇3

图像数据挖掘模型主要有功能驱动模型和信息驱动模型。

1.1 功能驱动模型

功能驱动的图像数据挖掘是针对具体应用的特定要求来设计挖掘系统的驱动框架。Multi Media Miner是以DBMiner系统和C-BIRD(content-based image retrieval from digital libraries)系统为基础发展起来的图像数据挖掘系统,它是典型的功能驱动模型[2],如图1所示。它由4个功能模块组成。图像采集器(excavator):从多媒体数据库中抽取图像数据。预处理器(preprocessor):提取图像特征,并把所计算的特征存放在特征数据库中。检索引擎(search engine):利用图像特征进行匹配查询。知识发现模块(discovery modules):对图像集进行特征描述、分类、关联规则挖掘、聚类等挖掘。

1.2 信息驱动模型

Zhang[3]提出信息驱动模型是针对图像的原始信息,以基于内容的图像处理技术为基础的图像数据挖掘框架,主要强调不同的图像信息层次起到的作用不同。该模型首先根据图像的原始信息,以及基于原始特征的对象或区域信息,利用聚类算法和领域知识将图像分割成有意义的区域或对象,然后进行高层次的推理和挖掘,从而产生高层次的语义概念和有用的、易于理解的模式。该模型中图像信息分为4个层次[3]:象素层:由原始图像信息和原始图像特征组成,如象素点、纹理、形状和色彩等。对象层:处理基于象素层原始特征的对象和区域信息。语义概念层:结合领域知识从识别出的对象和区域中生成高层次的语义概念。模式知识层:可结合与某一领域相关的文字和数字信息发现潜在的领域知识和模式。在信息驱动模型中,象素层和对象层主要进行图像处理、对象识别和特征提取,而语义概念层和模式知识层主要进行图像数据挖掘和知识集成。该模型不仅只在图像的高层次进行挖掘,而且还可以扩展此模型以使挖掘能够在每个层次以及不同层次间进行。

2 图像数据挖掘技术

2.1 图像预处理

在大型图像数据库中存在许多脏数据和已破坏了的数据,这些数据能使挖掘过程陷入混乱导致不可靠的输出,有必要对数据进行清洗,以提高数据的质量。图像数据不仅数据量大,信息丰富,而且原始图像无法直接应用于数据挖掘,在使用挖掘工具之前,除了必要的数据清洗外,还要根据挖掘工具的特点和挖掘目的对图像数据进行必要的预处理。预处理主要包括可视特征提取、对象识别、数据规约、遥感数据离散化、图像融合等。

1)可视特征采用图像处理技术通过计算获得,主要包括颜色、纹理、形状等。颜色是应用最广泛的可视特征。颜色直方图用于存放图像对象中每种颜色的像素的比例,具有平移和旋转不变性,是最常用的颜色描述。纹理刻画了颜色和密度分布的均匀性,包含了表面结构和其与周围环境关系的重要信息,表示方法主要有:共现矩阵法,小波变换法等。形状表示法主要有基于边界表示的傅立叶描述法、基于区域表示的不变矩方法。

2)对象识别即在图像中识别出对象及其空间关系,涉及到的技术有图像分割、对象模型的表示及对象识别。

3)数据规约主要包括维规约和数据压缩,是为了提高挖掘质量和效率而进行的数据处理。

4)为了更好地提取图像特征,有必要进行图像融合,获取一种新型图像,其形态结构显示得更直观,可获取更详细、准确的特征。

2.2 图像数据的相似性搜索

对于图像数据的相似性检索,主要考虑了两种图像标引和检索系统:1)基于描述的检索系统,主要是在图像描述之上建立标引和执行对象检索;2)基于内容的检索系统,它支持基于图像内容的检索,如颜色构成、纹理、形状、对象和小波变换等.基于描述的检索若用手工完成是很费力的;若自动完成,检索的结果质量通常又较差。基于内容的检索使用视觉的特征标引图像并基于特征相似检索对象。

2.3 目标识别

目标识别一直是图像处理领域中活跃的研究焦点。这是图像挖掘领域中的一个主要任务。自动的机器学习和有意义的信息抽取能被实现仅仅在某些目标已经被机器识别的情况下。已知目标的模型通常由人工输入作为先验知识。

2.4 图像关联规则挖掘

关联规则挖掘主要根据图像中象素的光谱特征,构成纹理图像的各个象素、各个纹理基元之间都具有关联关系,这是关联规则挖掘能够用于图像的前提。要挖掘纹理图像的关联规则,我们可以把每一个图像看作一个事务,从中找出不同图像问出现频率高的模式。如果图像数据挖掘深入到象素级,则需要将一个象素及其邻域看作一个事务,从中找出在图像中重复出现的模式。在纹理图像中,这种模式实际上就是纹理基元。纹理基元有大小之分,这就要求在多个层次上多分辨率情况下进行挖掘。根据图像数据的矩阵表达方法,借助图像矩阵的事务数据模式化的方法,我们界定一系列图像事务定义。根象素:一个nⅹn邻域的根象素是这个邻域的中心象素,一个ⅹn的图像包含(N-n+1)2个根象素。项:所给定的根象素所在的邻域中每一个象素映射为一个项。通过一个元组(X,Y,I)来定义,其中X和Y分别是邻域中相对于根象素的偏移量,I是象素的灰度值。这样,一个具有G种灰度值的n Xn邻域中,可能产生n2G个不同的项。项集:一系列项的集合构成项集,实际上映射为图像中一系列相关象素集合。事务:同某一根象素相关的一系列项组成一个事务。确切地说,每一个根象素对应一条事务,邻域中每个项都可能进人事务。针对每个根象素,如果有K种偏移量情况,加之每个象素可以有G种可能的灰度值,因此,统计相同的偏移量所构成的事务,会产生Gk条事务。关联规则:一条关联规则表达了图像的局部结构,形式为(X1,Y1,I)∧…∧(Xm,Ym,Im)→(Xm+1,ym+1,I m+1)∧…∧(Xm+n,Ym+Im+n)(s%,c%)。例如,下面这条关联规则表示了在二值图像中,一个象素宽的垂直条带的右边通常为一个象素宽的白色条带。(0,1,l)∧(0,0,l)∧(0,-1,l)→(1,0,0)∧(1,1,0)∧(1,-1,0)(s%,c%支持度和置信度表明了这种情况出现的可能性。

2.5 图像分类和聚类

基于内容的智能图像分类可通过将图像与不同的信息类别相关联实现。图像分类是一种有监督学习方法,过程分3步:1)建立图像表示模型,对已进行类别标注的样本图像进行特征提取,建立每一图像属性描述;2)对每一类别的样本集进行学习,建立规则或公式;3)使用模型对未标注图像进行分类判决和标注。常用的分类方法有:判定树Bayes方法、神经网络方法,其它方法包括:K一最近邻分类、粗糙集分类等。图像聚类是依据没有先验知识图像的内容本身将给定的无标签图像集合分为有含义的簇,常用于挖掘过程的早期阶段,其特征属性是颜色,纹理和形状。

3 结束语

图像数据挖掘是目前国际上数据库、图形图像技术和信息决策领域最前沿的研究方向之一,是数据挖掘的一个新兴的富有挑战性的领域,具有较高的学术价值和广泛的应用前景。现阶段图像挖掘的理论与技术有待继续研究和完善,所以专门研究图像数据挖掘技术具有重要的意义。

参考文献

[1]Burl M C,et al.Mining for image content[C]∥Systemics,Cy-bernetics and Informatics/Information System:Analysisand Synthesis.Orlando,FL,1999.

[2]Zaiane OR,Han JW.Mining Multimedia Data,Proceedingsof CASCON98,Meeting of Minds,Toronto,Canada,1998:83-96.

[3]Zhang J.An Information–Driven Framework for ImageMining,Proceedings of 12th International Conference onDatabase and Expert Systems Applications(DEXA),Germany,2001-09.

[4]方玲玲,王相海.图像挖掘研究[J].计算机科学2009,8.

上一篇:池塘处理下一篇:学校骨干教师培养杂谈