数据挖掘在医院信息系统中的应用探讨

2022-09-11

目前, 我国大中型医院均建立了医院信息系统 (Hospital Infmation System, HIS) 系统, 它的最显著的一个优点就是可以对信息数据交流共享和查询方便。随着近年来大型医院信息管理系统的发展, 有关病人和疾病的数据日益增多, 利用数据挖掘技术在庞大的数据中发掘有用的知识, 充分利用这些知识, 可以为广大患者提供更有效地服务, 并能发现医院运作的基本规律, 预测医院发展的趋势, 为医院管理者决策提供有价值的参考信息。

1 数据挖掘概念

数据挖掘 (Data Mining, DM) 就是从大量的、不完全的、有噪声的、模糊的、随机的数据中, 提取隐含在其中的、人们事先不知道的, 但又是潜在有用的信息和知识的过程。数据挖掘技术是一门综合性的技术领域, 主要涉及数据库、人工智能、数理统计等众多领域的知识。

2 数据挖掘在HIS中的应用过程

2.1 确定挖掘对象、准备数据

确定研究对象, 明确数据挖掘的目的是数据挖掘的重要一步。只有这样数据挖掘才可能达到预期的目的。数据准备是保证数据挖掘得以成功的先决条件。包括数据选择、数据处理、数据转换。

(1) 数据选择。从医院信息系统中选择出与研究对象有关数据信息, 获取原始数据并从中选择适合数据挖掘应用的数据。

(2) 数据预处理。数据预处理就是对数据进行初步整理, 清洗不完全的数据, 不一致的数据, 为进一步的分析作准备。例如, 病历书写过程中, 不同医生对同一种病的命名可能会不同, 从而造成了不一致数据, 在数据挖掘前, 必需转化成一致的数据。

(3) 数据转换。数据转换的目的是将数据转换成适合于挖掘的形式。常用的方法是数据概化。如对于病名中耳炎, 在病人的记录中常呈现为分泌性中耳炎、化脓性中耳炎、卡他性中耳炎等等, 挖掘时都需概化为中耳炎。

2.2 发现知识

对转换后的数据进行挖掘, 提取有用的, 潜在的知识。在这一关键性的环节中运用的方法有粗糙集理论、遗传算法、决策树、人工神经网络、关联分析法、时间序列预测法等。

2.3 结果分析及知识的应用

结合医学专业知识对数据挖掘的结果进行解释, 选择最优的模型, 作出评估, 得到新知识。将知识应用于医学研究和医院管理中, 发挥指导作用。

3 数据挖掘技术在HIS中的应用

3.1 在临床诊断中的应用

(1) 粗糙集理论。粗糙集理论是一种用于处理不确定性和含糊性知识的计算方法, 其基本思想是在保持分类能力不变的前提下, 通过知识约简, 导出概念的分类规则, 并从中发现隐含的知识, 揭示潜在的规律。数据挖掘在医学中, 基于粗糙集理论的规则产生模型可以发现临床数据库中的正例和反例知识。如自主判别算法可以诊断肺部肿瘤是良性还是恶性的。

(2) 人工神经网络。人工神经网络是模拟人脑神经元结构, 通过向一个训练数据集学习和应用所学的知识, 生成分类和预测模型, 主要应于分类、聚类、特征挖掘、预测方面, 人工神经网络自组织性、鲁棒性和容错性, 在医学数据挖掘中得到广泛的应用。特别是用于颅内星形胶质细胞瘤良、恶性的影像诊断。由于星形胶质细胞恶性肿瘤具有手术风险大、预后不理想的状况, 因此术前正确评价肿瘤的良、恶性对于治疗方案的正确选择及预后评估均具重要意义。

(3) 决策树。决策树是一种用树枝状展现数据受各变量的影响情况的分析预测模型, 提取分类规则。它首先通过一批已知的训练数据建立一颗决策树, 然后采用建好的决策树对数据进行预测, 实现了数据规则的可视化, 易于理解。利用决策树建立2型糖尿病发生的规则, 为解释糖尿病发病因素之间的相互关系以及影响程度提供了一种新的方法, 为建立2型糖尿病的预警和开展干预控制的研究提供了基础。

3.2 在医院管理中的应用

(1) 灰色关联分析法。灰色关联分析方法, 是根据因素之间发展趋势的相似或相异程度, 作为衡量因素间关联程度的一种方法。利用灰色关联分析方法对医院收治病人数的影响因素进行分析, 掌握病床周转次数、住院病人手术人次、年收治病人人数、平均开放病床数和年平均医生人数与年收治病人数关联程度等。

(2) 时间序列预测法。时间序列预测法是将某种统计指标的数值, 按时间先后顺序排列形成序列。通过编制和分析时间序列, 根据时间序列所反映出来的发展过程、方向和趋势, 进行类推或延伸, 借以预测下一段时间或以后若干年内可能达到的水平。该方法可以对H I S中现有的药品用量信息进行计算模拟, 得出药品消耗模型。根据医院药品实际消耗情况自动产生领药量, 有效避免药品积压和断货现象, 满足医院用药需要, 提高药房备药的合理性、科学性。

4 结语

利用数据挖掘技术, 让我们获得有意义的信息, 归纳出有用的知识, 不但可以辅助临床诊断, 而且为医院管理者提供了决策依据。由于医学信息自身的特殊性和复杂性, 与常规数据挖掘相比, 在挖掘对象的广泛性、挖掘算法的高效性和鲁棒性、提供知识或决策的准确性方面有着更高的要求, 它将面临着更大的挑战和许多亟待解决的问题。但是, 随着数据挖掘技术的不断发展, 数据挖掘在医学领域中将有更重要的实用价值和更为广阔的发展前景。

摘要:目前, 医院信息系统普遍应用于大中型医院, 提高了医务工作者的工作效率, 同时也积累了大量的医学数据。采用数据挖掘中的粗糙集理论、人工神经网络算法、决策树算法可以对医院信息系统的大量数据进行分析, 发现有用的、潜在的知识为开展高水平医学研究提供了有力的技术工具;也为医院管理人员提供有价值的信息, 帮助其作出正确的决策。因此对医院信息系统中数据挖掘的过程以及所应用的技术深入研究, 能充分发挥数据挖掘在医学领域的作用。

关键词:数据挖掘,医院信息系统,粗糙集,人工神经网络,决策树

参考文献

[1] 史忠植.知识发现[M].北京:清华大学出版社, 2002.

[2] 安淑芝.数据仓库与数据挖掘[M].北京:清华大学出版社, 2005.

[3] 金新政, 陈敏.医院信息系统[M].北京:科学出版社, 2003.

[4] 王欣萍, 李燕.数据挖掘技术于医学电子病历系统的应用[J].现代预防医学, 2008, 35 (13) :2450~2451.

[5] 姜代红.数据挖掘及其在HIS系统中的应用[J].电脑与信息技术, 2004, 2:55~57.

[6] 朱凌云, 吴宝明.医学数据挖掘的技术、方法及应用.[J].生物医学工程学杂志.2003, 20:559~562.

[7] 胡蓉, 郭芳, 张燕.数据仓库技术在医院信息管理及决策中的应用[J].现代医院管理.2005, 3 (3) :28~29.

[8] 杨海青.数据挖掘技术在医院管理中的应用[J].中华医院管理杂志.2005, 7:497~499.

上一篇:充分发挥政治课堂的德育功能下一篇:以就业为导向的计算机网络教学改革研究