医疗数据分析论文

2022-04-17

摘要:相对传统的分布式数据库和数据仓库技术,Hadoop和MapReduce技术以其简单性、良好的可扩展性和容错性成为当前大规模数据处理的主流技术之一。而Hive等软件产品在Hadoop基础上实现了与关系数据库的接口模式,从而进一步改善了Hadoop的易用性。下面是小编为大家整理的《医疗数据分析论文(精选3篇)》相关资料,欢迎阅读!

医疗数据分析论文 篇1:

基于元数据可追溯性的健康医疗大数据分析

摘  要:对于健康医疗大数据而言,其具有来源多样、数据分散、存在大量非结构化信息、融合壁垒高等特点,正是基于上述特点,导致无法有效的对健康医疗大数据进行追溯与治理。因此为有效的改变上述不良情况,则需要采用一种有效的方式对健康医疗大数据进行追溯与治理,目前多使用基于元数据可追溯性的方式进行分析。本文将论述基于元数据的数据融合方式及数据可视化呈现等内容。

关键词:元数据;可追溯性;健康医疗大数据

随着健康意识的不但提升,近年来健康医疗大数据开始受到医学界的重点关注,为此国家卫建委下发相关的政策加强对健康医疗大数据的规范管理与开发应用。为有效的实现上述目标,目前开始使用基于元数据可追溯性的方式对健康医疗大数据进行分析[1]。本文将探讨基于元数据可追溯性的健康医疗大数据分析方式与效果。

1.基于元数据的数据融合方式

1.1需求现状分析

1.1.1目前我国国医疗健康元数据的现状

所谓的元数据主要是指“关于数据的数据”,若能对元数据进行良好的管理,则能够有效的实现对数据统一管理,由此可知,需要对元数据进行准确、快捷访问。通过近年来的研究发现,完整的元数据管理模式主要分为如下部分,即完整的字段定义、与数据源的对应关系、不同数据来源元数据间的映射关系。但通过观察实际情况可知,因无法对元数据定义及录入时统计口径进行统一,从而导致医疗数据存在精准度欠缺、一致性低、准确度较低等不良问题[2]。

1.1.2临床数据交换标准协会中元数据可追溯能力的可视化呈现

自进入国际协调会议后,我国卫生部门对临床数据提交的规则与要求进行了更加向有效的完善。Real World Data是临床数据交换标准协会的一个重要项目,其主要的宗旨在于通过电子健康记录系统对相关数据进行收集,以便能够将其有效的运用到临床研究与安全报告中。然而通过纵观实际情况发现,临床数据交换标准协会在元数据的可追溯性方面仍然存在较大的缺陷,因此为有效的解决此问题,目前临床数据交换标准协会开始使用Trace-XML系统,主要包括验证端到端的追溯能力、运行端到端追溯查询、可视化端到端的追溯能力等部分,有效的提升元数据的分析能力。

1.2基于元数据的数据融合的设计思路

为有效的提升基于元数据的数据融合能力,目前多使用半自动化的融合方式,该种方式包括如下功能:①能够实现对原始数据库的表、字段、表间关系的有效抽取;②形成原始数据库的数据模型元数据,能够对每个表与字段标注业务名称与备注;③具有按照业务名称或表与字段名称进行搜索的功能;④具有对表与字段的增加、修改、删除管理数据模型的功能。

1.3基于元数据的数据融合的结构设计

(1)逻辑架构。对于数据采集而言,需要具有规范地目录,包括数据源、数据目标与转换规则等。目录的生成的方式如下,即将基于已存在的业务术语关联到对应的元数据,并通过数据源映射到业务术语,并且形成新目录。在形成目录的过程中,主要涉及到如下方面:①使用自然语言处理算法去重、归一、梳理、消歧数据,之后将数据模型添加至知识库中;②依据对应业务数据模型将处理后的数据模型抽取、清洗到目标数据库中。

(2)数据收集与分析。在数据收集方面主要使用具有高性能、高可用、高扩展特性的结构化数据库集群系统,该种系统不仅能够提供通用计算平台,同时还能够广泛应用于支撑各类数据仓库系统、商务智能系统与决策支持系统中。在数据分析方面,筛选不同部门的所需数据,以便能够对医疗数据全景图进行规划,从而能够提取出更具有价值的数据。

(3)技术架构。目前多使用基于CWM的医疗元数据管理进行技术架构。所谓的CWM主要是指对象管理组织在数据仓库系统中定义的、具有完整的元模型体系结构,主要用于数据仓库构建与应用的元数据建模方面。通过分析可知,CWM模型主要包括如下规范:①CWM元模型。该模型主要用于对数据仓库系统的描述。②CWM XML,主要是指CWM元模型的XM表达形式。③CWM DTD。该种格式主要是DW/BI共享元数据的交换格式。④CWM IDL。该种格式主要是DW/BI共享元数据的应用程序访问接口。

2.数据可视化呈现

为更加明确数据资产分布情况与产生过程,目前多采用数据可视化系统,主要包括元数据采集、元数据展示、元数据应用、元数据搜索、元数据浏览及管理、数据字典管理等内容,具体如下:

2.1元数据可视化的主要内容

2.1.1元数据采集方面的可视化

纵观目前的实际情况,现有的健康医疗大数据平台主要包括事实表与值域表。事实表主要分为定义类与管理类元数据等方面;值域表主要为表示类元数据。为实现数据融合后的格式统一,在采集数据的过程中采用可视化操作管理,主要包括结构标准化、数据标准化等内容。通过对数据进行标准化处理,在较大程度上实现了数据的高效与融合的规范性[3]。

2.1.2元数据展示方面的可视化

所谓的元数据展示功能主要是指对某元数据来源的分布情况进行展示,从而能够追溯到影响该指标的所有源数据库的元数据,通过采用血缘关系分析能力利用图形对各业务数据的图谱进行完整展现。

2.1.3元数据搜索方面的可视化

所谓的元数据搜索主要是指用户可通过不同类型的数据源库对元数据进行搜索,以便能够更快的对元数据进行定位,并增强用户的了解程度。

2.1.4元数据浏览方面的可视化

所谓的元数据浏览主要是指用户可对数据字段名称、字段类型、长度、是否必填等项目进行查看浏览;并且用户能够依据自身的实际需求对过滤规则进行编辑,以便能够使元素局更加标准化、更具有规范性。

2.2治理后的平台功能情况

通过纵观健康医疗大数据平台治理后的实际情况,相比于治理前,該平台具有更高的完整性、正确性、一致性、合理性与时效性。收集实时与标准的数据能够对数据进行有效的治理;对元数据标准进行统一后获得的主数据具有更加良好的存储、整合、清洗与监管效用。按照目前现有的需求,基于元数据的数据融合能够对诸多不同医疗机构的数据进行整合;将整合后的数据按照慢病管理、公共卫生、药品使用情况予以分类,由集合后的数据集市对所需要数据进行抽取,之后进行计算,并对计算后的数据予以可视化呈现,便于用户直截了当的进行观察分析。同时,用于生成统计指标所调用到的字段,不仅能够进行详细的可视化展现,同时还能够辅助用户对数据实体间的组合与依赖关系进行理解,最终有利于客户的选择。

通过对平台进行治理后,医疗大数据平台可依据追溯数据来源及其元数据,实现了对数据的有效的控制,并且用户可依据患者、病种、科室的具体情况对该区域的医疗信息进行详细查看并作出相应的分析。

3.总结

伴随着互联网技术的不断发展,将会出现更多的健康医疗大数据,为确保数据控制获得较高的质量,对数据进行统一、一致的管理,保证大数据平台的正常运行,则需要对数据进行良好的整合,而基于元数据的数据融合方式则是实现上述目标的重要方式,能够获得良好效果。

参考文献:

[1]王霞,李岳峰,董方杰,胡建平,张学高.中国健康医疗大数据资源核心元数据研究[J].中国卫生信息管理杂志,2019,16(03):268-271.

[2]王利亚,邱航,陈若雅.基于元数据可追溯性的健康医疗大数据治理方法及可视化呈现[J].中国卫生信息管理杂志,2019,16(06):661-666.

[3]阮彤,邱加辉,张知行,叶琪.医疗数据治理——构建高质量医疗大数据智能分析数据基础[J].大数据,2019,5(01):12-24.

作者:吴小颖 李熠慜

医疗数据分析论文 篇2:

基于Hadoop的Web医疗咨询数据分析系统的实现

摘 要:相对传统的分布式数据库和数据仓库技术,Hadoop和MapReduce技术以其简单性、良好的可扩展性和容错性成为当前大规模数据处理的主流技术之一。而Hive等软件产品在Hadoop基础上实现了与关系数据库的接口模式,从而进一步改善了Hadoop的易用性。数据存储使用Hadoop分布式存储,使用Hive特有的数据库语言HiveQL实现数据的查询以及分析操作。最后使用Java JFreeChart实现结果可视化,将结果以柱状图的形式显示出来。由于使用Hadoop作为基础,数据的查询分析速度更快,能够更好地与系统后台对接,方便管理者操作。

关键词:数据分析; 分布式存储; Hive; JFreeChart

Key words: data analysis; distributed storage; Hive; JFreeChart

引言

如今已经进入大数据时代,各式各样的数据与日俱增。不仅是数据总量在迅速增加,同时数据生成速率也在不断增加。截止到目前,数据量已从TB级别跃升到PB、EB乃至ZB级别。

为了紧跟全球大数据技术发展的趋势,国内各界对大数据也赋予了高度关注。在这种情况下,人们要挑战的是,如何从大数据中提取价值最大的信息。

Hadoop2解决了namenode的单点故障和内存压力过大难以扩展问题,解决JobTracker单点故障和访问压力过大问题,同时还解决了对MapReduce之外的框架支持问题。

本系统主要研究的内容是对Web医疗咨询数据记录进行分析。使用HDFS和MapReduce,把预的数据导入并存储在集群的节点上。利用Hadoop自带的Hive数据库语言进行数据的查询和分析。数据分析的结果进行可视化,使得结果可以以图表的样式展示给用户。系统中需要使用JFreeChart中的柱状图样式将数据展示给用户。

1 主要技术介绍

1.1 HDFS

Hadoop分布式文件系统(HDFS)是适合运行在通用硬件(commodity hardware)上的分布式文件系统。与现有的分布式文件系统有很多共同之处。同时也有一些显著的不同。HDFS是一个容错性很高的系统,适合运用在廉价的机器上。HDFS访问数据的吞吐量非常高,非常适合应用于大型数据集。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。

1.2 Hive

Hive是建立在Hadoop上的数据仓库基础构架[2],提供了能够用来提取转化加载(ETL)数据的一系列工具。Hive是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。定义了特有的简单类SQL查询语言HiveQL,利于熟悉SQL的用户查询数据。该语言也可以让熟悉MapReduce的用户开发自定义的mapper函数和reducer函数来处理內部建立的mapper和reducer无法完成的复杂的工作。Hive采用类SQL的查询方式,将SQL查询转换为MapReduce的job在Hadoop集群上執行。

2 系统分析

網页数据是以.txt格式存储在文件中。使用Hadoop操作技术将数据拷贝到系统的HDFS中, Hive脚本利用“|”符号将数据属性划分存储;用户可以在数据分析页面分别以性别分布、年龄段分布、地区分布以及各年龄段性别分布将分析出的结果可视化,等条件进行选择以柱状图的形式返回页面显示。系统需求如图1所示。

3 系统设计

3.1 总体结构

数据分析系统总体结构如图2所示。

由图2中可以看出数据分析系统的流程如下:首先进入首页,选择功能界面。由用户选择功能进入相应的界面;如进入数据查询界面后,用户在输入框中输入想要查询的数据ID编号,点击查询按钮,所要查询的数据会在页面的数据显示区域显示出来,并按照属性划分以表格形式展示;进入数据分析页面后,用户根据自己意愿选择分析条件,点击查询按钮,分析结果会在页面的显示区域以柱状图的形式展示。

3.2 数据存储设计

在使用系统前,需要将即将使用的数据存入系统中。把数据以文本形式存储,放在主文件夹中;使用Hadoop命令将文件拷贝到HDFS中;使用Hive把数据按照属性划分,建立表格。

3.3 详细设计

3.3.1 数据属性划分设计

根据数据的实际情况,将数据属性划分为13个部分。当用户进行数据查询时,数据的信息会按照这13个属性划分在页面中,并以表格的形式呈现出来。其中,数据查询会用到“编号”来进行数据查阅;数据分析则会用到性别、年龄和地区属性作为条件进行数据分析。

3.3.2 数据分析设计

数据分析共包含4个分析条件,分别是性别分布、年龄段分布、地区分布以及各年龄段性别分布。

4 系统实现

4.1 Hadoop基础构架

在安装Hadoop之前,需要在ubuntu系统中安装SSH免密码登录。

在.ssh文件夹下创建id_dsa和id_dsa.pub两个文件,这是一对私匙和公匙,需把公匙追加到授权的key里面。

4.2 Hive安装配置

解压Hive-1.2.1.tar.gz至主文件夹,配置环境变量。在Hive文件中配置信息,Hive元数据库配置为Mysql,如图3所示。

在HDFS上创建Hive所需路径/tmp和/user/hive/warehouse

4.3 功能实现

4.3.1 数据存储

准备好的数据放入主文件夹中,使用Hive语言基于现有文件创建表。把数据文件illness.txt拷贝到HDFS,然后确认该文件确实存在。操作过程如图4所示。

在Hive脚本文件hql文件中将数据分属性存储,文件名命名为illness.hql:执行HiveQL脚本。

4.3.2 数据查询模块及界面实现

选择数据查询功能后,进入数据查询界面。页面包含了一个文本输入框,用来输入数据的编号ID,一个查询按钮,连接后端QueryServlet类。QueryServlet中doPost()方法接收输入的数据ID编号,进入系统DBConn类,使用HiveQL语言,执行select语句,将与ID符合的数据返回QueryServlet类,由QueryServlet中的HttpSession类传输到前端数据查询页面的表格中。

4.3.3 数据分析模块及界面实现

选择数据分析功能后,进入数据分析界面。右边部分有4个单选按钮,分别为性别分布、年龄段分布、地区分布和各年龄段男女分布,还有一个查询按钮,连接后端SelectServlet。查询界面如图5所示。

4.3.4 分析结果可视化

进入系统后选择数据分析进入数据分析界面,图像显示部分就连接至后端SelectServlet类。把所选按钮的value值传送给SelectServlet类。SelectServlet类中有4个方法分别对应4个不同的value值,按照value值选择对应方法将结果可视化。可视化完成后,通过“onClick”执行一个JavaScript函数clk_searchImg()。这个函数先与页面的imgForm表格连接,从表格中得到chart值,然后连接后端ChartServlet,通过request方法和response方法,将可视化图像显示在页面上。显示页面如图6所示。

使用DefaultCategoryDataset类建立一个对象,用来输入图像所用的数据。addValue()方法中number数据的数量,就是根据该数据画出在图像中的柱的高度,数据输入完成,由JFreeChart类建立一个图表对象,将数据放入对象类中。最后将图表类输入到ChartUtilities类,将图表对象转化为图表文件。

5 结束语

基于Hadoop的Web医疗咨询数据分析系统采用了当下较为普遍和便捷的Hadoop技术,提供了大数据的查询和分析功能,查看分析结果。系统完成了将数据按照用户希望的形式展现出来的任务,将分析结果变成了图表,提高了用户使用系统的直观性和舒适度。由于受Hive语言的限制,在系统中还不允许用户随时存储数据,也不能随意更改和删除数据。系统有待进一步改善和提高。

参考文献

[1] 陆嘉恒. Hadoop实战[M]. 北京:机械工业出版社,2011.

[2] CAPRIOLO E,WAMPLER D,RUTHERGLEN J. Hive编程指南[M]. 曹坤,等. 北京:人民邮电出版社,2013.

[3] 陈恒,楼偶俊,朱毅,等译. JSP网站设计[M]. 北京:清华大学出版社,2017.

[4] TURKINGTON G. Hadoop基础教程[M]. 张治起,译. 北京:人民邮电出版社,2014.

[5] 岑文初. 分布式计算开源框架Hadoop入门实践[EB/OL]. [2018-08-29] Http://blog.csdn.net/cenwenchu79/archive/2008/08/29/2847529.aspx.

[6] Apache Software Foundation. Apache Hadoop[EB/OL]. [2018-06-13]. Http://hadoop.apache.org.

[7] WHITE T. Hadoop权威指南[M]. 周傲英,曾大聃,译. 北京:清华大学出版社,2010.

[8] NOLL M G. Running Hadoop on ubuntu Linux (Single-Node Cluster)[EB/OL]. [2011-07-17]. http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/.

[9] WANG Cong,WANG Qian, REN Kui,et al. Ensuring data storage security in Cloud Computing[C]//2009 17th International Workshop on Quality of Service. CHARLESTON, SC, USA:IEEE,2009:1-9.

[10]CHANG F,DEAN J, GHEMAWAT S, et al. Bigtable:A distributed storage system for structured data[C]//7th USENIX Symposium on Operating Systems Design and Implementation. Seattle, WA:USENIX Association,2006:205-218.

作者:张国锋

医疗数据分析论文 篇3:

论新医改背景下大数据分析对医疗资源配置的促进作用

【摘  要】以医疗服务机构改革、医保体制改革和药品流通体制改革为核心的三医联动医疗服务体系改革是解决百姓“看病难”“看病贵”问题的重要途径。资源的优化配置已成为此次改革中实现医疗资源公平性的着眼点之一。论文从大数据的特征入手,从医疗保障、药品供应保障体制改革、医联体的建设及医疗机构内部改革三个层次梳理大数据分析运用现状,并通过大数据分析的预测性及分析范围的高维度论述其在医疗卫生服务体系改革中的促进作用。

【關键词】大数据分析;医疗卫生服务体系改革;资源配置

1 引言

为了缓解和根本上解决长久以来困扰医疗行业健康发展的诸多问题,国家积极实施了一系列医疗体制改革的措施并取得了一些成效。然而,当改革逐步进入“深水区”,协调推进医疗服务体制、药品供应保障体制以及医疗保障体制改革已是势在必行。2017年李克强总理在主持召开的国务院常务会议中,明确指出要通过医改,优化医疗资源配置以保障人民健康。因此,医疗资源优化配置既是医疗行业发展的关键,同时也是三医联动中亟待解决的重要问题之一。

资源是稀缺的,医疗资源更是如此。有学者认为,医疗资源的优化配置需要以医疗服务的可及性、医疗服务的公平性以及医疗体系的效率为主要标准[1],因此,在三医联动中要实现资源的优化配置需要三个层次共同协作完成:首先,医保基金要对医疗、医药资源的配置体现出核心杠杆的作用;其次,在医联体改革中,促进医疗资源下沉,平衡各级医疗机构成员间的医疗资源的分布,实现“双向转诊”制度长久并有效得到实施,也需要体系内医疗资源的合理配置;最后,对于参与改革的各级医院来说,协调改革与发展的关系,提升人力及物质资源有效分配,实现资源优化配置也是保证改革顺利实施的重要一环。要每一个层次达到资源优化配置的管理目标,不但需要实施管理的主体对自身情况有充分的认识,同时还需要对改革所涉及的各利益主体有更为全面和深刻的了解。如何更有效地实现这三个层次的资源配置的目标,便是摆在改革者面前的一个难题。幸运的是,在互联网及云计算风起云涌的当前,大数据的分析与应用或许可以为我们提供一个解决问题的全新视角。

什么是大数据?目前学术界没有明确统一的界定,但是数据规模大、数据类型多以及应用价值高等特点是目前很多学者广泛所认同的。随着信息时代的到来,海量数据的收集、处理、分析与应用已经帮助很多行业实现跨越式的发展。近几年,医疗卫生服务体系改革的有关研究中,很多学者已经开始运用大数据的分析作为工具解决改革过程中涉及的一些问题。

2 三医联动中大数据分析已取得的进展

2.1 大数据分析在医疗保障及药物保障体系中的应用

《“十三五”深化医药卫生体制改革规划的通知》中明确指出,未来的医疗体制改革将以病种付费为主,按人头、按床日、总额预付等多种付费方式相结合的复合型付费方式,鼓励实行按疾病诊断相关分组付费(DRGs)的方式。有条件的地区可将点数法与预算管理、按病种付费等相结合,促进医疗机构之间有序竞争和资源合理配置。由此可以看出,医保付费的核算趋向精细化、复杂化。这就迫使医保付费体系的改革需要涉及更多方面,既需要考虑医保及自费总额的总体控制要求,又要考虑医学技术的安全性、疗效以及经济性。因此,信息的收集和分析也必然是多维度的,如公共卫生数据,患者就診行为偏好,临床医学信息以及管理等方面。通过整合大量信息,可以为医保决策提供更有价值的科学依据。另外,在基本药物保障体系中,由于网上集中采购信息系统功能的缺失,存在着交易过程以及信息不对称所造成的信息碎片化问题。借助于大数据可以帮助政府监管者从全局掌握信息,有助于降低政府型和市场型交易费用,提高药品供应效率[2]。

2.2 大数据分析在平衡医联体中医疗资源的应用

为了解决目前医疗资源在地域间以及不同层级的医疗机构间分布不均衡的问题,我国正逐步引导并实行社区首诊、分级诊疗、双向转诊的医疗体制的供给侧改革。有研究表明,借助智慧医疗项目的大数据平台,可以有效地控制医疗业务成本并进行预警式分析,并借助服务创新以弥补各级医院的服务短板[3]。此外,融合大数据分析及博弈论的思想,通过模型建立医疗系统总效益公式,可以提高患者病情甄别精度、提高院间双向转诊的效率,实现医疗系统以及患者双方总效益的增加[4]。

2.3 大数据分析在医院资源优化配置中的应用

在疾病诊治、慢性病的防治以及重大疾病的诊断、精准治疗等方面,大数据的收集与应用也有了开拓性的进展。其中精准的治疗就意味着通过对患者大量的诊治数据分析,对疾病的治疗方式、药物用量等能做到更为精准,也可以为医院实现智慧医疗提供强大的数据支持。从管理运营角度来看,大数据的分析和应用因客观情况存在着差异,在管理方面仍属于起步和探索阶段。未来改革中医院决策的可靠性程度将更多地依赖数据分析的全面性。通过挖掘大量患者的诊疗数据的有价值的信息,可以实现医疗数据社会效应与经济效应的双重提高[5]。还有学者认为,大数据可以为医院的管理带来潜在的价值,其中包括依据通过对患者住院信息,可以降低住院患者的平均住院日以及医疗保险赔付精算和预测。

3 信息时代大数据分析的优势

在信息时代背景下,医疗机构内部管理的分析中,大数据的分析具有时代优势。大数据的分析具有较强的预测性。在三医联动的改革中,医疗服务提供主体在各项决策的制定过程中,对信息的预测性需求增强。从很多成功实施医联体改革地区的经验来看,在形成医疗联合体的同时,普遍都采取了整体打包医保资金的做法。以更为精细化的医疗资源布局,推动医生合理接诊、患者合理就诊的新格局的形成。而为了实现这一目标,与医保机构协商确定打包资金的规模以及打包资金在医疗服务体系内部的再分配,则是医疗服务机构需要决策的难点。通行的做法就是根据以往的信息进行测算并据此对下一年的医保资金进行预测,因此,数据的分析要具有一定的预测性。大数据分析正是以大量样本作为分析对象,因大量样本总体变化具有一定的稳定性,可以弥补个别样本以及极端特殊情况对分析结果造成的影响。面向管理决策的有关研究认为,大数据的分析的技术可以厘清数据交互连接所产生的复杂性,克服数据冗余与缺失对分析造成的不确定性,根据实际需要从高速增长和交叉互联的数据中充分挖掘其中的信息、知识和智慧,以达到充分利用数据信息价值的目的[6]。

随着改革过程的逐步推进,医疗服务机构面临的不确定因素增多,这就意味着医院决策所需要考虑的因素既是多方面的又是难以量化的。管理决策的制定所依赖的不仅是管理者的经验和直觉,而是需要获取大量的外部信息,尤其是与患者就诊有关的信息。只有基于这些科学的数据所得到的结果才能使决策更为科学、合理。另外,传统的财务指标对运营成果的考核具有局限性。大数据的分析既可以满足传统财务指标综合分析的需要,同时还支持对非财务指标的需要,正是这种高维度信息的使用,对于问题成因可以有更为充分的认识和发现,提高决策的精准性和预测性。

4 医疗服务体系改革中大数据分析所面临的问题

4.1 跨机构数据整合口径一致性

为了提高医疗资源的利用效率,大数据的分析的内容既包括医疗机构运营所产生的全成本信息,同时又包括患者在药品使用、医疗费用以及医保基金等海量就诊数据。而这些数据在信息系统开发之初,不同医疗机构对信息要求的个体化差异,会使这些数据在统计口径、数据格式以及信息完整性方面存在差异。在医联体组建过程中,信息共享以及信息整合的程度,会直接影响到大数据分析的内容覆盖的范围以及分析获取数据的质量。

4.2 分析方法的应用

医疗行业用于资源整合的数据信息既包括大量的已经量化的数据,同时包含大量的定性数据的分析。决策的对象既包括可用货币计量的实物资产,同时还包括医护等人力资源等非货币化资源的配比问题。数据处理及分析方法除了涉及统计、计量等管理学科,还可能扩展到计算机、社会学、生物等多学科、多角度的交叉来处理相关问题。因此,数据处理及分析的方法的应用既可能会影响到数据分析质量,又是大数据分析需要突破的难点和重点。

4.3 数据的保密

许多地区与智慧医疗有关的项目都在积极地实施和开展。大量与患者就诊有关的数据被保存,这其中包括医院日常管理患者的临床诊断、病程记录、检查化验的信息、用药记录等方面,信息类型既包括了文字同时还会包括许多图像信息。因此,在这些数据的收集、储存、传输以及调用方面对患者信息的保密性是医院开发的信息系统是需要着重考虑的方面。此外,大数据在使用、储存过程中需要防范信息泄露的问题,避免信息被不法分子窃取和滥用。

未来随着医改进程的不断推进,作为一种适应时代需要的分析方法,与大数据有关的分析将更加广泛地应用到各个层次的改革中。相信随着大数据的分析方法研究的不断深入,资源配置会更加精细化、科学化。希望在医改中,大数据的分析可以被更多的改革主体所接受和应用,也希望大数据分析技术和方法可以得到更深层次的研究和开发,从而更有效地推动医改的顺利实施。

【参考文献】

【1】代英姿,王兆刚.中国医疗资源的配置:失衡与调整[J].东北财经大学学报,2014,91(1):4-53.

【2】左根永,方龙宝.基于交易费用理论和大数据技术的基本药物供应保障体系优化策略研究[J].中国卫生经济,2014,33(6):62-64.

【3】吴俊,文联.大数据如何驱动医疗服务供给侧改革——基于A市智慧医疗案例的探索研究[J].山东财经大学学报,2017,29(1):73-89.

【4】郭晨,李刚,何宇.大数据时代下分级诊疗制度设计:基于医疗资源优化配置的博弈分析[J].中国卫生经济,2018,37(5):22-25.

【5】陈惠芳,徐卫国.大数据视角下医疗行业发展的新思维[J].现代管理科学,2015(4):70-72.

【6】徐宗本,冯芷艳,郭迅华.大数据驱动的管理与决策前沿课题[J].管理世界,2014(11):158-163.

作者:陈明

上一篇:岩彩绘画研究论文下一篇:基于因子分析论文