收藏本站
《南方医科大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘技术在医院医保费用分析中的研究与应用

黄晶晶  
【摘要】: 随着基于关系结构的传统数据库技术广泛地应用于信息化时代的各个领域,各种复杂的数据库系统纷纷被建立,由计算机代替了手工操作,极大提高了人们的工作效率。随着关系数据库和各类信息系统应用的年深日久,在数据库系统中积累了大量的业务数据,并且由于业务应用的深入数据量还在日益增加。当前社会的市场竞争日趋激烈,使得医疗行业对于数据库的要求不仅仅停留于数据处理层面,而逐渐向数据的深层次分析与利用的方向转变。但如果没有强大的数据分析工具对现有数据库中的数据进行挖掘分析,而单凭目前数据库的分析查询功能以及各业务系统的的能力,是无法发现并提取这些海量数据中所蕴含的知识与规律的。因此为了满足日益增长的对数据进行深层次利用的需要,数据挖掘与数据仓库技术应运而生,它们能够对现有的海量数据进行深层次的知识提取和经验总结,并获取对管理决策有用的信息。目前这些技术广泛的运用于金融业(如银行、保险)、零售业(超级市场)以及电信业等商业领域,但是在医疗卫生领域还处于摸索阶段,对此我们进行了大胆的尝试,对这一领域进行研究,在医院医保费用分析中采用了数据挖掘技术来产生对医保费用管理工作有意义的规则集。 现在国内许多医院都建立了自己的医院信息系统(HIS系统),甚至有些大型医院都拥有了包括HIS系统、图像存储与传输系统(PACS)以及实验室信息系统(LIS)等配套关联的信息系统在内的医院综合信息系统。HIS系统应用复杂,经过多年的运行,现有的业务数据库中包含的不仅仅是大量的病人基本信息,还包含了病人的费用信息以及临床生理信息,影像图片信息等等。特别是医保等新兴医疗方式不断涌现并逐渐占据重要地位,如何从现有的海量数据中提取出对于医院临床医疗、学科建设、决策管理等多方面具有指导意义的知识与经验,帮助医院取得竞争优势,成为了医院工作中的一个重要任务。我们采用数据挖掘与数据仓库技术对医院现有的历史数据进行分析成为了一个必然趋势,这也正是医院信息化建设所面临的新课题。 随着医疗改革的深入,国家大力普及医保的保障范围、努力提高医保的保障水平,医保病人在医院病人中占的比例越来越高,医保收入在医院的营业收入中占的比重也越来越大,目前医院医保管理所面临的问题有:如何合理的控制医保病人医疗费用的上涨,同时又尽可能的为医保病人提供完善的医疗服务,降低医院的垫支压力;如何制定科学、合理的医保定额指标,合理分配医保返回资源,调动科室积极性促使科室主动贯彻医保政策。 基于本课题的研究,我们提取了医院历年来与医保病人相关的各类信息,建立了基于费用分析为主题的数据仓库,在数据仓库建立过程中,对业务数据的数据抽取、数据清洗、数据转换、数据加载等一系列数据准备的过程进行了详细阐述,并建立了包括时间维、科室维、医生维、诊断维、地址维、性别维、年龄维、身份维等在内的多种分析维度以及与费用相关的事实表,建立了以医保费用分析为主题的星型模式的数据仓库。 在本课题中数据源分别来自于医院信息系统(HIS)与医保信息系统(PJ3)这两个异构数据源,面临着描述同一种事物时存在着不同的表达方式,或者数据缺失、数据重复等情况,如果采用手工筛选的方式将无法完成这些大量的数据清洗工作。数据准备的工作是建立挖掘系统的过程中重要的部分,它所花费的时间与精力也最多,而在数据准备的工作中数据清洗又是其中的重点内容。数据清洗将从业务数据库中提取出来的数据“干净地”导入到数据仓库中,数据清洗工作的好坏将直接影响到数据挖掘的质量和效率,直接关系着数据挖掘的结果。 针对这一课题,我们设计了自动数据清洗的方式。其主要工作是:将HIS系统与PJ3系统这两个异构数据源对其中数据的不规范性和二义性以及重复和不完整等问题进行了数据清洗,经过一段时间的跟踪,我们记录下通过自动数据清洗解决了以下几个方面的问题: 1、自动筛选出缺少住院号的医保记录。 2、自动筛选出数据中住院号与姓名不匹配的记录。 3、病人ID号与住院号在两个数据源中不匹配的记录。 4、数据中科室错误的记录,包含没有科室信息以及转科信息等。 通过这种自动筛选的数据清洗方式,能够有效的提取拦截有问题的数据,加快了数据清洗的时间,保证了数据挖掘的质量。 本课题通过对医院历年医保病人数据采用数据挖掘的方法,使用关联规则中的Apriori算法实现了对医保费用与相关因素(如医保病人身份、科室、医生、诊断、住院天数、地域等)间的规则挖掘,得出了医保费用分析的规则集。利用该规则集进行分析我们可以看出与医保病人费用关联最大的是住院天数和特定出院科室这两个因素的组合,规则集中前5条规则的匹配模式是对医保费用影响最大的因素,今后对于具有这些属性的医保病人应该给予较高的关注,一方面在满足病人医疗需求的前提下尽量避免超出定额情况的发生,另一方面努力调动科室积极性、合理分配医疗资源、保障医保补偿性收入。通过本课题的研究表明:数据仓库以及数据挖掘技术能够找出与医保费用管理工作关系密切的规则集,通过规则来为医保费用管理工作提供有益的参考和指导,并协助制定动态的定额分配指标,加快医保数据分析反馈的速度以及做出及时的分析回溯。数据挖掘技术与传统技术相比具有灵活、快速、分析能力强的优点,把数据挖掘技术引入医保管理工作中将适应医保管理工作新的变化与挑战。 本文为国内医疗机构采用数据挖掘技术对医保数据进行分析与利用作了有益的探索,为新的医疗管理决策方式提供了相关技术、过程与资料参考,为数据挖掘在医疗信息化建设中的应用作了有益的尝试。
【学位授予单位】:南方医科大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前3条
1 龚卫宁;;数据挖掘在医院管理中的应用[J];中国医药指南;2012年12期
2 张勇;赵峻;于冬;;浅谈医保系统与医院信息系统的数据挖掘[J];中国医疗设备;2012年07期
3 石晓敬;;数据挖掘及其在医学信息中的应用[J];医学信息学杂志;2013年05期
中国硕士学位论文全文数据库 前5条
1 李纳;社会保障体系中医疗保险的数据挖掘与联机分析研究[D];贵州财经学院;2011年
2 章堃;门诊病人就诊行为模型挖掘研究[D];华东理工大学;2012年
3 龙冰莹;多生理参数远程监护系统数据终端的研究与应用[D];南京邮电大学;2013年
4 李娜娜;数据挖掘在医疗保险理赔分析中的应用[D];大连理工大学;2013年
5 白聃;医疗费用挖掘系统的设计与实现[D];黑龙江大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 王春才;韩贵东;杨玉东;李英韬;张羽;;医保数据仓库的单因素方差分析与应用[J];长春理工大学学报(自然科学版);2007年04期
2 陈雪峰,蔡锋,王静;恶性血液病数据库分析系统的建立[J];第四军医大学学报;2005年21期
3 邱芸;李青;;基于交叉索引技术的呼叫中心运营分析系统的研究与应用[J];电信科学;2008年11期
4 赵燕;姜薇;;几种数据挖掘方法的特点及其适用领域[J];福建电脑;2007年04期
5 胡蓉;郭芳;张燕;;数据仓库技术在医院信息管理及决策中的应用[J];现代医院管理;2005年03期
6 白素兰;;数据仓库维度建模与ETL过程[J];辽宁高职学报;2008年10期
7 朱扬勇;熊赟;;DNA序列数据挖掘技术[J];软件学报;2007年11期
8 张萌;梁正;祝思清;;基于关联规则的数据挖掘在医疗诊断中的应用[J];山东科学;2008年01期
9 余辉;张力新;刘文耀;;计算机辅助医学知识发现系统研究——糖尿病并发症流行病学数据挖掘[J];生物医学工程学杂志;2008年02期
10 谭敏;袁乐平;;定额结算下保险医疗费用支付制度安排[J];财务与金融;2008年04期
【共引文献】
中国期刊全文数据库 前10条
1 秦洪英;数据挖掘在网络业务流设计中的实现过程[J];阿坝师范高等专科学校学报;2005年03期
2 李瑞娟;杨文明;;中医证候研究方法学探讨[J];中医药临床杂志;2010年02期
3 陈志民;李亭;杨敬锋;彭晓琴;;珠海市斗门区水产品病害网络诊断与防治系统算法设计[J];安徽农业科学;2010年17期
4 叶良艳;;基于改进后的K-means聚类算法的网吧用户行为聚类[J];安徽科技学院学报;2009年04期
5 饶正周;唐斌;郁文山;;2.4m跨声速风洞控制系统的智能运行技术[J];兵工自动化;2007年01期
6 张晓明;刘萍;王鹏;;基于数据仓库的数据挖掘及联机分析技术[J];兵工自动化;2008年09期
7 程韦;苏志同;;数据挖掘技术在现代信息管理系统中的研究与分析[J];北京工业职业技术学院学报;2008年04期
8 李波;;数据仓库与联机分析处理(OLAP)技术[J];北京广播学院学报(自然科学版);2005年04期
9 秦如新;田英杰;陈静;邓乃扬;张海斌;;双聚类的关联规则挖掘方法[J];北京工业大学学报;2009年04期
10 孟海洋;薛红;郭培源;曹利红;;网上超市购物系统的设计与实现[J];北京工商大学学报(自然科学版);2008年06期
中国重要会议论文全文数据库 前10条
1 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
2 冯春晖;陈彦桥;刘金琨;;数据挖掘技术在火电机组运行参数优化中的应用[A];中国自动化学会控制理论专业委员会B卷[C];2011年
3 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论和Apriori算法建立中医症候诊断标准[A];中国自动化学会控制理论专业委员会D卷[C];2011年
4 张柔玲;黄君瑶;;谈病案信息的利用[A];中国医院协会病案管理专业委员会第十八届学术会议论文集[C];2009年
5 刘扬;曹惠玲;梁大敏;;关联规则挖掘在航空发动机QAR数据中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 尹松;周永权;;基于联机分析处理的数据仓库分析[A];广西计算机学会2004年学术年会论文集[C];2004年
7 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
8 付森;;数据仓库技术在财务综合指标分析中的应用研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
9 王忠明;何卫平;;基于Web的协作项目管理系统数据仓库构建[A];先进制造技术论坛暨第二届制造业自动化与信息化技术交流会论文集[C];2003年
10 董燕;;Web挖掘对电子商务网站建设的影响[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 刘汉霞;我国权力寻租的影响因素研究[D];华南理工大学;2010年
2 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
3 韩明华;基于情境分析的集群企业知识转移机理与模型研究[D];浙江工商大学;2011年
4 刘晓茜;云计算数据中心结构及其调度机制研究[D];中国科学技术大学;2011年
5 叶莹;基于数据挖掘技术的痰、饮辨证论治规律的比较研究[D];成都中医药大学;2011年
6 梁成军;网球技战术决策支持系统研究与应用[D];上海体育学院;2011年
7 金海浩;五行相生间接补法古代应用规律研究[D];南京中医药大学;2011年
8 黄丹飞;基于生理信号关联分析的可组合多通道监护系统的研究[D];长春理工大学;2011年
9 朱小栋;基于扩展预测模型标记语言的数据流挖掘系统建模研究[D];南京航空航天大学;2009年
10 周明;基于数据挖掘的制造业采购DSS理论及方法研究[D];天津大学;2009年
中国硕士学位论文全文数据库 前10条
1 梁大圣;空间数据仓库的设计与构建[D];山东农业大学;2010年
2 曾祥莉;ETL在经济普查信息发布系统中的应用研究[D];哈尔滨工程大学;2010年
3 解保忠;计算机在矽肺病早期诊断及预测中的应用研究[D];哈尔滨工程大学;2010年
4 徐一凤;隐私保护聚类挖掘方法的研究[D];哈尔滨工程大学;2010年
5 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
6 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
7 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
8 王宏云;基于数据挖掘的煤矿安全监测系统研究[D];辽宁工程技术大学;2009年
9 胡雅馨;基于粗糙集与证据理论的瓦斯传感器故障诊断技术的研究[D];辽宁工程技术大学;2009年
10 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 陈增祥;;SQL Server数据库数据完整性的研究与分析[J];信息安全与技术;2012年01期
2 崔柔刚,温阳东;数据挖掘技术在医院信息管理中的应用[J];安徽水利水电职业技术学院学报;2004年01期
3 张双雨;张国英;马宗峰;石先跃;;实现医保系统与HIS系统接口的标准[J];承德医学院学报;2010年03期
4 庞国明;;从合肥医保联网看医院信息化[J];当代医学;2006年05期
5 邓维斌,周玉敏;ADO.NET访问数据库的方法及实现[J];电脑学习;2005年05期
6 付阶辉,赵林度;数据挖掘技术在HIS中的应用[J];东南大学学报(哲学社会科学版);2002年S2期
7 袁占花;李祥生;;数据挖掘在医学信息系统中的应用[J];电脑开发与应用;2009年07期
8 林平荣;;ADO.NET的数据库访问技术研究与实现[J];电脑知识与技术;2008年07期
9 彭巧珍;邓林生;;社保DSS中数据仓库的设计与实现[J];电脑知识与技术;2008年23期
10 刘莉,徐玉生,马志新;数据挖掘中数据预处理技术综述[J];甘肃科学学报;2003年01期
中国博士学位论文全文数据库 前2条
1 易静;医院信息数据挖掘及实现技术的探索[D];重庆医科大学;2007年
2 伍平阳;基于数据挖掘技术的医疗设备绩效预测方法的应用研究[D];南方医科大学;2008年
中国硕士学位论文全文数据库 前10条
1 高勇;基于BS短信办公系统的设计与实现[D];电子科技大学;2010年
2 苏亚丁;基于决策树的数据挖掘技术在口腔诊疗中的应用[D];河北科技大学;2010年
3 阎岩;基于身份的数字签名在自测系统中的应用[D];上海交通大学;2011年
4 张泰峰;基于数据仓库的医院财务决策支持系统[D];华南理工大学;2011年
5 刘燕峰;数据挖掘及决策支持技术在医院中的应用研究[D];浙江大学;2012年
6 林琳;医院信息化系统集成技术的研究[D];浙江大学;2002年
7 蔡越君;数据挖掘技术及其在中药配伍系统中的应用研究[D];浙江大学;2003年
8 周忠彬;基于oracle数据仓库技术构建医院统计资源库[D];第四军医大学;2004年
9 毕建欣;数据挖掘技术在我国保险业中的应用研究[D];福州大学;2005年
10 付光金;HIS中医疗费用的数据挖掘[D];吉林大学;2005年
【二级引证文献】
中国期刊全文数据库 前2条
1 肖辉;周征奇;肖革新;于石成;;公共卫生领域中的数据挖掘[J];医学信息学杂志;2013年12期
2 苏云梅;刘菊锋;;知识发现在数字图书馆资源建设中的应用[J];医学信息学杂志;2013年12期
中国硕士学位论文全文数据库 前1条
1 张莎莎;数据挖掘在城镇基本医疗保险中的应用分析与设计[D];贵州财经大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
2 王艳春;郭小利;陈鸿;高龙;;基于数据挖掘算法的教学评测系统研究[J];长春理工大学学报;2006年04期
3 王艳春;秦刚;陈毓;;数据挖掘在医保系统中的应用[J];长春理工大学学报(自然科学版);2007年02期
4 王镝;赵毅;陈白尘;王国仁;;DNA序列中基于后继数组索引的SATR查找算法[J];东北大学学报(自然科学版);2007年02期
5 张燕;肿瘤医院数据仓库的建立与应用[J];当代医学;2004年08期
6 屈景辉,廖琪梅,许卫中,陈汉勇;医学信息数据库的建立与数据挖掘[J];第四军医大学学报;2001年01期
7 瞿爱珍,庄天戈;计算机辅助医学诊断系统的数据挖掘和知识发现研究[J];国外医学.生物医学工程分册;2002年03期
8 余辉,吕扬生;数据挖掘技术在生物医学领域的应用[J];国外医学.生物医学工程分册;2003年02期
9 薛锦;数据仓库及其创建中的几个问题[J];河海大学常州分校学报;2001年02期
10 杨学兵,蔡庆生;一种基于概念层次的分类规则挖掘算法研究[J];华中科技大学学报;2001年09期
中国博士学位论文全文数据库 前1条
1 余辉;医学知识获取与发现的研究[D];天津大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 张永宾;;基于数据仓库和数据挖掘的客户忠诚度的分析[J];商场现代化;2008年21期
2 夏瑞丽;;浅谈数据挖掘[J];科技创新导报;2008年24期
3 郑斌;;基于数字校园的数据挖掘在贫困生界定中的应用[J];中国科教创新导刊;2010年28期
4 罗健萍;吴海;;数据挖掘技术中基于关联规则算法的研究[J];硅谷;2011年13期
5 常睿;崔志明;;数据挖掘在网络管理中的应用[J];福建电脑;2006年09期
6 张帆;;试论数据挖掘中的遗传算法[J];中国科技信息;2006年19期
7 张明霞;;数据挖掘技术及其应用[J];苏盐科技;2006年03期
8 刘军;叶钒;;基于数据仓库和数据挖掘的应用研究[J];福建电脑;2007年03期
9 陈涛;;正在走向实用的数据挖掘技术[J];电脑知识与技术(学术交流);2007年07期
10 李鑫;杨涛;;数据仓库数据挖掘在软件职业教育中应用研究[J];农业网络信息;2007年04期
中国重要会议论文全文数据库 前10条
1 谷斌;靳艳峰;王磊;;关联规则算法在邮政报刊征订中的应用研究[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
2 陈铭;顾宏斌;;数据挖掘技术在航空事故分析中的应用[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
3 刘震宇;郭宝龙;杨林耀;;数据仓库技术及其与数据挖掘的关系[A];2001年中国智能自动化会议论文集(下册)[C];2001年
4 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
5 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
6 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
7 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
8 嵇晓;周世春;;企业数据仓库化建设理论及实践[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
9 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 阎玮;柏文阳;张剡;;基于FP-Tree重构事务数据集的关联规则隐藏[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
3 谭中和;数据仓库 “金保工程”建设的一项重要技术[N];中国劳动保障报;2006年
4 南京市地方税务局信息管理处、计算机中心 明靖 朱岚;数据挖潜让业务说话[N];中国计算机报;2006年
5 侯闯;动态数据仓库让BI走向一线[N];计算机世界;2007年
6 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
7 谷斌;数据仓库银行信息化新热点[N];金融时报;2006年
8 朱维嘉;决策支持系统效力电子政务[N];计算机世界;2006年
9 首之;数据挖掘并不神秘[N];金融时报;2006年
10 ;微软数据仓库技术 帮国信证券挖掘潜力[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
2 冯变玲;基于数据挖掘技术的心脑血管用药ADR关联模型构建研究[D];天津大学;2012年
3 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
4 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年
5 赵春;基于数据挖掘技术的财务风险分析与预警研究[D];北京化工大学;2012年
6 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
7 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
8 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
9 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
10 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 余亮;数据仓库及数据挖掘技术在电信网络资源管理中的研究[D];武汉理工大学;2007年
2 初永玲;数据挖掘在智能答疑系统中的应用与研究[D];沈阳工业大学;2008年
3 李娜;校园一卡通决策支持系统的研究与实现[D];同济大学;2008年
4 宋丹娃;森林资源管理信息系统中数据处理的解决方案研究[D];北京林业大学;2009年
5 欧军;企业数据分析系统开发[D];成都理工大学;2007年
6 王涛;数据仓库技术在税务行业的应用[D];武汉理工大学;2006年
7 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
8 孙水华;基于数据仓库的库存分析系统研究与开发[D];中南大学;2008年
9 张慧萍;数据挖掘技术与应用研究[D];武汉科技大学;2005年
10 赵艳铎;关联规则算法研究及其在网络安全审计系统中的应用[D];清华大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026