收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于数据挖掘技术的医疗设备绩效预测方法的应用研究

伍平阳  
【摘要】: 本文在系统介绍数据挖掘技术相关知识的基础上,重点研究了建立数据仓库的技术和决策树挖掘算法及其在医疗设备绩效预测中的应用。 目前,医疗机构把绝大部分的经营积累用于购置医疗设备,每年用于购置医疗设备的费用约占当年形成的可动用资金的80%,因此,医疗设备效益的好坏直接关系到医疗机构的经营状况,直接关系到医疗机构能否为广大患者提供良好的服务、能否稳定、持续地发展的重要课题。正因为如此,卫生部《医院管理评价指南(试行))》中要求医疗机构购置大型医疗设备必须经过严格的可行性论证并加强大中型医疗设备合理应用成本分析,而对医疗设备在购置前就对其投入使用后的绩效进行预测,是医疗设备购置前进行可行性论证中最为关键的一环,也是医疗设备投入使用后进行合理应用成本分析的前提。数据挖掘技术当前已经成为数据库和信息决策领域的前沿研究方向之一,受到国内外学术界的广泛关注,在商业、工业和医学领域都得到了较为广泛的应用,取得了显著的社会及经济效益。因此,应用数据挖掘技术的理论和方法,对医疗设备的绩效预测方法进行深入的研究,对于充分发挥医疗设备的社会效益和经济效益,具有重要意义。 近年来,随着计算机技术、网络技术的迅速发展和医院信息系统(HIS)在医院的普及和广泛应用,虽然HIS中包含有病人信息管理模块和医疗设备管理模块,但两者是相互分离的,相应的软件模块仅局限于分别对病人信息和医疗设备信息进行录入、修改、查询、统计等简单功能的实现,停留在基于数据库技术支持的操作型事务处理的水平上。对医疗设备购置前的可行性论证的决策支持和投入使用后的设备使用、维护等信息的深层次加工较少,如何充分利用这些宝贵的信息资源来为医院的管理者和决策者实施对医疗设备的高效管理和科学决策提供准确、可靠的依据,提高医疗设备的社会效益和经济效益,促进医院的快速健康发展,已成为人们关注的焦点。 数据挖掘(Data Mining,DM)也称为数据库知识发现(Knowledge Discovery in Database,KDD),这一术语出现于1989年,是从数据库中识别出有效的、新颖的、潜在有用的、并且最终可理解的模式的非平凡过程。数据挖掘技术在90年代有了突飞猛进的发展,数据挖掘从理论和技术上继承了知识发现领域的成果,同时,它还借鉴了许多其它领域的理论和算法,如数据库系统、机器学习、模式识别、人工智能、数据可视化、信息检索以及统计学等。数据挖掘本质上可归类为深层次的数据分析方法。数据分析本身已经有很多年的历史,不过由于以往计算能力的局限性,限制了对大量数据进行分析的复杂数据分析方法的应用。近年来,由于电子信息技术的发展及应用的普及,商业、医疗及其它领域都产生了大量的业务数据,分析这些数据可以为决策提供真正有价值的信息,因此具有重要的意义。 数据挖掘的结果通常表示为概念、规则、规律、模式、约束、可视化等形式。通过数据挖掘所获得的知识可以直接用于辅助决策或修正已有的知识体系,也可作为新的知识存储于应用系统中。数据挖掘的原始数据可以是结构化的;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现的知识可以被用于信息管理、查询优化、决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单统计、查询,提升到从数据中挖掘知识,提供决策支持。 数据挖掘需要良好的数据组织和纯净的数据,数据的质量直接影响数据挖掘的效果,而数据仓库的特点恰恰最符合数据挖掘的需求,它从各类数据源中抽取数据,经过清洗、集成、选择、转换等处理,为数据挖掘所需要的高质量数据提供了保证。数据仓库是数据库技术发展的高级阶段,它是面向主题的、集成的、内容相对稳定的、随时间变化的数据集合,可以用来支持管理决策的定制过程。数据仓库系统允许将各种应用系统、多个数据库集成在一起,为统一的历史数据分析提供坚实的平台,其主要目的是为决策提供支持,为OLAP、数据挖掘等深层的数据分析提供平台。可以说,数据挖掘为数据仓库提供了有效的分析处理手段,数据仓库为数据挖掘准备了良好的基础。 SOL Server 2005 Integration Services(SSIS)是用于创建高性能的数据集成解决方案的平台,它能够执行抽取(extraction),转换(transformation)和加载(load),缩写为ETL,用于为数据仓库提供服务。SSIS提供了工作流环境,可以使用该环境来构建数据转换包。可以从不同的数据源中提取数据,然后对该数据执行一系列操作。 由于医学数据库是一个复杂数据库,而目前数据挖掘技术主要应用于以结构化数据为主的关系数据库、事务数据库和数据仓库,对复杂类型数据的挖掘尚处在起步阶段。结合医学信息自身具有的特殊性和复杂性,处理好挖掘过程中的关键技术,医学数据挖掘将有广阔的应用前景。分类和预测是数据挖掘的两种数据分析形式,通常的算法有粗糙集理论、决策树、人工神经网络、渐近计算等,各有优点。应该注意的是大部分算法都不是专业为解决某个问题而特制的,算法之间也并不互相排斥。一般来说并不存在所谓的最好的算法,在最终决定选取哪种算法之前,有可能对各种算法都试一下,然后再选取一个较好的。在实际应用中,可对这些方法进行适当的修改、扩充和优化,从而能在各种特殊的医学数据库中进行分类和预测。本文重点研究决策树算法的原理及方法。 决策树算法最基本的原理是递归地将数据拆分成子集,以便每一个子集包含目标变量类似的状态,这些目标变量是可预测属性。每一次对树进行拆分,都要评价所有的输入属性对可预测属性的影响。当这个递归的过程结束时,决策树也就创建完成了。比较有名的决策树算法有ID3算法、ID4算法、ID5R算法、C4.5算法。 当今先进的数据挖掘工具都提供多种可供选择的数据挖掘算法。这是因为一种算法不可能完成所有不同类型的数据挖掘任务。本次挖掘任务可分为两部分的任务:分类任务和回归任务。 分类任务是:对不同条件下的设备使用情况进行分类。假设疾病例数和设备使用情况存在线性关系:y=ax+b,其中x表示疾病例数,y表示设备使用次数,根据这个公式就能对设备的使用情况进行预测。简单来说,如何得到这个公式的任务就是回归算法的主要任务。 同时可以假定,不同的设备和不同的疾病种类会有不同的线性关系(函数),所以需要对不同的关系进行分类,例如‘CT检查’与‘肺炎’存在线性公式y=a_1x+b_1,‘cT检查’与‘肺癌’存在线性公式y=a_2x+b_2。 对于本次挖掘任务,决策树算法与其它的数据挖掘算法相比有一定优势,如利用决策树算法可以快速创建挖掘模型,并且创建的模型也容易解释。每一条从根节点到叶节点的路径就是一条规则,基于决策树的预测也非常高效。本次任务主要是对医疗设备的绩效进行预测,因此,用决策树算法来完成本次挖掘任务是一个较好的选择。 SQL Server 2005 Analysis Services(SSAS)的决策树算法(MicrosoftDecision Trees)是一个混合决策树算法,Microsoft线性回归算法不拆分数据,并且回归公式基于整个数据集,这个算法支持分类和回归两种任务。Microsoft回归树的每一个叶节点都有一个线性回归公式。在每一个回归模型中至少有一个回归量(regressor)。回归量是一个连续的输入属性,这个输入属性采用线性的方式对连续的可预测属性进行建模。例如,使用B超次数是一个连续的可预测属性,则疾病例数就是一个回归量。经典的线性回归公式是:使用B超次数=a+b~*疾病例数+e,其中:e代表噪声,其平均值为0,系数a(截距)和b(斜率)由残差方程决定。 本文对数据挖掘技术的理论和方法进行了研究探讨,并将其应用于基于数据挖掘技术的医疗设备绩效预测的研究中,在对得到的数据挖掘模型进行测试、评估时,CT、MRI、CR、B超、彩超、电子胃镜、电子肠镜等7台(类)设备的预测值与实际值基本相符。通过本研究,基本实现了在医疗设备购置前对其投入使用后的绩效进行较为准确的预测,并为开展合理应用成本分析奠定了良好的基础,进一步的深入研究,可实现对医疗设备从购置前的可行性论证到淘汰报废的全过程提供决策支持,使医疗设备的全寿命期都纳入管理者的统筹管理之中,较好地解决医疗设备绩效、代价、风险等互相制约的难题,充分发挥医疗设备的社会效益和经济效益。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 姜楠;高巍;张丽秋;;基于Analysis Services的数据挖掘模型的研究与应用[J];机械设计与制造;2007年04期
2 万明秀;吴阳波;;客户管理系统中数据挖掘技术应用研究[J];煤炭技术;2009年11期
3 雷松泽,郝艳;基于决策树的就业数据挖掘[J];西安工业学院学报;2005年05期
4 罗妤;余力;;聚类数据挖掘在商场顾客分析中的应用[J];自动化技术与应用;2007年09期
5 伍平阳;林意群;林木炎;;基于数据挖掘技术的医疗设备绩效预测方法的应用研究[J];南方医科大学学报;2008年02期
6 马飞,马彪;一种基于数据立方体的数据挖掘技术的研究[J];中国仪器仪表;2005年10期
7 谭立云;丁智斌;玉嘉邓;;基于数据仓库的图书借阅数据挖掘[J];现代情报;2009年12期
8 李雪燕;;数据挖掘在高校成绩管理中的研究和应用[J];计算机与数字工程;2011年07期
9 赵彩云;常晋义;;数据挖掘模型快速更新的算法研究[J];计算机时代;2007年02期
10 张成叔;胡学钢;;基于SQL Server 2005的决策树挖掘算法在安徽省高等职业院校招生决策中的应用研究[J];电脑知识与技术;2010年26期
11 王剑;卢华明;;数据挖掘技术在CRM中的应用[J];北京信息科技大学学报(自然科学版);2010年02期
12 蔡嘉荣;印鉴;刘玉葆;余阳;;基于OLAP的免疫疾病预防数据分析系统的设计和实现[J];计算机与现代化;2008年02期
13 陈鸿雁;;商务智能在保险数据分析和决策支持中的设计与实现[J];计算机系统应用;2010年11期
14 张波;陈定方;祖巧红;;基于SQL SERVER 2005的数据挖掘系统设计[J];湖北工业大学学报;2007年03期
15 刘佳;袁中凡;林大全;;数据挖掘在辐照人体模型等效性判断中的应用探讨[J];中国科技信息;2009年03期
16 秦永平;王丽萍;孙庆;李哲;;基于数据仓库的突发公共卫生事件预警预报系统[J];计算机工程与设计;2010年13期
17 林庆;廖定安;吴旻;王飞;王敏;;医药连锁销售决策支持系统的研究[J];计算机工程与设计;2007年13期
18 安利平;张松;仝凌云;;基于决策树的OLAM及其应用研究[J];计算机工程与设计;2008年15期
19 陈鸿雁;;保险商务智能系统的设计与实现[J];华南金融电脑;2009年10期
20 陈良;杨冬青;王腾蛟;常雷;;基于PMML的移动通信客户流失模型交换[J];计算机工程;2007年22期
中国重要会议论文全文数据库 前10条
1 廖燕玲;卢语丹;阮艳萍;高丽金;;高校教学决策支持系统的数据仓库研究[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
2 严哲南;楼荣生;;窗口算法问题的解决方案[A];第十六届全国数据库学术会议论文集[C];1999年
3 杨崇联;谢旭升;;基于数据仓库的政府决策支持服务系统研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 刘刚;付忠广;申鹏飞;郑玲;靳涛;;基于发电厂机组数据仓库的数据挖掘系统的研究[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
5 姚卿达;屈定春;;联邦数据库互操作方法在数据仓库中的应用[A];数据库研究进展97——第十四届全国数据库学术会议论文集(下)[C];1997年
6 唐蕾;张剡;柏文阳;徐洁磐;;数据仓库工具集NGDW-1的设计与实现[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 曹波伟;王崛;陈忱;;基于OLAP的数据挖掘在设备维护中的应用研究[A];第二十二届中国(天津)'2008IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2008年
8 宋擒豹;沈钧毅;;数据仓库体系结构研究[A];第十六届全国数据库学术会议论文集[C];1999年
9 刘伟宏;李晋晋;何瑷;徐洁磐;;数据仓库及其在OMNIX中的实现[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
10 曹顺良;李荣;张忠平;汪卫;朱扬勇;李亦学;;BioDW:一个整合的生物信息学数据仓库平台[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 伍平阳;基于数据挖掘技术的医疗设备绩效预测方法的应用研究[D];南方医科大学;2008年
2 孟京辉;经营单位级森林经营数据仓库研建及应用研究[D];中国林业科学研究院;2011年
3 朱传华;三峡库区地质灾害数据仓库与数据挖掘应用研究[D];中国地质大学;2010年
4 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
5 克里木;自适应数据仓库系统的研究与实现[D];大连理工大学;2003年
6 景旭文;基于数据挖掘的动态全息产品概念设计理论与方法研究[D];东南大学;2005年
7 宋杰;面向多类型数据源的数据仓库构建及ETL关键技术的研究[D];东北大学;2008年
8 陈金玉;数据仓库实体化视图联机—致性维护研究[D];重庆大学;2002年
9 徐铭杰;遥感图像数据挖掘体系与实现技术研究[D];中国人民解放军信息工程大学;2003年
10 徐小博;客户关系管理系统的安全防护机制[D];吉林大学;2012年
中国硕士学位论文全文数据库 前10条
1 孙桐;改进的决策树算法在刑事审讯决策支持中的应用[D];大连理工大学;2005年
2 向春;医疗保险信息系统的数据仓库与数据挖掘研究[D];南京航空航天大学;2007年
3 陈文;基于数据仓库的决策树算法研究与应用[D];西安电子科技大学;2010年
4 黄秀勤;数据挖掘在邮政网运分析系统中的应用[D];南京理工大学;2009年
5 乔巍;基于数据挖掘技术的客户关系管理系统的研究和设计[D];吉林大学;2009年
6 祝婷婷;基于数据挖掘的图书馆用户使用因素分析[D];东北师范大学;2007年
7 高晓艳;数据挖掘交互式过程可视化的研究与应用[D];沈阳工业大学;2007年
8 牛建平;基于数据仓库和数据挖掘技术的油田生产决策分析研究[D];电子科技大学;2010年
9 贲琳;基于移动经营分析系统的设计与实现[D];吉林大学;2007年
10 陈健;数据挖掘技术在交叉销售中的应用[D];苏州大学;2009年
中国重要报纸全文数据库 前10条
1 段云峰 杨凤年 宋俊德;数据仓库必不可少[N];计算机世界;2002年
2 ;“快钱”的速度[N];网络世界;2005年
3 ;IBM DB2商业智能软件[N];中国计算机报;2007年
4 刘庆;颗粒归“仓”,刀枪入“库”[N];网络世界;2006年
5 本报记者 赵晓涛;中国人保试点数据仓库[N];网络世界;2004年
6 本报记者 潘永花;实时企业的决策引擎[N];网络世界;2005年
7 邹大斌;关注商业智能的性能[N];计算机世界;2007年
8 ;数据仓库向外部用户开放[N];网络世界;2007年
9 本报记者 谌力;心甘情愿的“不归路”[N];网络世界;2005年
10 ;企业范围内部署BI效果更佳[N];网络世界;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978