收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

医院信息数据挖掘及实现技术的探索

易静  
【摘要】: 探索基于SPSS Clementine的在线医院数据挖掘技术的实现,达到节约资源、共享资源的目的。在此基础上,探讨数据挖掘技术在因素预测、疾病判别诊断、疾病关联分析中的应用,结合实例研究重庆市结核病流行过程及发展趋势、乳腺癌腋窝高位淋巴结转移的危险因素及判别分类模型和糖尿病与并发症的关联知识发掘。为临床管理人员、医务人员、科研工作者进行科学管理、提高诊疗水平以及开展医学研究提供辅助决策与综合分析的工具。当前信息领域内普遍存在的“知识发现”问题迫切需要研究和解决,就方法学而言,科学地选择适当的数据挖掘算法是获得准确知识规则的关键;而在线医院数据挖掘技术的实现对提高医院管理水平和医疗质量具有重要的应用价值。 随着计算机技术、生物医学工程研究的飞速发展,计算机信息技术在医学领域广泛应用,使得大量医学信息被精确记录下来,积累了大量的数据资源,激增的数据背后隐藏着许多重要的有用信息。从这些大量的数据资源中挖掘深层次的、隐含的、有价值的知识显得越来越重要。到目前为止,在国内,数据挖掘技术在医疗服务领域的研究有所报道,但未见其在线分析系统的研究应用;针对不同目标的实际应用,科学地选择适当的数据挖掘算法的方法学研究尚属先例。 本研究采用Java网络编程语言,实现基于SPSS Clementine的在线医院数据挖掘的技术。利用来源于重庆市三所医疗机构(重庆市结核病防治所、重庆医科大学附属第一医院、附属第二医院)的医院数据,包括结核病、乳腺癌和糖尿病的资料。分别采用ARIMA模型、BP神经网络模型、GM(1,1)模型对结核病发病率进行预测分析比较;采用Logistic模型、CHAID模型、RBFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型对乳腺癌腋窝高位淋巴结转移判别分类比较;采用Apriori关联分析模型对糖尿病与并发症的关联强度进行描述。 主要研究内容:①采用Java网络编程语言,对在线数据挖掘技术的实现进行探索。②分析重庆市结核病流行过程,乳腺癌腋窝高位淋巴结转移的危险因素以及糖尿病与并发症的关联。③采用ARIMA模型、BP神经网络模型、GM(1,1)模型对结核病发病率进行预测分析。④采用Logistic模型、CHAID模型、RBFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型对乳腺癌腋窝高位淋巴结转移判别分类。⑤利用准确率(Accuracy)和可靠性(Reliability)指标评价模型的准确性和可靠性。 研究结果表明:①初步整合了SPSS Clementine,实现了在线医院数据采集、执行引擎、分析结果处理和分析结果查询的流程处理。②结核病有明显的季节流行高峰,基本是每年一、三季度发病人数较少,二、四季度发病人数较多。一个结核病流行年各季度发病率与一年前的一个半结核病流行年各季度发病率有关系。对结核病发病率的预测必须考虑季节因素、周期性及随机因素的影响,才能做出准确的预测。③ARIMA模型、BPANN2模型和GM(1,1)模型比较,前两者对结核病发病率的预测的相对误差分别为0.05872和0.06999,GM(1,1)模型为0.01210,说明残差GM(1,1)模型对结核病具有较好的预测性能。④乳腺癌腋窝高位淋巴结转移与腋窝中低淋巴结状况、肿瘤大小有明显关系。⑤RBFN模型采用权值矩阵表达诊断知识,Logistic模型与RBFN-Logistic混合模型采用Logistic回归系数表达诊断知识,二者均不易被使用者解读;CHAID模型和RBFN-CHAID混合模型采用了自然语言以树型的方式表达,提高了结果的可理解性。⑥Logistic模型、CHAID模型、RBFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型的平均预测准确率分别为83.34%、83.79%、85.61%、83.77%、79.74%,r ?1分别为0.0720、0.0625、0.0549、0.0766、0.0948。RBFN模型所获知识的可靠程度以及对测试集合测试的准确率明显优于其它算法。⑦CHAID模型提取的诊断规则描述简单易懂,应用方便,可判断各诊断指标对乳腺癌腋窝高位淋巴结转移诊断贡献的大小,从CHAID决策树型可见,中低淋巴结状况对乳腺癌腋窝高位淋巴结转移诊断起决定性作用,肿瘤大小则可作为诊断的重要指标。因此,CHAID模型是一种简便可行的计算机辅助诊断方法,可从病例自动提取诊断规则,具有较广泛的实用价值,可应用于其它疾病的诊断研究。⑧泌尿道感染、肾病、眼部病变、神经病变、高脂血症、高血压、心脏病、冠心病等与糖尿病具有明显并发倾向。 结论:①在线医院数据挖掘技术是未来医院信息系统的重要组成部分,对提高医院管理水平和医疗质量,降低医院运营成本具有重要的应用价值。②明确了GM(1,1)模型是预测结核病发病率的最佳预测算法;乳腺癌腋窝高位淋巴结转移判别分类的最佳算法是RBFN模型,对判别分类准确率和可靠性排位紧随其后的CHAID模型也是极佳的选择,这是从使用者易理解性、判别分类准确率和可靠性角度综合之结果;Apriori关联分析模型作为医生的辅助工具,提示临床医生关注、研究泌尿道感染与糖尿病两者之间的真正关系。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李丰森;李兵;;基于医院信息系统的数据挖掘技术研究[J];卫生职业教育;2009年16期
2 刁琰;;数据仓库与数据挖掘技术在医院信息管理中的应用[J];华南国防医学杂志;2008年04期
3 王建强;仲晓伟;杨飞;;数据挖掘在医疗临床路径中的应用[J];现代医院;2011年03期
4 刘佳;兰顺碧;张晓祥;;数据仓库与数据挖掘在医院管理中的应用[J];医学与社会;2006年10期
5 王徐冬;杨希武;;数据仓库与数据挖掘在医院信息系统中的应用[J];医疗卫生装备;2008年08期
6 郭庆;谷岩;;数据挖掘技术在医院信息系统的统计分析与决策中的应用[J];中国医疗设备;2010年05期
7 韩煜;;数据挖掘技术在医院信息系统中的应用[J];医学信息学杂志;2010年10期
8 翟红;黄庆华;陈方远;李友章;司锋刚;李杰;;医院数据深加工的研究探讨[J];医学信息(中旬刊);2010年06期
9 李怀庆;张文东;;数据挖掘技术在医院信息系统中的应用[J];医疗设备信息;2007年12期
10 李春涛;白英龙;;数据挖掘技术在医院HIS系统中的应用研究[J];中国误诊学杂志;2008年04期
11 董静怡;居益君;车永茂;;利用数据挖掘技术对平均住院日进行分析[J];中国医院统计;2008年03期
12 彭柳芬;周怡;夏毓荣;冯博华;;数据挖掘技术在临床决策中的应用研究[J];数理医药学杂志;2008年03期
13 熊友生;徐祖铭;;数据挖掘技术在医院资金分析管理中的应用[J];医学信息;2009年09期
14 代伟;朱敏;;基于HIS门诊信息资源的数据挖掘与利用[J];医疗卫生装备;2011年03期
15 刘丽华,周忠彬,金水高;基于数据仓库技术建立医院统计数据资源库的应用研究[J];中国医院统计;2005年03期
16 喻晓芬;王峥;过湘钗;;数据挖掘技术在手术室医院感染管理中的应用[J];中华医院感染学杂志;2008年01期
17 吴德贻;;数据挖掘技术及其在医院管理里中的应用[J];中国医疗器械信息;2009年07期
18 廖汗成;;数据仓库在临床诊断系统中的应用[J];中国数字医学;2007年01期
19 庄军;李峰;叶世清;刘侃;何皎;;HIS系统中药物医嘱序列模式挖掘[J];医疗卫生装备;2007年07期
20 汪涛;;医院信息系统中的数据挖掘[J];医学信息;2008年02期
中国重要会议论文全文数据库 前10条
1 陆炜;汤伟丽;;数据挖掘和医疗设备成本核算[A];2009年浙江省医学工程学术年会论文汇编[C];2009年
2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
4 张衍浩;张安宁;薛冠华;;医院信息系统十年回顾及展望[A];2004年中华医院管理学会学术年会论文集[C];2004年
5 吴佩智;;如何制定医院信息系统《HIS》开发计划[A];齐齐哈尔市首届学术年会论文汇编[C];2004年
6 吴新跃;;如何保障医院信息系统安全稳定运行[A];中华医学会第十二次全国医学信息学术会议论文汇编[C];2006年
7 张勇;;医院信息系统在医院管理中的重要作用[A];内蒙古医学会第一届医学工程专业学术研讨会论文汇编[C];2001年
8 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
9 李晶;张曼;;浅谈医院信息系统的现况[A];新疆医学工程学会第四届学术年会论文汇编[C];2002年
10 高峰;;借力信息新技术 建设数字化医院[A];2007中国口腔医院管理与信息化研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 易静;医院信息数据挖掘及实现技术的探索[D];重庆医科大学;2007年
2 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
3 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
4 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 吕英华;数据仓库技术在医院信息系统中的应用[D];吉林大学;2007年
2 南军红;数据挖掘技术在医院信息系统中的应用[D];华北电力大学(北京);2007年
3 夏冉;医院收费信息的数据分析和挖掘研究[D];苏州大学;2008年
4 马平川;基于电子病历的糖尿病数据分析与管理系统的设计和实现[D];华东师范大学;2009年
5 唐泽君;物资与固定资产管理系统(MFS)—医院信息系统(HIS)分系统[D];电子科技大学;2010年
6 韩祥永;面向医疗服务的医院信息系统开发与应用研究[D];昆明理工大学;2003年
7 殷杰;数据挖掘在医疗信息分析中的研究与应用[D];重庆大学;2007年
8 尹晓健;基于粒子群优化的神经网络在药品管理中的应用[D];新疆大学;2008年
9 段刚龙;XAUT医院信息系统设计与开发研究[D];西安理工大学;2005年
10 吴伶俐;数据挖掘技术在基于XML的电子病历中的应用研究[D];武汉理工大学;2006年
中国重要报纸全文数据库 前10条
1 代巧;乳房结核莫误诊[N];大众卫生报;2007年
2 北京同仁医院 张友平;征服结核病的艰难历程[N];保健时报;2009年
3 上海市(复旦大学附属)公共卫生临床中心结核病科主任、上海市结核病学组首席核心组员 卢水华;年轻人就与结核病无缘吗[N];上海科技报;2009年
4 记者 李晓;我市结核病治愈率87%[N];苏州日报;2010年
5 胡文华;结核病呈卷土重来之势[N];中国医药报;2000年
6 记者 叶明旻;我市结核病治愈率高于国际平均水平[N];镇江日报;2011年
7 刘泉;治疗结核病[N];健康报;2004年
8 记者何丰伦;怎样防治结核病?[N];人民日报;2003年
9 记者 张杰 陈猛;预防结核病不可忽视青春期[N];齐齐哈尔日报;2006年
10 张丽娜;专家说:结核病的预防胜于治疗[N];中国中医药报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978