收藏本站
《上海交通大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

结合属性筛选的决策树分析及其在中医诊断中的应用

廖晓威  
【摘要】: 传统中医学作为世界医学的一个宝库,两千多年来为中国及世界人民健康做出了不可磨灭的贡献,但是由于传统中医诊断学体系具有很多的不确定性、模糊性的内容,严重阻碍了中医的普及、推广和发展,如何将充满模糊性的中医辨证过程进行规范化和客观化是本文研究的主要问题。本课题通过应用基于属性筛选的决策树分析技术,从中医肝硬化病例数据中发现症状与证候之间的规律并提取出相应的辨证规则,作为一种辅助工具供给医务工作者参考,为实现中医诊断的数字化和客观化提供了一条途径。 属性筛选作为一项重要的数据预处理技术,主要目的是识别和消除样本的属性集中与预测结果不相关的或冗余的属性。对于中医病例数据样本,由于采集数据代价较高,因此中医数据分类是典型的小样本分类问题。而且中医病例数据的维数相对来说较大,导致数据中的冗余和无关部分也会相应的增多。为得到更准确的辨证结果和辨证规则,在辨证前对数据进行属性筛选十分必要。 中医辨证的本质是证候分类。现有的分类方法很多,其中决策树算法是一种以实例为基础的归纳学习算法。它具有易于提取显式规则、适合处理非数值型数据、可以显示重要的决策属性和较高的分类准确率等优点,从而成为辨证模型构建及辨证规则提取的有效工具。 本文将围绕特征属性筛选算法和决策树分类模型进行研究,通过学习和总结前人的研究成果,提出一种结合属性筛选的决策树分析方法,并应用于中医肝硬化的辨证,旨在提供一种中医客观化诊断的新途径。本文主要工作包括以下方面: 首先,对属性筛选算法进行研究,分析了属性筛选的主要目的和过程,以及基于相关度信息为评价依据的属性搜索方式和属性组合评价策略,提出了一种自适应属性筛选算法A-FCBF(Adaptive Fast Correlation-Based Filter),该算法通过对不同筛选阀值所对应的筛选结果进行属性组合优劣性评定,能够自适应的找出最优筛选阀值与特征属性子集,降低了由于人为干预所可能引入的误差,提升了数据约简过程的操作性和准确性。 其次,对常用决策树算法的优缺点进行了总结,并从数据约简、决策属性选择和预剪枝策略等方面对传统算法进行了改进,提出了E-ID3(Enhanced Iterative Dichotomiser 3)决策树算法。以该算法进行决策树建模,首先将对原始训练数据进行特征属性约简;其次以相关信息增益度CIG(Correlated Information Gain)作为评估标准选定决策树各节点的分裂属性;在决策树的构建过程中,一旦树节点满足预剪枝标准,则停止对该节点继续分裂,并令该节点成为叶子节点。与传统算法相比,新算法提高了执行效率、预测精度,以及分类规则可理解性。 最后,将本文提出的分析算法应用到中医肝硬化证候辨证问题上,通过总结清晰的辨证规则为中医客观化诊断提供参考依据,同时为中医智能化辨证提供了一条可行性途径。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:R241;TP18

【引证文献】
中国期刊全文数据库 前2条
1 车志英;马利庄;何建成;;临床四诊信息与证候关联性分析研究进展[J];辽宁中医药大学学报;2012年06期
2 苏式兵;胡义扬;赵立平;曹志伟;马利庄;张永煜;张庆华;刘平;;慢性乙型病毒性肝炎中医证候生物学基础的研究思路[J];中国中西医结合杂志;2011年02期
中国博士学位论文全文数据库 前1条
1 褚娜;基于混合智能的中医辨证系统研究[D];上海交通大学;2012年
中国硕士学位论文全文数据库 前2条
1 钟蜜;基于模糊决策树的热轧工艺关键变量的分析与提取[D];武汉科技大学;2011年
2 洪弘;数据挖掘技术在中药水提液膜分离中的应用研究[D];南京中医药大学;2012年
【参考文献】
中国期刊全文数据库 前4条
1 赵翔,祁云嵩,刘同明;协方差及相关系数在决策树构造中的应用[J];华东船舶工业学院学报(自然科学版);2003年05期
2 曲开社,成文丽,王俊红;ID3算法的一种改进算法[J];计算机工程与应用;2003年25期
3 张琴,刘平,陈慧芬,陈良,曹素华,刘莺,魏建军,方志红,吴定中;肝炎后肝硬化中医证候特点的临床调查研究[J];中西医结合学报;2003年02期
4 张琴,刘平,陈惠芬,陈良,曹素华,刘莺,魏建军,方志红,吴定中;肝炎肝硬化中医证候特点的多元分析[J];中西医结合肝病杂志;2003年02期
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
6 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期
7 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
8 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期
9 左吉峰;乔均俭;;ID3算法的合理性证明及实验分析[J];保定学院学报;2008年04期
10 王晓红,高洪深;数据挖掘技术在大型超市中的应用研究[J];北方工业大学学报;2003年03期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 项凤梅;江一平;熊明芳;;益气养阴治疗慢性乙肝气阴两虚证候的临床观察分析[A];首届江西省中西医结合肝病学术研讨会、首届江西省中西医结合肝病新进展学习班资料汇编[C];2008年
3 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
4 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 张士玉;马丽仪;何勤;;基于熵理论的社会数据分析方法探讨[A];第十三届中国管理科学学术年会论文集[C];2011年
6 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
7 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
8 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
9 王枫;王志良;;油田数据仓库信息平台管理的实现[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
10 叶中行;陆青;余敏杰;;计算智能在银行信贷信用分类中的应用[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
中国博士学位论文全文数据库 前10条
1 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
4 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
5 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
6 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
7 李军;不平衡数据学习的研究[D];吉林大学;2011年
8 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年
9 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
10 杨明;分布式环境下的安全策略关键技术研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 郭慧;数据挖掘技术对放射工作人员知觉压力因素分析[D];郑州大学;2010年
3 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
4 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
5 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
6 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
7 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
8 郑陶;基于平面向量的决策树算法在高考志愿选择系统中的应用[D];辽宁工程技术大学;2010年
9 孙怡哲;一种改进的决策树算法研究与应用[D];辽宁工程技术大学;2010年
10 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 郭振球;论中医诊断学的发展[J];安徽中医学院学报;1988年03期
2 殷峻;王国清;范宝明;嵇晓;刘建荣;朱敏;;提高冷轧高强度钢板屈服强度控制水平的研究[J];宝钢技术;2006年01期
3 张鹏,鹿守理,高永生,赵辉,赵俊萍,曹辉;板带轧制过程温度场有限元模拟及影响因素分析(Ⅰ)[J];北京科技大学学报;1997年05期
4 曹美玲;张新峰;沈兰荪;;分类器融合技术在中医舌象老嫩识别中的应用研究[J];北京生物医学工程;2006年06期
5 徐红敏;王海英;梁瑾;黄帅;;支持向量机回归算法及其应用[J];北京石油化工学院学报;2010年01期
6 高风琴;徐慧媛;李筠;;慢性乙型肝炎病理诊断与中医证型关系初探[J];北京中医药;2010年07期
7 李靖;王硕仁;徐冰;高菁;;基于关联规则的IgA肾病中医证候与病理相关性的探讨[J];北京中医药;2011年09期
8 王鸿谟,张栋;中医色诊学的定位定量研究[J];中国医药学报;1998年04期
9 洪净;中医辨证的量化研究现状与展望[J];中国医药学报;2002年08期
10 杨丽平;李平;杜金行;李靖;邓德强;占永立;倪青;谢院生;金秀萍;史丽萍;房辉;刘阁玲;;350例2型糖尿病肾病患者中医证候分布及其与实验室指标的相关分析[J];中华中医药杂志;2010年05期
中国重要会议论文全文数据库 前1条
1 李乾构;;改革辨证模式——按主症与次症辨证施治[A];中华中医药学会脾胃病分会第十八次学术交流会论文汇编[C];2006年
中国博士学位论文全文数据库 前9条
1 孔志周;多分类器系统中信息融合方法研究[D];中南大学;2011年
2 王彦;中医证候的数据挖掘[D];上海交通大学;2009年
3 刘昆宏;多分类器集成系统在基因微阵列数据分析中的应用[D];中国科学技术大学;2008年
4 薛飞飞;基于数据挖掘的肝郁脾虚证研究[D];北京中医药大学;2008年
5 王刚;混合智能系统及其在商务智能中的应用研究[D];复旦大学;2008年
6 王晓锋;Web应用入侵异常检测新技术研究[D];华中科技大学;2007年
7 潘永兰;中药水提液无机陶瓷膜膜污染基础数据库的建立及数据的关联分析[D];南京中医药大学;2009年
8 赵静娴;基于决策树的信用风险评估方法研究[D];天津大学;2009年
9 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 钱俊;热连轧轧制过程温度模拟[D];武汉科技大学;2002年
2 皋军;基于模糊理论的数据挖掘技术的研究与应用[D];南京航空航天大学;2004年
3 谢竞博;关于模糊决策树生成过程中启发式算法的研究[D];河北大学;2004年
4 郝玲;ID3算法的模糊扩展研究[D];河北大学;2005年
5 肖根福;精轧温度过程控制模型研究[D];南昌大学;2005年
6 刘斌;支持向量机及其在信号处理中的应用[D];大庆石油学院;2006年
7 李春宇;基于径向基函数神经网络的中医脉象信号检测研究[D];重庆大学;2006年
8 朱晓峰;缺失值填充的若干问题研究[D];广西师范大学;2007年
9 宋健;基于数据挖掘方法的热轧带钢表面质量缺陷分析[D];上海交通大学;2008年
10 王鑫;加权支持向量机在可靠性预测中的应用[D];电子科技大学;2008年
【二级引证文献】
中国期刊全文数据库 前5条
1 张爱民;;清热解毒利湿法治疗慢性重型肝炎的临床疗效及其作用机制探讨[J];江西中医药;2012年09期
2 陆奕宇;宋雅楠;张贵彪;张永煜;苏式兵;;慢性乙型肝炎及其肝炎后肝硬化中医证候分类的系统生物学研究[J];世界科学技术-中医药现代化;2013年06期
3 管艳;张辉;张玮;苏式兵;;慢性乙型病毒性肝炎肝肾阴虚证与湿热蕴结证患者外周血的差异基因表达谱分析[J];中西医结合学报;2012年07期
4 王晓柠;胡义扬;;系统生物学与中西医“病证结合”研究[J];中西医结合肝病杂志;2011年06期
5 王世东;赵国屏;张庆华;;系统生物学在中医“证”本质研究中的应用[J];中国中西医结合杂志;2013年01期
中国博士学位论文全文数据库 前1条
1 刘姬艳;基于蛋白组学的肺结核病及其中医证候血清标志物筛选与鉴定[D];浙江大学;2013年
中国硕士学位论文全文数据库 前2条
1 史书真;股价时间序列的分析与预测研究[D];大连理工大学;2013年
2 王健;慢性乙型病毒性肝炎脾胃湿热证与肝郁脾虚证的microRNA差异表达研究[D];成都中医药大学;2013年
【二级参考文献】
中国期刊全文数据库 前6条
1 何浩明,田小平,苏彩女,徐凤英,冯岚,陈宽浩;肝硬化患者血浆纤维结合蛋白和纤维蛋白原检测的临床意义[J];放射免疫学杂志;1999年06期
2 郭景峰,米浦波,刘国华;决策树算法的并行性研究[J];计算机工程;2002年08期
3 滕皓,赵国毅,韩保胜;改进决策树的研究[J];济南大学学报(自然科学版);2002年03期
4 杨明,张载鸿;决策树学习算法ID3的研究[J];微机发展;2002年05期
5 中华医学会传染病与,寄生虫病学分会,肝病学分会;病毒性肝炎防治方案[J];中华肝脏病杂志;2000年06期
6 ;病毒性肝炎的诊断标准[J];中西医结合肝病杂志;2001年01期
【相似文献】
中国期刊全文数据库 前10条
1 张青,徐贵丽,庞云丽,方丽莎,徐亚萍;泌尿系感染3种治疗方案的决策树分析[J];中国药房;2001年11期
2 邱世犹;3种方案治疗下呼吸道感染的决策树分析[J];医药导报;2005年01期
3 王有森;公共卫生风险型决策分析——介绍一种决策树分析法[J];中国公共卫生;1991年10期
4 张永恩,叶伟东,向旭明,郑平;三种方案治疗小儿肺炎的药物经济学研究[J];广东药学院学报;2003年01期
5 张海波;沈晓波;孟玲;邵志高;;3种方案治疗社区获得性肺炎的决策树分析[J];中国药房;2007年32期
6 姜丽萍;胡善联;陈文;;肾移植免疫抑制治疗方案的决策树分析[J];中国药房;2007年02期
7 李文兵;周亦农;李清;;3种方案治疗非淋菌性尿道(宫颈)炎的决策树分析[J];中国医药导报;2010年32期
8 敖梅红;李隆玉;李凌;乔志强;;宫颈癌机会性筛查方案卫生经济评价初步探讨[J];中国妇幼保健;2009年09期
9 曹伟燕;王培承;蔡伟芹;孟祥臻;;居民住院卫生服务利用影响因素决策树分析[J];中国公共卫生;2009年05期
10 李冬果;陈斌;华琳;刘红;郑卫英;张金旺;;应用决策树挖掘人类淋巴母细胞的SNP遗传标记[J];中国优生与遗传杂志;2007年10期
中国重要会议论文全文数据库 前8条
1 周巍;杜月中;;舰船总体布置方案多目标模糊决策[A];2004年船舶与海洋工程学术研讨会论文集[C];2004年
2 聂广金;冯斐斐;吴拥军;吴逸明;;不同分类技术联合肿瘤标志在诊断和预测肺癌方面的研究[A];中国毒理学会生化与分子毒理专业委员会第六届全国学术会议、中国毒理学会遗传毒理专业委员会第五届全国学术会议、广东省预防医学会卫生毒理专业委员会学术会议、广东省环境诱变剂学会学术会议论文汇编[C];2008年
3 陈全;张玲玲;石勇;;基于知识发现的客户分析与营销策略研究[A];第三届(2008)中国管理学年会论文集[C];2008年
4 叶永安;田德录;蒋健;李志红;李筠;陈建杰;赵一鸣;王融冰;杨世忠;邵凤珍;季光;李梢;周大桥;刘铁军;成冬生;张玮;孙克伟;;慢性乙型肝炎(ALT≥2ULN)“肝郁脾虚”、“肝胆湿热”证候辨证诊断研究[A];第十八次全国中西医结合肝病学术会议论文汇编[C];2009年
5 梁建凤;;儿科常见病种住院费用的回归决策分析[A];应对突发公共卫生事件论坛论文集[C];2005年
6 王家华;高海余;刘炳;;可视化蒙得卡罗分析与油气产量预报的风险评价[A];第七届全国数学地质与地学信息学术会议论文摘要汇编[C];2004年
7 章维加;;供电企业有效管理的两种方法创新[A];第三届浙江中西部科技论坛论文集(第一卷)[C];2006年
8 胡伟;孙德翔;程翔;;试论数据挖掘技术在智能化航空维修管理系统中的应用[A];第四届长三角科技论坛航空航天与长三角经济发展分论坛暨第三届全国航空维修技术学术年会论文集[C];2007年
中国重要报纸全文数据库 前5条
1 邱世犹;三种治疗下呼吸道感染的决策树分析[N];医药经济报;2003年
2 刘庆;Excel决策树之初体验[N];网络世界;2006年
3 李璐;资本资产定价模型与现实期权理论[N];中国审计报;2003年
4 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
5 ;基于组件的智能CRM[N];计算机世界;2003年
中国博士学位论文全文数据库 前3条
1 向先全;基于水信息技术的渤海湾水生态环境特性及模拟研究[D];天津大学;2011年
2 路蝉伊;结核不同感染状态下宿主对结核特异性抗原获得性免疫应答的差异及相关分子标识筛选[D];复旦大学;2011年
3 彭佳红;湖南省生态公益林服务功能价值评价智能决策支持系统研究[D];湖南农业大学;2013年
中国硕士学位论文全文数据库 前10条
1 王燕飞;食管静脉曲张破裂出血治疗决策分析[D];山西医科大学;2005年
2 汪涛;数据挖掘在隧道交通中的应用[D];长安大学;2003年
3 邓松;基于决策树的区域电力系统电压稳定性评估[D];广西大学;2007年
4 宋静艳;工程造价工程量清单计价方法的理论与应用研究[D];西南交通大学;2009年
5 傅磊;岗位知识含量指标体系的构建及实证[D];东华大学;2004年
6 袁娟;数据挖掘在车险CRM中的应用研究[D];暨南大学;2007年
7 徐刚;决策树与Logistic回归结合在新型农村合作医疗制度实施效果研究中的应用[D];南昌大学;2007年
8 侯文喆;基于数据挖掘的银行信用卡客户细分研究[D];天津财经大学;2008年
9 赵璐;基于MATLAB的空间数据挖掘系统(M-SDM)设计与实现[D];山东师范大学;2008年
10 韩冰;股票投资行为模式研究[D];西南财经大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026