收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本语义分块的中医病情分类问题研究

付钊  
【摘要】:中医智能医疗研究对于解决我国中医传承难、中医资源匮乏、中医“看病难”等一系列问题,具有十分重要的意义。其中,智能辩证是中医智能医疗中最基本而又最关键的一步。本文通过将智能辩证问题抽象为一个病情文本分类问题,首先提出基于分块向量的病情文本相似性计算方法,将病情文本按照所描述的病位划分为块,并赋予各个病位块不同的权重来区分主次症状,通过计算块向量的余弦夹角找出两段病情文本的相似症状。然后,结合自然语言处理和数据挖掘相关技术,给出了中医病情文本分类模型。最后,以中医肾病综合征七种分型患者的病程数据为基础,通过实验将基于文本块向量相似性的病情分类模型与传统的文本分类模型进行对比。实验结果表明,本文提出的基于文本块向量相似的病情分类模型具有更高的准确性。论文主要贡献如下:1)研究传统的文本表示、文本相似性计算方法,并分析各个方法的优缺点,实现基于TF-IDF特征的随机森林病情分类模型和SVM病情分类模型,两种模型F1 值为 75.38%和 75.20%。2)针对中医病情文本,提出了一种基于分块向量的病情文本特征表示方法,更准确的表达了文本语义;以病位词的文档频率为块权值,区分主次症状。3)在基于分块向量的病情文本特征表示方法的基础上,提出了一种基于文本分块向量的相似性计算方法(Similarity Based On Block Vector,SBBV算法),并与现有的文本相似性计算方法做实验对比,证明该方法的准确率明显高于现有方法。4)在基于文本块向量特征的文本相似性计算方法的基础上进一步提出了相应的中医病情文本分类模型,综合F1值达到90.81%。最后,融合病情的非文本特征,提出了多维度的中医病情分类方法,综合F1值较文本分类模型提升近1%。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 汪明霓;BASIC文本系统[J];计算机应用研究;1988年01期
2 易树鸿;张为群;;一种基于粗集的文本数据特征信息的挖掘方法[J];计算机科学;2002年08期
3 潘大胜;;不确定噪声下海量文本数据的模糊挖掘算法研究[J];微电子学与计算机;2017年09期
4 王珊珊;冯利鑫;;基于新词识别的大数据聊天文本舆情热点挖掘[J];电子商务;2018年01期
5 陈晓峰;如何在flash中读入外部文本数据[J];电脑知识与技术;2004年13期
6 施瑞朗;;基于社交平台数据的文本分类算法研究[J];电子科技;2018年10期
7 张玉红;陈伟;胡学钢;;一种面向不完全标记的文本数据流自适应分类方法[J];计算机科学;2016年12期
8 袁鹏;江媛媛;;多元化文本数据的智能提取[J];测绘与空间地理信息;2015年09期
9 王海燕;胡学钢;李培培;;基于向量表示和标签传播的半监督短文本数据流分类算法[J];模式识别与人工智能;2018年07期
10 陈伟;勾东升;徐发亮;;基于文本数据分析的大数据审计方法研究[J];中国注册会计师;2018年11期
11 刘俊华;利用Excel生成的文本数据提高工作效率和质量[J];山西交通科技;2005年01期
12 杨爱芹;;大规模文本数据的分类系统的设计与实现[J];现代计算机(专业版);2012年25期
13 宗峰;;基于MapReduce技术的海量文本数据统计方法研究[J];山东英才学院学报;2017年04期
14 张椿琳;;汽车行业文本信息炼金术[J];经营者(汽车商业评论);2018年06期
15 朱林源;;公司披露文本分析研究进展[J];现代经济信息;2018年02期
16 李长镜;赵书良;池云仙;罗燕;;文本情感分类方法的分析[J];电子世界;2018年03期
17 谢攀;邓珍荣;朱益立;;结合文本信息量和聚类的文本裁剪算法[J];计算机工程与设计;2018年03期
18 何进安;;Excel中转换大量文本数据和准确计算年龄的方法[J];农村电工;2009年07期
19 徐阳;王志杰;钱诗友;;基于分布式平台Spark的空间文本查询分析[J];华东师范大学学报(自然科学版);2018年05期
中国重要会议论文全文数据库 前10条
1 易天元;叶春生;;工业锅炉图纸输入的文本数据处理[A];1997中国控制与决策学术年会论文集[C];1997年
2 陈光强;杨树强;张晓辉;李润恒;贾焰;;面向海量文本数据的多任务并行调度加载技术研究与实现[A];第15届全国信息存储技术学术会议论文集[C];2008年
3 周纯洁;黎巎;徐翼龙;;文本情感分析研究[A];中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集[C];2018年
4 刘伟;陈春林;;基于注意模型深度学习的文本情感倾向性研究[A];第19届中国系统仿真技术及其应用学术年会论文集(19th CCSSTA 2018)[C];2018年
5 丁兆云;贾焰;周斌;;基于文本数据的多维层次式舆情计算模型的研究与实现[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
6 李洋;倪丽萍;李莹;;电子商务平台在线评论对冰箱销量的影响——基于文本情感分析方法[A];第十三届(2018)中国管理学年会论文集[C];2018年
7 李锋刚;张亚南;汪兵;;基于词向量和AP聚类的短文本主题演化分析[A];第十三届(2018)中国管理学年会论文集[C];2018年
8 苏变萍;侯筱婷;;文本数据的非线性降维方法研究[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
9 李虎;邹鹏;贾焰;周斌;;一种基于Map Reduce的分布式文本数据过滤模型研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
10 刘建伟;于守健;乐嘉锦;;基于分裂-凝聚的Web新闻主题聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 徐康;基于主题模型的文本情感和话题建模的研究[D];东南大学;2017年
2 胡卉芪;空间文本数据的量质融合与推送[D];清华大学;2016年
3 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
4 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
6 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
7 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
8 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
9 龚才春;短文本语言计算的关键技术研究[D];中国科学院研究生院(计算技术研究所);2008年
10 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
中国硕士学位论文全文数据库 前10条
1 余文礼;基于深度学习的多类标文本分类算法研究[D];哈尔滨工业大学;2017年
2 付钊;基于文本语义分块的中医病情分类问题研究[D];浙江大学;2018年
3 付宇博;基于决策树的英语文本难度评估研究[D];华中师范大学;2018年
4 郝利栋;基于深度学习的短文本情感分类研究[D];华东师范大学;2018年
5 李伟;基于决策树的网页敏感词过滤系统设计[D];西北农林科技大学;2018年
6 夏亮;面向电子商务评论文本的情感分析技术研究[D];华中师范大学;2018年
7 唐玉茹;空间文本数据发布/订阅研究[D];华中师范大学;2018年
8 王逍翔;基于Simhash的文本相似性检测研究与改进[D];昆明理工大学;2018年
9 范创;人机对话中的情感文本生成方法研究[D];哈尔滨工业大学;2018年
10 许萧宇;基于深度语义特征的文本情感分析方法研究[D];杭州电子科技大学;2018年
中国重要报纸全文数据库 前1条
1 通讯员 王成弟 刘欢 本报记者 廖志林;肺部常见疾病AI诊断产品呼之欲出[N];健康报;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978