收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本挖掘在中医药中的若干应用研究

周雪忠  
【摘要】:文本挖掘是人工智能、机器学习、自然语言处理、数据挖掘及相关自动文本处理如信息抽取、信息检索、文本分类等理论和技术相结合的产物,它得到了越来越多研究人员的关注。文本挖掘是数据挖掘研究面向文本数据的自然延伸,其研究仍处于婴儿期,在方法和应用方面均未成熟。中医药学作为生命科学具备中国特色的传统医学组成部分,在疾病诊治和方药使用等方面具有特色和显著的临床疗效,并包含着丰富的知识,几千年的医学实践积累获得了大量的数据。在中医药学信息化建设的基础上进行KDD研究具有重要意义。中医药领域未存在文本挖掘的相关研究,本文在多个方面如文献临床复方药物组成和科属配伍知识发现、中医术语及关系抽取和中医证候基因关系知识发现等进行了研究。本文研究内容包括如下四个方面: ● 进行基于字特征的中文文本分类研究,实验表明字特征是中文文本分类的高效特征表示方法。提出了分布字聚类方法,该方法无需分词、具有低达10~2数量级的特征维数和高性能的特点,其与NB结合的性能接近基于词特征的SVM分类器,微平均准确率达到86%。 ● 进行中医药文献信息抽取研究,提出了Bubble-bootstrapping和ATP方法,该方法无需任何浅层中文自然语言处理、专业词库和已标注的训练语料,是一种接近无导师的可缩放性、可移植性信息抽取方法。在近40万文献题录的复方名称和疾病名称抽取实验中,取得了平均准确率达99%,F1值65%左右的结果。应用于中医药文献自动标引的副主题词抽取,达到80%的F1值。ATP是一种semi-hard的模式方法,是未来信息抽取研究的技术方向之一。 ● 进行文献临床复方药物组成文本挖掘研究,提出了复方科属配伍的概念,并进行了临床复方科属配伍知识发现研究,实现了MeDisco/3T文本挖掘系统。MeDisco/3T实验表明,复方文本挖掘研究具有较高的质量和实际应用价值,复方用药中存在科属配伍的规律,并能进行挖掘发现。 ● 整合利用中医药文献库和生物医学文献库(Medline)进行中医证候和基因相关关系知识发现研究,实现了原型系统MeDisco/3S,并进行了初步实验和分析,表明MeDisco/3S能为辅助中西医结合研究和生命科学交叉研究提供智能化的知识发现平台,是进行生物医学文本挖掘和多学科信息整合研究的典型范例。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周雪忠;吴朝晖;;文本知识发现:基于信息抽取的文本挖掘[J];计算机科学;2003年01期
2 邹腊梅;肖基毅;龚向坚;;基于Maximum Likelihood与HMM的文本挖掘[J];计算机技术与发展;2007年12期
3 程志;黄荣怀;;文本挖掘及其教育应用[J];现代远距离教育;2008年02期
4 游宏梁;张巍;沈钧毅;刘挺;;一种基于加权投票的术语自动识别方法[J];中文信息学报;2011年03期
5 冯晋,李春平;基于统计学和语义信息的中文文本主题识别技术[J];清华大学学报(自然科学版);2005年S1期
6 区力;王新旭;陈敏;;Web文本挖掘技术在电力EIP的应用研究[J];现代计算机(专业版);2007年10期
7 张煜斌;陆建峰;李文林;陈涤平;;基于Meta-Bootstrapping的中医医案结构化研究[J];微电子学与计算机;2009年10期
8 ;浅析大规模文本数据挖掘技术在媒体中的创新应用[J];中国传媒科技;2007年11期
9 张燕;寒枫;楚红涛;;文本挖掘简述[J];中国电力教育;2006年S3期
10 孙玉娣;裴勇;;基于可视化文本挖掘的本体构建[J];情报杂志;2007年12期
11 程红莉;周宁;肖爽;;文本驱动的商务智能研究[J];情报科学;2007年10期
12 张克菊;韩毅;;关系抽取技术的发展与应用——以生物信息学为例[J];情报科学;2010年01期
13 薛中玉;李春梅;黄道雄;;基于文本挖掘的本体自动构建系统架构解析[J];计算机技术与发展;2011年01期
14 赵慧勤;基于因特网的信息检索特点与发展趋势[J];情报理论与实践;2000年05期
15 崔志明,谢春丽;基于Web的文本挖掘研究[J];微电子学与计算机;2002年10期
16 胥桂仙,朴泰雄,杨丹丹,徐小博,高旭;中文文本挖掘中最长频繁序列的发现算法[J];中央民族大学学报(自然科学版);2004年01期
17 张宏松;刘建辉;;面向Web的文本信息挖掘研究[J];计算机系统应用;2006年09期
18 渡部勇;;文本挖掘技术应用于专利检索分析[J];微电脑世界;2007年12期
19 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
20 付国瑜;;Web文本分类挖掘[J];科学咨询(决策管理);2008年03期
中国重要会议论文全文数据库 前10条
1 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
2 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
3 李穆;;用现代语言和传播媒体普及中医药知识的思考[A];2010年全国中医药科普高层论坛论文集[C];2010年
4 陈林;王晓华;李殿赟;文俊浩;;基于Web的自增模式文本挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
5 陈林;王晓华;李殿赟;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
6 鞠宝兆;;中医药科普创作要素的思考[A];2007全国中医药科普高层论坛文集[C];2007年
7 王莹;刘杨;;维基百科的文本聚类方法分析[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
8 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
9 李俊伟;;发挥中医中药的优势提升我省全科医学的创新力[A];2009年浙江省全科医学学术年会论文汇编[C];2009年
10 张巍;游宏梁;张吉才;;一种基于加权投票的术语自动识别方法[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
2 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
3 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
4 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
5 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
6 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
7 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
8 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
9 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
10 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
2 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
3 陶小波;电子就业文本挖掘系统关键技术研究与应用[D];浙江工商大学;2011年
4 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
5 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
6 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
7 李永波;基于数据挖掘的军事情报分析系统研究[D];重庆大学;2005年
8 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
9 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
10 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
中国重要报纸全文数据库 前10条
1 晓网;六剂“良方”保护中医药知识产权[N];中国中医药报;2009年
2 王娅妮;农村中医药发展亟待“拯救”[N];中国信息报;2005年
3 汪玮玮;专家把脉中医药知识产权保护[N];中国知识产权报;2004年
4 记者 周颖;黑龙江中医药积极参与新农合[N];中国中医药报;2005年
5 记者 向佳;加强中医药知识产权制度建设[N];中国中医药报;2011年
6 沈燕萍 鄢圣英;农村需要普及中医药知识[N];中国中医药报;2006年
7 洪净;WTO与中医药知识产权保护[N];健康报;2002年
8 记者 王泽议;中医药将在社区卫生服务中挑重担[N];中国医药报;2006年
9 张仕元;必须高度重视中医药知识产权保护[N];中国中医药报;2002年
10 本报记者  熊昌彪;围绕重点难点发展中医药[N];中国医药报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978