收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

领域驱动知识发现方法研究

朱正祥  
【摘要】: 数据挖掘是一种常用的、从海量数据中获得潜在的、有用知识的发现过程,但传统的数据挖掘是以数据为驱动,强调挖掘过程的自动化,挖掘的结果中常常包括大量冗余、甚至错误的知识,无法直接应用于现实世界的实践活动。以挖掘用户感兴趣,可行动知识为目标的数据挖掘,需要将领域知识,特别是专家的偏好、经验、知识和智慧贯穿于整个挖掘数据过程中,变数据驱动的数据挖掘为领域驱动的数据挖掘,以弥补数据挖掘在学术研究与现实世界应用之间存在的鸿沟。另一方面,大量知识存在于人类载体中,特别是具有丰富理论与实践经验的领域专家,对于复杂问题的求解需要直接以领域专家为挖掘对象,获得群体专家对复杂问题的共识知识,并通过两种知识发现方式的相互补充、验证,从而能获更为全面、准确的知识。 本文应用管理科学、计算机科学及综合集成方法论,以领域知识为驱动、数据与领域专家为挖掘对象研究获取用户感兴趣、可行动知识的方法,并将这种方法称为领域驱动知识发现,主要的研究内容包括: 1、在分析传统数据挖掘存在不足的基础上,研究如何将领域知识贯穿到整个数据过程的方法,进一步丰富、充实领域驱动数据挖掘的相关理论。针对传统数据挖掘过程模型CRISP-DM存在的不足,提出一个新的领域驱动数据挖掘过程模型,并引入综合集成系统方法论指导领域驱动数据挖掘过程。 2、提出一个基于语义的Apriori改进算法以实现将领域知识整合到挖掘算法中,以满足获取不同层次、不同目的的挖掘需求。 3、研究如何在领域专家研讨获得专家的共识知识。在分析专家知识特点的基础上,建立专家知识模型,在对专家共识分析时,提出用对应分析方法从专家与专家意见两个维度同时进行聚类并在二维平面上进行映射,以挖掘专家之间,专家与意见之间的聚类知识,同时改进一个二分图网络投影压缩算法,并将其应用于计算专家的意见相似度中,以定量化方法描述专家意见的相似性和独立性。 4、在上述理论研究的基础上,设计开发一个以领域知识为驱动知识发现平台,利用该平台分别从数据和专家两种知识载体为对象挖掘名老中医的学术思想,实证结果表明领域驱动知识发现方法的可行性及优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱正祥;顾基发;宋武琪;;从数据挖掘到专家挖掘[J];系统工程;2009年01期
2 张晶;张斌;胡学钢;;基于领域知识的冗余关联规则消除算法[J];合肥工业大学学报(自然科学版);2011年02期
3 邢平平,施鹏飞,熊范纶;数据挖掘技术在农业数据中的有效应用[J];计算机工程与应用;2001年02期
4 梁凯强;陆菊康;;基于领域本体与概念格的关联规则挖掘[J];计算机工程与设计;2007年13期
5 王栋;向阳;张波;;本体在数据挖掘系统中的应用研究[J];计算机工程与应用;2009年05期
6 李锐利;;数据挖掘中聚类算法的研究[J];山西冶金;2010年03期
7 朱正祥;顾基发;高蕊;;基于旋进原则的领域驱动数据挖掘方法研究[J];情报学报;2010年06期
8 王洪春;彭宏;;一种基于熵的聚类算法[J];计算机科学;2007年11期
9 赵连胜,行飞;数据挖掘的任务、对象和方法[J];内蒙古大学学报(自然科学版);2002年02期
10 李彩霞;张瑛;;面向主题的智能化查询分析研究[J];青海科技;2008年06期
11 夏师;梁碧珍;陆月然;罗明山;;聚类分析研究进展[J];现代计算机(专业版);2009年03期
12 张瑞雪;解晨光;郝春梅;;关联规则算法优化研究[J];黑龙江科技信息;2010年14期
13 曾海泉;胡勤友;周水庚;胡运发;;基于互关联后继树的时序模式挖掘[J];模式识别与人工智能;2003年03期
14 王德兴;胡学钢;刘晓平;王浩;;改进购物篮分析的关联规则挖掘算法[J];重庆大学学报(自然科学版);2006年04期
15 刘齐宏;唐常杰;李川;朱军;刘齐巍;乔少杰;蒋永光;;基于多基准属性概化的知识归纳[J];四川大学学报(工程科学版);2007年02期
16 倪涛;刘耀;;基于C4.5挖掘算法的纳税评估模型设计[J];现代计算机(专业版);2007年09期
17 潘海为;谭小雷;韩启龙;;领域知识驱动的医学图像关联模式挖掘算法[J];黑龙江大学自然科学学报;2009年05期
18 唐常杰;段磊;王悦;杨宁;朱军;代礼;;干预规则挖掘的任务分类和三项技术进展[J];计算机应用;2010年01期
19 王振宇;杭小树;边历峰;;一种基于时间窗口的关系数据库中挖掘序贯模式的算法[J];模式识别与人工智能;2001年03期
20 张秋余,张红,马彦宏;基于Web信息领域的知识库模型的研究与设计[J];微机发展;2003年12期
中国重要会议论文全文数据库 前10条
1 张文凌;李晋宏;;应用领域知识的数据预处理方法的研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
2 于波;王宏鼎;唐世渭;童云海;;基于数据挖掘的数据质量分析研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
3 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
4 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
5 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
6 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
7 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
8 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
9 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 朱正祥;领域驱动知识发现方法研究[D];大连理工大学;2010年
2 许兆新;基于元知识的数据挖掘系统研究[D];哈尔滨工程大学;2003年
3 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
4 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
5 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
6 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
7 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 周循;基于领域知识的面向分类的属性泛化研究[D];合肥工业大学;2008年
2 胡谢斐;基于多重关系领域知识的分类问题研究[D];合肥工业大学;2006年
3 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
4 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
5 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
6 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
7 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
8 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
9 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
10 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978