收藏本站
收藏 | 论文排版

面向本体学习的粒计算方法研究

邱桃荣  
【摘要】: 随着Web发展,面向主题的领域数据源(本文称为领域信息系统)不仅越来越多,而且其包含的信息非常丰富。这类数据源可以归属于半结构化数据源,具有内部结构不完整、内容不完备或不精确或不确定、数据量大、动态和分布式存储等特点。如今,从这类数据源中用于实现知识抽取和知识表示的方法正变得日益重要。 然而,现有的本体学习方法基本上是基于非结构化和结构化数据源下提出的,对半结构化数据源进行本体学习时一般按基于非结构化方法进行相应处理,而没有充分考虑半结构化数据源本身具有的隐含结构特征。从现有的文献资料看很少专门介绍基于半结构化数据源的本体学习方法与技术的阐述。因此,从领域信息系统中实现知识抽取以构建近似本体必然给本体学习算法带来很大的挑战。 另一方面,虽然在粒计算数据挖掘方面有不少学者进行了广泛深入的研究,但从领域信息系统这类数据源中进行基于粒计算的数据挖掘方法研究还不多见。由于粒计算在不完备、不确定信息处理和对复杂问题近似求解方面具有特殊的优势,所以针对领域信息系统,通过研究基于粒计算的数据挖掘方法不仅扩展数据挖掘、知识发现的理论与方法,而且将为在复杂数据源下的本体学习提供一条有效的途径。 本文以粒计算理论为指导,针对领域信息系统就面向本体学习的粒计算方法进行了一些探索性的研究工作。 本文的主要贡献表现在以下几个方面: (1)通过对领域信息系统中信息函数的扩展,给出了领域信息系统的形式化描述和相应的粗糙集,提出了面向本体学习的领域概念粒度空间模型 首先,由于领域信息系统可以归属于一种半结构化数据,具有数据不完备又有数据值是多值等特点,需要对信息函数进行扩展。通过扩展的信息函数可以定义领域信息系统中对象之间的各种关系,包括等价关系,由此给出了相应的粗糙集模型,从而拓展了粗糙集应用环境。 其次,从面向本体概念学习和分类学习的需要出发,针对领域信息系统提出了一种逐层粒化方法生成具有不同抽象程度的信息粒(本文称为对象粒),并从粒计算的近似概念观点出发定义了对象粒的特征描述和相应的特征支持集,构建了领域对象粒度空间。将对象粒及其特征描述结合为一个整体定义为概念粒,以此来体现领域(近似)概念。并通过层次粒化所生成的领域对象粒度空间诱导出相应的领域概念粒度空间。讨论了概念粒度空间中概念粒之间的关系、概念粒之间的运算、有关性质和领域不确定信息的粒近似表示,分析了概念粒度空间模型的特点。并将基于领域信息系统的本体概念学习和分类关系归结为概念粒度空间生成的过程。 (2)针对领域本体概念和概念之间关系获取的需要,提出领域多层次概念获取的粒计算方法 基于所提出的领域概念粒度空间模型,针对领域信息系统中特征值具有不确定或不精确的情形定义了具体的粒化准则,提出领域多层次概念获取算法(CGS),从而为领域信息系统的本体概念学习和分类关系学习提供了一种有效的解决方法和实现技术。并在该算法的基础上针对领域信息系统具有动态特征和分布性特征提出了领域多层次概念获取的增量方法(CGS2),从而能有效地适应动态数据源的需要。通过算法测试比较、原型演示测试,以及本体学习原型演示系统的仞步应用表明所提出的方法是有效的。 (3)针对领域本体关系概念获取的需要,提出领域多维多层次之间关联关系挖掘的粒计算方法 通过关联关系的挖掘来实现领域本体关系概念及非分类关系的学习是一种经常使用的方法。先前的方法是针对非结构化数据源在已经具有概念集的基础上发现概念之间的关联关系。本文应用特征值域概念层次结构和关联关系挖掘的优化策略,提出了基于粒计算的领域多维多层次关联关系挖掘算法(G—Approach)。对所提出的算法进行详细的实例说明,并选择不同类型数据集和其他典型挖掘方法进行不同角度的测试与比较。测试结果表明了所提出的方法是有效的。另外,本文所提出的领域多维多层次之间关联关系挖掘的粒计算方法是直接运行于领域信息系统上,用于发现具有不同概念层次之间的关系概念。因此,所提出的方法不仅扩展了对复杂数据源数据挖掘方法,而且为领域本体关系概念学习提供了一种有效的解决方法与实现技术。 同时基于G-Approach方法提出领域多维多层次间关联关系的粒计算增量挖掘方法(G-Approach2),从而能适应动态的或分布式的领域信息系统的需要。实验测试与比较结果表明对非稠密型数据源G-Approach2方法比G-Approach方法具有更好的性能,但对完全属于稠密型数据集的测试结果却不如直接采用CGS方法好。因此,这需要我们进一步深入分析研究,以图改进增量方法使之能对稠密型数据集有更好的性能。 (4)针对本体非分类关系学习的需要,提出基于不同概念粒度空间的概念粒间交叉关系获取方法 针对同一领域信息系统从不同的角度或侧面构建不同领域概念粒度空间,通过分析粒间上下文,提出了基于不同领域概念粒度空间的概念粒间交叉关系获确椒āS纱宋恿煊蛐畔⑾低辰辛煊虮咎宓姆欠掷嘌疤峁┝艘恢钟行У慕饩龇椒ㄓ胧迪旨际酢? (5)提出基于粒计算的本体学习框架 结合形式概念格提出基于粒计算的简单本体生成算法;提出基于粒计算的本体学习框架。该框架主要包括三个部分,一是领域概念获取,二是领域概念间关系的获取,三是将所获取的概念和关系映射为本体类和关系,包括类映射、关系映射和实例映射等;基于该框架和面向本体学习的粒计算方法设计了相应的原型演示系统,通过具体的数据集的测试运行验证了所提出的框架和算法是有效的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张韬;胡旻;;互联网Web数据挖掘模型设计与技术实现[J];卫星与网络;2010年10期
2 王艳;;数据隐私保护技术综述[J];知识经济;2011年14期
3 杜垒;王飞;;数据挖掘在学生管理中的应用[J];科技信息;2011年18期
4 李想;;PLE编码在关联数据挖掘中的应用[J];电脑知识与技术;2011年15期
5 张博;张超伟;;中药方剂数据挖掘中的数据预处理研究[J];电脑知识与技术;2011年17期
6 杜英;;关联规则挖掘研究[J];知识经济;2011年14期
7 李炳燃;张金哲;;数据挖掘在设备故障诊断专家系统知识获取中的应用[J];科技信息;2011年20期
8 张红艳;都娟;;关联规则中Apriori算法的应用[J];数字技术与应用;2011年08期
9 吴旭东;柳炳祥;;聚类分析在高校图书馆管理中的应用[J];电脑开发与应用;2011年09期
10 吕鸣剑;;数据挖掘在知识工程中的应用研究[J];电脑知识与技术;2011年23期
11 熊芃;邓蓓;;数据挖掘在图书馆读者借阅系统中的应用[J];九江学院学报(自然科学版);2011年02期
12 刘亚楠;;网络信息检索在统计中的应用[J];现代营销(学苑版);2011年08期
13 王颖洁;;模糊聚类分析在数据挖掘中的应用研究[J];大连大学学报;2011年03期
14 胡锟;杨路明;;浅谈移动CRM客户价值细分[J];电脑知识与技术;2011年13期
15 鹿莉霞;;关联规则在课程相关性分析中的应用[J];电脑知识与技术;2011年14期
16 汪明;;SQL Server 2008 R2关联规则研究[J];电脑知识与技术;2011年16期
17 冯艳玲;;一种基于数据挖掘的HIFU温度估计方法[J];电脑知识与技术;2011年16期
18 朱渊萍;;一种新的时间序列相似性模式发现算法[J];海南师范大学学报(自然科学版);2011年02期
19 况莉莉;;Microsoft关联规则在高校图书馆中的应用[J];宿州学院学报;2011年05期
20 华振楠;;多维度数据挖掘中目标相关维度选取方法对比[J];企业科技与发展;2011年10期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国博士学位论文全文数据库 前10条
1 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年
2 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
3 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
4 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
5 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
6 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
7 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
8 罗建宏;粒计算分类知识发现算法及其应用[D];浙江大学;2010年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 陈玉明;基于信息粒与粒计算理论的数据约简研究[D];南昌大学;2005年
2 沈亚兰;基于粒度计算的数据挖掘方法的研究[D];沈阳工业大学;2006年
3 苏蕊;数据挖掘中关联规则算法的研究[D];上海海事大学;2007年
4 张亮;基于粒度和概念格的知识发现模型研究[D];合肥工业大学;2006年
5 赵小龙;粒计算在数据挖掘中的应用研究[D];西南交通大学;2007年
6 刘明生;粒计算及其在本体学习中应用的研究[D];南昌大学;2007年
7 赵敏;基于粗糙集理论的属性约简算法研究[D];长沙理工大学;2008年
8 孙小林;金融数据挖掘中的增量聚类算法及应用研究[D];华中科技大学;2004年
9 孙迪;基于关联规则的数据挖掘算法研究[D];电子科技大学;2010年
10 马丽娜;基于Web的数据挖掘技术研究[D];山东师范大学;2002年
中国重要报纸全文数据库 前10条
1 本报记者 郭白岩;大众点评网向数据挖掘要收益[N];中国经营报;2011年
2 本报记者 黎宇文;博时基金王德英: 数据挖掘促进基金精细化管理[N];中国证券报;2011年
3 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
4 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
5 赵纪元;数据挖掘在CRM中的应用[N];人民邮电;2001年
6 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
7 黄献东;鞍钢冷轧厂实施数据挖掘系统项目[N];中国冶金报;2011年
8 刘光强;靠数据挖掘抓住客户的心[N];中国计算机报;2009年
9 赵骏飞;数据挖掘在金融行业的应用[N];中国保险报;2011年
10 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978