收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

混合数据知识发现的粗糙计算模型和算法

胡清华  
【摘要】: 机器学习和知识发现是人工智能最重要的研究方向,而复杂环境下信息的不确定性和不一致性是知识发现面临的主要困难。粗糙集理论模拟了人类认知推理中粒化和近似的特点,是刻画分类数据的不一致性程度的有效数学工具,已经成功应用于符号数据知识发现,但是还没有系统研究广泛存在的符号、数值和模糊变量共存的复杂分类问题。本文提出在人类的思维中存在6种决策的一致性假设。基于粗糙计算方法论中粒化和近似的思想,本文分别建立了这些一致性假设的数学模型,并给出了一般形式。具体从以下几个方面进行了探索: 第一,提出了度量空间多粒度分类学习的邻域粗糙计算模型和算法。度量空间中点的δ邻域形成了论域的一种粒化结构,基于邻域粒化建立了度量空间的邻域粗糙集模型,形成了度量空间分类分类一致性的粗糙计算模型。邻域的大小可视为分析分类的粒度,改变邻域的大小可形成混合数据分类一致性的多粒度分析工具。基于邻域粗糙集模型设计了边界样本选择算法和混合数据属性约简算法。 第二,提出了混合数据分类分析的核模糊粗糙计算模型和算法。当前模糊粗糙集的研究主要集中于模糊近似算子的构造,忽略了对模糊粒化结构的分析。研究发现一大类核函数计算的核矩阵都满足模糊等价关系的性质,从而可引入这些核函数为模糊粗糙计算建立模糊粒化结构。本文提出了基于核函数粒化的核模糊粗糙集模型,建立了分类模糊一致性分析的数学模型。设计了基于核近似的混合属性重要度评价指标,探讨了模糊依赖度函数和特征评价算法ReliefF之间的关联,提出了抗噪声的属性约简算法和大样本集的样本加权重采样方法。 第三,提出了混合数据描述的有序决策问题的模糊偏好粗糙分析模型。有序分类学习是一大类分类学习任务,在多标准决策分析中具有重要的地位。本文引入多标准决策分析中广泛使用的模糊偏好关系,并将其与广义的模糊粗糙集模型结合起来,从而建立了混合数据排序一致性分析的模糊粗糙计算模型。 第四,给出了一系列粗糙计算模型的一般形式,统一了Pawlak粗糙集、邻域粗糙集、核粒化粗糙集和模糊偏好粗糙集,从而建立了粗糙数据分析的统一视角。并且基于一般模型,提出了各种近似空间的不确定性的统一度量模型。分析表明多种近似空间的不确定性程度都可以采用这一信息函数进行刻画。由此,本文给出了混合数据描述的一般分类问题和有序决策问题的一般信息度量理论。 第五,本文分析了各种粗糙集属性评价指标的参数和样本稳定性。研究表明,信息熵和模糊信息熵是非常稳定的属性评价指标,少量样本的扰动不会对属性约简产生影响,而邻域依赖度和邻域一致性是不稳定的评价函数,评价结果易受样本扰动影响。 第六,设计了混合数据约简的算法平台,测试了各种算法在真实分类中的性能,并提出采用选择性集成方法利用多个约简的互补信息。某些决策系统可以得到一组约简,每个约简都保持了原始数据分类的一致性,提供了分类数据的一种理解视角。基于选择性多分类器集成的研究成果,本文提出有选择地集成部分约简训练的分类器构造多分类器系统,并且设计了前向贪心选择和后剪枝的分类器选择策略,试验表明该方法能够获得相对紧凑并且分类能力很强的多分类器系统。 本文的研究建立了符号和数值数据共存的混合决策系统的粗糙计算模型。基于邻域粗糙集模型和核粒化的模糊粗糙集模型,本文建立了混合数据一般分类问题的统一计算模型。接下来又基于模糊偏好粗糙模型建立了混合数据有序分类问题的粗糙计算模型。最后,本文基于广义的粗糙模型统一了一般分类问题和有序分类问题的粗糙计算模型,并为各种粗糙计算模型提出了统一的信息度量理论,从而形成了一大类决策问题的粗糙计算理论。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐马陵;;混合数据库解行业应用难题[J];每周电脑报;2007年09期
2 李士进;朱跃龙;刘净;;一种基于k-prototype的多层次聚类改进算法[J];河海大学学报(自然科学版);2007年03期
3 任涛;丛小杰;翁志成;陈志勇;姜会林;杨大任;李共德;周秀良;于德英;杨妹清;;用混合数据库系统实现科学工程数据库[J];光学机械;1992年01期
4 郭金玉,张健,曾静;混合数据校正法在间歇过程中的应用[J];沈阳化工学院学报;2005年01期
5 张艳丽;郑诚;;一种混合属性数据的聚类算法[J];微型机与应用;2011年03期
6 刘若辰;钮满春;焦李成;;一种新的人工免疫网络算法及其在复杂数据分类中的应用[J];电子与信息学报;2010年03期
7 王剑;地理信息系统(GIS)与公路数据库[J];交通与计算机;1994年03期
8 高智慧,王任阁;混合型数据库的发展[J];现代图书情报技术;1994年03期
9 蔡荣太;王延杰;;稀疏混合数据的矢量聚类分析与应用[J];系统仿真学报;2008年22期
10 胡卓玮;宫辉力;赵文吉;李小娟;;一种新型的灾害救助撤离路线分析方法——基于混合空间数据的研究[J];自然灾害学报;2008年06期
11 李德仁,李清泉;一种三维GIS混合数据结构研究[J];测绘学报;1997年02期
12 倪燕;;混合数据库悄然来临[J];软件世界;2007年07期
13 陈志勇;丛小杰;翁志成;任涛;姜会林;杨大任;李共德;于德英;周秀良;杨妹清;;中国光学镜头数据库系统设计[J];光学机械;1992年01期
14 李相枢;MIS系统的组成和构件模型[J];计算机工程与应用;1999年01期
15 刘晶;郭雷;聂晶鑫;;基于SVM的一种新的分类器设计方法[J];计算机应用研究;2006年07期
16 石峰,吴旭光,王晓利,徐德民;基于时/频混合数据的鲁棒辨识[J];西北工业大学学报;1999年04期
17 何亮;史永哲;刘加;;联合因子分析中的本征信道空间拼接方法[J];自动化学报;2011年07期
18 童莉葛,王立,汤学忠,赵立合,李化治,刘资;智能管理系统中数据库和模型库间的混合数据传输方式[J];河北理工学院学报;1997年04期
19 黄金才;陈文伟;;基于多值属性和数值属性数据的遗传分类算法[J];计算机科学;2001年02期
20 ;广播与广播系统[J];电子科技文摘;2001年08期
中国重要会议论文全文数据库 前10条
1 令狐大智;李陶深;;一种面向混合数据的自反馈模糊聚类分析算法[A];广西计算机学会2007年年会论文集[C];2007年
2 饶翔;邓波;杨树强;史殿习;;基于混合数据流管理系统模型的海量数据聚集查询优化[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 梁莹;陈红;;度量值上基于bitmap编码的混合数据压缩算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 钱毅;周玉辉;裴家成;;基于灰色预测理论的加速寿命试验评估方法研究[A];2009年全国机械可靠性技术学术交流会暨第四届可靠性工程分会成立大会论文集[C];2009年
5 叶玮琳;宋占伟;郑传涛;;基于CAN总线网络的数据融合系统实现[A];2009全国虚拟仪器大会论文集(一)[C];2009年
6 李燕凌;曾福生;;农村公共品供给效率实证研究[A];建设我国现代化农业的技术经济问题研究——中国农业技术经济研究会2007年学术研讨会论文集[C];2007年
7 王桂安;余先川;方李根;张婷;;快速独立成分分析及其在矿产预测中的应用[A];第七届全国数学地质与地学信息学术会议论文摘要汇编[C];2004年
8 向垂益;何怡刚;;曼彻斯特码在RFID防碰撞算法中的应用[A];第二十届电工理论学术年会论文集[C];2008年
9 江倩苗;赵燕平;;基于电子邮件分析的企业员工网络监测模型[A];第12届全国信息管理与工业工程学术会议论文汇编[C];2008年
10 张正华;王宇;;基于四类融资结构划分的上市公司融资行为特征研究[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年
中国博士学位论文全文数据库 前7条
1 胡清华;混合数据知识发现的粗糙计算模型和算法[D];哈尔滨工业大学;2008年
2 冀进朝;针对多维混合属性数据的聚类算法研究[D];吉林大学;2013年
3 廖志芳;大肠早癌辅助诊断数据挖掘方法研究[D];中南大学;2008年
4 李常有;维修决策理论研究及其在离心压缩机转子系统中的应用[D];哈尔滨工业大学;2009年
5 范黎林;基于产业链协作平台的商务智能架构及数据挖掘技术研究[D];西南交通大学;2009年
6 王玉荣;中国上市公司融资结构研究[D];对外经济贸易大学;2004年
7 谢小平;基于静息态脑fMRI数据的时空非线性动力学特性分析[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 杨军;中国畜牧业增长与技术进步、技术效率研究[D];中国农业科学院;2003年
2 杨文静;数字信号的模糊平滑方法[D];南京理工大学;2009年
3 肖聪;基于混合数据的证券客户聚类研究[D];天津师范大学;2010年
4 谢信喜;符号聚类新方法的研究及应用[D];江南大学;2008年
5 宋婷;基于模糊等价关系的数据约简方法研究[D];山西大学;2010年
6 谷冰川;基于混合数据非参数方法的税收收入能力估测[D];浙江工商大学;2011年
7 王丽丽;不完备系统中混合数据关联规则挖掘的研究[D];长沙理工大学;2008年
8 王艳侠;基于CBR和MADM的多Agent推荐系统研究[D];河北师范大学;2010年
9 张扬;混合属性数据聚类算法及其应用[D];大连理工大学;2013年
10 赵英会;我国家电业上市公司资本结构优化研究[D];河南大学;2007年
中国重要报纸全文数据库 前10条
1 于翔;混合数据库时代何日降临?[N];网络世界;2007年
2 林雨;IBM混合数据库助力电子病历[N];民营经济报;2007年
3 于翔;混合数据库策动技术变革[N];网络世界;2008年
4 本报记者 于翔;DB2走过1/4世纪[N];网络世界;2008年
5 王如;数据库与XML[N];网络世界;2002年
6 邹功达 李风华 顾娟;可转债定价经验模型研究[N];上海证券报;2005年
7 米笑;宽带接入的另一种选择[N];中国计算机报;2003年
8 本报实习记者  朴晓玉;走进新的沟通时代[N];国际商报;2006年
9 于翔;普及仍需时日[N];网络世界;2006年
10 ;思博伦:服务效能与网络安全[N];网络世界;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978