收藏本站
《安徽大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

构造性知识发现方法研究

吴涛  
【摘要】: 科学和网络技术的不断发展,数据的产生量急速增加,海量数据中知识发现成为人工智能领域研究的重要课题。决策树、神经网络、Bayesian网络等是当前知识发现的重要工具。但这些方法存在速度慢、网络结构难以确定等问题,难以满足知识发现对时效性的要求。张铃教授等在对BP等算法分析的基础上提出了基于覆盖的构造性机器学习方法,该方法根据样本自身的特点,构造神经网络,方法直观高效,较好地解决海量数据的处理问题。本文在分析当前知识发现中常用的分类方法的基础上,结合Rough集、SVM等理论,对该方法进行了深入研究,取得以下研究成果: (1) 基于覆盖的构造性学习方法直接根据样本数据构造覆盖网络,克服了传统神经网络计算中网络结构难以确定、运行速度慢、局部极小等问题,适宜于多类别、海量数据的处理。本文对该方法进行深入的分析,在领域构造、激励函数、距离函数等方面提出改进措施,实验证明这些改进进一步提高了覆盖算法的性能; (2) 学习样本的选择和学习顺序对神经网络的结构和网络的性能有直接影响,覆盖网络也与学习顺序密切相关,本文给出三种顺序覆盖方法,实验表明这些顺序覆盖方法不是最优的学习顺序,但其精度都接近或高于随机学习的平均值。在顺序覆盖的基础上,本文给出覆盖算法的增量学习和领域约简方法,有效地降低覆盖领域个数并提高覆盖网络的识别精度; (3) 由于描述对象的相关属性未知,现有的数据库使用大量的属性描述对象,大量冗余属性的存在,致使分类系统无法有效运行,合理选取属性特征,在保持分类能力的前提下,降低数据量,以提高分类的速度。Rough集理论为特征属性的选择提供了重要工具。本文利用Rough集方法选择属性,建立基于Rough的覆盖算法,在基本保持分类能力的前提下,提高分类的速度,并提出加权覆盖的设想。 (4) 建立在统计学习理论基础上的SVM方法,通过映射到高维空间和最大化分类间隔,构造最优分类超平面,具有较高的泛化能力和推广能力。本文分析了SVM与覆盖算法的共性和径向基函数的特点,提出基于径向基函数的覆盖算法,实验表明这一算法可以大幅度地降低覆盖个数和拒识样本数,同时实验也表明当参数选择适当时特征空间确实现线性可分。在 安徽大学博士学位论文 商空间理论的指导下,本文提出覆盖领域溶合的概念,并给出领域的最大 值融合和组合优化溶合的具体算法。领域溶合算法光滑了覆盖领域的分类 边界,简化了SVM问题求解的复杂度,提高了覆盖算法的性能,将覆盖 算法与统计学习理论结合起来,为覆盖算法提供了理论依据。 ⑤目前分类的方法众多,如何求出个数最少的分类超平面或者说隐层 元,一般是很困难的。本文利用样本集和超平面的对偶关系,提出求解分 类问题的对偶算法,它将样本集和超平面投影到各自的扩充空间,用遗传 算法的思想,给出求划分矩阵的连线搜索法,然后用粗糙集的约简方法求 出分类问题的解域,最后用求最大间隔解的方式求出问题的最优(次优) 解。这一方法仍须进一步完善,但为我们求解分类问题提供一个全新的方 法和思考问题的角度,具有广阔的应用前景和丰富的研究内容。
【学位授予单位】:安徽大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:TP301.6

【引证文献】
中国期刊全文数据库 前1条
1 张持健;汪力;;构造性神经网络覆盖算法的模糊化技术及其应用[J];安徽师范大学学报(自然科学版);2007年03期
中国博士学位论文全文数据库 前6条
1 许静;面向模块化产品平台的技术对象有序化及重用技术研究[D];浙江大学;2011年
2 段震;基于构造性学习的覆盖算法的发展及应用[D];安徽大学;2010年
3 赵立权;粒度计算的模型研究[D];安徽大学;2007年
4 郑婷婷;随机商分形模型及其在蛋白质分析中的应用[D];安徽大学;2007年
5 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
6 方宏彬;粒度计算中的不确定性问题研究[D];安徽大学;2006年
中国硕士学位论文全文数据库 前4条
1 严晨;多连通覆盖学习算法及其应用研究[D];苏州大学;2015年
2 丁旭玲;基于构造性神经网络的时间序列预测研究[D];太原理工大学;2011年
3 孙永春;应用神经网络预测调整井压力技术[D];大庆石油学院;2008年
4 王倩倩;基于覆盖算法的中文垃圾邮件过滤[D];安徽大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 张燕平,张铃,吴涛;机器学习中的多侧面递进算法MIDA[J];电子学报;2005年02期
2 叶少珍,张钹,吴鸣锐,郑文波;一种基于神经网络覆盖构造法的模糊分类器[J];软件学报;2003年03期
3 陶品,张钹,叶榛;构造型神经网络双交叉覆盖增量学习算法[J];软件学报;2003年02期
4 羌磊,肖田元,乔桂秀;一种改进的Bayesian网络结构学习算法[J];计算机研究与发展;2002年10期
5 刘红岩,陈剑,陈国青;数据挖掘中的数据分类算法综述[J];清华大学学报(自然科学版);2002年06期
6 张燕平;提取特征规则的重复覆盖算法(RCA)[J];安徽大学学报(自然科学版);2002年02期
7 柳回春,马树元;支持向量机的研究现状[J];中国图象图形学报;2002年06期
8 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
9 周志华,陈世福;神经网络规则抽取[J];计算机研究与发展;2002年04期
10 赵军,王国胤,吴中福,李华;基于粗集理论的数据离散化新算法[J];重庆大学学报(自然科学版);2002年03期
【共引文献】
中国期刊全文数据库 前10条
1 刘静;;基于决策树技术的CET-4成绩数据挖掘研究[J];赤峰学院学报(自然科学版);2015年24期
2 孙利;徐艳艳;;数据挖掘在居家养老服务管理信息系统中的应用研究[J];凯里学院学报;2015年06期
3 杜二玲;王英新;李俊华;;拟概率空间上样本受噪声影响的SLT关键定理[J];模糊系统与数学;2015年06期
4 柴雯;左美云;许伟;王轶博;;SNS中影响力用户预测研究——基于不平衡数据的多种数据挖掘方法对比[J];系统科学与数学;2015年09期
5 陈斌;苏一丹;黄山;;基于KM-SMOTE和随机森林的不平衡数据分类[J];计算机技术与发展;2015年09期
6 杨婷;滕少华;;改进的贝叶斯分类方法在电信客户流失中的研究与应用[J];广东工业大学学报;2015年03期
7 饶琛;;大数据挖掘中的数据分类算法技术研究[J];电子技术与软件工程;2015年14期
8 张翔;徐洪平;安雪岩;耿辉;张素明;;液体火箭发动机稳态运行故障数据聚类分析研究[J];火箭推进;2015年02期
9 叶平;;诱导覆盖粗糙模糊集[J];科教导刊(中旬刊);2015年04期
10 胡靖枫;何利力;周庆燕;;基于聚类分析的ABC库存分类方法研究[J];工业控制计算机;2015年03期
【同被引文献】
中国期刊全文数据库 前3条
1 张持健,张铃;前向FP神经网络实现控制系统的拒识模式[J];控制理论与应用;2005年03期
2 叶少珍,张钹,吴鸣锐,郑文波;一种基于神经网络覆盖构造法的模糊分类器[J];软件学报;2003年03期
3 张铃,张钹;多层反馈神经网络的FP学习和综合算法[J];软件学报;1997年04期
中国博士学位论文全文数据库 前10条
1 苏士勇;基于信息技术的大型企业集团管控研究[D];中国矿业大学(北京);2010年
2 苏楠;基于可拓逻辑的产品族配置设计方法[D];浙江工业大学;2009年
3 江伟光;产品集成建模关键技术及应用研究[D];浙江大学;2009年
4 邓军;面向产品生命周期的全面质量管理系统建模及实现技术研究[D];浙江大学;2009年
5 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
6 王丹;煤矿安全精细化管理及运行机理研究[D];中国矿业大学(北京);2009年
7 金茂竹;产品平台范围描述与评价模型研究[D];华中科技大学;2008年
8 马军;零件资源分类、建模与共享技术及其在零件库中的应用研究[D];浙江大学;2008年
9 崔剑;PLM需求流动链结构模型及其决策控制研究[D];浙江大学;2008年
10 王建正;基于产品平台的快速设计集成系统研究与开发[D];机械科学研究总院;2008年
中国硕士学位论文全文数据库 前5条
1 汪小寒;商空间粒度计算理论在时间序列预测中的应用[D];安徽大学;2007年
2 陈凯;反垃圾邮件技术的研究与实践[D];北京邮电大学;2006年
3 张启宇;基于贝叶斯算法的垃圾邮件过滤系统的研究与设计[D];曲阜师范大学;2006年
4 刘志强;基于神经网络的期权定价模型[D];重庆大学;2005年
5 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 鲍慧玲;;基于最大熵原理的多目标运动跟踪[J];安徽师范大学学报(自然科学版);2014年02期
中国博士学位论文全文数据库 前9条
1 贾秀芳;基于粒计算模型的知识推理理论与方法[D];中国科学技术大学;2014年
2 许静;面向模块化产品平台的技术对象有序化及重用技术研究[D];浙江大学;2011年
3 何富贵;商空间理论在网络路径分析中研究[D];安徽大学;2011年
4 郭翠翠;基于粒计算的地下空间监控预警方法研究[D];武汉理工大学;2010年
5 路强;面向功能的可视化创新概念设计方法研究[D];合肥工业大学;2010年
6 戢晓峰;基于交通信息提取的区域路网拥挤管理方法[D];西南交通大学;2009年
7 赵立权;粒度计算的模型研究[D];安徽大学;2007年
8 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
9 储节旺;企业应对危机的知识管理问题研究:能力、体系、机制与技术[D];南昌大学;2006年
中国硕士学位论文全文数据库 前1条
1 吴鲁辉;多李群核覆盖学习算法及其应用研究[D];苏州大学;2017年
【二级参考文献】
中国期刊全文数据库 前10条
1 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
2 周志华,陈世福;神经网络集成[J];计算机学报;2002年01期
3 王建芬,曹元大;支持向量机在大类别数分类中的应用[J];北京理工大学学报;2001年02期
4 周志华,何佳洲,尹旭日,陈兆乾;一种基于统计的神经网络规则抽取方法[J];软件学报;2001年02期
5 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
6 权光日,刘文远,叶风,陈晓鹏;连续属性空间上的规则学习算法[J];软件学报;1999年11期
7 张铃,张钹,殷海风;多层前向网络的交叉覆盖设计算法[J];软件学报;1999年07期
8 张朝晖,陆玉昌,张钹;利用神经网络发现分类规则[J];计算机学报;1999年01期
9 张铃,张钹;M-P神经元模型的几何意义及其应用[J];软件学报;1998年05期
10 马少平,夏莹,朱小燕;基于模糊方向线素特征的手写体汉字识别[J];清华大学学报(自然科学版);1997年03期
【相似文献】
中国期刊全文数据库 前10条
1 汪小寒;陈洁;张迎春;张燕平;张铃;;基于核覆盖算法的煤价预测[J];计算机技术与发展;2006年12期
2 马军;尹义龙;杨公平;许信顺;;2008自然计算与模糊系统和知识发现国际会议[J];国际学术动态;2009年06期
3 马军;尹义龙;杨公平;许信顺;;2008国际自然计算会议暨模糊系统与知识发现会议[J];国际学术动态;2009年01期
4 靳嘉林;王曰芬;;大数据环境下知识发现研究的变化及其发展趋向[J];数字图书馆论坛;2018年05期
5 宋小康;赵宇翔;朱庆华;;公众科学项目中知识发现的流程及内在机理研究[J];情报资料工作;2018年05期
6 ;欢迎订阅2017年《数据分析与知识发现》(月刊)[J];数据分析与知识发现;2017年01期
7 陶春丽;黄海东;;大数据知识发现的马克思主义追问[J];佳木斯大学社会科学学报;2017年05期
8 李怡;;基于数据挖掘技术的知识发现系统[J];科技创新导报;2017年21期
9 张松岩;崔鹏;;图书馆知识发现系统建设与应用研究[J];图书馆工作与研究;2014年02期
10 陀向明;;图书馆知识发现系统应用状况分析[J];科技情报开发与经济;2013年16期
中国重要会议论文全文数据库 前10条
1 杨志豪;林鸿飞;;生物医学文献中的隐含知识发现[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 万家华;刘冰;江早;;知识发现中的可视化技术[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
3 王泳霁;;数字档案管理中的知识发现与知识服务[A];“决策论坛——公共政策的创新与分析学术研讨会”论文集(上)[C];2016年
4 王纪凯;王鹏;张启彬;陈宗海;;激光数据特征提取与学习方法[A];第17届中国系统仿真技术及其应用学术年会论文集(17th CCSSTA 2016)[C];2016年
5 薛燕;李建良;朱学芳;;人脸识别中特征提取的一种改进方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
6 黄先锋;韩传久;陈旭;周剑军;;运动目标的分割与特征提取[A];全国第二届信号处理与应用学术会议专刊[C];2008年
7 孙威;阎石;郭鹏飞;;基于固定重构核函数的无网格法及其在弹性力学中的应用研究[A];第16届全国结构工程学术会议论文集(第Ⅰ册)[C];2007年
8 路文焕;曲悦欣;杨亚龙;王建荣;党建武;;用于无声语音接口的超声图像的混合特征提取[A];第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集[C];2015年
9 胡学钢;郭骏;王浩;袁兆山;;基于粗集与基于格结构的知识发现方法比较[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
10 刘克彬;李芳;刘磊;韩颖;;基于特征选择和语义扩展的词序列核函数研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前1条
1 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
中国博士学位论文全文数据库 前10条
1 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
2 张永;基于粗糙集的铁路列车客票收入知识发现及预测模型研究[D];中国铁道科学研究院;2018年
3 梁协雄;数据库中的知识发现及其应用研究[D];重庆大学;2004年
4 蒙祖强;基于分类模型的知识发现机理和方法研究[D];中南大学;2004年
5 单莘;基于知识发现的告警相关性分析关键问题研究[D];北京邮电大学;2006年
6 李存荣;产品制造信息中的知识发现及其应用研究[D];武汉理工大学;2006年
7 胡林;基于知识发现技术的林火研究[D];北京林业大学;2006年
8 张国庆;基于生物医学文献的知识发现方法研究[D];华中科技大学;2006年
9 朱传军;车间不确定信息的约简及知识发现研究[D];华中科技大学;2006年
10 刘书暖;工艺知识发现与重用技术[D];西北工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 牛娇娇;基于概念格的异构数据知识发现方法及算法实现[D];昆明理工大学;2018年
2 仵宁飞;基于橡胶材料库的知识发现与重用研究[D];西安工业大学;2018年
3 韩杰;基于公安交通数据的知识发现算法应用研究[D];河北科技大学;2018年
4 肖俊伟;因素空间上的知识发现与决策分析[D];郑州大学;2018年
5 褚嘉欣;数字化古籍知识管理研究[D];郑州大学;2018年
6 徐晓聪;基于知识发现的职业学校学生操行考核管理系统的设计与研究[D];广东技术师范学院;2018年
7 潘婷婷;地质空间大数据知识发现与信息提取关键技术研究[D];中国地质大学(北京);2018年
8 Kharin Anton;面向俄罗斯痹证范围高发病艾灸治疗配穴规律知识发现研究[D];燕山大学;2017年
9 孙晔琦;旅游景点现状分析[D];云南财经大学;2018年
10 薛冰莹;因素空间上的知识发现与因素约简[D];郑州大学;2017年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026