收藏本站
《安徽大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

基于商空间的构造性数据挖掘方法及应用

张燕平  
【摘要】: 随着计算机模式识别技术的研究和发展,其应用范围也在不断拓展,这使得许多实际问题,如金融工程预测、基于内容的多媒体数据库检索等领域的识别分类成为可能。总结这类问题,可以发现它们表现出的共有特征:①属于海量数据的处理问题,问题的特征空间维数高,提供的样本数量大而且所涉及的类别数目多。②牵涉的因素很多,问题本身是个不完备信息系统。③采集的数据中存在着难以明确界定的噪音信息。 针对这类问题,本文展开了一系列的研究探讨,主要工作包括: 1.分析这类问题求解的一种可行方案是:用商空间法来合理地对复杂问题进行粒度描述,分解复杂问题为可求解的。提出对分解后的不同粒度的子问题,引入构造性机器学习方法首先获取不同粒度的学习规则,然后再合成相关的规则,最终得到复杂问题的综合规则。 2.针对相同粒度中如何得到学习规则问题,提出了多侧面递进MIDA的基本框架,对原有的超球面覆盖算法进行了必要的改进。指出了覆盖方法最优之处在于覆盖领域完全真实地反映了样本的分布情况,给出了在此方法中需要进一步研究的三个问题。第一个是对该算法识别的正确率与泛化能力之间矛盾的解决,利用没有被任何覆盖领域覆盖的样本(即拒识向量),引入了多侧面递进的处理方法MIDA(Muliside increasing by degrees algorithm)。第二个是如何改进覆盖方法,使得覆盖领域可以识别噪音(即异动向量),为此引入了覆盖领域涵盖的向量个数为识别中的权值。第三是如何减少所得到的覆盖领域的数目,为此引入了重复覆盖方法RCA(Repeat cover algorithm)和去除覆盖领域过小的方法,这有利于提高网络的泛化能力。一个值得研究的方案是将覆盖的思想(或基于覆盖的对数据的描述方法)应用于特征选择的主分量分析,为此,引入点对的概念,提出了点对主分量分析方法DPCAA(Double-point Principal Component Analysis Algorithm)。 3.在商空间模型中,利用商拓扑形成的多数据源,提出了一种新的 概率决策型数据挖掘规则算法DDMR。作者认为:对于高维海量数据的对 象,用多侧面递进方法进行划分、分解,使它由难变易;而对于多表描述 的复杂的数据库或数据仓库,则可认为是给定了多侧面的一个复杂对象, 因此,在商空间的模型下,两者可用相同的方法分析、处理、识别。 股市的运行是一个非常复杂的不完备的非线性过程,因此,需要用对 不完备信息进行处理的非线性模型代替传统的统计模型,以便进一步提高 股市预测的质量。本文将构造性机器学习算法用于建立股市分析的商空间 模型,其中的主要工作有: 1.结合股市趋势预测这一实际问题,建立了股市分析的商空间模型, 将多侧面递进算法MIDA、概率决策型数据挖掘规则算法DDMR应用于时间 序列的预测问题。 2.对序列问题的预测,提出处理的方法应尊重数据本身规律,不人 为的采取另行预处理,以便能挖掘出对象的本质规律。对采集的股市数据, 直接按一定的时段、交易量组成序列,进行识别分类,实验测试结果令人 满意,因此,提出的方法具有普遍意义。
【学位授予单位】:安徽大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前1条
1 张持健,李旸,张铃;商空间理论(粒度计算方法)实现高精度模糊控制[J];计算机工程与应用;2004年11期
中国博士学位论文全文数据库 前2条
1 赵姝;计算智能及其在气象信息分析中的应用[D];安徽大学;2007年
2 方宏彬;粒度计算中的不确定性问题研究[D];安徽大学;2006年
中国硕士学位论文全文数据库 前3条
1 汪小寒;商空间粒度计算理论在时间序列预测中的应用[D];安徽大学;2007年
2 杨凯;模糊商空间下的不确定性问题研究[D];太原理工大学;2007年
3 曹洁;基于案例推理的数据挖掘算法搜索策略的研究[D];太原理工大学;2007年
【参考文献】
中国期刊全文数据库 前7条
1 张铃,张钹,吴福朝;神经网络的规划学习算法[J];计算机学报;1994年09期
2 许涤龙,王珂英;上海股市有效性与可预测性并存的实证研究[J];经济问题;2001年11期
3 方子良;时序法在股市行情技术分析中的应用[J];南京理工大学学报;1999年02期
4 张铃,张钹,殷海风;多层前向网络的交叉覆盖设计算法[J];软件学报;1999年07期
5 张铃,张钹;M-P神经元模型的几何意义及其应用[J];软件学报;1998年05期
6 马军海,陈予恕,刘曾荣;动力系统实测数据的非线性混沌模型重构[J];应用数学和力学;1999年11期
7 张铃,张钹;多层反馈神经网络的FP学习和综合算法[J];软件学报;1997年04期
【共引文献】
中国期刊全文数据库 前10条
1 吴福朝,张铃;基于突出特征的联想记忆神经网络[J];计算机研究与发展;1997年01期
2 陶卿,曹进德,孙德敏;基于线性规划的联想记忆神经网络模型[J];计算机学报;2001年04期
3 刘林;喻国平;;基于自组织特征映射(SOM)网络对潜在客户的挖掘[J];南昌大学学报(理科版);2006年05期
4 张铃,张钹;M-P神经元模型的几何意义及其应用[J];软件学报;1998年05期
5 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
6 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
7 于海涛;Rough集理论在数据约简中的应用[J];安徽教育学院学报;2004年03期
8 汪小寒;项响琴;陈洁;;燃料管理与智能分析网络系统设计与实现[J];安徽教育学院学报;2006年03期
9 张燕平;提取特征规则的重复覆盖算法(RCA)[J];安徽大学学报(自然科学版);2002年02期
10 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
中国重要会议论文全文数据库 前10条
1 刘锡兰;杨昱;;支持相量机方法在渤海湾风暴增水强度预报中的应用[A];节能环保 和谐发展——2007中国科协年会论文集(二)[C];2007年
2 鲍林江;贾世发;;电网经济运行实时分析监测系统的研究[A];2003中国电机工程学会电力系统自动化专委会供用电管理自动化分专业委员会成立暨第一届学术交流会议论文集[C];2003年
3 李雪红;叶燕华;;水工混凝土结构裂缝主要成因挖掘的粗集方法[A];第五届混凝土结构耐久性科技论坛论文集[C];2006年
4 由立真;穆志纯;;基于GHSOM网络预测客户欺诈行为[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
5 张影;;基于Oracle的空间碎片减缓设计专家数据库系统[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
6 郭锋;刘丽丽;吕凝;;基于LLE和SVM的人像识别方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
7 张艳宁;郑江滨;赵荣椿;;一种有效的遥感图像识别方法[A];第九届中国体视学与图像分析学术会议论文集[C];2001年
8 王伟;郑东良;;支持向量机的分类机理研究[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
9 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
10 石培培;刘红英;;具有单个等式和界约束二次规划的新算法[A];中国运筹学会第八届学术交流会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 刘慷;超临界二氧化碳二元体系临界性质的理论研究[D];北京化工大学;2002年
2 陈莉;KDD中的几个关键问题研究[D];西安电子科技大学;2003年
3 罗忠辉;大型薄板坯热连轧机异常振动与故障监测研究[D];广东工业大学;2005年
4 张道强;基于核的联想记忆及聚类算法的研究与应用[D];南京航空航天大学;2005年
5 刘皓玮;行车指挥系统的Petri网建模与列车运行调整的遗传优化的研究[D];铁道部科学研究院;2000年
6 李桃;烧结过程智能实时操作指导系统的研究[D];中南大学;2000年
7 施式亮;矿井安全非线性动力学评价模型及应用研究[D];中南大学;2000年
8 莫玮;神经网络在自适应均衡中的应用研究[D];西安电子科技大学;2000年
9 董建华;面向大规模定制生产模式的产品设计技术研究[D];大连理工大学;2000年
10 阎石;结构振动智能控制的人工神经网络与模糊逻辑方法研究[D];大连理工大学;2000年
中国硕士学位论文全文数据库 前10条
1 李辛夷;大空间建筑火灾数值模拟研究[D];重庆大学;2003年
2 时文;基于人工神经网络的平面图像识别研究[D];武汉理工大学;2005年
3 刘海勃;基于RBF神经网络的期货走势预测模型研究[D];大连海事大学;2006年
4 李福乐;高速数据采集和目标识别理论及技术研究[D];西安电子科技大学;1999年
5 吕且妮;多级衍射全息光栅与神经网络的光学互连[D];陕西师范大学;2000年
6 唐红梅;客户机/服务器模式下图像检索技术及应用[D];河北工业大学;2000年
7 董法军;基于超媒体的智能教学系统的研究与开发[D];华北工学院;2000年
8 张勇;粗集理论及其在心电图自动分析中的应用研究[D];电子科技大学;2000年
9 赵会;地区宏观经济预测中的人工神经网络模型与方法研究[D];大连理工大学;2000年
10 何俊杰;船舶航向智能模糊控制系统及其仿真[D];大连理工大学;2000年
【同被引文献】
中国期刊全文数据库 前10条
1 王雪聪,唐晓青;基于产品平台技术的大规模定制质量保证研究[J];北京航空航天大学学报;2004年05期
2 张旭辉;宁汝新;张旭;;面向多视图的柔性编码系统研究与实现[J];北京理工大学学报;2006年01期
3 雍明培;余雄庆;;基于模块化产品平台的飞机族设计技术探讨[J];飞机设计;2006年04期
4 王艳东;黄克正;刘和山;王震亚;赵英新;;生长型产品族设计平台[J];工具技术;2006年09期
5 刘晓冰,董建华,孙伟;面向产品族的建模技术研究[J];计算机辅助设计与图形学学报;2001年07期
6 王爱民,孟明辰,黄靖远;基于设计结构矩阵的模块化产品族设计方法研究[J];计算机集成制造系统-CIMS;2003年03期
7 齐峰,谭建荣,张树有,王世伟;面向大规模定制设计的资源可重用模型及过程[J];计算机集成制造系统-CIMS;2004年05期
8 谢习华;何清华;周亮;;基于柔性结构的产品数据管理信息分类编码方法[J];计算机集成制造系统-CIMS;2005年12期
9 李响烁;祁国宁;杨青海;顾新建;;基于事物特性表的服装样板建模技术研究[J];计算机集成制造系统;2007年05期
10 刘明周,施培阔;客户化模式下面向产品的采购BOM研究[J];制造业自动化;2004年08期
中国博士学位论文全文数据库 前10条
1 桑大勇;基于部件的软件重用技术研究[D];西安电子科技大学;1998年
2 余军合;面向全生命周期虚拟产品模型的研究与应用[D];浙江大学;2002年
3 郑华林;面向大规模定制的生产管理模式及其产品族建模技术研究[D];重庆大学;2002年
4 徐晓刚;设计结构矩阵研究及其在设计管理中的应用[D];重庆大学;2002年
5 齐元胜;基于设计知识重用的集成产品快速开发技术的理论与实践[D];武汉理工大学;2003年
6 杨志雄;面向大规模定制的Web零件库的若干关键技术和系统的研究[D];浙江大学;2004年
7 丁祥海;制造企业信息化实施过程管理理论与方法研究[D];浙江大学;2004年
8 齐峰;产品设计信息可重用性及产品设计资源管理关键技术研究[D];浙江大学;2004年
9 张东民;支持工程机械产品快速设计的关键技术研究与实现[D];南京航空航天大学;2005年
10 耿志强;流程工业粒度数据挖掘技术研究与应用[D];北京化工大学;2005年
中国硕士学位论文全文数据库 前10条
1 王笑非;基于可重用技术的产品全生命周期管理[D];重庆大学;2006年
2 杨宾宏;制造企业信息对象采集与规范化[D];西北工业大学;2007年
3 林夕慧;我国高新技术企业技术标准化研究[D];浙江工业大学;2007年
4 李扬;我国工业企业标准化政策研究[D];山东大学;2007年
5 戴群;改进型前向神经网络的时间序列预测及其性能比较[D];南京航空航天大学;2003年
6 赵立军;基于MODIS数据的北京地区土壤含水量遥感信息模型研究[D];中国农业大学;2004年
7 白斌飞;基于神经网络理论的线性时间序列预测研究[D];西南交通大学;2005年
8 钱宇华;基于粗糙集的粒度计算理论与方法研究[D];山西大学;2005年
9 赵雪清;数据挖掘技术在电信客户流失中的研究与应用[D];大连海事大学;2005年
10 刘志强;基于神经网络的期权定价模型[D];重庆大学;2005年
【二级引证文献】
中国期刊全文数据库 前1条
1 刘岩;李友一;陈占军;葛文奇;;基于商空间理论的模糊控制在航空相机中的应用[J];南京航空航天大学学报;2006年S1期
中国博士学位论文全文数据库 前4条
1 刘仁金;基于商空间的纹理图象分割研究[D];安徽大学;2005年
2 张持健;商空间下模糊系统与模糊控制的问题求解[D];安徽大学;2005年
3 杨明;光纤智能结构的软计算方法研究[D];南京航空航天大学;2005年
4 赵立权;粒度计算的模型研究[D];安徽大学;2007年
中国硕士学位论文全文数据库 前3条
1 郑艺泉;基于粒度计算的模式识别及其应用研究[D];华侨大学;2006年
2 陈洁;多粒度建模及在燃料分析系统中的应用[D];安徽大学;2006年
3 朱永红;基于BS模式的燃料管理系统的研究[D];安徽大学;2007年
【二级参考文献】
中国期刊全文数据库 前3条
1 俞乔;市场有效、周期异常与股价波动——对上海、深圳股票市场的实证分析[J];经济研究;1994年09期
2 张铃,张钹;多层反馈神经网络的FP学习和综合算法[J];软件学报;1997年04期
3 张铃,张钹;M-P神经元模型的几何意义及其应用[J];软件学报;1998年05期
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026