收藏本站
《东北石油大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于MAS的数据挖掘模型自动选择方法研究

高雅田  
【摘要】:各个行业部门积累了大量业务数据,迫切需要将这些数据转换成有用的信息和知识,数据挖掘(Data Mining, DM)引起信息产业界的极大关注。应用数据挖掘技术去解决各类实际问题,数据挖掘模型的选择与设计是主要的环节,也是能否有效处理应用问题的关键。传统的数据挖掘模型设计依赖建模人员的专业知识,在分析应用领域业务特征的基础上,通过重复的数据探索和算法测试建立挖掘模型,大大降低了工作效率与模型准确程度。随着新技术的出现,模型设计人员可能忽略一些重要的挖掘方法及有助于知识发现的算法技术。针对数据挖掘人工建模效率低、知识复用困难等问题,本文研究数据挖掘应用特征、技术特征及业务数据特征,探讨数据挖掘模型的自动建模方法,设计数据挖掘模型的评价体系;在数据挖掘自动建模方法研究的基础上,结合MAS(Multi-Agent System)技术,建立基于MAS的数据挖掘模型自动选择架构,并且应用于油田开发领域。 首先,通过引入挖掘模型自动选择方法所涉及的建模概念,明确特征、框架、目标、活动、方法、实体的基本意义,开发了数据挖掘模型选择通用技术。完成数据特征、业务特征、数据挖掘技术特征的具体抽象与定义,以符号的形式建立特征系统;基于节点模式,结合目标分析、活动分析、方法设计三个方面研究数据挖掘模型自动选择框架。以数据挖掘模型选择及设计为总体目标,将挖掘行为抽象为数据预处理、初步模型设计、模型调整、模型评估、知识表示五个基本活动。数据挖掘模型选择框架规范了数据挖掘模型自动设计各个阶段的目标及活动,组织挖掘业务与挖掘技术特征的具体逻辑关系,框架的设计基于目标、活动、方法等基本概念,利用节点表达挖掘过程中不同场景下需要的期望、响应及措施,表达挖掘模型选择不同阶段、不同层面的模型设计活动。为了完成可行数据挖掘模型集合求解任务,设计了基于DMMS_F (Data Mining Model Selection based on Feature, DMMS_F)及DMMS_E (Data Mining Model Selection based on Experience, DMMS_E)的求解方法。 其次,设计数据挖掘模型评价体系结构,研究从可行数据挖掘模型集合中选择相对适用的挖掘模型评估方法,进行挖掘模型评价目标建模,完成挖掘模型自动选择机制中模型评价目标的规范描述;探讨数据挖掘模型的综合评价方法,包括评价框架和评价因子的设计。兼顾主观因素与客观因素对挖掘模型评价的影响,研究基于层次的评价框架,采用可调整的方法设计评价因子的层次位置及权重,给出数据挖掘模型评价体系,设计挖掘模型质量的评价方法。 随后,将MAS技术引入数据挖掘模型自动选择方法的研究,建立基于MAS的DMMAS (Data Mining Model Auto Selection)模型框架;提出Agent集群概念与设计,通过外交角色、管理角色及劳务角色的引入实现Agent集群在挖掘模型选择设计过程的协作与交互;研究数据挖掘模型选择支持环境,分离数据挖掘模型设计方案的推理与运行,构建一个能够在知识合理组织基础上实现可能有效数据挖掘方案选择与配置的设计平台;就Agent技术实现而言,探讨Agent体系结构的设计及Agent协作模型的设计;在逻辑环组织结构的基础上,设计Agent动态管理平台,实现Agent的动态管理,主要包括Agent动态管理平台环形组织结构和动态管理平台对于Agent的管理方法;在模型研究的基础上,从系统开发角度分析基于MAS的DMMAS系统设计。 最后,在油田开发生产领域探讨了基于MAS的DMMAS应用,设计石油测井岩性识别挖掘模型选择框架及压裂措施选井系统,并从运行和应用角度评价其质量。在挖掘模型的设计中,应用数据挖掘模型通用选择建模的特征符合系统,并且给出具体的模型选择流程与结果,从开发角度展示了业务定义、自动数据选择、挖掘模型设计、模型比较等数据挖掘模型自动选择的实现,完成基于MAS的DMMAS模型的实例化。
【学位授予单位】:东北石油大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 李春生;檀坤;;基于Multi-Agent的数据挖掘模型及其应用[J];长江大学学报(自然科学版)理工卷;2008年04期
2 李春生;单继辉;杨冬黎;;基于规则的数据挖掘算法选择机制研究[J];长江大学学报(自然科学版)理工卷;2009年03期
3 郑庆生;韩大匡;;高阶神经网络在储层分布参数定量预测中的应用[J];地球物理学进展;2007年02期
4 唐秋华;刘保华;陈永奇;周兴华;丁继胜;;结合遗传算法的LVQ神经网络在声学底质分类中的应用[J];地球物理学报;2007年01期
5 孙东生;王红才;侯默;赵卫华;宋清新;刘振华;牛淑芳;;影响水力压裂效果的因素及人工神经网络评价[J];地质力学学报;2006年04期
6 尹传环;田盛丰;牟少敏;;一种面向间隙核函数的快速算法[J];电子学报;2007年05期
7 付宁;乔立岩;彭喜元;;基于改进K-means聚类和霍夫变换的稀疏源混合矩阵盲估计算法[J];电子学报;2009年S1期
8 李荣陆,胡运发;基于密度的kNN文本分类器训练样本裁剪方法[J];计算机研究与发展;2004年04期
9 刘向东 ,骆斌 ,陈兆乾;支持向量机最优模型选择的研究[J];计算机研究与发展;2005年04期
10 常群;王晓龙;林沂蒙;Daniel S.Yeung;陈清才;;通过全局核降低高斯核的局部风险与基于遗传算法的两阶段模型选择[J];计算机研究与发展;2007年03期
中国博士学位论文全文数据库 前1条
1 刘靖旭;支持向量回归的模型选择及应用研究[D];国防科学技术大学;2006年
中国硕士学位论文全文数据库 前1条
1 张弦;基于数据并行的BP神经网络训练算法[D];华中科技大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
2 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
3 王文姬;陆玉麒;胡子付;;连云港市区土地级别调整的实践性研究[J];安徽农业科学;2006年01期
4 门可佩;周丽;鲜丽华;;江苏粮食安全分析研究[J];安徽农业科学;2008年02期
5 田立新;崔晓红;徐伟军;;配送中心选址研究[J];安徽农业科学;2008年33期
6 门可佩;朱鸿婷;;我国区域生态安全的评价研究[J];安徽农业科学;2009年04期
7 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
8 武素华;;基于最小二乘支持向量机的土壤含水量检测的研究与分析[J];安徽农业科学;2009年09期
9 陈念;沈佐民;;基于化学成分检测和SVM分类的茶叶品质鉴定[J];安徽农业科学;2010年15期
10 黄灏然;俞守华;区晶莹;;农产品批发市场核心竞争力评价研究[J];安徽农业科学;2011年04期
中国重要会议论文全文数据库 前10条
1 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
2 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
5 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
6 吴静珠;刘翠玲;孙晓容;;支持向量机在近红外光谱检测技术中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
7 尹钟;张建华;;基于支持向量机方法的过程操作员功能状态分类[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 杨坤;纪志成;;基于峰值识别的改进SVM用电需求预测[A];中国自动化学会控制理论专业委员会B卷[C];2011年
9 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
10 谭龙;刘云;樊威;;改进的二次加权法在科技实力评价中的应用研究[A];第七届中国科技政策与管理学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
2 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
5 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
6 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
7 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
8 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
9 李先锋;基于特征优化和多特征融合的杂草识别方法研究[D];江苏大学;2010年
10 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
5 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
6 李翔;基于DEA方法的信息技术类上市公司绩效评价研究[D];浙江理工大学;2010年
7 姜念;区间自适应粒子群算法研究及其应用[D];郑州大学;2010年
8 赵鹏;基于模糊物元的中小型水电站增容改造方案研究[D];郑州大学;2010年
9 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
10 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 张治国,杨毅恒,夏立显;RPROP算法在测井岩性识别中的应用[J];吉林大学学报(地球科学版);2005年03期
2 冉启全,李士伦,顾小芸;神经网络模式识别沉积微相[J];沉积学报;1996年S1期
3 贺清碧,周建丽;BP神经网络收敛性问题的改进措施[J];重庆交通学院学报;2005年01期
4 邓娟,杨家明;一种改进的BP算法神经网络[J];东华大学学报(自然科学版);2005年03期
5 刘洪,赵金洲,胡永全,张绍伦,刘江雁;用T-S模型模糊神经网络进行压裂效果预测[J];断块油气田;2002年03期
6 位云生,胡永全,赵金洲,颜鑫,田继东;人工神经网络方法在水力压裂选井评层中的应用[J];断块油气田;2005年04期
7 朱明程,徐健,李昆华;采用MCU多层神经网络模型设计探讨[J];东南大学学报(自然科学版);2000年02期
8 文巨峰,罗翔,颜景平,周骥平,朱兴龙;基于多智能体的智能机器人分布式控制系统[J];东南大学学报(自然科学版);2003年01期
9 刘光鼎;我国油气资源勘探开发中存在的主要问题及对策[J];地球物理学进展;2005年01期
10 杨立强,宋海斌,郝天珧;基于BP神经网络的波阻抗反演及应用[J];地球物理学进展;2005年01期
中国硕士学位论文全文数据库 前3条
1 李华;SVM中多项式核函数的修改及Exon-Intron特征序列的研究[D];北京工业大学;2001年
2 周东树;支撑向量回归机(SVRM)的微分几何方法[D];北京工业大学;2001年
3 张治宏;基于MPI的并行计算研究[D];中国地质大学(北京);2006年
【相似文献】
中国期刊全文数据库 前10条
1 丁纪云,蔡春娥;利用构造数据集评定数据挖掘过程的方法[J];湖南广播电视大学学报;2001年02期
2 任承业,罗伟其;校园信息系统中CRM与数据挖掘的结合和应用[J];计算机工程与应用;2003年13期
3 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
4 邵红全,赵茜;用SQL Server2000实现数据挖掘的技术与策略[J];电脑开发与应用;2003年04期
5 耿庆鹏,卢子芳;利用数据挖掘技术实现对电信行业用户欺诈行为的预测[J];电信快报;2003年10期
6 蒋良孝,蔡之华;基于数据仓库的数据挖掘研究[J];计算技术与自动化;2003年03期
7 叶静,蔡之华;遥感图像中的数据挖掘应用概述[J];计算机与现代化;2003年10期
8 黄解军,万幼川,潘和平;银行客户关系管理与数据挖掘的应用[J];计算机工程与设计;2003年07期
9 崔强,朱卫东;基于数据挖掘的铁路机务段成本控制系统[J];铁路计算机应用;2003年01期
10 杨思春;基于数据仓库的数据挖掘技术分析研究[J];微机发展;2003年09期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 高雅田;基于MAS的数据挖掘模型自动选择方法研究[D];东北石油大学;2011年
2 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
3 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
4 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
5 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
6 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
7 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
8 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
9 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
10 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
中国硕士学位论文全文数据库 前10条
1 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
2 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
3 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
4 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
5 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
6 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
7 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
8 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
9 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年
10 刘华敏;数据挖掘在高职院校学生成绩分析中的应用[D];安徽大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026