收藏本站
《大连理工大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

序列模式挖掘在软件开发信息库中的应用

张甲武  
【摘要】: 随着计算机技术水平的提高和社会信息化的发展,各行各业对软件的需求不断增加,随之而来的是数据量的成倍增长和功能的不断细化。为了满足新的需求,软件开发人员需要不断的更新来完善系统,增强软件的生命力。但如今的计算机程序越来越庞大,环境变化也很频繁,加之各种文档的缺乏,使软件更新变的十分困难。 在软件更新过程中,涉及最多的就是源代码的修改,软件开发人员在更新软件系统时,经常需要跨模块的修改大量的源代码,而人工的从庞大的系统中找出每一个修改文件是非常耗时的,因此设计一个可以确定源代码文件相互关系的工具是十分必要的。 序列模式挖掘技术是数据挖掘技术的一个重要分支,被广泛的应用在各个领域,它可以从大量的历史数据中挖掘出隐含的、有用的信息。软件开发信息库是软件开发过程中所有相关数据总和,存储着大量的项目开发过程数据、源代码数据、相关文档等。本文设计的系统就是以序列模式挖掘技术为基础,挖掘软件开发信息库。 本文研究了序列模式挖掘的经典算法,对这些算法进行了比较。实现了PrefixSpan算法,在实现过程中,综合了对投影数据库存储优化和扫描优化的建议,提高了算法的执行效率。 本文设计的代码分析系统,在从Subversion中获取日志信息后,提出了三个分组准则对数据进行处理,之后对不同的分组数据进行挖掘,最后做了对比分析,不仅帮助软件开发人员提供了相关修改的建议,而且加深了软件开发人员对程序的理解。本系统同时提供XML格式的输出方式,在此基础上可以方便的进行二次开发。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP311.52

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 赵素娟;基于互联网的人物简历问答系统的研究与设计[D];东北财经大学;2010年
2 王健慧;基于本体的高血压电子病历本体库的构建及其规则推理研究[D];太原理工大学;2012年
【参考文献】
中国期刊全文数据库 前7条
1 刘莉,徐玉生,马志新;数据挖掘中数据预处理技术综述[J];甘肃科学学报;2003年01期
2 倪晓峰,赵文耘,张捷;构件软件配置管理以及其版本控制技术研究[J];计算机工程与应用;2005年02期
3 苏绍勇;潘金贵;;数据挖掘在软件维护中的应用[J];计算机科学;2005年10期
4 阳万安;李彦;;通用版本控制系统的研究和设计[J];计算机工程;2008年12期
5 白洁;李春平;;面向软件开发信息库的数据挖掘综述[J];计算机应用研究;2008年01期
6 陈卓;杨炳儒;宋威;宋泽锋;;序列模式挖掘综述[J];计算机应用研究;2008年07期
7 林英;张雁;;支持构件演化的软件配置管理研究[J];计算机工程与设计;2006年19期
中国博士学位论文全文数据库 前2条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
2 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 罗小江;韩建保;;车辆传动系运行状态监测信号的预处理[J];车辆与动力技术;2006年02期
2 刘妮;唐慧佳;;Web挖掘在基于标签的个性化推荐中的应用[J];成都信息工程学院学报;2007年04期
3 郑金彬;;一种基于m元树结构的序列模式挖掘[J];赤峰学院学报(自然科学版);2010年10期
4 王鹏飞;王坚;赵荣泳;;物流企业汽车油耗动态分析系统软件的关键技术[J];电脑知识与技术;2009年33期
5 石家亮;;新闻全文检索系统的数据预处理技术[J];电脑知识与技术;2010年23期
6 伍平阳;林意群;林木炎;;基于数据挖掘技术的医疗设备绩效预测方法的应用研究[J];南方医科大学学报;2008年02期
7 吴蓉晖,荣宏;数据预处理在电力远程智能监测系统的应用[J];高电压技术;2005年07期
8 魏建;;医学病历系统规则挖掘算法研究及模型设计[J];广西教育学院学报;2010年01期
9 鹿莉霞;;关联规则在课程相关性分析中的应用[J];电脑知识与技术;2011年14期
10 刘丽轻;丁巧林;张铁峰;陈健;;数据预处理方法对模糊C均值聚类的影响[J];电力科学与工程;2011年08期
中国重要会议论文全文数据库 前4条
1 寇纲;彭怡;石勇;;基于数据挖掘的软件缺陷度量评估管理及研究现状综述[A];第三届(2008)中国管理学年会论文集[C];2008年
2 寇纲;彭怡;石勇;;面向缺陷的软件系统可靠性管理研究现状评述[A];第十一届中国管理科学学术年会论文集[C];2009年
3 ;A General Framework for Medical Data Mining[A];Proceedings of 2010 International Conference on Future Information Technology and Management Engineering (FITME 2010) Volume 2[C];2010年
4 张国卿;马亚龙;同兰娟;孙明;;一种数字信号处理方法在数据预处理中的应用研究[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 姜保庆;关于弱比例规则的挖掘及推理研究[D];西南交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 宋卫林;基于最大频繁项目集的数据挖掘关联规则算法研究[D];北京邮电大学;2006年
4 马静华;基于运动信息获取及智能处理的运动员训练指导系统研究[D];中国科学技术大学;2006年
5 徐雪琪;基于统计视角的数据挖掘研究[D];浙江工商大学;2007年
6 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年
7 李宏;面向应用领域的分类方法研究[D];中南大学;2007年
8 夏骄雄;数据资源聚类预处理及其应用研究[D];上海大学;2007年
9 方辉;机械制造信息资源的非规范知识处理技术研究[D];四川大学;2007年
10 顾巧祥;面向产品全生命周期配置标识关键技术研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
2 黄学辉;数据挖掘分类技术在企业人才招聘中的应用研究[D];中国海洋大学;2010年
3 况莉莉;关联规则在高校图书馆读者数据处理中的应用研究[D];合肥工业大学;2010年
4 文志安;应急通信监控系统中采集数据预处理技术研究[D];沈阳理工大学;2010年
5 周绪倩;基于电子商务的Web数据挖掘系统架构研究[D];河北工程大学;2010年
6 王丽平;数据预处理技术在电厂中的应用[D];华北电力大学(北京);2004年
7 王书青;基于粗糙集理论的数据挖掘研究[D];河北农业大学;2004年
8 陈云樱;数据挖掘技术在移动通信行业客户关系管理中的应用研究[D];西南交通大学;2004年
9 黄新宇;紫外光谱数据库的构造与初步研究[D];中南大学;2004年
10 张龙翔;基于Frame页面过滤与关联规则的Web日志挖掘的研究[D];山东科技大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 李季,迟呈英;中文问答系统的研究[J];鞍山科技大学学报;2003年06期
2 李季;孙冀侠;;标准中文问答系统的研究与实现[J];鞍山师范学院学报;2005年06期
3 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
4 李伟明;;电子病历档案应用现状及前景的探讨[J];广东档案;2010年03期
5 林鸿飞;基于示例的文本标题分类机制[J];计算机研究与发展;2001年09期
6 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期
7 聂规划;罗迹;陈冬林;;电子目录的SWRL规则研究[J];计算机工程与应用;2011年07期
8 张永奎,赵辄谦,白丽君,陈鑫卿;基于互联网的中文问答系统[J];计算机工程;2003年15期
9 陈康;樊孝忠;刘杰;余正涛;;受限领域问答系统的中文问句分析研究[J];计算机工程;2008年10期
10 刘昌钰,唐常杰,于中华,杜永萍,郭颖;基于潜在语义分析的BBS文档Bayes鉴别器[J];计算机学报;2004年04期
中国硕士学位论文全文数据库 前10条
1 赵伟;基于Web日志的用户访问模式挖掘[D];天津大学;2004年
2 陈玉;基于事实性问题中文问答系统的研究与实现[D];山西大学;2006年
3 丁豪;基于自然语言处理的文本自动校对系统[D];电子科技大学;2006年
4 钱凌;一个基于本体和规则推理的查询系统的设计与实现[D];东南大学;2006年
5 张辉丽;计算机领域中文自动问答系统的研究[D];天津大学;2006年
6 刘春泳;中文问答系统中信息检索模型的研究[D];重庆大学;2007年
7 刘宝艳;面向生物医学领域的问答系统的研究与实现[D];大连理工大学;2007年
8 刘俊侠;序列模式挖掘及时间序列相似性搜索研究[D];辽宁科技大学;2008年
9 刘伟;基于限定领域的问句相似度[D];天津师范大学;2008年
10 孙艺峻;大规模网络安全态势分析中的报警关联挖掘[D];哈尔滨工业大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 牛兴雯,杨冬青,唐世渭,王腾蛟;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[J];计算机研究与发展;2004年10期
2 张坤;朱扬勇;;无重复投影数据库扫描的序列模式挖掘算法[J];计算机研究与发展;2007年01期
3 李必信,郑国梁,李宣东,张勇翔,梁佳;软件理解研究与进展[J];计算机研究与发展;1999年08期
4 彭鑫,赵文耘,朱崇湘;一个支持构件演化的配置管理框架[J];计算机工程与应用;2004年32期
5 毛国君;;数据仓库的质量管理问题和方法[J];计算机科学;2003年08期
6 崔建;李强;杨龙坡;;基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法[J];计算机科学;2011年04期
7 崔立新,苑森淼,赵春喜;约束性相联规则发现方法及算法[J];计算机学报;2000年02期
8 吕静,王晓峰,Osei Adjei,Fiaz Hussain;序列模式图及其构造算法[J];计算机学报;2004年06期
9 许兆新,周双娥,郝燕玲;决策支持系统相关技术综述[J];计算机应用研究;2001年02期
10 周宇,钱红兵;软件过程中的度量数据收集方法研究[J];计算机应用研究;2005年01期
【相似文献】
中国期刊全文数据库 前10条
1 高阳;;中国数据挖掘研究进展[J];南京大学学报(自然科学版);2011年04期
2 陈瑛琦;扶晓;刘劲;;可视化数据挖掘技术[J];电脑编程技巧与维护;2011年14期
3 罗健萍;吴海;;数据挖掘技术中基于关联规则算法的研究[J];硅谷;2011年13期
4 蒋晖;陈允锋;;数据挖掘及其一种关联规则算法[J];计算机与数字工程;2011年06期
5 金育婵;;数据挖掘技术中基于关联规则算法的研究[J];科技传播;2011年12期
6 唐学军;;基于网格的运动训练数据挖掘研究[J];现代计算机(专业版);2011年10期
7 李霞;;数据挖掘在分布式入侵检测中的研究[J];信息与电脑(理论版);2011年06期
8 冯研;刘薇薇;张兵兵;王馨;;国内图书馆数据挖掘研究及应用的文献计量分析[J];医学信息学杂志;2011年06期
9 王娜敏;高艺博;;基于数据挖掘技术的入侵检测系统[J];电脑知识与技术;2011年21期
10 王海军;;数据挖掘提高企业决策分析[J];福建电脑;2011年06期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
3 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
9 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
10 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 张甲武;序列模式挖掘在软件开发信息库中的应用[D];大连理工大学;2009年
2 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年
3 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年
4 张圆圆;序列模式发现模型的研究[D];合肥工业大学;2007年
5 李春媚;基于序列模式挖掘的入侵检测研究及应用[D];长沙理工大学;2007年
6 贾宁;基于数据挖掘的软件测试技术研究[D];天津大学;2007年
7 陈景强;序列模式挖掘在Web日志挖掘中应用研究[D];重庆大学;2008年
8 但红卫;基于偏序的频繁序列模式压缩算法研究[D];浙江大学;2007年
9 王峰;基于数据挖掘的入侵检测系统的设计与实现[D];山东大学;2006年
10 孟宪苹;基于序列模式挖掘的入侵检测系统的研究与实现[D];南京航空航天大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026