收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

软件工程数据挖掘若干问题研究

郁抒思  
【摘要】:软件工程数据是软件工程整个过程中所产生的各种数据,包括软件的源代码、文档、缺陷报告等。在绝大多数情况下,软件工程数据是开发者获取信息的唯一来源。随着计算机软件规模的不断扩大,手工获取开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程,提高软件质量。本文针对软件工程数据挖掘的若干问题进行研究,主要贡献如下: 1.提出了一种Java源代码中Method的自动命名方法。软件源代码中标识符的正确命名对软件维护非常重要,恰当的Method名能够使开发者了解Method的功能,而不恰当的命名则会误导他们。但是,开发者除了个人的经验技术之外,他们在为Method命名时几乎无所凭依。本文提出了一种基于文本分类的方法,为Method选择恰当的动作名。实验表明,本文方法的命名正确率达到70%以上。 2.提出了一种程序盗用检测方法。与软件业、特别是开源软件的蓬勃发展相比,用以保护现有软件免遭软件盗用者侵害的检测工具少得可怜。一个不自律的开发者可以通过代码伪装技术盗用他人的源码,而又逃脱法律的制裁。现有的基于程序依赖图的检测工具可以检出若干种专业的代码伪装,但时间效率无法让人满意,并且它们无法识破影响程序依赖图结构的伪装。本文提出了一种新的盗用检测工具TPLAG,它不仅将代码盗用检测的时间复杂度从指数级降到多项式级,而且能成功地识破影响图结构的代码伪装技术。 3.提出了一种缺陷分派方法。大型软件的开发组每天都会收到成百上千的缺陷报告,对这些缺陷进行分派是软件开发者们的一项沉重的负担。现有的研究工作将软件缺陷自动分派归结为文本分类问题。本文利用Latent Dirichlet Allocation(LDA)进行文本降维,在此基础上基于文本分类方法进行缺陷分派,提高了分派的准确率。 4.提出了一种缺陷报告质量评估方法。软件维护工作的质量与缺陷报告本身的质量高度相关,不包含有用信息、质量低下的缺陷报告很可能被开发者直接忽略,相应的缺陷也就无法得到修复。本文提出了一种基于主题模型的方法对缺陷报告的内容进行分析,并量化缺陷报告的信息量,即缺陷报告质量。 5.提出了一种缺陷报告库上主题发现与跟踪的方法。本文试图从缺陷报告库中提取两方面的内容:缺陷的主题和某一主题缺陷爆发的时段,这些内容能够为软件项目的管理者提供高层次的信息,以了解软件维护的整体情况。我们采用LDA模型提取缺陷报告内容中的主题,并开发了一种事件检测算法以检测缺陷集中爆发的时段。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴源俊;软件工程知识结构[J];信息技术与标准化;2002年05期
2 陈利平;“软件工程”课程教学改革的探讨[J];福建电脑;2002年01期
3 熊节;刘艺;汪颖;;三味书斋——软件工程篇[J];程序员;2002年12期
4 马永涛;浅议高职软件工程专业教学计划[J];中国职业技术教育;2003年16期
5 张为;理论与实践相结合——《软件工程》教学浅探[J];广州大学学报(自然科学版);2003年05期
6 付剑晶;软件工程中引进监理机制[J];现代情报;2003年10期
7 朱向华;软件工程中的系统思想[J];苏州市职业大学学报;2003年04期
8 ;CSDN 3月论坛TOP 10[J];程序员;2003年05期
9 刘天北;;好书榜 软件工程专题[J];程序员;2003年10期
10 刘乃琦;;软件工程教育的特点与问题[J];计算机教育;2004年10期
11 许旻鸿;实施《软件工程》项目管理教学的实践[J];机械职业教育;2004年09期
12 尹锋;“软件工程”课程教学改革初探[J];长沙大学学报;2004年04期
13 杨波;《软件工程》课程教学探讨[J];科技广场;2004年09期
14 潘加宇;;软件工程与项目管理[J];程序员;2004年09期
15 吴裕祥;赵池龙;孙伟;;软件工程中项目管理的革新教材及创新实践[J];计算机教育;2005年05期
16 杨宏伟;;“软件工程”课程教材中的概念二义性问题分析一例[J];计算机教育;2005年08期
17 赖振丹;软件工程课程教学实践与探讨[J];广西商业高等专科学校学报;2005年01期
18 陈七妹;软件工程“36计”[J];互联网周刊;2005年18期
19 张云;软件工程实习期的设计思考[J];嘉兴学院学报;2005年03期
20 沈杨;软件工程中的自然辩证法[J];中国科技信息;2005年16期
中国重要会议论文全文数据库 前10条
1 李刚;董火民;杨子江;韩红强;;软件工程标准化现状与分析[A];第四届中国软件工程大会论文集[C];2007年
2 宋雨;赵文清;王晓辉;;《软件工程》课程双语教学实践[A];第四届全国高等学校电气工程及其自动化专业教学改革研讨会论文集(上册)[C];2007年
3 张勇;;云计算环境下软件工程模式初探[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
4 李奋华;;《软件工程》课程双语教学的研究与探索[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
5 钱俊彦;赵岭忠;蔡国永;;软件工程人才培养研究[A];2008年计算机应用技术交流会论文集[C];2008年
6 ;江苏省捷达软件工程有限公司简介[A];华东六省一市生物化学与分子生物学会2008年学术交流会论文摘要汇编[C];2008年
7 王育欣;安伟;;基于软件工程的JAVA移植策略方法研究[A];创新沈阳文集(A)[C];2009年
8 王邦宁;;CAD软件工程的特点[A];中国土木工程学会计算机应用学会学术报告会论文集(4)[C];1989年
9 吴闽泉;徐仁佐;;软件工程中的分离方法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
10 侯令忠;任大全;;软件工程的管理思想在跨栏跑多媒体教学软件开发中的应用[A];第七届全国体育科学大会论文摘要汇编(二)[C];2004年
中国博士学位论文全文数据库 前2条
1 郁抒思;软件工程数据挖掘若干问题研究[D];复旦大学;2011年
2 黄胜;面向软件工程数据挖掘的开发测试技术[D];复旦大学;2013年
中国硕士学位论文全文数据库 前10条
1 周鸣乐;软件工程监理体系的建设与应用[D];山东大学;2009年
2 陈化;软件工程的实施与欧洲猫网络监控系统研发[D];四川大学;2004年
3 周北平;复杂网络在软件工程中的应用[D];南京信息工程大学;2008年
4 谷千书;软件工程系统结构模型的应用分析[D];复旦大学;2008年
5 黄长远;基于知识点库的软件工程学习系统[D];天津大学;2007年
6 钟亚强;利用软件工程的方法开发新车保险信息系统[D];四川大学;2005年
7 介艺橙;成都置信房地产成本管理系统的设计与实现[D];电子科技大学;2013年
8 元烽;软件工程专业核心课程在线学习平台设计与实现[D];东北大学;2013年
9 郝鹏;对日软件工程日语口译实践报告[D];河北大学;2013年
10 黄震;面向Agent软件工程的初步讨论[D];中国科学院软件研究所;2001年
中国重要报纸全文数据库 前10条
1 刘艺;跨越20年的软件工程经典教材[N];中国图书商报;2002年
2 记者  徐瑞哲 唐烨;中国软件工程 和谐融入世界[N];解放日报;2006年
3 ;软件工程“世博会”首次登陆中国[N];中国计算机报;2006年
4 许莉君;中国软件工程与全球同热[N];中国计算机报;2006年
5 ;中国软件工程社团进入世界主流[N];民营经济报;2006年
6 记者 王晓晴 实习生 龙茜瑶;教育部软件工程实训基地在深揭牌[N];深圳特区报;2010年
7 本报记者 小舟;实现软件工程的可视化管理[N];计算机世界;2004年
8 云杰;惠普软件工程学院成立一周年[N];计算机世界;2006年
9 辽宁海德制药有限公司 张宝富;加强医药产业软件工程建设[N];本溪日报;2010年
10 邱燕娜;李炎与软件工程[N];中国计算机报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978