收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于神经网络的软件缺陷分派和数据误用研究

彭新宇  
【摘要】:为了方便地管理软件缺陷,许多大规模开源项目使用软件缺陷追踪系统,以缺陷报告的形式记录、管理缺陷。软件缺陷分派是软件缺陷管理中的重要步骤,目的是分派合适的开发人员修复缺陷。缺陷修复效率对软件质量有重要影响,而高效地修复缺陷需要及时准确地分派开发人员。在大规模开源项目中,不仅每天新增的缺陷报告数量多,而且项目中存在的开发人员数量也很多。因此,软件缺陷分派需要耗费大量人力成本和时间成本。为了提升缺陷分派的效率,许多研究提出预测修复人员的方法。其中最新的一类方法使用神经网络建立分类模型。但目前这类方法使用的数据集和参数设置都存在差异,难以进行对比。因此本文根据这类方法中模型的主要特点构建相似模型,并在同样的数据集和参数设置下进行实验,从而便于对比。此外,本文使用注意力机制、标签平滑尝试改进现有模型。最后,由于缺陷属性可能会随时间而变动,如果使用错误时间点的属性值进行测试,有导致模型效果虚高的风险。因此,本文使用不同时期的属性值来研究数据误用对模型效果的影响。本文的主要研究内容有:一、以缺陷基本属性如文本和组件为特征,使用卷积神经网络、循环神经网络和注意力机制构建模型。二、以缺陷派生属性组件内历史修复人员序列为特征构建模型,探索人员序列本身和根据人员序列计算的动态标签平滑对模型效果的影响。三、探索增加缺陷报告提交者特征对模型效果在整体上及不同类型缺陷报告上的影响。四、探索由属性变动导致的数据误用对模型效果的影响。本文的主要结论有:一、特征对模型效果的影响程度远大于网络类型对模型效果的影响程度。单独使用派生属性特征的模型就能得到比使用基本属性特征的模型更好的效果。二、动态标签平滑可以提升预测修复人员中靠后部分的准确率,静态标签平滑可以提升预测修复人员中靠前部分的准确率。三、加入缺陷提交者特征后的模型效果提升,基本来自于缺陷提交者同时为缺陷修复者的缺陷。由于提交者可以直接将缺陷分派给自己,因此在实际应用中这部分提升的价值有限。四、各种属性变动对模型效果都有明显影响,属性变动的影响程度从高到底依次为历史修复人员序列、组件、文本。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 王铁建;吴飞;荆晓远;;基于多核字典学习的软件缺陷预测[J];计算机科学;2017年12期
2 刘柯宏;刘晓建;;开源程序的软件缺陷分布特征的量化分析研究[J];电子元器件与信息技术;2017年04期
3 胡柳;邓杰;赵正伟;李瑞;;一种基于关联规则的网络软件缺陷预测方法[J];信息技术与网络安全;2018年04期
4 杨开懋;施小逸;汤恩义;;基于爬虫的软件缺陷预测[J];南昌教育学院学报;2016年06期
5 傅艺绮;董威;尹良泽;杜雨晴;;基于组合机器学习算法的软件缺陷预测模型[J];计算机研究与发展;2017年03期
6 甘露;臧洌;李航;;深度信念网软件缺陷预测模型[J];计算机科学;2017年04期
7 张志武;荆晓远;吴飞;;基于二次学习的半监督字典学习软件缺陷预测[J];模式识别与人工智能;2017年03期
8 李勇;黄志球;王勇;房丙午;;数据驱动的软件缺陷预测研究综述[J];电子学报;2017年04期
9 朱朝阳;陈相舟;闫龙;张信明;;基于主成分分析法的人工免疫识别软件缺陷预测模型研究[J];计算机科学;2017年S1期
10 孟浩;邓惠文;黄永兢;;基于软件生命周期的软件缺陷预防流程研究[J];电脑编程技巧与维护;2017年12期
11 王铁建;吴飞;荆晓远;;核字典学习在软件缺陷预测中的应用[J];小型微型计算机系统;2017年07期
12 王铁建;吴飞;荆晓远;;基于半监督集成学习的软件缺陷预测[J];模式识别与人工智能;2017年07期
13 韦良芬;;基于机器学习的软件缺陷预测技术研究[J];长春大学学报;2017年10期
14 杨泽辉;李琳;乔冰琴;;基于改进蚁群算法在软件缺陷预测中的应用[J];太原科技大学学报;2016年01期
15 黎铭;霍轩;;半监督软件缺陷挖掘研究综述[J];数据采集与处理;2016年01期
16 程俊;张雪莹;李瑞贤;;基于元学习的软件缺陷预测推荐方法[J];中国电子科学研究院学报;2015年06期
中国重要会议论文全文数据库 前10条
1 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
2 赵亮;侯金宝;;文件和包层次的软件缺陷预测研究[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
3 于秀山;王广俭;;软件缺陷管理[A];中国电子学会可靠性分会第十三届学术年会论文选[C];2006年
4 寇纲;彭怡;石勇;;基于数据挖掘的软件缺陷度量评估管理及研究现状综述[A];第三届(2008)中国管理学年会——信息管理分会场论文集[C];2008年
5 李立清;;用软件缺陷数据进行缺陷预测[A];中国工程物理研究院科技年报(2005)[C];2005年
6 张志刚;赵静;张苓琳;;基于语义分析的软件缺陷自动检测技术研究[A];第五届中国指挥控制大会论文集[C];2017年
7 高通;焦彦平;龚波;;基于曲线拟合的软件缺陷排除成本预测[A];2010年全国通信安全学术会议论文集[C];2010年
8 涂亚明;毛军鹏;余静;尹磊;;系统测试阶段的软件缺陷预测模型分析[A];第六届中国测试学术会议论文集[C];2010年
9 宋建伟;谢璟;;软件缺陷管理对改进软件测试与维护的研究与应用[A];2016年MIS/S&A学术交流会议论文集[C];2016年
10 刘峻宇;李强;余祥;何海洋;;基于符号执行的指挥信息系统软件缺陷检测技术[A];2014第二届中国指挥控制大会论文集(上)[C];2014年
中国博士学位论文全文数据库 前10条
1 程铭;软件缺陷预测若干关键技术研究[D];武汉大学;2016年
2 张志武;基于机器学习的软件缺陷预测方法研究[D];南京邮电大学;2018年
3 张芸;软件工程缺陷分析关键技术研究[D];浙江大学;2018年
4 李志强;异质软件缺陷预测技术研究[D];武汉大学;2018年
5 王铁建;基于度量的软件缺陷预测研究[D];武汉大学;2018年
6 陈媛;基于数据挖掘的软件缺陷预测技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
7 张凯;软件缺陷混沌分形描述与软件质量进化度量的研究[D];武汉理工大学;2005年
8 陈琳;基于机器学习的软件缺陷预测研究[D];重庆大学;2016年
9 于巧;基于机器学习的软件缺陷预测方法研究[D];中国矿业大学;2017年
10 马樱;基于机器学习的软件缺陷预测技术研究[D];电子科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 赵琪;基于软硬件特征的系统失效预测模型研究及应用[D];南京航空航天大学;2019年
2 陈蛟龙;基于机器学习方法的软件缺陷预测模型研究与优化[D];哈尔滨工业大学;2019年
3 何金虎;基于迁移学习的软件缺陷预测模型研究[D];哈尔滨工业大学;2019年
4 孙静;关于软件缺陷预测方法的相关研究[D];南京邮电大学;2019年
5 熊文君;儿童绘本中的中国元素应用研究[D];江西师范大学;2019年
6 仲崇涛;游梁式抽油机皮带自动张紧系统技术研究[D];山东科技大学;2018年
7 刘倩;基于集成学习的软件缺陷预测方法研究[D];燕山大学;2019年
8 刘建宇;基于自动特征工程的软件缺陷预测模型[D];华中科技大学;2019年
9 彭新宇;基于神经网络的软件缺陷分派和数据误用研究[D];武汉大学;2019年
10 陈顺义;基于数据度量和多目标决策的软件缺陷技术研究[D];华侨大学;2018年
中国重要报纸全文数据库 前10条
1 谢敏、戴金龙;追踪每一个软件缺陷[N];计算机世界;2005年
2 沈雪芳 译;修复软件缺陷的成本[N];计算机世界;2006年
3 金晨;摩托罗拉V8088存在软件缺陷[N];重庆商报;2000年
4 ;Microsoft计划推出Windows Server SP1[N];计算机世界;2004年
5 中国软件评测中心、中科软件股份有限公司;缺陷生命周期控制方法[N];中国计算机报;2003年
6 学健;可怕的不是缺陷本身[N];计算机世界;2001年
7 聪之;手机质量如何界定[N];中国电子报;2003年
8 冠群电脑(中国)有限公司;安全管理 策略先行[N];网络世界;2002年
9 ;Firefox、IE中发现缺陷[N];计算机世界;2005年
10 ;歧视消费者是品牌的自我贬损[N];中国企业报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978