收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本挖掘的软件缺陷分析系统的设计和实现

罗国虎  
【摘要】:软件缺陷分析是软件产品与软件过程的评估改进的重要技术手段之一,已成为学术界和工业界的研究热点。本文以软件过程改进为目标,研究使用文本挖掘的方法并结合统计分析进行软件缺陷分析,通过对软件缺陷描述的文本检索、文本聚类和文本摘要等,挖掘、分析软件缺陷的分布、聚集和重复出现等信息。然而,软件缺陷描述一般都存在冗余信息多、句法不规范的问题,并且噪声词、同义词、同类词的分布也非常广泛;与此同时,应用软件的缺陷描述中涉及的对象种类往往比较多,对象间关系也较为复杂。这些使得针对软件缺陷描述的特征选择、文本摘要和文本匹配存在挑战。针对这些挑战,本文提出了针对缺陷描述文本的挖掘技术与方法,设计、实现了一个基于文本挖掘的软件缺陷分析系统。具体研究工作包括:(1)以软件过程改进为目标,分析了软件缺陷分析的应用场景,识别出核心环节存在的问题,从而提出了基于文本分析与挖掘的软件缺陷分析的整体方案。(2)根据软件缺陷描述质量不高、语法不严谨、涉及对象关系复杂、同义词和同类词密集的特点,结合深层语义分析和互信息和文档频率统计方法,提出了针对软件缺陷描述的特征选择和摘要方案,在初步摘要的基础上采用基于依存结构树的深层语义分析进行特征选择和文本摘要。(3)研究提出了基于特征和语义映射的缺陷匹配方法。根据互信息和文档频率统计筛选文本检索所需的文本向量;根据依存结构树选择与主题密切相关的属性词作为相似缺陷查找和缺陷细分聚类的文本向量。同时,为不同文本挖掘任务设计相应的匹配方法,把词的本体信息、同义信息、关联性考虑进匹配过程。(4)对软件缺陷分析系统进行功能需求与非功能需求分析,采用多层架构风格设计了系统总体架构,并对系统的核心模块进行了详细设计与实现,刻画了其处理流程和类图。(5)在网管软件缺陷数据集上对软件缺陷分析系统进行了全面的功能测试和性能测试。测试结果表明,缺陷检索和缺陷相似查找的查全率与查准率分别达到了84.5%和88.4%、81.9%和91.4%,缺陷细分聚类的准确率达到了88.5%,缺陷描述摘要正确率达到了93.1%,系统满足预定的要求。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 林涛;高建华;伏雪;马燕;林艳;;面向软件缺陷报告的提取方法[J];计算机科学;2016年06期
2 吕方兴;;对软件缺陷预防的分析研究[J];科技信息;2012年15期
3 梅锋;蔡子仪;陆璐;;面向软件缺陷预测的树状结构编码方式[J];计算机应用研究;2020年S2期
4 秦庆强;魏启国;;结合软件开发过程的软件缺陷预测方法[J];计算机应用研究;2020年S2期
5 张智国;;考虑执行轨迹的软件缺陷自动定位方法[J];信息与电脑(理论版);2020年21期
6 傅娜;;通信软件缺陷预防和改进体系设计[J];技术与市场;2021年02期
7 徐思婕;;一种基于关联规则的网络软件缺陷预测方法[J];电子技术与软件工程;2020年24期
8 陈勇;徐超;何炎祥;沈凡凡;;基于编译优化的软件缺陷预测研究[J];电子学报;2021年02期
9 刘文英;林亚林;李克文;雷永秀;;一种软件缺陷不平衡数据分类新方法[J];山东科技大学学报(自然科学版);2021年02期
10 曲豫宾;陈翔;李龙;;可缓解类重叠问题的跨版本软件缺陷预测方法[J];吉林大学学报(理学版);2021年02期
11 杨昊天;顾乾晖;王嘉璐;施恺杰;徐力晨;;基于混合采样和集成学习的软件缺陷预测[J];网络安全技术与应用;2021年05期
12 李鹏宇;江云松;高猛;滕俊元;;基于知识图谱和自动机器学习的软件缺陷预测[J];空间控制技术与应用;2021年02期
13 马辉;;基于改进神经网络的静态软件缺陷自动分配方法[J];信息与电脑(理论版);2021年04期
14 刘亚娜;吴彩华;陈浩;石晶;;软件缺陷倾向性预测投票方法[J];科学技术创新;2021年18期
15 杨昊天;黎敏;万齐康;邓雄狮;顾乾晖;;基于多段处理的软件缺陷预测[J];工业控制计算机;2021年08期
16 潘长安;;基于加权马尔可夫链的试运行软件缺陷预测模型[J];巢湖学院学报;2021年03期
中国重要会议论文全文数据库 前16条
1 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
2 赵亮;侯金宝;;文件和包层次的软件缺陷预测研究[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
3 于秀山;王广俭;;软件缺陷管理[A];中国电子学会可靠性分会第十三届学术年会论文选[C];2006年
4 寇纲;彭怡;石勇;;基于数据挖掘的软件缺陷度量评估管理及研究现状综述[A];第三届(2008)中国管理学年会——信息管理分会场论文集[C];2008年
5 李立清;;用软件缺陷数据进行缺陷预测[A];中国工程物理研究院科技年报(2005)[C];2005年
6 高通;焦彦平;龚波;;基于曲线拟合的软件缺陷排除成本预测[A];2010年全国通信安全学术会议论文集[C];2010年
7 张志刚;赵静;张苓琳;;基于语义分析的软件缺陷自动检测技术研究[A];第五届中国指挥控制大会论文集[C];2017年
8 涂亚明;毛军鹏;余静;尹磊;;系统测试阶段的软件缺陷预测模型分析[A];第六届中国测试学术会议论文集[C];2010年
9 宋建伟;谢璟;;软件缺陷管理对改进软件测试与维护的研究与应用[A];2016年MIS/S&A学术交流会议论文集[C];2016年
10 刘峻宇;李强;余祥;何海洋;;基于符号执行的指挥信息系统软件缺陷检测技术[A];2014第二届中国指挥控制大会论文集(上)[C];2014年
11 张毅;王鸿;;软件可靠性测试实例分析[A];第五届中国测试学术会议论文集[C];2008年
12 寇纲;彭怡;石勇;;面向缺陷的软件系统可靠性管理研究现状评述[A];第十一届中国管理科学学术年会论文集[C];2009年
13 符开桂;胡泽平;;浅谈软件测试应把握的几个问题[A];海南省通信学会学术年会论文集(2006)[C];2006年
14 李立清;;软件缺陷数据的分析和预测[A];第三届中国测试学术会议论文集[C];2004年
15 王雅文;宫云战;肖庆;杨朝红;;区间运算在软件缺陷检测中的应用[A];第五届中国测试学术会议论文集[C];2008年
16 张雯婷;;软件测试丢失数据遗补算法[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
中国博士学位论文全文数据库 前20条
1 任俊桦;高速铁路软件缺陷预测方法研究[D];北京交通大学;2020年
2 程铭;软件缺陷预测若干关键技术研究[D];武汉大学;2016年
3 张志武;基于机器学习的软件缺陷预测方法研究[D];南京邮电大学;2018年
4 邱少健;基于迁移学习的跨项目软件缺陷预测关键技术研究[D];华南理工大学;2019年
5 张芸;软件工程缺陷分析关键技术研究[D];浙江大学;2018年
6 李志强;异质软件缺陷预测技术研究[D];武汉大学;2018年
7 王铁建;基于度量的软件缺陷预测研究[D];武汉大学;2018年
8 陈媛;基于数据挖掘的软件缺陷预测技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
9 倪超;跨项目软件缺陷预测方法研究[D];南京大学;2020年
10 陈琳;基于机器学习的软件缺陷预测研究[D];重庆大学;2016年
11 刘文杰;软件缺陷报告严重性预测研究[D];大连理工大学;2020年
12 于巧;基于机器学习的软件缺陷预测方法研究[D];中国矿业大学;2017年
13 马樱;基于机器学习的软件缺陷预测技术研究[D];电子科技大学;2012年
14 徐洲;不同场景的软件缺陷预测方法研究[D];武汉大学;2019年
15 Kamal Bashir Elsiddig Abdelgadir;基于机器学习的软件缺陷预测方法研究[D];西南交通大学;2020年
16 刘望舒;软件缺陷预测中数据预处理关键技术研究及应用[D];南京大学;2017年
17 杨晓杏;基于度量元的软件缺陷预测技术[D];中国科学技术大学;2014年
18 单纯;软件缺陷分布预测技术及应用研究[D];北京理工大学;2015年
19 王伟光;动态软件缺陷测试关键技术研究[D];南京大学;2016年
20 Shaikh Salahuddin;基于机器学习的数据挖掘在软件缺陷预测中的应用研究[D];华北电力大学(北京);2021年
中国硕士学位论文全文数据库 前20条
1 罗国虎;基于文本挖掘的软件缺陷分析系统的设计和实现[D];上海交通大学;2020年
2 邓杰瀚;基于程序源码语义的软件缺陷预测系统的设计与研究[D];华南理工大学;2020年
3 李文昊;基于特征迁移和实例迁移的跨项目软件缺陷预测方法研究[D];哈尔滨师范大学;2021年
4 周建含;基于半监督集成的软件缺陷预测方法研究[D];哈尔滨师范大学;2021年
5 袁智丹;基于主动迁移学习的跨项目软件缺陷预测方法的设计与工具实现[D];南通大学;2020年
6 田永清;基于程序切片的软件缺陷预测模型研究[D];河北大学;2020年
7 陶美彤;软件缺陷预测的特征选择方法研究[D];吉林大学;2020年
8 陈顺义;基于数据度量和多目标决策的软件缺陷技术研究[D];华侨大学;2018年
9 向威;代价敏感的混合软件缺陷预测模型[D];云南大学;2018年
10 刘亚娜;基于正则化交叉验证的静态软件缺陷预测方法研究[D];山西大学;2019年
11 刘娇;软件缺陷修复者推荐方法的研究[D];重庆邮电大学;2018年
12 沈鹏;基于机器学习的软件缺陷预测方法研究[D];西南大学;2019年
13 赵琪;基于软硬件特征的系统失效预测模型研究及应用[D];南京航空航天大学;2019年
14 陈蛟龙;基于机器学习方法的软件缺陷预测模型研究与优化[D];哈尔滨工业大学;2019年
15 何金虎;基于迁移学习的软件缺陷预测模型研究[D];哈尔滨工业大学;2019年
16 孙静;关于软件缺陷预测方法的相关研究[D];南京邮电大学;2019年
17 陈稳;软件缺陷预测中数据预处理机制的研究与系统构建[D];南京邮电大学;2019年
18 黄琳;基于度量元的静态跨项目软件缺陷预测技术研究[D];南京邮电大学;2019年
19 刘倩;基于集成学习的软件缺陷预测方法研究[D];燕山大学;2019年
20 刘建宇;基于自动特征工程的软件缺陷预测模型[D];华中科技大学;2019年
中国重要报纸全文数据库 前6条
1 ;Microsoft计划推出Windows Server SP1[N];计算机世界;2004年
2 记者 刘春辉;如何界定手机的质量问题?[N];人民邮电;2003年
3 ;Firefox、IE中发现缺陷[N];计算机世界;2005年
4 ;歧视消费者是品牌的自我贬损[N];中国企业报;2006年
5 本报记者 冯卫东;软的不行就来硬的[N];科技日报;2007年
6 ;假冒防病毒软件威胁上升[N];计算机世界;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978