收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

程序中重复代码的自动检测

刘恒  
【摘要】: 本文介绍了一个自动的检测程序中非连续参数化重复代码的方法。所作的工作有两部分,(1)对Baker的参数化匹配算法进行了改进。把匹配单位由单个的字符变为程序中的语句,为了配合匹配单位的改变,重新定义了转换函数。经过改进,算法的空间复杂性得到降低,使之更适于大型程序文本的匹配;(2)提出了程序碎片合并算法,判断通过参数化匹配算法找到的重复代码段之间的可合并性,从而能从程序中识别出非连续的近似重复代码。分析表明:改进的参数化匹配算法的复杂性同程序文件的行数成线性关系;碎片合并算法的复杂性是O(n~2)的,其中n是碎片所在依赖单位的语句个数。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 包小源,宋再生,唐世渭,杨冬青,王腾蛟;SuffIndex——一种基于后缀树的XML索引结构[J];计算机研究与发展;2004年10期
2 何丽,韩文秀;一种基于后缀树的Web访问模式挖掘算法[J];计算机应用;2004年11期
3 乔百友,葛健,王国仁,韩东红;并行后缀树的构造及查询算法[J];东北大学学报(自然科学版);2004年03期
4 王咏,申瑞民;采用构造后缀树方法的在线挖掘浏览模式[J];计算机工程;2004年19期
5 李建忠;刘建宾;余楚迎;;基于过程蓝图的参数化重复代码检测技术研究[J];汕头大学学报(自然科学版);2007年01期
6 成杰峰,王国仁,于戈;用后缀树构造XML路径字典加快路径查询评价速度[J];小型微型计算机系统;2004年04期
7 胡昕;让你的检索更精确——一种实现中文HTML文档自动聚类的方法[J];软件工程师;2002年12期
8 缪嘉嘉,吴刚,毛捍东,杨强,邓苏;一种基于条件概率分布的近似重复记录检测方法[J];小型微型计算机系统;2004年12期
9 葛健;王国仁;于戈;;后缀树的并行构造算法[J];计算机科学;2004年05期
10 何国辉;张标;尚新萍;;基于后缀树的图像识别研究[J];苏州科技学院学报(自然科学版);2007年03期
11 冯冰洁;杨天奇;;后缀树聚类算法在元搜索引擎中的应用[J];微计算机信息;2010年03期
12 陈昌平;刘自伟;周文鹃;彭春艳;;串联重复序列识别方法研究[J];电脑知识与技术;2008年31期
13 董云耀;李笑;;基于后缀树的知识点间关联规则挖掘算法[J];杭州电子科技大学学报;2006年01期
14 高强;张敬之;耿桦;潘金贵;;基于重复模式的Web信息抽取[J];计算机科学;2007年04期
15 赵杰文;原娇杰;;数据挖掘中后缀树算法的应用研究[J];焦作大学学报;2007年03期
16 胡海龙;孙晨;赫枫龄;左万利;;基于改进后缀树算法中英文聚类引擎的实现[J];吉林大学学报(理学版);2009年02期
17 买买提依明·哈斯木;维尼拉·木沙江;;基于后缀树的维吾尔文网页聚类算法的研究与实现[J];电脑知识与技术;2010年25期
18 徐恒宇;王镝;王国仁;郑若石;;Tandem repeat查找方法比较[J];计算机科学;2005年10期
19 邵雄凯;廖晔;;元搜索引擎搜索结果的排序及优化[J];软件导刊;2007年07期
20 叶青青;;软件系统中代码克隆的检测技术[J];计算机系统应用;2007年12期
中国重要会议论文全文数据库 前10条
1 骆雄武;万小军;杨建武;吴於茜;;基于后缀树的Web检索结果聚类标签生成方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 务孟庆;高军;王腾蛟;杨冬青;;WD-STC:一种基于网络词典的WEB新闻文档后缀树聚类算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
3 包小源;宋再生;唐世渭;杨冬青;王腾蛟;;SuffIndex——一种基于后缀树的XML索引结构[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 刘亚军;翟林;;本体知识库中概念间关系的自动获取方法研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 买买提依明·哈斯木;维尼拉·木沙江;;研究维吾尔文Web文档聚类算法设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 张龙;周傲英;郑仕辉;梁宇奇;;一种可行的层次型XML仓库索引结构[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 杨建武;;Web检索结果的层次聚类研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 朱扬勇;郭德培;施伯乐;;数据库中序列模式的增量数据采矿技术[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
9 骆吉洲;李建中;杨昆;赵锴;;基于局部优化策略的DNA序列压缩算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
2 龚才春;短文本语言计算的关键技术研究[D];中国科学院研究生院(计算技术研究所);2008年
3 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
4 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
5 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
6 李斌;LZ复杂性算法及其在生物序列分析中的应用研究[D];中南大学;2008年
7 尹传环;结构化数据核函数的研究[D];北京交通大学;2008年
8 史庆伟;基于小世界模型的P2P网络文本检索[D];天津大学;2008年
9 曹欢欢;基于大规模搜索日志挖掘的上下文感知搜索研究[D];中国科学技术大学;2009年
10 胡昌慧;车载自组网络安全协议和安全字符串匹配协议研究[D];山东大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘恒;程序中重复代码的自动检测[D];大连理工大学;2003年
2 张天勇;PE系统的自动化重构研究与实践[D];浙江大学;2008年
3 李建祥;智能网页推荐系统的相关技术研究[D];西南交通大学;2004年
4 买买提依明·哈斯木;基于后缀树的维吾尔文网页聚类算法的设计与实现[D];新疆大学;2011年
5 王学;基因组中最大唯一匹配的查找算法研究[D];西安电子科技大学;2009年
6 胡海龙;基于改进的后缀树算法的中英文聚类引擎的实现[D];吉林大学;2008年
7 贾立峰;流数据中频繁模式挖掘算法的研究[D];吉林大学;2006年
8 缪嘉嘉;数据仓库的数据获取关键技术研究[D];国防科学技术大学;2003年
9 张任文;生物序列索引结构的研究与实现[D];哈尔滨工业大学;2006年
10 张玉良;一种基于后缀树的包装器自动生成方法的研究[D];吉林大学;2005年
中国重要报纸全文数据库 前1条
1 作者:Jimmy;防火墙,蠕虫的下一个目标[N];电脑报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978