收藏本站
《辽宁工程技术大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于文档复制检测技术的研究与实现

孙伟  
【摘要】: 文本复制检测就是判断一篇给定文档是否抄袭﹑剽窃了或者复制于另外一篇或者多篇文档的内容,复制不仅仅是原封不动地照搬,还包括部分复制、对原作的移位变换﹑同义词替换以及改变说法重述等方式。本文通过对文本复制各种手段的分析,提出了文章相似度检测框架( PSEF )和句子相似度检测框架(SSEF ),并给出了一个实现——平行相似度模型(PSM);应用“分词”从逻辑上划分句子边界,解决了COPS等系统在边界处理上的问题;使用比较法代替数值法,解决了CHECK等大多数系统需要手动设置域值的问题。以分词为语义导向,通过句子清理,更准确地检测出文档复制的部分。以LCS算法为基础,用java语言给出了相应的框架实现。相关的实验结果表明,这些方法和手段对于复制行为的检测可以达到预期的检测效果。
【学位授予单位】:辽宁工程技术大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 仇壮丽;;在线论文复制检测系统设计[J];计算机工程与应用;2011年19期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 傅珊珊;雷庆;吴扬扬;;从XML到关系数据模型的映射[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
2 肖璐;路燕;张亮;汪卫;施伯乐;;多DTD环境中XML的关系数据库存储[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
中国重要报纸全文数据库 前1条
1 本报记者 曹树林 朱虹;网上“论文反抄袭”检测可信吗[N];人民日报;2011年
中国博士学位论文全文数据库 前2条
1 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
2 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 孙伟;基于文档复制检测技术的研究与实现[D];辽宁工程技术大学;2010年
2 李婷婷;基于语义结构的学术论文复制检测技术研究与实现[D];北京邮电大学;2010年
3 马勤;文档复制检测技术在学术监管中的应用研究[D];郑州大学;2012年
4 刘双明;文档复制检测的应用研究[D];太原理工大学;2010年
5 王森;基于主题树的自上而下文本复制检测研究[D];大连理工大学;2010年
6 卢小康;中文文本复制检测技术研究[D];杭州电子科技大学;2009年
7 李旭;基于串匹配方法的文档复制检测系统研究[D];燕山大学;2006年
8 李淑静;基于内容的垃圾邮件过滤研究与实现[D];南京信息工程大学;2006年
9 熊志勇;数据挖掘在反垃圾邮件领域中的应用与研究[D];南昌大学;2006年
10 邓爱萍;程序源代码复制检测技术研究[D];湖南大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026