收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

公式相似度算法及其在论文查重中的应用研究

唐亚伟  
【摘要】:随着信息技术的发展以及互联网的普及,人们获取信息的方式越来越便利。为了更加方便、快捷地共享与交流新的学术研究成果,学术资源网络化已经成为发展趋势,但网络学术资源的共享性质以及获取成本的降低,使得抄袭、剽窃等不道德行为日益增多。 文本形式的数字化学术论文是网络学术资源的重要组成部分,为了防止文本的非法复制与抄袭,文本复制检测技术已成为研究热点,给学术论文文本查重提供了方法,并且取得了很大进展,但对图像、图表、公式等非文本类元素的复制检测技术尚处于起步阶段,有待进一步的研究。 本文首先阐述了复制检测技术,分析了现有复制检测系统的处理方式。其次,分析了文本、源码复制检测与公式复制检测的特点,提出一种基于二叉树结构的LaTeX格式数学表达式匹配算法,首先根据数学公式的LaTeX格式生成其二叉树表示,并对树形结构作归一化处理,然后先序遍历二叉树并对变量名作归一化处理,最后根据对应位相同的公式元素计算两个公式的相似度。在此基础上,提出了一种数学公式抄袭检测算法。首先生成待检测数学公式的二叉树表示及结构码,然后在与结构码同名的表中查找记录,计算相似度,最后根据阀值确定是否为抄袭。实验结果表明,该算法准确地实现了数学公式的抄袭检测,是一种较实用的算法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李静柏;;多信息源图像的融合技术研究[J];黑龙江科技信息;2011年12期
2 王钟斐;;一种改进的PageRank算法[J];计算机与数字工程;2011年06期
3 范伟,宣国荣;VR系统三维建模中细节水平分割的分析[J];计算机工程;1998年01期
4 李振星,徐泽平,唐卫清,唐荣锡;网页多词元快速聚类算法[J];计算机工程;2003年02期
5 孙宏伟,田新广,李学春,张尔扬;一种改进的IDS异常检测模型[J];计算机学报;2003年11期
6 贺晓,刘景宁,李淑霞;基于灰色关联理论的案例推理在故障智能诊断系统中的应用[J];中国机械工程;2004年22期
7 田捷,何余良,陈宏,杨鑫;一种基于相似度聚类方法的指纹识别算法[J];中国科学E辑;2005年02期
8 李志东,云晓春,杨武,辛毅;基于相似通信特征扩散分析的未知蠕虫检测[J];计算机工程与应用;2005年19期
9 范自柱;;一种基于曲面求交的图像识别方法[J];计算机与信息技术;2005年03期
10 张树江;邢慧;颜景龙;;一种基于相似度的子弹识别方法[J];广西师范大学学报(自然科学版);2006年04期
11 李珊;何建敏;厉浩;;基于本体和加权互信息的专业知识检索[J];情报学报;2006年05期
12 田宏;王秀坤;;一种基于弱模糊相似关系的广义粗糙集[J];大连理工大学学报;2007年02期
13 闫英杰;林鸿飞;王剑峰;;基于混合策略的中文文摘自动评测方法[J];广西师范大学学报(自然科学版);2007年02期
14 孟海涛;陈笑蓉;;基于模糊相似度的科技文献软聚类算法[J];贵州大学学报(自然科学版);2007年02期
15 谢桂芳;李仁发;;具有概念联想功能的语义关系库的自动构建[J];计算机工程与应用;2007年07期
16 李锋;魏莹;;分布式环境下基于语义相似的案例检索[J];计算机工程;2007年09期
17 黄新;徐小娟;;基于ontology的智能答疑系统的研究[J];科学技术与工程;2007年12期
18 王展;朱斌;杨海成;李虹;;不确定性顾客需求的产品优选方法研究[J];计算机工程与应用;2007年20期
19 胡立辉;;基于偏好一致性的群体聚类算法[J];计算机工程与应用;2007年22期
20 魏玲玲;邱桃荣;陈霞;;基于相似度对Rough关系数据库检索[J];计算机工程与设计;2007年17期
中国重要会议论文全文数据库 前10条
1 李娆娆;雷沛霖;黄兰岚;原思通;刘营;;芫花药材高效液相指纹图谱研究[A];中华中医药学会四大怀药与地道药材研究论坛暨中药炮制分会第二届第五次学术会与第三届会员代表大会论文集[C];2007年
2 张虎;郭玉翠;宫尚宝;;移动Ad-hoc网络中基于第三方观察机制的信任管理研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
3 王志松;;决策树中数据遗失值填充方法的研究[A];2001年中国智能自动化会议论文集(下册)[C];2001年
4 汤丽华;赵吴静;金菊良;张明;;基于熵的水质综合评价的相似插值模型[A];第八届中国管理科学学术年会论文集[C];2006年
5 王娟;;一种基于粗糙集理论的操作风险判别方法[A];科学发展观与系统工程——中国系统工程学会第十四届学术年会论文集[C];2006年
6 刘晓林;郁滨;;基于相似度的遗传算法模式理论研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
7 金保华;高湘飞;柳雪环;张磊;;基于XML框架与CBR智能预案管理的研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
8 王超;许方;;一种基于奇异值分解的印刷体数字识别算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
9 麦智毅;杨春玲;;基于结构相似度的H.264帧内预测快速算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
10 李增扬;李兵;何克清;;本体中复杂网络特性的发现[A];2006全国复杂网络学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
2 顾本柏;客体相似性表征的认知和发展机制研究[D];西南大学;2011年
3 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
4 苏伟;基于Web的数学公式输入及可访问性关键问题研究[D];兰州大学;2010年
5 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
6 肖宇;聚类分析及其在图像处理中的应用[D];北京交通大学;2012年
7 游扬声;一般分布模式下GIS位置数据的不确定性研究[D];武汉大学;2005年
8 孙平;高科技品牌延伸的评价模型与消费者评价实证研究[D];山东大学;2008年
9 刘晓东;面向无线传感器网络数据传输与查询的节能算法与理论研究[D];中国海洋大学;2009年
10 张旭秀;盲源分离及其在脑电信号处理中应用的研究[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 唐亚伟;公式相似度算法及其在论文查重中的应用研究[D];渤海大学;2013年
2 王森;基于主题树的自上而下文本复制检测研究[D];大连理工大学;2010年
3 刘双明;文档复制检测的应用研究[D];太原理工大学;2010年
4 伍星宇;基于相似度的社区发现算法研究[D];华中科技大学;2012年
5 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
6 闵江;基于语义网的本体相似度算法研究[D];华东交通大学;2011年
7 马勤;文档复制检测技术在学术监管中的应用研究[D];郑州大学;2012年
8 李旭;基于串匹配方法的文档复制检测系统研究[D];燕山大学;2006年
9 卢小康;中文文本复制检测技术研究[D];杭州电子科技大学;2009年
10 宋杰;改进的基于串匹配的中文文档复制检测方法研究[D];湖南大学;2012年
中国重要报纸全文数据库 前10条
1 张清;数学公式输入不求人[N];中国电脑教育报;2002年
2 四川省资中县球溪高级中学 蒋礼卫;类比教学在数学公式中的应用[N];学知报;2011年
3 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年
4 聂磊 曹进 罗国安;中药指纹图谱相似度评价方法各有千秋[N];中国医药报;2006年
5 江山;汉王发布手写公式[N];中华工商时报;2006年
6 杨振中;汉王发布手写公式[N];电子资讯时报;2006年
7 魏文忠,刘必祥,陈光平;探寻精细化管理的"数学公式"[N];中国税务报;2005年
8 山东 吕立霞;一步一步学数学公式的输入[N];电脑报;2005年
9 朱建中;在《几何画板》中使用数学公式或符号[N];中国电脑教育报;2003年
10 孟祥宁 张亚萌 郭青剑;山寨文化:是一种什么样的文化[N];中国艺术报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978