收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义理解的论文相似度研究

唐凌志  
【摘要】:当前社会,信息技术、计算机技术与语言学(统计语言学与语料库语言学的兴起与发展)处于一个高速发展时期,这为相似度研究打下了坚实的基础。与此同时,各个高校中也发生少量的学术不端行为,主要表现在抄袭、剽窃、侵吞他人学术成果,给整个学术界的声誉以及高校的学术质量造成了极坏的影响,因此急需论文检测系统来提高论文的质量,为防止其不端行为的发生,目前的各种论文检测系统在高校被广泛应用,在一定程度上遏制了学术不端行为的发生,但是目前的论文检测系统主要侧重于字面上的重复度检测,而对语法结构的调整、图像、公式等非结构化的检测相对欠缺。结合其检测系统的不足与相似度研究的现状,以相似度研究在论文检测中的应用为方向展开研究,希望有助于相似度研究在应用方面取得成绩。 本文先从相似度的概念、相似度计算的原则、应考虑的因素以及具体的相似度算法等方面来分析文本相似度与语义相似度,通过对其算法的分析,考虑到各种算法的优缺点,最后选择了以《知网》为基础的词语相似度算法,并在原有算法的基础上对原有算法进行了改进,在词语相似度的计算过程中引入了本体相似度算法中的语义密度因子,并且将此算法延伸到句子相似度、段落相似度与论文相似度的计算;通过词语相似度、句子相似度、段落相似度与论文相似度四个层次的算法分析,把语义理解应用到论文检测中,根据其各个层次的计算给出了在论文检测中其相对应的模块及流程;最后根据本文涉及到的相似度算法,通过相应的实验验证了其算法的有效性与实用性,实现了其相似度计算在论文检测领域的部分应用,其主要是指在词语相似度、句子相似度与段落相似度的应用,在一定程度上实现论文检测的真正意义。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 顾榕,王小平,曹立明;一种基于潜在语义分析的查询扩展算法[J];计算机工程与应用;2004年18期
2 聂卉;龙朝晖;;结合语义相似度与相关度的概念扩展[J];情报学报;2007年05期
3 王惠敏;聂规划;付魁;;领域本体中基于多维特征的语义相似度算法研究[J];情报杂志;2008年10期
4 申改英;李建华;;基于语义的Web服务自动组合算法[J];计算机工程;2009年16期
5 黄宏斌;刘志忠;张维明;邓苏;马丽丽;;基于层次本体模型(HOM)的语义相似度计算方法[J];系统工程与电子技术;2009年07期
6 吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;一种新的基因注释语义相似度计算方法[J];生物信息学;2010年01期
7 骆正华,樊孝忠,夏天;基于结构化问句实例的自动问答系统[J];微电子学与计算机;2005年07期
8 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
9 徐德智;C.Onyango;王怀民;;上位本体中语义相似度的计算及其实现[J];计算技术与自动化;2007年02期
10 张晓孪;王西锋;;FCA中的概念语义相似度计算[J];现代图书情报技术;2007年03期
11 路松峰;冯玲;刘芳;胡和平;;SSW:一种语义相关的P2P网络资源检索机制[J];小型微型计算机系统;2008年08期
12 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
13 史斌;闫健卓;王普;方丽英;;基于本体的概念语义相似度度量[J];计算机工程;2009年19期
14 刘卫;刘金岭;;基于《知网》的词语语义相似度改进及应用[J];福建电脑;2010年05期
15 刘景方;邹平;张朋柱;齐峰;;一种改进的本体概念语义相似度算法研究[J];武汉理工大学学报;2010年20期
16 刘紫玉;黄磊;;基于领域本体模型的概念语义相似度计算研究[J];铁道学报;2011年01期
17 陈琨;张蕾;;基于知识图的领域本体构建方法[J];计算机应用;2011年06期
18 柳巧玲;尚艳艳;;基于领域本体的语义知识检索研究[J];图书情报工作;2011年06期
19 徐德智;郑春卉;K. Passi;;基于SUMO的概念语义相似度研究[J];计算机应用;2006年01期
20 郑丽萍;李光耀;梁永全;沙静;;本体中概念相似度的计算[J];计算机工程与应用;2006年30期
中国重要会议论文全文数据库 前10条
1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 何梅;刘亚军;陈耿;;词性划分和差额法在主观题阅卷中的应用[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
4 刘晓平;沈冠町;;协同讨论观点影响度分析方法及其应用[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
5 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
6 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
7 刘寒磊;关毅;徐永东;;多文档文摘中基于语义相似度的最大边缘相关技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 王永恒;贾焰;杨树强;;面向汉语短文的话题识别系统研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 章成志;章成敏;王萍;;基于语义的同义词识别算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
2 朱新懿;三维颅面相似度比较的研究[D];西北大学;2012年
3 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
4 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
5 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
6 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
7 胡晓;支持机械产品概念设计的功能知识聚类方法研究[D];上海交通大学;2011年
8 李宏伟;基于Ontology的地理信息服务研究[D];解放军信息工程大学;2007年
9 魏军英;基于WEB服务的中小企业制造资源共享关键技术研究[D];山东科技大学;2011年
10 杨峰;本体映射关键技术研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 唐凌志;基于语义理解的论文相似度研究[D];湘潭大学;2011年
2 袁瑞红;基于语义相似度的WEB结构挖掘研究及实现[D];南京理工大学;2009年
3 郑丽萍;本体映射的研究[D];山东科技大学;2005年
4 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
5 胡艳波;基于区间直觉模糊集的语义相似度研究[D];曲阜师范大学;2012年
6 柴秀琴;模体相似度比较算法研究[D];天津师范大学;2012年
7 常晓环;基于概念图的语义检索方法研究[D];吉林大学;2009年
8 任波;基于语义的Web服务发现研究[D];浙江工业大学;2005年
9 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
10 郭嘉琦;领域本体的构建及其在信息检索中的应用研究[D];北京邮电大学;2007年
中国重要报纸全文数据库 前1条
1 夏小云;面料追赶时尚[N];中国服饰报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978