收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义树的短文本相似度算法研究与应用

郭炳元  
【摘要】:互联网时代的海量信息资源充斥着我们的生活,这些信息资源很大一部分是以自然语言的形式存在的文本信息,如电子邮件、网页、电子书等。伴随着人工智能的发展,自然语言处理的各种技术被应用到互联网的各个方面,如文本数据挖掘,搜索引擎等,而文本相似度计算是自然语言处理的核心技术之一。本文对自然语言处理这一研究方向的背景和研究现状进行了较为深入的了解和分析,并对相关理论进行了总结和学习,确立了本文的研究目标:短文本相似度算法研究。同时结合读研期间参与的在线教育平台项目,提出了基于短文本相似度算法的主观题自动评分算法,并将该算法应用到了面向政治公共课考试的主观题自动评分系统,并予以实现。本文所提出的短文本相似度算法以一棵语义树来表示一个语义完整的短文本,语义树以短文本中的核心词语为节点,以节点间的语义依存关系作为树节点间的权值。根据语义树的特点,综合考虑了根节点核心词语相似度,语义依存关系种类,具有相同语义依存关系的词语相似度等因素来计算短文本相似度。在短文本相似度算法的基础上提出了主观题自动评分算法,该算法将答案文本根据一定特征进行切分,然后将切分后的短文本逐条计算相似度,得出一个得分矩阵,根据得分矩阵计算出整个答案文本的最后得分。最后将本文提出的短文本相似度算法和主观题自动评分算法应用到了面向大学政治公共课考试的主观题自动评分系统中,本文选取了某次政治考试名词解释的学生答案和标准答案以及教师真实评分作为实验数据进行实验,并分析了实验结果,验证了算法有效性。本文旨在尝试解决基于语义层面的短文本相似度计算的问题,希望能为中文自然语言处理中文本处理方面的技术提供新的思路和新的应用形式。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 张明红;佘廉;耿波;;基于情景的结构化突发事件相似度研究[J];中国管理科学;2017年01期
2 陈叶斐;张学军;黄卫东;;基于干扰相似度的多话题演化模型[J];电信科学;2017年09期
3 任雪利;代余彪;;软件相似度在成本估算中的应用[J];计算机应用与软件;2015年06期
4 谭明超;刁兴春;曹建军;冯径;;一种基于函数依赖的属性相似度调整算法[J];上海交通大学学报;2015年08期
5 陈立凤;;河马找亲戚[J];学生之友(童花果);2016年12期
6 周娴莉;;十个中文流行语翻译[J];初中生辅导;2016年36期
7 杜碧涵;;母爱[J];少年月刊;2017年05期
8 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期
9 詹雪艳;林兆洲;段天璇;李磊;乔延江;;色谱指纹图谱相似度方法的适应性研究[J];中国中医药信息杂志;2012年05期
10 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期
11 方文超;马怀礼;;中国-东盟自贸区二周年的比较研究——基于出口相似度与显性比较优势的分析[J];安徽行政学院学报;2012年03期
12 詹雪艳;史新元;段天璇;乔延江;;色谱指纹图谱相似度方法的研究进展[J];中国实验方剂学杂志;2011年02期
13 许鹏远;党延忠;;基于元相似度的推荐算法[J];计算机应用研究;2011年10期
14 支力佳;张少敏;赵大哲;赵宏;林树宽;;互信息启发的相似度组合图像检索算法[J];中国图象图形学报;2011年10期
15 吴雅妮;;相似度法在综合分析投资环境中的应用[J];统计与决策;2009年15期
16 徐晓静;李健;;静态粗相似度的特征[J];山东大学学报(理学版);2006年06期
17 霍明远 ,汪培庄;相似度求解的一般方法与应用[J];求是学刊;1986年01期
中国重要会议论文全文数据库 前10条
1 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 李红莲;潘建军;范京;;音节相似度及其在语音识别中的应用[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
3 丁维龙;吴水生;陈琦;程志君;;基于树形结构相似度的植物种类识别系统[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
4 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 郭瑛媚;史晓东;陈毅东;高燕;;基于词的话题分布相似度的无监督日文旅游意见词翻译[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三维相似度的活性小分子寻靶平台(英文)[A];中国化学会第30届学术年会摘要集-第二十五分会:化学信息学与化学计量学[C];2016年
8 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
中国博士学位论文全文数据库 前10条
1 王玉标;基于动态信任建模的云服务可信性评估与选择研究[D];重庆大学;2018年
2 高欣健;多模态相似度学习方法研究[D];合肥工业大学;2017年
3 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年
4 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年
5 张明西;信息网络中的相似度搜索问题研究[D];复旦大学;2013年
6 朱娜斐;基于RTT相似度的网络延迟估测理论和方法[D];北京工业大学;2012年
7 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年
8 朱笑尘;异质过程数据集成与修复[D];清华大学;2015年
9 贾连印;内存数据库中集合相似度及集合包含问题的研究[D];华南理工大学;2012年
10 崔晓兰;面向在线抱怨自动处理的推荐方法研究[D];华中科技大学;2017年
中国硕士学位论文全文数据库 前10条
1 徐傲丹;基于高阶路径相似度网络的融合模型及多组学数据整合分析方法[D];华南理工大学;2019年
2 郭炳元;基于语义树的短文本相似度算法研究与应用[D];湘潭大学;2019年
3 顾冲;社会化问答网站的社区发现及其服务推送研究[D];武汉理工大学;2018年
4 赵朋磊;基于图神经网络的二进制函数相似度检测算法研究及实现[D];浙江大学;2019年
5 薛曌;基于文本相似度的主观题自动评分系统的设计与实现[D];北京邮电大学;2019年
6 徐鑫鑫;基于WMD距离的文本相似度算法研究[D];太原理工大学;2019年
7 李兆兆;基于语义理解的智能问答系统关键技术研究[D];西安邮电大学;2019年
8 靳莉亚;基于威胁情报多维度分析的攻击组织关联与研判系统[D];国际关系学院;2019年
9 赵作成;基于用户相似度和项目相似度的加权Slope One算法优化[D];吉林大学;2019年
10 方敏;基于节点相似度的线要素匹配方法设计[D];北京建筑大学;2018年
中国重要报纸全文数据库 前10条
1 杨林;住宿按“相似度”分 体现学生视角[N];北京日报;2017年
2 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年
3 胡可;婚姻VS事业相似度揭秘[N];中国妇女报;2019年
4 本报记者 王斌 本报实习生 蒲晓磊;版权局官员:相似度极高的不受保护[N];法制日报;2012年
5 记者 李学梅;研究证实:父亲“偏爱”与自己相像的孩子[N];新华每日电讯;2009年
6 天相投资顾问公司 张新文;风格稳定基金业绩更胜一筹[N];证券时报;2007年
7 记者 刘妮;曾维会见日本新任驻沈总领事[N];沈阳日报;2012年
8 小新;妊娠中毒症与夫妇HLA基因相似度有关[N];中国医药报;2007年
9 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年
10 栾海;妊娠中毒症可能与夫妇 HLA基因相似度有关[N];医药经济报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978