收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种综合多层次信息的句子相似度计算方法研究

王璐  
【摘要】:传统句子相似度计算方法中仅考虑句子的某一方面信息,这些方法在特定领域比较实用,如果改变领域或侧重点,则移植性比较差并且准确率不高,因此,需要一种能综合平衡多层次信息的方法来弥补现有方法的不足。本文旨在研究一种新的综合多层次信息的句子相似度计算方法,主要研究工作如下:(1)提出一种两部语义词典相结合的方法来计算词语语义相似度。两部语义词典分别为:《哈尔滨工业大学同义词词林扩展版》和《知网》。同时,将词语的反义关系进行了特殊考虑,把反义关系也加入了词语的相似度计算中。(2)提出一种综合多层次信息的句子相似度计算方法。该方法首先考虑句子的语义信息,提出利用最大权匹配算法来计算句子语义相似度,寻找两个句子中一个具有最大权值的匹配,从而得到两个句子最大程度上的相似性。然后提出利用树核算法来计算句子的句法结构相似度。同时,针对两个句子可能具有两对反义词这种情形,提出将双重反义关系进行特殊考虑的方法。最后综合以上各种信息,得出句子的最终相似度。(3)通过实验对上述方法的有效性进行了验证。对词语相对度计算方法进行了同义词对识别、贬褒极性识别、文本聚类等实验,该方法在准确率、召回率或F值等指标上均有所提升。对句子相似度计算,进行了两种不同策略的实验,来对比分析本文方法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 蔡东风;白宇;于水;叶娜;任晓娜;;一种基于语境的词语相似度计算方法[J];中文信息学报;2010年03期
2 丁政建;张路;;一种改进的本体相似度计算方法[J];计算机工程;2010年24期
3 朱珍元;郑诚;;一种改进的本体相似度计算方法[J];微型机与应用;2011年01期
4 崔韬世;麦范金;;词语相似度计算方法分析[J];网络安全技术与应用;2012年05期
5 王国春;郑山红;赵辉;董亚则;;基于阶段递进的综合本体相似度计算方法[J];吉林大学学报(信息科学版);2014年02期
6 张忠平;田淑霞;刘洪强;;一种新的本体相似度计算方法[J];计算机应用研究;2008年10期
7 赵欢;李仁发;王家琴;张在美;;综合多层信息的本体概念相似度计算方法的研究[J];通信学报;2009年06期
8 李改;李章凤;李磊;;一种新的社会化相似度计算方法[J];计算机应用研究;2013年09期
9 曾辉;徐海洲;钟茂生;;基于主题和焦点的问句相似度计算方法[J];科学技术与工程;2014年06期
10 张忠平;田淑霞;刘洪强;;一种综合的本体相似度计算方法[J];计算机科学;2008年12期
11 李迎凯;徐小良;;一种改进的基于知网的句子相似度计算方法[J];电子科技;2012年07期
12 吕刚;郑诚;;基于加权的本体相似度计算方法[J];计算机工程与设计;2010年05期
13 陆军;;一种综合概念相似度计算方法[J];甘肃科技;2010年03期
14 石静;吴云芳;邱立坤;吕学强;;基于大规模语料库的汉语词义相似度计算方法[J];中文信息学报;2013年01期
15 张敏;王振辉;王艳丽;;一种基于《知网》知识描述语言结构的词语相似度计算方法[J];计算机应用与软件;2013年07期
16 王东;熊世桓;;一种新颖的汉字字形相似度计算方法[J];计算机应用研究;2013年08期
17 杨思春,程节华,陈家骏,王启祥;一种基于模式的汉语句子相似度计算方法[J];微型机与应用;2001年08期
18 李苏梅;韩国强;;感兴趣区域的确定及相似度计算方法[J];湖南工业大学学报;2008年04期
19 吴全娥;熊海灵;;一种综合多特征的句子相似度计算方法[J];计算机系统应用;2010年11期
20 陈大亨;;基于区间属性的相似度计算方法研究[J];科技信息;2011年08期
中国重要会议论文全文数据库 前8条
1 白宇;于水;叶娜;蔡东风;任晓娜;;一种基于语境的词语相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
2 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
5 章志凌;虞立群;罗海飞;邵晓敏;;基于改进Corpus库的词语相似度计算方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
6 章成志;李斌;;基于混合策略的查询串相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 陈希友;冯少荣;张东站;薛永生;;基于反馈的用户访问预测模型[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
8 李天宁;肖桐;朱靖波;;科技论文的IPC自动标注[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前2条
1 蔡圆媛;基于知识整合的词汇语义相似度计算方法研究[D];北京交通大学;2016年
2 吴小坤;轻量级服务推荐算法研究[D];北京邮电大学;2015年
中国硕士学位论文全文数据库 前10条
1 唐积益;推荐系统中相似度计算方法的研究[D];江苏科技大学;2015年
2 张广源;微博检索系统关键技术研究与实现[D];北京工业大学;2015年
3 尹路修;XML文档的聚类研究[D];湖南师范大学;2015年
4 邹能清;一种基于语义网络的中文文本相似度计算方法[D];湘潭大学;2015年
5 邬明强;基于分段融合的藏文文本相似度计算方法研究[D];西北民族大学;2016年
6 吕亚伟;食品安全网络舆情监测方法研究[D];北京化工大学;2016年
7 王璐;一种综合多层次信息的句子相似度计算方法研究[D];重庆大学;2016年
8 高鹏杨;基于多标签学习框架的微博文本分类研究[D];东南大学;2016年
9 万青云;并行LDA、聚类算法的研究及应用[D];南昌大学;2016年
10 陈欣;一种基于多属性本体的概念相似度计算方法的研究[D];东北师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978