收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于框架核心语义依存图的句子相似度计算研究

李双红  
【摘要】: 句子相似度计算在自然语言处理领域中占有基础而重要的地位。提高句子相似度计算的准确率对于提高自动问答,信息检索,机器翻译等系统的效率起到重要作用。本文在分析了国内外研究现状的基础上,以汉语框架网为基础,提出用框架语义依存图模型来表示一个句子的框架语义信息,并以框架语义依存图的相似度为依据来计算两个句子的语义相似度。同时,通过对框架元素进行多词块标注来提取框架元素的语义核心词,从而把框架语义依存图转化为框架核心语义依存图。具体来说,本文的工作主要包括: 依据英语核心依存图给出了汉语框架语义依存图模型。它是基于汉语框架网对汉语句子核心语义结构的一种形式化表示。提取一个句子的框架语义依存图就意味着抽取了这个句子的基于框架网的语义骨架。 在建立了汉语框架网络和依存图的数学模型的基础上,给出了汉语框架网上的语义度量方法。为了计算句子语义相似度,分别计算了依存图相似度和外围成分相似度,最后以它们的凸组合作为两个句子的相似度。同时,提出了度量一个相似度计算算法好坏的区分度的概念;为了计算一个框架元素在一个框架中的重要程度,本文给出了框架元素对框架的支持度的概念。实验表明基于框架依存图的句子相似度计算理论比基于HowNet的正确率有15%的提高。 提出了基于多词块标注的框架元素语义核心词识别和提取方法,通过对比分析,给出了多词块和框架元素的融合策略,并建立了在多词块标注基础上提取框架元素语义核心词的规则集。基于6771个框架元素上的实验结果显示,采用本文的方法和规则集提取框架元素核心词的平均准确率和覆盖率分别为95.58%和82.91%;在框架核心语义依存图上计算句子的相似度比在框架语义依存图上计算的准确率和召回率分别提高了1.33%和2.2%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 由丽萍;秦雅楠;董文博;裴夏璇;;框架与Petri网相结合的中文情境知识表示方法研究[J];情报理论与实践;2011年03期
2 秦雅楠;由丽萍;董文博;裴夏璇;;一种基于框架的情境知识表示方法[J];情报杂志;2011年01期
3 王文晶;李茹;;基于汉语框架网的问句分析及本体知识库推理[J];电脑开发与应用;2011年09期
4 贾君枝;邰杨芳;;FrameNet的语义类型研究[J];情报理论与实践;2007年05期
5 赵巾帼;徐德智;罗庆云;;汉语句子相似度计算方法比对之研究[J];福建电脑;2007年10期
6 贾君枝;卫荣娟;;框架间的语义本体类型关系研究[J];情报理论与实践;2009年02期
7 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报(自然科学版);2003年06期
8 王文晶;李茹;宋小香;;基于问题分析的旅游咨询系统[J];计算机工程;2009年12期
9 秦新国;;基于句子相似度的文档复制检测算法研究[J];现代图书情报技术;2007年11期
10 贾君枝;王永芳;;框架元素语义类型的自动确定[J];情报杂志;2010年06期
11 由丽萍;张惠春;;基于规则的中文框架元素自动标注方法研究[J];情报学报;2011年02期
12 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
13 李高和,张艳莉,李琪;一种由框架生成XML结构模型的方法[J];计算机工程;2005年15期
14 李茹;王文晶;梁吉业;宋小香;刘海静;由丽萍;;基于汉语框架网的旅游信息问答系统设计[J];中文信息学报;2009年02期
15 薛慧芳;;句子相似度计算初探[J];科技信息;2009年19期
16 郭书杰;黄明;梁旭;;陪护机器人口语对话系统设计与实现[J];网络安全技术与应用;2010年12期
17 刘建舟;刘晓华;;主观题自动批改技术的研究[J];湖北工业大学学报;2006年04期
18 乌庆敏;杨思春;;概念向量空间模型在智能答疑系统中的应用[J];安徽工业大学学报(自然科学版);2008年02期
19 陈雪艳;吕国英;李茹;何鹏;;基于层叠条件随机场的CFN自动标注研究[J];电脑开发与应用;2009年03期
20 吉胜军;;基于Levenshtein distance算法的句子相似度计算[J];电脑知识与技术;2009年09期
中国重要会议论文全文数据库 前10条
1 林丽;毕玉德;;越南语给予类动词的语义结构和层级分类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 康旭珍;李双红;李茹;;框架元素语义核心词自动识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 王荀;李素建;宋涛;姜伯平;;服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 王智强;刘海静;李双红;李茹;;基于TCRF的核心框架元素标注[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 吾买尔江·库尔班;阿里甫·库尔班;;维吾尔语框架语义知识库语义角色描述体系研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 李丽;冯志伟;;框架网络的理解和构建[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 李双红;李茹;钟立军;;基于多词块的框架元素语义核心词自动识别研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 刘开瑛;陈雪艳;李济洪;;汉语框架元素自动标注实验报告[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前7条
1 李茹;汉语句子框架语义结构分析技术研究[D];山西大学;2012年
2 李济洪;汉语框架语义角色的自动标注技术研究[D];山西大学;2010年
3 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
4 马洪海;汉语交易域框架语义系统研究[D];上海师范大学;2008年
5 肖开容;翻译中的框架操作[D];西南大学;2012年
6 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
7 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 李双红;基于框架核心语义依存图的句子相似度计算研究[D];山西大学;2010年
2 阿里甫.库尔班;维吾尔语框架语义知识库信息管理系统的设计与实现[D];电子科技大学;2011年
3 宋小香;基于汉语框架网的中文问句分类研究[D];山西大学;2010年
4 康旭珍;框架元素语义核心词自动识别研究[D];山西大学;2011年
5 高亚慧;汉语框架自动识别中的歧义消解[D];山西大学;2011年
6 刘海静;汉语框架排歧技术研究[D];山西大学;2011年
7 赵文娟;基于汉语框架本体的网络资源标注[D];山西大学;2010年
8 薛慧芳;句子相似度计算理论及应用研究[D];西北大学;2011年
9 刘欣;智能答疑系统中句子相似度计算的研究与应用[D];电子科技大学;2011年
10 王智强;基于依存特征的汉语框架语义角色自动标注[D];山西大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978