收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语句子相似度计算方法及其应用的研究

周舫  
【摘要】:在中文信息处理中,汉语句子的相似度计算是一项基础而又重要的工作,它直接决定着某些领域的研究发展状况。例如,自动问答系统、基于实例的机器翻译、信息检索、自动文摘等领域,句子相似度计算都是一个非常关键的问题,长期以来一直是人们研究的一个热点和难点。 本文在研究汉语句子相似度的过程中,针对汉语由语素构成词语,由词语构成语句的特点,分别对汉语中的义原、词语、句子三个层次的相似度计算进行了研究。这三者层次不同,但是联系密切,由部分构成一个有机的整体,整个计算过程每一步都利用上一步的计算结果。本文主要有如下几个方面的研究成果: 1.研究了汉语语句的问句意图,并提出问句意图的提取方法。问句意图的提取是以疑问句为研究对象的,问句类型不同,提取意图的方法也会有所差异。本文的研究是处于问答系统背景下,分析语料根据不同疑问句出现的频率,把问句类型分为三类:特指问句,正反问句,句末语助词问句,从而根据问句的类型针对性的提出相对应的问句意图提取方法。 2.研究了汉语词语语义相似度及其计算方法,利用知网提供的丰富语义信息,计算义原相似度,进一步计算基于知网的词语语义相似度。词语相似度是本文句子相似度计算的基础。 3.提出多层次多种特征融合的汉语句子相似度计算方法。该算法从多个角度考察语句的相似性,充分利用句子含有的目标层、结构层、语义层等丰富信息,从句子中提取问句意图、关键词集、句子长度、名词个数、动词个数、专有名词个数等多种特征。运用一种简单有效的融合手段,进而获取综合特征,利用综合特征确定句子相似度的值。 4.以金融领域自然语言问答系统的模型为实例,体现句子相似度计算在具体应用领域的重要性。 这一课题的研究及其成果对于中文信息处理中的多种领域,都将具有一定的参考价值和良好的应用前景。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张莉;刘雅举;李东明;侯晨伟;;中文问句分类系统的分析[J];科技情报开发与经济;2007年25期
2 李波;邱锡鹏;曹均阔;;查询扩展在开放领域问答系统中的应用[J];计算机应用与软件;2009年07期
3 张莉;李东生;肖燕峰;;基于Web的受限领域问答系统研究及应用[J];电脑开发与应用;2007年05期
4 康海燕;刘文华;庄祺彦;;受限领域智能问答系统的研究与实践(英文)[J];西华大学学报(自然科学版);2008年02期
5 康海燕;李飞娟;苏文杰;;基于问句表征的web智能问答系统[J];北京信息科技大学学报(自然科学版);2011年01期
6 夏天;杨瑛霞;田爱奎;张际平;;学习支持系统问题理解模块的架构[J];开放教育研究;2006年04期
7 拜战胜;蓝岚;彭佳红;陈哲;;对话系统中控制模型的比较研究[J];郑州大学学报(理学版);2006年04期
8 张巍;陈俊杰;;浅层语义分析及SPARQL在问答系统中的应用[J];计算机工程与应用;2011年02期
9 周法国;杨炳儒;;句子相似度计算新方法及在问答系统中的应用[J];计算机工程与应用;2008年01期
10 李婷玉;葛正荣;姚天昉;;汉语情感问题类型分类研究[J];中文信息学报;2011年02期
11 陈哲;文敦伟;;用自然语言处理改进问答系统的研究和实现[J];计算机工程;2006年20期
12 游斓,周雅倩,黄萱菁,吴立德;基于最大熵模型的QA系统置信度评分算法[J];软件学报;2005年08期
13 李季;孙冀侠;;标准中文问答系统的研究与实现[J];鞍山师范学院学报;2005年06期
14 郭涛;郭浩;;图书信息领域中文问句浅层语义分析技术[J];太原理工大学学报;2009年04期
15 付鸿鹄;基于W eb的开放领域问答系统研究[J];现代图书情报技术;2005年09期
16 杜玮;邸书灵;孙树静;;基于互联网技术的问答系统研究[J];微计算机信息;2007年36期
17 张晓孪;王西锋;;中文问答系统中语义角色标注的研究与实现[J];科学技术与工程;2008年10期
18 李季;一个标准中文问答系统的研究与实现[J];计算机系统应用;2004年06期
19 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
20 黄祥喜;刘卫国;;自然语言处理和情报检索[J];计算机科学;1986年05期
中国重要会议论文全文数据库 前10条
1 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
2 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 栗振江;杨洋;李丽;;智能问答系统[A];2011年全国通信安全学术会议论文集[C];2011年
4 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
6 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
8 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
2 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
3 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
4 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
5 路遥;用户交互式问答系统中问题推荐机制的研究[D];中国科学技术大学;2012年
6 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
7 张显;信息距离理论及其在问答系统中的应用研究[D];清华大学;2008年
8 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
9 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
10 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
中国硕士学位论文全文数据库 前10条
1 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
2 刘艳芳;中文视频问答系统[D];燕山大学;2007年
3 张晓孪;中文问答系统中问题理解与信息检索的研究与实现[D];西北大学;2007年
4 张兰轩;基于潜在语义分析的大学概况中文问答系统[D];大连理工大学;2004年
5 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
6 刘祥;基于课程知识的问答系统研究与应用[D];大连海事大学;2010年
7 高艳影;中文问答系统中的问题分类研究[D];合肥工业大学;2011年
8 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
9 刘渊杰;社区问答系统最佳回答机制的研究[D];上海交通大学;2010年
10 胡家豪;基于互联网的WEB舆情问答系统[D];电子科技大学;2011年
中国重要报纸全文数据库 前10条
1 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
2 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
6 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
7 蓝岸;微软亚洲研究院在深设立实验室[N];深圳特区报;2006年
8 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
9 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
10 ;开天辟地第一回[N];计算机世界;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978