收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语词和短语的歧义消解研究

秦颖  
【摘要】: 信息网络技术的飞速发展使信息的发布和共享超越了时空限制,基于自然语言处理技术的文档高质量自动处理成为热点研究课题。自然语言中普遍存在着歧义现象。计算机处理自然语言文档时,必然要面对和解决各种歧义问题。歧义消解成为自然语言处理中的核心任务之一。 语言中的歧义错综复杂,本文认为,简单的单一分析不可能认识语言歧义的全貌,因而也就不可能高质量地消解歧义,只有对歧义进行多视角综合考察,才能达到此目标。为此,本文从纵横两个视角进行歧义研究。 一、基于全信息理论的横向视角:信息有语法、语义和语用三个层次,语言信息同样如此。而每个层次都存在歧义,即有语法歧义,语义歧义和语用歧义。这个角度有助于从语言逻辑层面更清晰地研究歧义特征。 二、基于语言单元的纵向视角:汉语的主要语言单元包括词、短语及句子等。而歧义在每一级单元都存在,即有词汇层歧义、短语层歧义以及句子层歧义等。纵向角度便于研究的具体实现,并有可能探索通用的消歧方法。 综合这两个角度,本文研究的内容包括,从语法层看的词汇边界歧义和短语边界歧义,从语义层看的词汇多义歧义、短语功能歧义及短语结构歧义。 在各种歧义的研究中,本文主要围绕歧义分类、歧义侦测和歧义消解三个问题进行。歧义分类研究各种歧义的特征,歧义侦测是为了发现歧义及确定歧义的位置,而基于歧义特点对侦测出的歧义进行消解则是语言处理的中心任务。 从两个视角出发,集中解决三个问题构成了本文的研究框架。 本文的主要研究成果包括以下几点: 1.对汉语语言信息自动处理时的歧义在特征上进行了分类。将词汇级语法歧义分为交叠歧义和包络歧义两大类。提出了新的歧义侦测和消歧方法; 2.利用级联分类方法改进了基于经验定义的短语识别的性能,有效降低了学习器训练时间,进一步从语义角度研究了复合名词短语定界歧义问题,同时实现了跨语料的短语识别及歧义研究; 3.用粒度短语的观点处理汉语短语定义模糊的问题,实现了粒度名词短语的定义和识别方法; 4.从短语功能角度完成句子骨架成分的识别,消解短语在句子中的句法功能歧义。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期
2 全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期
3 荀恩东,李生,赵铁军;基于汉语二元同现的统计词义消歧方法研究[J];高技术通讯;1998年10期
4 李沐,高维君,姚天顺;英汉翻译中短语的识别与分析[J];小型微型计算机系统;2000年07期
5 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
6 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
7 李纲;寇广增;;自举在词义消歧中的应用及其关键问题[J];情报学报;2010年01期
8 陈浩;何婷婷;姬东鸿;;基于MDL聚类的无导词义消歧[J];小型微型计算机系统;2005年10期
9 张明宝;马静;;一种基于知网的中文词义消歧算法[J];计算机技术与发展;2009年02期
10 全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期
11 何婷婷;谢芳;;利用BP神经网络的中文词义消歧模型[J];华中师范大学学报(自然科学版);2005年04期
12 陈笑蓉;秦进;;基于最大熵原理的汉语词义消歧[J];计算机科学;2005年05期
13 曲维光;陈小荷;董宇;穗志方;;基于语境计算模型的汉语词义消歧(英文)[J];广西师范大学学报(自然科学版);2006年04期
14 张剑飞;李照欣;;基于后缀数组的Web文本重复短语识别[J];高师理科学刊;2007年05期
15 王博;杨沐昀;李生;赵铁军;;中文全词消歧在机器翻译系统中的性能评测[J];自动化学报;2008年05期
16 李辉;张琦;卢湖川;杨德礼;;基于知网的中文常问问答系统[J];计算机工程;2008年23期
17 刘商飞;张志祥;;基于改进的Bayes判别法的中文多义词消歧[J];计算机与数字工程;2009年10期
18 王瑞琴;孔繁胜;潘俊;;基于WordNet的无导词义消歧方法[J];浙江大学学报(工学版);2010年04期
19 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
20 张仰森;郭江;;四种统计词义消歧模型的分析与比较[J];北京信息科技大学学报(自然科学版);2011年02期
中国重要会议论文全文数据库 前10条
1 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
5 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 吴云芳;温珍珊;段慧明;俞士汶;;语料库粗粒度词义标注[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 何径舟;王厚峰;;基于特征自动选取的汉语词义消歧[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 景元;陈春纬;;基于规则的英汉翻译技术报告[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
10 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前10条
1 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
2 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
3 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
4 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
5 王菁华;文本中知识的获取[D];北京邮电大学;2008年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
8 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
9 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
10 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
中国硕士学位论文全文数据库 前10条
1 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
2 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
3 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
4 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
5 秦少康;英语词汇歧义及英汉机器翻译中词义消歧上下限研究[D];厦门大学;2006年
6 徐赟;基于知网和贝叶斯模型的词义消岐技术的研究[D];南京理工大学;2010年
7 汤小娜;词义消歧在统计机器翻译中的应用研究[D];厦门大学;2007年
8 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
9 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
10 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
中国重要报纸全文数据库 前2条
1 钱峻英;搜索引擎的过去与未来[N];光明日报;2004年
2 本报记者 念珍;搜出e片暖冬[N];中国电脑教育报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978