收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义范畴扩展的词义消歧的研究

孙广庆  
【摘要】: 词义消歧是自然语言处理中亟待解决的一个关键问题,词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,也是近些年来是计算语言学和自然语言处理领域一个重要的研究课题。本文对词义消歧的相关研究方法和词义消歧的知识源进行了综合评述。针对当前词义消歧常见的问题采用了一种新的解决方法。 近年来计算机的运算速度成倍增长及存储设备容量的增加也使得基于统计的方法能够发展下去,所以近年来基于统计的方法也得到了较快的发展。词典资源和语料库是基于统计方法消歧消歧常用的资源,基于有指导的词义消歧需要语料库来进行训练,为消歧提供判断词义的信息。本文根据实际需要选择了扩充的词典资源,使之更符合词义消歧的需要。 数据稀疏及小概率词义的问题一直是词义消歧领域很难解决的问题。为了缓解有导词义消歧方法中人工标注语料的繁重劳动以及数据稀疏问题,我们分别对歧义词和歧义词的指示词进行了同义词扩展和同范畴扩展,以此来提高现有语料的使用效率,解决数据稀疏的问题。通过设计实验,验证了本文方法是有效的,该方法能够较有效的缓解有导词义消歧方法中数据稀疏问题及小概率词义问题。本文的方法使词义消歧的正确率有了一定的提高,对词义消歧的方法的研究具有一定的参考价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 兰美辉;李红林;;中文词义消歧的方法研究[J];科技信息;2010年09期
2 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
3 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
4 全昌勤;何婷婷;姬东鸿;余绍文;;基于多分类器决策的词义消歧方法[J];计算机研究与发展;2006年05期
5 雷雪梅;王大亮;田中贵秋;曾广平;;基于深层特征抽取的日文词义消歧系统[J];北京科技大学学报;2010年02期
6 李永亮;黄曙光;鲍蕾;;一种基于PageRank算法和知网的词义消歧方法[J];计算机应用与软件;2011年05期
7 孙继明;李舟军;文健;;基于《知网》的汉语词语词义消歧方法[J];计算机与信息技术;2007年03期
8 范冬梅;卢志茂;张汝波;潘树燊;;基于信息增益改进贝叶斯模型的汉语词义消歧[J];电子与信息学报;2008年12期
9 陈佳;罗振声;;一种基于语义搭配的汉语词义消歧方法[J];微计算机信息;2008年03期
10 刘风成;黄德根;姜鹏;;基于AdaBoost.MH算法的汉语多义词消歧[J];中文信息学报;2006年03期
11 吴云芳;金澎;郭涛;;基于词典属性特征的粗粒度词义消歧[J];中文信息学报;2007年02期
12 龚永恩;袁春风;武港山;;基于语义的词义消歧算法初探[J];计算机应用研究;2006年03期
13 刘挺;卢志茂;李生;;一个全文词义自动标注系统的实现[J];哈尔滨工业大学学报;2005年12期
14 王灿辉;张敏;马少平;;自然语言处理在信息检索中的应用综述[J];中文信息学报;2007年02期
15 谈文蓉;符红光;刘莉;杨宪泽;;一种基于贝叶斯分类与机读词典的多义词排歧方法[J];计算机应用;2006年06期
16 朱虹;刘扬;;词汇语义知识库的研究现状与发展趋势[J];情报学报;2008年06期
17 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
18 全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期
19 胡蓉;词义消歧方法初探[J];洛阳工业高等专科学校学报;2005年01期
20 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
中国重要会议论文全文数据库 前10条
1 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 郎君;刘挺;张会鹏;李生;;LTP:语言技术平台[A];第三届学生计算语言学研讨会论文集[C];2006年
3 郎君;刘挺;李生;张会鹏;;基于XML的开放式语言技术平台:LTP[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
6 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
8 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
4 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
5 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
6 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
7 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
8 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
9 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
10 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
中国硕士学位论文全文数据库 前10条
1 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
2 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
3 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
4 闫蓉;基于语义的汉语词义消歧方法研究[D];西北大学;2006年
5 王文兴;基于语义分析的查询扩展及其关键技术研究[D];哈尔滨工程大学;2008年
6 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
7 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
8 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
9 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
10 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
8 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
9 ;开天辟地第一回[N];计算机世界;2002年
10 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978