收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的汉语词义消歧方法研究

张晶莹  
【摘要】:自然语言中一词多义现象是普遍存在的。词义消歧(word sense disambiguation,WSD)任务是依据上下文语境确定词的词义,词义消歧任务可以直接影响机器翻译(Machine Translation,MT)、信息检索(Information Retrieval,IR)等任务的性能。本文在机器学习框架下研究汉语词义消歧和未登录词词义预测问题。具体而言,本文将从以下三个方面展开研究:(1)基于序列标注的汉语词义消歧。本文将词义消歧任务形式化为序列标注问题,研究不同序列标注模型和不同特征的消歧性能。实验结果表明:融入五级标注词义特征的条件随机场模型消歧效果较好。(2)基于词向量的汉语词义消歧。为了进一步提高词义消歧性能,本文尝试将包含语义信息的词向量融入词义消歧中。一方面,利用上下文共现词频与句法依存信息缩减歧义词词义的候选数量,而后在神经网络模型下,通过计算学习获得的词义标记向量与歧义词向量的语义相似度确定词义;另一方面,我们对最大熵模型进行优化,并通过确定性区别词和语义相似度对语料进行扩展,以提高词义消歧的准确率。实验结果表明,利用扩展语料在神经网络最大熵模型的消歧效果最佳。(3)基于词向量的汉语未登录词的词义预测。在词义消歧的基础之上,本文探索未登录词的词义预测问题,分为两个子问题:词义候选构造与词义预测。在构造词义候选阶段,本文分别采用基于词性、内部语素、语义相似度的方法以及多方法融合进行构造;在词义预测阶段,本文利用不同粒度的词向量语义相似度对候选的词义进行预测。实验结果显示:基于多方法融合的方法构造未登录词的预测词义效果最佳。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴云芳;;词义消歧相关术语简介[J];术语标准化与信息技术;2010年03期
2 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
3 于林林;魏琦;宋丽芳;;基于多种方法相融合的词义消歧的研究[J];电脑知识与技术;2010年33期
4 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
5 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期
6 全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期
7 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
8 全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期
9 胡蓉;词义消歧方法初探[J];洛阳工业高等专科学校学报;2005年01期
10 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
11 闫蓉;张蕾;;一种新的汉语词义消歧方法[J];计算机技术与发展;2006年03期
12 卢志茂;刘挺;李生;;基于可拓学理论的汉语词义消歧[J];哈尔滨工业大学学报;2006年12期
13 吴云芳;金澎;郭涛;;基于词典属性特征的粗粒度词义消歧[J];中文信息学报;2007年02期
14 原媛;彭建华;张汝云;;基于统计的汉语词义消歧研究[J];信息工程大学学报;2007年04期
15 郭宇航;车万翔;刘挺;;基于语言模型验证的词义消歧语料获取[J];中文信息学报;2008年06期
16 陈佳;罗振声;;一种基于语义搭配的汉语词义消歧方法[J];微计算机信息;2008年03期
17 张明宝;马静;;一种基于知网的中文词义消歧算法[J];计算机技术与发展;2009年02期
18 葛斌;封孝生;汤大权;;基于模板的无导词义消歧方法[J];计算机工程与科学;2009年12期
19 林进展;王惠;;多义动词的词义消歧策略[J];云南师范大学学报(哲学社会科学版);2010年01期
20 李旭;刘国华;张东明;;一种改进的汉语全文无指导词义消歧方法[J];自动化学报;2010年01期
中国重要会议论文全文数据库 前10条
1 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 郭宇航;车万翔;刘挺;;基于语言模型验证的词义消歧语料获取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 王菁华;刘建毅;王枞;;语义网络结构下的词义消歧[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
5 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
8 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 赫兰光;王轩;李露;范士喜;;基于最大熵分类器的谓词识别与词义消歧[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前9条
1 周云;基于统计学习的词义消歧关键技术研究[D];国防科学技术大学;2014年
2 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
3 陈俊鹏;词义消歧中若干关键技术研究[D];武汉大学;2012年
4 鹿文鹏;基于依存和领域知识的词义消歧方法研究[D];北京理工大学;2014年
5 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
6 王菁华;文本中知识的获取[D];北京邮电大学;2008年
7 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
8 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
9 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 卞月峰;面向全文标注的中文词义消歧研究与实现[D];南京师范大学;2015年
2 张振景;基于SVM的离合词词义消歧[D];河北大学;2016年
3 张晶莹;基于深度学习的汉语词义消歧方法研究[D];黑龙江大学;2016年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 但汉辉;一种汉语词义消歧方法的研究[D];重庆大学;2009年
6 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
7 潘兆志;有监督方法在词义消歧中的应用[D];苏州大学;2009年
8 于林林;基于知网的汉语词义消歧方法的研究[D];沈阳航空工业学院;2008年
9 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
10 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978