基于语料库的汉语词义消歧方法研究
【摘要】:词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,是一个影响着自然语言处理领域中许多其他应用问题(如机器翻译、信息检索等)的“中间问题”。本文主要研究以语料库作为主要知识源的汉语词义消歧方法。本文的研究工作主要包括以下几个方面:
1、对词义消歧的相关研究方法,包括词义消歧的知识源和消歧方法的分类进行了综合评述,主要对基于语料库的词义消歧方法进行了详细的分析和比较。
2、提出了一种基于多分类器决策的词义消歧策略,该策略综合利用带标语料和未标语料动态的构造消歧分类器,极大的减少了有导词义消歧方法中对大规模带有词义标注语料库的需求,扩展了有导词义消歧方法的应用。
3、为了缓解有导词义消歧方法中人工标注语料的繁重劳动以及数据稀疏问题,我们选择词义指示词作为词义消歧特征,通过它们来表达词与词之间的组合关系,并采用一种统计的机器学习方法(基于种子优选的词义指示词获取方法)高效的从语料库中获取代表多义词各义项的指示词集,从而在一定程度上解决了由人工选择消歧初始知识所带来的主观性和知识获取的瓶颈问题。
4、基于词义指示词,设计并实现了一种基于语料库的半指导的词义消歧方法,该方法能够较有效的缓解有导词义消歧方法中人工标注语料的繁重劳动以及数据稀疏问题。并且对词义指示词这一重要的消歧特征对消歧的影响进行了分析与考察,为综合利用多种消歧特征进行词义消歧提供了一定的参考。
|
|
|
|
1 |
全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期 |
2 |
兰美辉;李红林;;中文词义消歧的方法研究[J];科技信息;2010年09期 |
3 |
全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期 |
4 |
全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期 |
5 |
朱靖波,李珩,张跃,姚天顺;基于对数模型的词义自动消歧[J];软件学报;2001年09期 |
6 |
金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期 |
7 |
陈佳;罗振声;;一种基于语义搭配的汉语词义消歧方法[J];微计算机信息;2008年03期 |
8 |
全昌勤,刘辉,何婷婷;基于统计模型的词语搭配自动获取方法的分析与比较[J];计算机应用研究;2005年09期 |
9 |
朱靖波,姚天顺;词义自动消歧概率模型[J];东北大学学报;2000年05期 |
10 |
王贤川;曾敏;王小宁;朱雪波;李洪波;刘巧;;一种改进的基于语义的词义消歧方法[J];计算机应用与软件;2012年02期 |
11 |
于林林;魏琦;宋丽芳;;基于多种方法相融合的词义消歧的研究[J];电脑知识与技术;2010年33期 |
12 |
蒋平;;谈机器翻译中的词义消歧策略[J];文教资料;2007年04期 |
13 |
卢志茂,刘挺,张刚,李生;基于依存分析改进贝叶斯模型的词义消歧[J];高技术通讯;2003年05期 |
14 |
雷雪梅;王大亮;田中贵秋;曾广平;;基于深层特征抽取的日文词义消歧系统[J];北京科技大学学报;2010年02期 |
15 |
刘金辉;;一种消歧框架信息技术研究[J];数字技术与应用;2016年07期 |
16 |
李安;;多义词义项的语义关系及其对词义消歧的影响[J];语言文字应用;2014年01期 |
17 |
李畅;;信息抽取和实体消歧[J];福建电脑;2014年11期 |
18 |
陈浩;;基于知网的无指导词义消歧[J];电脑知识与技术;2015年10期 |
19 |
范冬梅;卢志茂;张汝波;潘树燊;;基于信息增益改进贝叶斯模型的汉语词义消歧[J];电子与信息学报;2008年12期 |
|