收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语料库的汉语词义消歧方法研究

全昌勤  
【摘要】:词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,是一个影响着自然语言处理领域中许多其他应用问题(如机器翻译、信息检索等)的“中间问题”。本文主要研究以语料库作为主要知识源的汉语词义消歧方法。本文的研究工作主要包括以下几个方面: 1、对词义消歧的相关研究方法,包括词义消歧的知识源和消歧方法的分类进行了综合评述,主要对基于语料库的词义消歧方法进行了详细的分析和比较。 2、提出了一种基于多分类器决策的词义消歧策略,该策略综合利用带标语料和未标语料动态的构造消歧分类器,极大的减少了有导词义消歧方法中对大规模带有词义标注语料库的需求,扩展了有导词义消歧方法的应用。 3、为了缓解有导词义消歧方法中人工标注语料的繁重劳动以及数据稀疏问题,我们选择词义指示词作为词义消歧特征,通过它们来表达词与词之间的组合关系,并采用一种统计的机器学习方法(基于种子优选的词义指示词获取方法)高效的从语料库中获取代表多义词各义项的指示词集,从而在一定程度上解决了由人工选择消歧初始知识所带来的主观性和知识获取的瓶颈问题。 4、基于词义指示词,设计并实现了一种基于语料库的半指导的词义消歧方法,该方法能够较有效的缓解有导词义消歧方法中人工标注语料的繁重劳动以及数据稀疏问题。并且对词义指示词这一重要的消歧特征对消歧的影响进行了分析与考察,为综合利用多种消歧特征进行词义消歧提供了一定的参考。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期
2 兰美辉;李红林;;中文词义消歧的方法研究[J];科技信息;2010年09期
3 全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期
4 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
5 朱靖波,李珩,张跃,姚天顺;基于对数模型的词义自动消歧[J];软件学报;2001年09期
6 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
7 陈佳;罗振声;;一种基于语义搭配的汉语词义消歧方法[J];微计算机信息;2008年03期
8 全昌勤,刘辉,何婷婷;基于统计模型的词语搭配自动获取方法的分析与比较[J];计算机应用研究;2005年09期
9 朱靖波,姚天顺;词义自动消歧概率模型[J];东北大学学报;2000年05期
10 王贤川;曾敏;王小宁;朱雪波;李洪波;刘巧;;一种改进的基于语义的词义消歧方法[J];计算机应用与软件;2012年02期
11 于林林;魏琦;宋丽芳;;基于多种方法相融合的词义消歧的研究[J];电脑知识与技术;2010年33期
12 蒋平;;谈机器翻译中的词义消歧策略[J];文教资料;2007年04期
13 卢志茂,刘挺,张刚,李生;基于依存分析改进贝叶斯模型的词义消歧[J];高技术通讯;2003年05期
14 雷雪梅;王大亮;田中贵秋;曾广平;;基于深层特征抽取的日文词义消歧系统[J];北京科技大学学报;2010年02期
15 刘金辉;;一种消歧框架信息技术研究[J];数字技术与应用;2016年07期
16 李安;;多义词义项的语义关系及其对词义消歧的影响[J];语言文字应用;2014年01期
17 李畅;;信息抽取和实体消歧[J];福建电脑;2014年11期
18 陈浩;;基于知网的无指导词义消歧[J];电脑知识与技术;2015年10期
19 范冬梅;卢志茂;张汝波;潘树燊;;基于信息增益改进贝叶斯模型的汉语词义消歧[J];电子与信息学报;2008年12期
中国重要会议论文全文数据库 前10条
1 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 全昌勤;何婷婷;姬东鸿;;基于义类的无导词义消歧方法的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
4 ;汉语共时语料库:持续开发与多维应用[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
5 陈建美;林鸿飞;杨志豪;;基于贝叶斯模型的词汇情感消歧[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 张姝;杨沐昀;郑德权;赵铁军;;面向奥运的多语语料库构建[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
7 刘方舟;施勤;陶建华;;基于最大熵模型的多音字消歧[A];第九届全国人机语音通讯学术会议论文集[C];2007年
8 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
10 周云;王挺;易绵竹;王之元;;全词消歧的序列标注方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
3 冯骁骋;基于表示学习的信息抽取技术研究[D];哈尔滨工业大学;2018年
4 孙雅铭;基于文本表示学习的实体消歧研究[D];哈尔滨工业大学;2017年
5 周杰;基于网络语义资源的命名实体识别与消歧技术研究[D];解放军信息工程大学;2016年
6 周云;基于统计学习的词义消歧关键技术研究[D];国防科学技术大学;2014年
7 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
8 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
9 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
10 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
中国硕士学位论文全文数据库 前10条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
3 汤小娜;词义消歧在统计机器翻译中的应用研究[D];厦门大学;2007年
4 孙彦晨;基于隐马尔可夫模型的中文词义消歧方法研究[D];哈尔滨理工大学;2016年
5 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
6 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
7 崔磊;基于语义向量的无导词义消歧[D];河北大学;2012年
8 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
9 商敏;汉语词义消歧研究[D];大连理工大学;2007年
10 闫蓉;基于语义的汉语词义消歧方法研究[D];西北大学;2006年
中国重要报纸全文数据库 前10条
1 北京科技大学法律系副教授 王竹青;《消歧公约》与中国司法实践[N];中国妇女报;2010年
2 张素芳 译 陈永伶 校;《消歧公约》面临新挑战[N];中国妇女报;2000年
3 王培 美国天普大学计算机与信息科学系;机器翻译会迫使翻译们全失业吗?[N];北京科技报;2016年
4 本报记者 刘峣;人工智能创造新闻新玩法[N];人民日报海外版;2016年
5 北京商报记者 姜红;人工智能:市场前夜的秀场[N];北京商报;2017年
6 归欣;无需为“二代狗”惊慌失措[N];河南日报;2017年
7 本报记者 张盖伦;小心,聊天机器人也会被“教坏”[N];科技日报;2017年
8 本报记者 马爱平;机器人能成为“闺蜜”吗?[N];科技日报;2017年
9 陈宗周;重建巴别塔[N];电脑报;2017年
10 记者 李思;企业纷纷抢先机[N];上海金融报;2017年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978