收藏本站
《北京理工大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于维基百科的命名实体消歧研究

唐博蓉  
【摘要】:词义是词汇在一定的语言环境下反映的特定语言现象。在自然语言中,一个词汇往往存在多个词义,称为词的多义性。词义消歧就是使计算机自动为词汇选择正确意思,这是自然语言处理领域中词汇级别上的难题,并且该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果。同时,多义词分布的普遍性决定了多义词词义消歧任务势必成为多种应用问题的关注焦点之一。诸如机器翻译、信息检索、自然语言内容语义分析、语法分析、语音识别和文语转换。命名实体是文本中承载信息的重要语言单位。命名实体的歧义问题在很多应用中已经成为一个亟待解决的问题。 本文对当前主流的针对命名实体的消歧方法进行了深入的研究,分析了不同消歧方法的特点和不足,提出了一种基于维基百科(Wikipedia)命名实体消歧方法。本文阐述的主要研究内容和取得的阶段成果是: 1.阐述当前命名实体消歧问题的研究历史与现状,讨论命名实体消歧的概念、分类与基本方法。 2.探讨分析传统命名实体消歧方法的基本原理并深入研究当前主流命名实体消歧方法的特征选取,消歧过程及各自的优劣。 3.提出了一种基于维基百科的命名实体消歧方法,提取多项特征,并通过机器学习的方法得到消歧结果。 4.从给定的实验数据集上进行对比实验,实验结果表明,所提出的方法在精度上比传统消歧方法有明显的提高。
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
2 赵军;;命名实体识别、排歧和跨语言关联[J];中文信息学报;2009年02期
【共引文献】
中国期刊全文数据库 前10条
1 朱姝;张政;;基于多层次句子相似度与向量空间模型的词义消歧[J];北京工商大学学报(自然科学版);2009年02期
2 朱敏;贾真;左玲;吴安峻;陈方正;柏玉;;中文微博实体链接研究[J];北京大学学报(自然科学版);2014年01期
3 陈宇;郑德权;赵铁军;;基于Deep Belief Nets方法的中文名实体分类研究[J];智能计算机与应用;2014年02期
4 罗文华;;非结构化数据处理分析在电子数据取证中的应用[J];警察技术;2010年03期
5 李静;罗文华;林鸿飞;;自然语言处理技术在网络案情分析系统中的应用[J];计算机工程与应用;2012年03期
6 赵星;;基于HNC理论的汉语词义消歧策略[J];丽水学院学报;2010年01期
7 赵军;;命名实体识别、排歧和跨语言关联[J];中文信息学报;2009年02期
8 乔剑敏;张仰森;;词义标注一致性检验系统的设计与实现[J];中文信息学报;2010年04期
9 赵军;刘康;周光有;蔡黎;;开放式文本信息抽取[J];中文信息学报;2011年06期
10 张禄彭;易绵竹;周云;;中文歧义研究25年——以《中文信息学报》论文为例[J];中文信息学报;2012年04期
中国重要会议论文全文数据库 前7条
1 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 陈建美;林鸿飞;杨志豪;;基于贝叶斯模型的词汇情感消歧[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 钟茂生;;基于词语形式标记的句际语义关系自动识别方法[A];第五届全国信息检索学术会议论文集[C];2009年
4 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
5 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
6 罗维;吉宗诚;吕雅娟;刘群;;一种改进词语对齐的新方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
中国博士学位论文全文数据库 前7条
1 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
2 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年
3 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
4 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
5 张俊三;Web中相关实体发现研究[D];北京交通大学;2013年
6 伍大勇;搜索引擎中命名实体查询处理相关技术研究[D];哈尔滨工业大学;2012年
7 郑志诚;用户查询歧义性分析研究[D];清华大学;2013年
中国硕士学位论文全文数据库 前10条
1 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
2 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
3 何世柱;文本分类和聚类若干模型的研究[D];江西师范大学;2011年
4 马二磊;互联网人物信息排歧技术研究[D];哈尔滨工业大学;2010年
5 林泉;学术网络重名排岐算法研究[D];华中科技大学;2011年
6 裴飞;基于聚类的英汉人名消歧研究[D];苏州大学;2011年
7 付春元;汉语嵌套命名实体识别方法研究[D];黑龙江大学;2011年
8 乔剑敏;汉语词义标注一致性检验方法的研究与实现[D];北京信息科技大学;2010年
9 张春国;工艺语句汉英计算机辅助翻译系统关键技术研究[D];南京航空航天大学;2004年
10 刘亚清;基于词义的汉语排歧方法研究[D];南京理工大学;2004年
【二级参考文献】
中国期刊全文数据库 前2条
1 蒋龙;周明;简立峰;;利用音译和网络挖掘翻译命名实体[J];中文信息学报;2007年01期
2 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【相似文献】
中国期刊全文数据库 前10条
1 杨莹,李应潭;基于意象知识的消歧体系[J];中文信息学报;1993年01期
2 汪津,杜德基;英汉机器翻译系统中的消歧策略[J];微型电脑应用;1997年04期
3 刘蓓,杜利民;汉语口语对话系统中语义分析的消歧策略[J];中文信息学报;2005年01期
4 周洪,陈强;基于SC文法的英汉机译中消歧处理的研究[J];北京联合大学学报;1997年03期
5 冯志伟;英日机器翻译系统E-to-J原语分析中的兼类词消歧策略[J];中文信息学报;1999年05期
6 张素芳;;国外跨语言信息检索中的翻译歧义性问题研究综述[J];图书馆学研究;2006年06期
7 陈淑珍,卢昌荆,林克明;WEB文本挖掘的中文分词系统的设计与实现[J];三明学院学报;2005年02期
8 范荣;;用融和丰富字特征的不等式平滑最大熵模型消解组合型歧义[J];电脑编程技巧与维护;2011年02期
9 张玥杰;张涛;朱靖波;姚天顺;;面向数据的句法分析消歧[J];计算机科学;2006年03期
10 方俊;郭雷;王晓东;;基于语义的关键词提取算法[J];计算机科学;2008年06期
中国重要会议论文全文数据库 前10条
1 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
2 李丽;孙甲申;王小捷;李江;宋占江;;基于属性信息的中文人名消歧[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
4 时迎超;王会珍;肖桐;胡明涵;;面向人名消歧任务的人名识别系统[A];第六届全国信息检索学术会议论文集[C];2010年
5 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 周云;王挺;易绵竹;王之元;;全词消歧的序列标注方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 冯志伟;;机器翻译系统消歧功能测试[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 杨晓安;;“没有VP的NP”型结构消歧的韵律手段[A];第九届中国语音学学术会议论文集[C];2010年
9 方向红;宋春阳;;介连兼类词“以”的句法语义区别特征及消歧策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 董亦农;;一个基于CFG的汉语句法分析器模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 张素芳 译 陈永伶 校;《消歧公约》面临新挑战[N];中国妇女报;2000年
2 北京科技大学法律系副教授 王竹青;《消歧公约》与中国司法实践[N];中国妇女报;2010年
3 本报记者木佳;私企难入农业科研门[N];中华工商时报;2003年
4 本报记者 王春霞;性别平等有助实现全面建设和谐社会[N];中国妇女报;2007年
5 本报记者 胡京春;跳出农业抓农业[N];人民政协报;2003年
6 傅燕;呼吁两会更多关注性别平等话题[N];中国妇女报;2007年
7 薛宁兰;我国妇女人权与法律的回顾和展望[N];中国社会科学院院报;2005年
8 谢虹;今春,民工返城不见“潮”[N];江苏经济报;2005年
9 ;别把我们当另类[N];中国妇女报;2000年
10 夏吟兰;在妇女人权框架下研究家庭暴力[N];法制日报;2004年
中国博士学位论文全文数据库 前10条
1 郑志诚;用户查询歧义性分析研究[D];清华大学;2013年
2 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
3 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
4 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
5 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
6 于永新;基于本体的图像语义识别和检索研究[D];天津大学;2009年
7 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
8 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
9 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
10 姜丽丽;实体搜索与实体解析方法研究[D];兰州大学;2012年
中国硕士学位论文全文数据库 前10条
1 李超;面向新闻领域的人名消歧方法研究[D];东北大学;2010年
2 宋文强;科技文献作者重名消歧与实体链接[D];哈尔滨工业大学;2012年
3 裴飞;基于聚类的英汉人名消歧研究[D];苏州大学;2011年
4 田维;基于半监督图聚类的专家消歧方法研究[D];昆明理工大学;2013年
5 王鑫;人名消歧关键技术研究与实现[D];哈尔滨工业大学;2012年
6 王沛;文本倾向性分析中的评价对象抽取与消歧研究[D];哈尔滨工业大学;2013年
7 沈剑平;面向网络人物搜索的中文人名消歧[D];哈尔滨工业大学;2010年
8 李丽;基于属性信息的中文人名消歧研究[D];北京邮电大学;2012年
9 朱小婷;基于本体的中文人名消歧[D];华东师范大学;2013年
10 赵凯祺;实体消歧及其在图像搜索中的应用[D];上海交通大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026