收藏本站
《大连理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于条件随机场模型的中文人名识别的研究

王东亮  
【摘要】: 中文人名识别是中文命名实体识别(NER)的一个重点工作,广泛应用于信息检索、信息抽取、机器翻译等领域。中文人名在命名实体中占有很大的比重,并且由于中文人名结构的复杂性和形式的多样性,中文人名识别一直是中文信息处理领域的一个难点。 本文在前人工作的基础上,采用条件随机场(Conditional Random Fields, CRFs)模型,并利用篇章信息,来完成中文人名识别的任务。本文的主要工作和特点介绍如下: (1)详细介绍了条件随机场模型,并讨论了本模型相比其他机器学习模型的特点。CRFs模型是当前比较优秀的条件概率模型,它既克服了生成模型的独立性假设,同时避免了有向图模型的标记偏执问题,并具有这两种模型的优点。 (2)由于中文人名可能在同一篇语料中多次出现,但是同一人名在不同的位置具有不同的上下文环境,因此对于上下文信息比较充足的人名很容易通过模型进行召回,但是对于上下文信息不足的人名可能被漏识别。本文基于篇章信息,将通过CRFs模型识别出来的人名提取出来作为人名词典,进行第二次人名识别,进一步提高中文人名识别的效率。 本文的研究成果同样适用于中文地名和机构名等其他命名实体的识别,实验证明本文提出的方法是有效的。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 冯伟;利用数据库处理CAD应用中的中文及表格[J];职大学报;1995年01期
2 明冬萍,骆剑承,周成虎,王晶;基于简化随机场模型的高分辨率遥感影像分割方法[J];计算机工程与应用;2004年26期
3 马桂琴;中文搜索引擎研究[J];兰州商学院学报;2001年S2期
4 陈明;网络的安全维护与故障排除[J];微型电脑应用;2001年03期
5 端木艺;网上中文学位论文数据库简评[J];现代情报;2003年01期
6 沈殊璇;Linux平台中文化的实现方案[J];微处理机;2003年01期
7 霍然;普通高校实施中文素质教育探索[J];杭州电子工业学院学报;2004年02期
8 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
9 葛金虎;;基于条件随机场的中文命名实体识别的研究[J];科技信息;2010年16期
10 王知津,孙美丽,蒋伟伟;网上中文社会科学信息资源利用研究——在校与非在校用户对比分析[J];晋图学刊;2003年04期
11 王本中;基于PDA系统的中文语音合成[J];工业技术经济;1998年03期
12 ;ThinkPad315ED着中文套装[J];每周电脑报;1998年11期
13 华强;中西文文本压缩的LZWCH算法[J];计算机工程与应用;1999年03期
14 史廷春;中文文字ASCⅡ码识别与应用系统开发[J];计算机工程;1999年10期
15 贺宏朝,何丕廉,高剑峰,黄昌宁;利用一种衰减的共现模型进行中文信息检索查询扩展(英文)[J];Transactions of Tianjin University;2002年03期
16 刘其成,肖明,高坚;Java编程中的中文问题及其解决方法[J];计算机系统应用;2003年06期
17 韩文君;赵伟;;基于随机场的碰撞检测控制算法[J];长春工业大学学报(自然科学版);2008年02期
18 杨铭,于振涛,刘希民;“中文科技期刊篇名数据库”系统数据文档结构分析和利用[J];高师理科学刊;1995年04期
19 华强;中文文本压缩的 LZSSCH 算法[J];中文信息学报;1998年01期
20 王永成,许慧敏;OA-1.4 版中文自动摘要系统[J];高技术通讯;1998年01期
中国重要会议论文全文数据库 前10条
1 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 王佳;;对中文屋思想实验四个主要版本的考察[A];第三届全国科技哲学暨交叉学科研究生论坛文集[C];2010年
4 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
5 吴法洲;苏昊;周明;李春平;;利用英文搜索日志建立中文新词同义词词表[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 计峰;邱锡鹏;黄萱菁;;中文不确定性句子的识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 周小甲;李昊旻;吕旭东;段会龙;;中文病历文本中的时间表达分类与识别[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会青年优秀论文[C];2010年
8 张小衡;;一个支持人工校对的中文简繁体转换工具[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 崔磊;王穗苹;;副中央凹-中央凹效应的中文眼动研究[A];第十一届全国心理学学术会议论文摘要集[C];2007年
10 韩宪军;武清玺;杨明珠;;岩石地基弹性模量随机场建模方法研究[A];2007重大水利水电科技前沿院士论坛暨首届中国水利博士论坛论文集[C];2007年
中国重要报纸全文数据库 前10条
1 张海桐;用中文把歌剧唱出来[N];人民日报海外版;2011年
2 张伟城;中文热持续升温[N];人民日报海外版;2009年
3 朱珉迕;说中文和“拌洋荤”[N];解放日报;2009年
4 本报驻巴黎记者 姚立;“中文热”在法升温速度令人始料不及[N];光明日报;2010年
5 刘菲;关注特殊的学中文群体[N];人民日报海外版;2011年
6 记者钟哲 通讯员李世举;合编首部“民族版”高校中文教材[N];中国社会科学报;2010年
7 ;“汉语桥”世界大学生中文比赛举行[N];人民日报;2011年
8 晓阳;《选报》落户起点中文网[N];中华新闻报;2009年
9 ;中文在线 “九死一生”的出版经历[N];电脑报;2010年
10 本报记者 原小瑛;欧特克发布中文工厂设计软件[N];中国化工报;2010年
中国博士学位论文全文数据库 前10条
1 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
2 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
3 邵晓鹏;红外纹理生成方法研究[D];西安电子科技大学;2005年
4 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
5 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
6 朱红霞;随机场理论在地基可靠度分析中的应用研究[D];天津大学;2008年
7 朱麟;中国人说英语的节奏模式及在教学中的运用[D];中央民族大学;2007年
8 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
9 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
10 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
2 陈成海;评塞尔的中文屋论证[D];浙江大学;2010年
3 侯立斌;中文事件抽取与缺失角色填充的研究[D];苏州大学;2012年
4 刘冬平;面向中文歌词的音乐情感分类研究[D];广东工业大学;2011年
5 李丽娜;中文专家检索关键技术研究[D];昆明理工大学;2011年
6 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年
7 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
8 汤明达;基于近邻传播算法的中文文本聚类的研究[D];广西师范大学;2012年
9 张硕果;基于条件随机场模型的文本分类研究[D];重庆大学;2010年
10 张山山;中文XML压缩技术研究[D];华中科技大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978