收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

现代汉语分词系统中专名识别的实用策略

李卫亮  
【摘要】: 中文信息处理的基础是分词。影响分词准确率的重要因素之一就是未登录 词的识别问题。人名、地名和企业名等专名是现代汉语未登录词的重要组成部 分。本文首先围绕分词系统中专名识别问题展开,对专名识别中具有代表性的 人名、地名、企业名的内部构成和上下文语境做了较为系统的分析,并在此基 础上,建立了人名、地名和企业名的识别规则集合。然后,本文就分词系统中 的用规则进行专名识别的技术和实现策略做了较为详细的阐述。基于上述技术 的中文分词系统已经实现,其中包含了专名识别的部分,所用的专名识别规则 经过了优化处理,并实现了多种专名歧义消解的动态规划算法。论文给出了该 系统专名识别性能的测试结果,并对结果进行了分析。测试结果表明,该系统 的专名识别能力达到了较高的实用水平。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郑靖洲;从批量替换功能浅析宏及宏病毒[J];微电脑世界;2002年01期
2 杨丽忠;专有名词中的人名研究[J];术语标准化与信息技术;2005年03期
3 梁卓明;陈炬桦;;基于专有名词优先的快速中文分词[J];计算机技术与发展;2008年03期
4 王娜;;在管理信息系统中加入自制的输入法[J];电脑知识与技术;2008年03期
5 李楠;;CNMARC环境下专有名词及专指主题词的标引特点[J];中华医学图书情报杂志;2010年03期
6 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
7 谭卫国;;英语新闻术语的特点[J];术语标准化与信息技术;2005年04期
8 TMG hyff;;教你装硬件之CPU是这样“吻”主板的[J];电脑爱好者(普及版);2009年08期
9 ;美英报刊导读——新闻写作(十五)[J];英语文摘;2005年11期
10 王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期
11 孔祥龙,卢鹏,陆汝占,刘绍明;西方姓名译名的自动识别研究[J];计算机仿真;2004年08期
12 ;山寨 手机是重灾区[J];电脑爱好者;2009年12期
13 冯磊;;重压之下也轻松[J];信息方略;2009年10期
14 曹爱菊;;外版图书编辑加工中的隐蔽问题[J];出版参考;2011年12期
15 莫玉羚;;外宣翻译中专有名词译名的统一问题[J];新闻爱好者;2009年08期
16 谢斌鑫;;积寒成冰的政经冬天[J];信息方略;2009年04期
17 周芝萍;拉鲁斯电影辞典即将问世[J];辞书研究;1988年03期
18 ;古代作弊与防治[J];中国新闻周刊;2000年11期
19 谭红叶,郑家恒,刘开瑛;基于变换的中国地名自动识别研究(英文)[J];软件学报;2001年11期
20 ;交流[J];科学世界;2003年01期
中国重要会议论文全文数据库 前10条
1 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
3 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 韩子满;;论二手专有名词的翻译[A];中国英汉语比较研究会第八次全国学术研讨会论文摘要汇编[C];2008年
5 刘开瑛;;专有名词与网络词语识别软件技术研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 张家龙;;罗素的摹状词理论述评[A];全国逻辑讨论会论文选集[C];1979年
7 吕永进;郑承萍;;外国人名、地名翻译中的汉字应用问题[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
8 张云涛;龚玲;王永成;;识别中文文本中的未登录专有名词的类别[A];2007年中国智能自动化会议论文集[C];2007年
9 郑家恒;杨晓岩;;英文译名自动识别方法研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
10 贾玉文;;《圣经》语词索引及其编制[A];2004年度中国索引学会年会暨学术讨论会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 钱琴;指涉理论与俄语中的指涉现象[D];上海外国语大学;2007年
2 王霄兵;玛雅文字研究[D];华东师范大学;2005年
3 陈俊和;现代汉语“X+们”的语义功能研究[D];复旦大学;2009年
4 姜红;与陈述、指称相关的现代汉语语法现象研究[D];苏州大学;2007年
5 唐德正;《晏子春秋》词汇研究[D];山东大学;2006年
6 樊长荣;汉英有定性制约机制研究[D];华中科技大学;2007年
7 骆琳;面向计算机的现代汉语“得”字研究[D];华中科技大学;2007年
8 贾晴;基于数据库的汉韩对话语篇指称研究[D];华东师范大学;2009年
9 李谨香;汉俄语名词性短语的结构与功能研究[D];黑龙江大学;2006年
10 陈会兵;古书中词语的特殊读音研究[D];福建师范大学;2007年
中国硕士学位论文全文数据库 前10条
1 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
2 武琦;法语中专有名词的语义研究[D];上海外国语大学;2010年
3 吴利利;专有名词泛化的认知研究[D];湖南大学;2011年
4 苗露;专有名词作指称语的语用研究[D];南京师范大学;2003年
5 王兴义;基于模式匹配的中文专有名词识别[D];山西大学;2005年
6 张琦;从顺应论浅析专有名词的翻译[D];上海外国语大学;2010年
7 施建凤;基于NSP和CRFs双层模型的专有名词识别方法[D];河北大学;2010年
8 郎咸慧;普通化专有名词的计算机辅助分析[D];大连海事大学;2002年
9 王霁;从符号学角度看《红楼梦》两个英语译本的专有名词翻译[D];上海外国语大学;2012年
10 王晓玲;基于语料库的网络服装类“专有名词”研究[D];山东大学;2011年
中国重要报纸全文数据库 前10条
1 蒋一帆;邮集专有名词与专业术语的英译[N];中国集邮报;2009年
2 本报记者 肖涛;甘洒热血谱华章[N];西藏日报;2010年
3 刘效仁;创新利益分配格局是一剂良方[N];中国审计报;2009年
4 本报记者 白 岭;高价股回落透出什么信息[N];证券日报;2005年
5 王道森;立法中的简称语言[N];法制日报;2003年
6 闻 名;“两税并轨”的政策不宜久拖[N];中国商报;2005年
7 罗艾桦;让村民早日变成市民[N];人民日报;2004年
8 本报记者 周净;家电一“变频”价格涨三成[N];消费日报;2010年
9 曾湘泉 李洪坚;给“穷忙族”更多关注[N];人民日报;2009年
10 本报记者 张文凯;衡州大道:梦想在提速[N];衡阳日报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978