现代汉语分词系统中专名识别的实用策略
【摘要】:
中文信息处理的基础是分词。影响分词准确率的重要因素之一就是未登录
词的识别问题。人名、地名和企业名等专名是现代汉语未登录词的重要组成部
分。本文首先围绕分词系统中专名识别问题展开,对专名识别中具有代表性的
人名、地名、企业名的内部构成和上下文语境做了较为系统的分析,并在此基
础上,建立了人名、地名和企业名的识别规则集合。然后,本文就分词系统中
的用规则进行专名识别的技术和实现策略做了较为详细的阐述。基于上述技术
的中文分词系统已经实现,其中包含了专名识别的部分,所用的专名识别规则
经过了优化处理,并实现了多种专名歧义消解的动态规划算法。论文给出了该
系统专名识别性能的测试结果,并对结果进行了分析。测试结果表明,该系统
的专名识别能力达到了较高的实用水平。
|
|
|
|
1 |
郑靖洲;从批量替换功能浅析宏及宏病毒[J];微电脑世界;2002年01期 |
2 |
杨丽忠;专有名词中的人名研究[J];术语标准化与信息技术;2005年03期 |
3 |
梁卓明;陈炬桦;;基于专有名词优先的快速中文分词[J];计算机技术与发展;2008年03期 |
4 |
王娜;;在管理信息系统中加入自制的输入法[J];电脑知识与技术;2008年03期 |
5 |
李楠;;CNMARC环境下专有名词及专指主题词的标引特点[J];中华医学图书情报杂志;2010年03期 |
6 |
张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期 |
7 |
谭卫国;;英语新闻术语的特点[J];术语标准化与信息技术;2005年04期 |
8 |
TMG hyff;;教你装硬件之CPU是这样“吻”主板的[J];电脑爱好者(普及版);2009年08期 |
9 |
;美英报刊导读——新闻写作(十五)[J];英语文摘;2005年11期 |
10 |
王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期 |
11 |
孔祥龙,卢鹏,陆汝占,刘绍明;西方姓名译名的自动识别研究[J];计算机仿真;2004年08期 |
12 |
;山寨 手机是重灾区[J];电脑爱好者;2009年12期 |
13 |
冯磊;;重压之下也轻松[J];信息方略;2009年10期 |
14 |
曹爱菊;;外版图书编辑加工中的隐蔽问题[J];出版参考;2011年12期 |
15 |
莫玉羚;;外宣翻译中专有名词译名的统一问题[J];新闻爱好者;2009年08期 |
16 |
谢斌鑫;;积寒成冰的政经冬天[J];信息方略;2009年04期 |
17 |
周芝萍;拉鲁斯电影辞典即将问世[J];辞书研究;1988年03期 |
18 |
;古代作弊与防治[J];中国新闻周刊;2000年11期 |
19 |
谭红叶,郑家恒,刘开瑛;基于变换的中国地名自动识别研究(英文)[J];软件学报;2001年11期 |
20 |
;交流[J];科学世界;2003年01期 |
|