期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《苏州大学》 2005年
加入收藏 获取最新

中文未登录词识别的研究及在汉字输入法中的应用

周蕾  
【摘要】:未登录词识别是中文信息处理领域中的一个难点。本文针对汉字输入法词库的特点,提出了一种适用于输入法词库的未登录词识别方案,该方案通过碎片分词和词结合提取两步进行未登录词识别;并利用该方案实现了一个用于更新输入法词库的完整系统ZHHZ-OOVRS。 本文首先分析和比较了现有的未登录词识别方案,并介绍了输入法词库的特点,从而明确课题目标;在此基础上,提出了系统的整体设计方案,分别介绍了动态语料库构筑、语料未登录词识别、未登录词录入输入法词库三个模块;然后,具体描述了系统的设计与实现,重点介绍了语料未登录词识别模块的详细设计、实现流程和实验数据分析;最后,介绍系统的整合与操作。 文章提出了一种适用于输入法词库的未登录词识别方案,对未登录词的研究具有一定的参考价值;实现的更新输入法词库的系统,能满足输入法词库的需求,具有一定的实用价值。
【关键词】:未登录词识别 汉字输入法 碎片分词 词结合提取
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP391.43
【DOI】:CNKI:CDMD:2.2005.134927
【目录】:
  • 摘要3-4
  • ABSTRACT4-8
  • 第一章 引言8-11
  • 1.1 课题提出8-9
  • 1.2 课题内容9-10
  • 1.2.1 课题内容9
  • 1.2.2 本人工作9-10
  • 1.3 课题意义10
  • 1.4 本文组织10-11
  • 第二章 相关知识介绍11-19
  • 2.1 未登录词介绍11-17
  • 2.1.1 未登录词概念11-12
  • 2.1.2 未登录词识别基本方法12-16
  • 2.1.3 未登录词识别具体方案介绍16-17
  • 2.1.4 未登录词识别性能评判标准17
  • 2.2 汉字输入法介绍17-19
  • 第三章 系统总体设计19-23
  • 3.1 系统构架设计19-22
  • 3.2 系统开发所用资源与运行环境22-23
  • 第四章 系统实现23-60
  • 4.1 动态语料库构筑23-28
  • 4.1.1 动态语料库构筑具体设计23-25
  • 4.1.2 动态语料库构筑具体实现25-28
  • 4.2 语料未登录词识别28-54
  • 4.2.1 语料未登录词识别具体设计28-32
  • 4.2.2 碎片分词提取未登录词32-46
  • 4.2.3 词结合提取未登录词46-53
  • 4.2.4 语料未登录词识别小结53-54
  • 4.3 未登录词录入汉字输入法54-57
  • 4.4 系统整合57-60
  • 第五章 总结与展望60-62
  • 5.1 总结60
  • 5.2 展望60-62
  • 参考文献62-65
  • 攻读学位期间公开发表的论文65-66
  • 致谢66-67
  • 硕士专业学位论文详细摘要67-69
全文下载: CAJ格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【相似文献】
中国期刊全文数据库 前10条
1 汪明霓;汉字输入法的若干诀窍[J];电脑爱好者;2001年15期
2 黄王乐;为中文WINDOWS增加汉字输入法的通用方法[J];广西师范大学学报(自然科学版);1997年03期
3 赵雷,吕强,杨季文,朱巧明;汉字输入法类的设计与实现[J];中文信息学报;1996年04期
4 姚其彬 ,徐怀彪;电脑汉字输入法的新篇章——记张新芳教授和他的新方码[J];中国党政干部论坛;2005年04期
5 郭村荣;汉字输入法的诀窍[J];家庭科技;2002年04期
6 宋文祥;汉字输入法亟待统一版本[J];科技文萃;1995年01期
7 李静;;手机汉字输入法被国外垄断让人担忧[J];IT时代周刊;2008年18期
8 黄长青;汉字输入法的分类及选用[J];家用电器.消费;1999年09期
9 李振勇;介绍一款好“码”——沈码输入法简介[J];家庭电子;2000年04期
10 徐娅;101汉字输入法简介[J];家庭电子;2003年07期
中国重要会议论文全文数据库 前10条
1 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 金结室;黄文;;交点式汉字输入法[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
3 郑岩松;;纯数字编码的汉字输入法将是今后键盘汉字输入法的主流——谈左右数码汉字电脑输入法及其键盘[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
4 张小衡;;为何汉字形码输入法难以走出“难”的困境?——谈谈一些技术上的欠妥观点[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 徐万胥;;数字统一码原理与实践[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
6 王尧世;;电脑、汉字、文化——汉字输入法的理论初探[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
7 雷静;张舵;冯霞;;基于构成模式的汉语机构名识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 徐万胥;;笔画的信息与数字编码[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 陈荣滨;;编码·相马·赛马——电脑速记创研的心路历程[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
10 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 新文;语句级手机汉字输入法问世[N];中国计算机报;2004年
2 记者 林英;一种全新的汉字输入法问世[N];光明日报;2003年
3 吴文虎;汉字输入法:适合的才是最好的[N];光明日报;2003年
4 刘培香 好诚;新一代手机汉字输入法问世[N];科学时报;2004年
5 本报记者 李秀玲;自主汉字输入法何时走入百姓手机[N];工人日报;2008年
6 杨谷;我国每年为进口汉字输入法花费数亿元[N];光明日报;2006年
7 本报记者 陈伟 实习生 吕亚茹;手机汉字输入法为何长期“受制于人”[N];经济参考报;2008年
8 中文信息学会课题组;如何提高国产手机汉字输入法的市场竞争力[N];光明日报;2007年
9 通讯员 杨明剑 本报记者 朱彤;小手机大名堂[N];科技日报;2006年
10 胡军;我国手机汉字输入技术缘何遭遇尴尬[N];中国消费者报;2008年
中国博士学位论文全文数据库 前1条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 周蕾;中文未登录词识别的研究及在汉字输入法中的应用[D];苏州大学;2005年
2 吴海辉;笔画码汉字输入法软件设计与实现[D];安徽大学;2004年
3 朱晓旭;手持设备汉字输入法自动生成技术研究与实现[D];苏州大学;2005年
4 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
5 袁学飞;基于uC/OS-Ⅱ操作系统的便携式转辙机测试仪的设计[D];西北工业大学;2006年
6 曲卫华;手机中文输入法的设计与实现[D];中国地质大学(北京);2007年
7 杨超;基于最大匹配的书面汉语自动分词研究[D];湖南大学;2004年
8 张会鹏;中文词法分析技术的研究与实现[D];哈尔滨工业大学;2006年
9 潘阿荣;基于Windows Mobile的智能手机汉字输入法研究[D];哈尔滨工业大学;2006年
10 黄立冬;基础教育资源搜索引擎中的中文分词技术研究[D];南京师范大学;2006年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭