收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

联机手写汉字识别技术研究

吕新桥  
【摘要】:联机手写作为一种友好的人机交互方式,以其“不用学,不用记”的特点一直受到人们的青睐,特别是近年来,消费类电子终端产品的普及,更是对联机手写汉字输入提出了更高的要求。联机手写汉字识别作为解决手写汉字的联机输入问题的重要方法更是一直作为人们关注和研究的热点。联机手写汉字识别是一个超多类的复杂模式识别问题,以其类别多,手写变形大,字形结构复杂而成为联机手写系统必须攻克的难题。多年来,许多新方法新技术不停应用于联机手写汉字识别系统,取得了相当的成功,但有关联机手写汉字识别的关键算法和体系架构尚没有完整的报道。联机手写汉字识别技术的研究有着广泛的市场前景和深刻的理论意义。 围绕着联机手写汉字识别的难题,开展了如下几个方面的工作:基于内角和多边形逼近提取笔段;基于有限状态机对笔段进行合并;基于字根的联机手写汉字识别算法研究;利用支持向量机识别字根和相似字。 针对汉字的结构特征提取不稳定以及笔段可能会被过度合并或者合并不足而影响识别结果,提出基于内角和多边形逼近的汉字笔段提取算法。算法首先找到笔画的第一个拐点(最小内角值小于指定阈值),该拐点将笔画分割成两个部分。然后分别寻找拐点两侧曲线段上的拐点,反复执行,直到再也找不到拐点为止。依次连接一个笔画中所有曲线的起点和终点,就形成了该笔画的笔段系列。对提取到的笔段集合运用有限状态机描述并判定笔段的状态,并以此判定笔段的合并要求,以最大限度地减少冗余笔段。实验证明,这种算法具有较低的计算复杂度和很好的逼近效果,能适应手写汉字的笔段提取合并要求。 对于基于字根识别手写汉字的算法进行了研究。汉字的类型分为包围、半包围、左右、上下和独体五种类型。在判断汉字的结构类型后,对汉字进行分解,得到汉字的字根属性字符串,然后对字根属性字符串进行匹配得到汉字的识别结果。系统稳定高效,取得了非常好的识别效果。 采用排除法判断汉字的结构类型。首先判断汉字是否为包围类型,即如果能检测到外围“口”字形,则判定该汉字为包围类型,需根据具体汉字的笔段个数决定对汉字进行拆分或者匹配;否则如果检测到汉字中的长笔段符合半包围的结构特征,则判定为半包围类型,并确定字根的类型,再根据笔段个数确定对汉字进行拆分或者匹配。针对既不是包围也不是半包围结构的汉字,使用聚类算法进行分类判断结构类型,为保证分类的准确性,对分类的结果进行了校验后再确定汉字的结构类型。如果不是独体字,则继续进行拆分直到不能拆分为止。这样,提取的每一个部分都是一个字根。将所有的字根结合起来构成汉字的待识字根属性串,对其进行匹配得到汉字的识别结果。为保证字根识别的正确性,利用局部排序算法对字根里的笔段进行了局部排序。 支持向量机是一种统计学习方法,具有全局最优性和学习泛化能力强的特点。近年来广泛应用于模式识别。对支持向量机应用于联机手写汉字识别做了研究和探讨。首先,对经过抽取得到的笔段块提取统计特征,然后进行学习识别以得到字根,实验证明,利用支持向量机能一定程度地有效识别汉字字根,支持向量机的优点得到了体现。针对汉字的字型结构复杂,相似汉字很多的特点,利用支持向量机结合部分空间特征对相似字进行识别处理。首先分析归纳相似汉字的不同特征,然后利用支持向量机进行学习和识别,最后得到相似字区分的结果。实验证明,在前期阶段已经识别的基础上,支持向量机能提高系统的识别率。 论文在联机手写体汉字识别方面做了一些有益的探索,也形成了稳定可靠的汉字识别系统。下一步应努力提高汉字的识别速度,使之能够很好地应用于嵌入式系统。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郝保水;;Equation Chapter 1 Section 1联机手写数学公式识别技术[J];大众科技;2011年06期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 熊军;周德新;;基于神经网络的手写印刷体汉字识别[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
2 张莲;邓力;李昌春;;模糊神经网络在汉字识别系统中的应用[A];电工理论与新技术2004年学术研讨会论文集[C];2004年
3 吴雅楠;李建华;;一种基于DSP的文字识别方法的研究[A];第七届全国信息获取与处理学术会议论文集[C];2009年
4 陈敏;王翠叶;;中文信息处理的现状与展望[A];语言文字应用研究论文集(Ⅱ)[C];2004年
5 焦希君;王金保;;计算机编排技术的综合运用与发展——科技编辑智能优化的新挑战[A];辽宁省科技期刊编辑优秀论文集[C];1997年
6 陈光;张洪刚;郭军;;基于余弦整形变换的手写汉字训练样本生成方法[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
7 王建平;潘乐;;基于广义误差反馈的手写体汉字识别系统研究[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
8 种锋;赵景秀;李兴华;李波;;一种有效的脱机手写汉字识别新方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 张荣;刘家锋;唐降龙;;基于统计学习理论的CHMM结构优化分析[A];2001年中国智能自动化会议论文集(上册)[C];2001年
中国博士学位论文全文数据库 前3条
1 吕新桥;联机手写汉字识别技术研究[D];华中科技大学;2009年
2 邓达;自组织学习及其在汉字识别和图象分析中的应用[D];华南理工大学;1995年
3 杨端端;手写虚拟汉字识别研究及其在多通道短信交互系统中的应用[D];华南理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 武桐;基于图像匹配的汉字识别系统研究与实现[D];上海交通大学;2010年
2 杨静;视频图像字符分割与识别的研究[D];合肥工业大学;2005年
3 鲍胜利;基于多算法集成和神经网络的汉字识别系统的研究[D];四川大学;2002年
4 刘晓娟;联机手写汉字识别中字根提取算法研究[D];华中科技大学;2008年
5 穆举胜;基于粗糙集的汉字图像识别方法研究[D];合肥工业大学;2007年
6 朱敏觉;多分类器集成的脱机手写体汉字识别方法的研究[D];湖南大学;2008年
7 陈正伟;基于粗糙集和遗传算法的脱机手写体汉字识别方法研究[D];合肥工业大学;2009年
8 梁涌;印刷体汉字识别系统的研究与实现[D];西北工业大学;2006年
9 倪桂博;印刷体文字识别的研究[D];华北电力大学(河北);2008年
10 戴维;基于Gabor特征与SVM的汉字识别系统研究与实现[D];上海交通大学;2009年
中国重要报纸全文数据库 前10条
1 彭保林 郑优军;“扫”进美丽[N];电脑报;2002年
2 许建伟任向阳 朱飞骏;网点半自动化服务系统有待开发[N];金融时报;2008年
3 李晓力;清华文通领先科技[N];中国高新技术产业导报;2000年
4 本报记者 曹春玲;张连毅的淘金情结[N];中国信息报;2000年
5 张文国;“汉王”的成功之路[N];中国高新技术产业导报;2000年
6 本报记者  齐柳明;站在手写板笔尖上的巨人[N];光明日报;2006年
7 海燕;独立软件商的生存思考[N];中华工商时报;2000年
8 本报记者 李大庆;清华科技攀高峰重转化[N];科技日报;2001年
9 邓励;巧用OCR软件扫描矢量表格[N];电脑报;2003年
10 本报实习记者 朱杰;汉王以核心技术奠定上市基础[N];中国经营报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978