收藏本站
《华南理工大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

旋转方向无关的无约束手写中文词组识别

龙腾  
【摘要】: 本文致力于研究旋转方向无关的无约束中文手写词组识别技术,这种技术能让用户在没有字符框约束的书写区域内自然、流畅地以任意角度书写汉字词组。然而,这项研究面临着多项技术难题,包括:书写词组的旋转方向矫正问题,词组字符间笔画的粘连与重叠所带来的切分问题,汉字结构复杂与书写风格多变的问题,以及汉字词组词汇量庞大等问题。本文围绕着这些难点对中文手写词组的识别技术展开了一系列研究,主要工作包括: 1.针对手写词组的倾斜矫正,提出了一种基于重心平衡的中文手写词组方向检测方法。实验结果表明,该方法能较好地将用户以任意倾斜角度(0°~ 360°)书写的中文词组矫正到水平位置,从而使得本文提出的手写词组识别方法成为一种旋转方向无关的手写词组识别方法。 2.用户在快速书写的过程中,字与字之间容易产生连笔的现象,而且用户如果书写的词组字间距很小,字与字之间也容易产生笔画粘连甚至部分笔画重叠等问题,针对这些问题,本文提出了一种基于笔段提取与启发式笔段拆分的过切分方法。实验结果表明,该方法能较好地将连笔、粘连笔画或部分重叠笔画切分开来,从而为后面的切分组合路径搜索打好了基础。 3.对手写单字识别进行了深入研究,提出两种不同的识别方案,一种基于笔画矢量方向特征和动态时间规整(DTW)技术的联机汉字识别方法,另一种则基于两级LDA粗分类器和一级MQDF细分类器的多级脱机汉字识别方法,并将两种识别方案进行了集成。实验结果表明,联机与脱机识别技术有着较好的互补性,两者的集成大幅提高了手写汉字的识别效果。另外,针对汉字书写可能出现不同的书写风格,本文也对手写汉字的多模板建模进行了研究,为了提高多模板的代表性,提出一种基于简化引力模型的聚类方法,实验结果表明,该聚类方法能生成比传统K-Means聚类更优的多模板,即使通过最小分类错误率(MCE)训练方法对多模板进行训练调整,调整后的模板也要优于经过同样MCE训练调整后的K-Means聚类模板。 4.针对手写词组的字符切分,提出一种基于识别的字符切分验证模型,并同时用到词典的信息对切分结果进行进一步确认,由于对切分出来的部分进行单字识别输出的是识别候选字序列,因此在切分路径的搜索过程中,只要每个切分部分的正确的结果位于该部分的识别候选字序列内,即使不是第一识别候选,也能在后续的基于词典信息的切分验证模型中将其找出组成正确的词组输出。另外,针对中文词组词汇量大的问题,本文采用了一种哈希词典技术,使词典搜索验证的时间复杂度为常数O(1)。实验结果表明,通过这种验证模型进行词组识别,由于利用了词组中单字间的上下文信息,识别率由单字识别的84.58%提高到91.67%,而错误率则由15.42%下降到5.23%,大幅下降了66.9%,从而显示出本文提出的中文手写词组识别方法的有效性, 5.传统的高准确率MQDF分类器由于其参数存储量巨大,无法被应用于存储空间受限的手持设备如手机或掌上电脑上,为了使其能得到应用,让人们体验到这种技术带来的识别率的大幅提升,本文研究提出了一种基于子空间共享的矢量量化压缩技术,该技术能以牺牲较小的识别性能来换取大幅降低的识别引擎字典存储空间。本文将其应用在传统的LDA与MQDF分类器上,使得整体分类器字典的容量从76.4MB降到了2.06MB,大幅压缩了97.3%,而识别率则仅仅下降0.88%,仍然维持在97%以上的水平。通过这种技术,使得传统的高识别率MQDF分类器被移植到手机等手持设备上成为可能。 总之,多字词的手写识别由于包含了上下文信息,只要切分问题能得以很好的解决,则对其的识别效果将优于单字的手写识别,而且多字词的连续输入相对于单个字符逐个逐框地输入更显得自然和人性化,这些特点都表明了多字词连续手写识别技术将是汉字手写识别技术未来的发展方向。
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.43

手机知网App
【引证文献】
中国博士学位论文全文数据库 前2条
1 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
2 丁凯;基于增量学习的中文手写书写者自适应技术研究[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前9条
1 莫咏柳;基于支持向量机的联机手写汉字识别的研究[D];太原理工大学;2011年
2 热娜古丽·达古提;联机手写维吾尔文单词识别关键技术研究[D];新疆大学;2011年
3 刘岗;无约束大词汇量联机手写词组识别新方法[D];华南理工大学;2011年
4 严汉羽;联机无约束手写汉字文本行识别[D];华南理工大学;2011年
5 何聪;基于Google Android和云计算的手写识别系统的研究与实现[D];华南理工大学;2011年
6 黄盛明;联机手写汉字的旋转无关识别研究[D];华南理工大学;2010年
7 严乔;基于WiFi无线网络的智能识别机器人研究与实现[D];华南理工大学;2010年
8 黄志斌;基于ILDA的用户书写风格自适应方法及其应用[D];华南理工大学;2010年
9 张辉;大规模联机手写汉字识别数据库整理、统计与实验分析[D];华南理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 吕岳,施鹏飞,张克华;基于汉字结构特征的自由格式手写体汉字切分[J];电子学报;2000年05期
2 郭军,蔺志青,张洪刚;一个新的脱机手写汉字数据库模型及其应用[J];电子学报;2000年05期
3 高彦宇,杨扬;无约束手写体汉字切分方法综述[J];计算机工程;2004年05期
4 蔡樱,盛立东;手写文稿识别的一种后处理方法和系统集成[J];中文信息学报;2000年03期
5 韩智;刘昌平;殷绪成;;手写中文信封的地址行字符切分算法[J];中文信息学报;2006年01期
6 李元祥,丁晓青,刘长松;基于HMM的汉语文本识别后处理研究[J];中文信息学报;1999年04期
7 田守瑞,马赓坚,王亚利,夏绍玮;无约束手写体支票金额汉字串识别系统[J];清华大学学报(自然科学版);2002年09期
8 姚正斌,丁晓青,刘长松;基于笔划合并和动态规划的联机汉字切分算法[J];清华大学学报(自然科学版);2004年10期
9 蒋焰;丁晓青;任征;;基于地址结构匹配的手写中文地址的切分与识别[J];清华大学学报(自然科学版);2006年07期
10 韩勇;须德;戴国忠;;MST在手写汉字切分中的应用[J];软件学报;2006年03期
【共引文献】
中国期刊全文数据库 前10条
1 赵骥;王丽君;李晶皎;;基于统计的满文识别后处理的研究和实现[J];鞍山科技大学学报;2005年06期
2 陈增照;杨扬;董才林;何秀玲;;支持向量机动态学习方法及其在票据识别中的应用[J];北京科技大学学报;2006年02期
3 李晶皎,赵骥;基于贝斯准则和待定词集模糊矩阵的满文识别后处理[J];东北大学学报;2004年11期
4 郑蕊蕊;赵继印;李敏;于为民;吴宝春;;多民族脱机手写体汉字数据库的设计与构建[J];大连民族学院学报;2011年05期
5 虞瑾;丁晓青;;联机手写公式中字符的切分与识别[J];电视技术;2007年S1期
6 丁晓青;汉字识别研究的回顾[J];电子学报;2002年09期
7 蔺志青,郭军;贝叶斯分类器在手写汉字识别中的应用[J];电子学报;2002年12期
8 吴天雷,马少平;基于重叠动态网格和模糊隶属度的手写汉字特征抽取[J];电子学报;2004年02期
9 徐蔚然,郭军;手写金融汉字识别中的可信度估计[J];电子学报;2005年10期
10 赵继印;郑蕊蕊;吴宝春;李敏;;脱机手写体汉字识别综述[J];电子学报;2010年02期
中国重要会议论文全文数据库 前6条
1 陈光;张洪刚;郭军;;基于余弦整形变换的手写汉字训练样本生成方法[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
2 曾薇;孟祥旭;杨承磊;黄磊;李学庆;;基于离散隐Markov模型的在线手写体识别系统[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 姜映映;王绪刚;敖翔;戴国忠;;手写化学公式的在线切分识别[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国人机交互学术会议(CHCI'06)论文集[C];2006年
4 ;Online Handwriting Mongolia Words Recognition Based on HMM Classifier[A];2009中国控制与决策会议论文集(3)[C];2009年
5 吴天雷;马少平;;基于重叠动态网格和模糊方向线素特征的手写汉字识别[A];第八届全国汉字识别学术会议论文集[C];2002年
6 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
2 鄢煜尘;基于信息融合的中文笔迹鉴别研究[D];武汉大学;2009年
3 丁凯;基于增量学习的中文手写书写者自适应技术研究[D];华南理工大学;2011年
4 杨兵;人—机交互中手绘图形的联机识别方法研究[D];西安电子科技大学;2001年
5 丛键;视频流分层传输与流中文本识别[D];电子科技大学;2001年
6 李蓉;基于质量评价的矢量化工程图后处理技术研究[D];西北工业大学;2003年
7 张重阳;票据自动处理系统中的预处理技术研究[D];南京理工大学;2004年
8 左文明;脱机手写中文签名鉴别的研究[D];华南理工大学;2004年
9 高学;基于运动图像的手写汉字识别研究[D];华南理工大学;2003年
10 孟明;基于力信息的在线签名认证研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 曾艳艳;基于RBF神经网络的手绘电气草图识别研究[D];湘潭大学;2009年
2 董兴辉;中文信封图像分割和目的地址块定位的研究[D];中国海洋大学;2010年
3 王明黔;口令认证系统的安全性研究与实现[D];昆明理工大学;2009年
4 莫咏柳;基于支持向量机的联机手写汉字识别的研究[D];太原理工大学;2011年
5 田露;基于多特征数据融合的离线中文笔迹鉴别研究[D];河南大学;2011年
6 林强;基于OCR的支票识别系统的研究与实现[D];北京邮电大学;2010年
7 万欣欣;HCL2000手写汉字识别的理论与应用研究[D];北京邮电大学;2011年
8 薛环振;运用机械臂的计算机书法创作系统设计与开发[D];华东师范大学;2011年
9 热娜古丽·达古提;联机手写维吾尔文单词识别关键技术研究[D];新疆大学;2011年
10 刘岗;无约束大词汇量联机手写词组识别新方法[D];华南理工大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李奇;高宁;;手写体笔迹识别中分类器的设计及实现[J];长春理工大学学报;2005年04期
2 张载高;解水本;胡尔滨;贝亚军;赵哲;贾群;姜湘伟;;机器臂辅助胸腔镜技术在心血管外科领域的应用[J];第二军医大学学报;2006年03期
3 张青,尹俊勋;小波变换在手写体汉字识别中的应用[J];电路与系统学报;1996年03期
4 金连文,徐秉铮;手写体汉字识别中的一种新的特征提取方法——弹性网格方向分解特征[J];电路与系统学报;1997年03期
5 宫蓉蓉;;基于SVM的手写体相似汉字识别[J];电脑与信息技术;2008年04期
6 赵道华;艾斯卡尔·艾木都拉;;基于过拆分和合并的联机手写英文单词分割技术[J];电脑知识与技术;2009年07期
7 金伟健;;手写体相似字识别方法研究[J];电脑知识与技术;2009年08期
8 吕岳,施鹏飞,张克华;基于汉字结构特征的自由格式手写体汉字切分[J];电子学报;2000年05期
9 郭军,蔺志青,张洪刚;一个新的脱机手写汉字数据库模型及其应用[J];电子学报;2000年05期
10 高学,金连文,尹俊勋,黄建成;一种基于支持向量机的手写汉字识别方法[J];电子学报;2002年05期
中国博士学位论文全文数据库 前6条
1 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
2 高学;基于运动图像的手写汉字识别研究[D];华南理工大学;2003年
3 金连文;手写体汉字识别的研究[D];华南理工大学;1996年
4 杨端端;手写虚拟汉字识别研究及其在多通道短信交互系统中的应用[D];华南理工大学;2007年
5 苏统华;脱机中文手写识别—从孤立汉字到真实文本[D];哈尔滨工业大学;2008年
6 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 何聪;基于Google Android和云计算的手写识别系统的研究与实现[D];华南理工大学;2011年
2 顾晶;基于实虚笔段方向特征粗分方法的联机手写汉字识别[D];南京理工大学;2002年
3 甘金来;图像边缘检测算法的比较研究[D];电子科技大学;2005年
4 俞庆英;联机手写汉字识别系统的研究与实现[D];安徽大学;2005年
5 陈军;基于支持向量机的脱机手写体汉字识别方法的研究[D];合肥工业大学;2006年
6 丁胜;基于支持向量机的手写体字符识别[D];青岛大学;2006年
7 曹志宏;维吾尔文字联机手写体识别系统的研究与实现[D];新疆大学;2007年
8 王树海;BP神经网络与支持向量机二级识别手写体数字[D];北京邮电大学;2007年
9 周奇;基于支持向量机的脱机手写字符识别研究[D];重庆大学;2007年
10 樊庆林;基于笔画的联机手写汉字识别系统的研究与实现[D];安徽大学;2007年
【二级引证文献】
中国期刊全文数据库 前1条
1 赵炜;;WIFI网络设计规划研究分析[J];信息通信;2012年02期
中国硕士学位论文全文数据库 前2条
1 严汉羽;联机无约束手写汉字文本行识别[D];华南理工大学;2011年
2 张辉;大规模联机手写汉字识别数据库整理、统计与实验分析[D];华南理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 吕岳,施鹏飞,张克华;基于汉字结构特征的自由格式手写体汉字切分[J];电子学报;2000年05期
2 丁晓青;汉字识别研究的回顾[J];电子学报;2002年09期
3 王琳琬,杨扬,颉斌,杨毅;基于连通域单元和穿越算法的汉字切分[J];信息技术;2004年04期
4 朱锴,赵宇明,吴越;一种离线手写体汉字切分的自适应算法[J];计算机工程与应用;2004年06期
5 高彦宇,杨扬;无约束手写体汉字切分方法综述[J];计算机工程;2004年05期
6 魏湘辉,马少平;基于凸包像素比特征的粘连汉字切分[J];中文信息学报;2005年01期
7 韩布新;部件组合──潜在的汉字结构层次[J];中文信息学报;1995年03期
8 周嫔,马少平,姜哲;基于单元合并的汉字切分算法的改进[J];中文信息学报;1999年02期
9 陈强,娄震,杨静宇;非限定手写汉字的分割研究[J];南京理工大学学报(自然科学版);2004年01期
10 田守瑞,马赓坚,王亚利,夏绍玮;无约束手写体支票金额汉字串识别系统[J];清华大学学报(自然科学版);2002年09期
【相似文献】
中国期刊全文数据库 前10条
1 马婉婕;孙虎元;孙立娟;孙晓光;;基于神经网络集成的手写识别系统[J];计算机应用与软件;2009年08期
2 郭锐峰;;汉王挑战手写识别盗版[J];程序员;2005年04期
3 李正豪;;汉王 引领“双核”手写识别新纪元[J];通信世界;2009年29期
4 杜文龙;毛学军;;手写识别技术在网上阅卷系统中的应用[J];电脑学习;2010年01期
5 ;专注 看汉王创造精彩[J];计算机与网络;2006年22期
6 阿呆;;汉王开启“双核”手写识别新纪元[J];通讯世界;2009年07期
7 ;汉王引领3G人脸开机时代开创手写识别新纪元[J];中国新通信;2009年14期
8 王欣然;;“捆绑”会毁了“手写”市场?[J];每周电脑报;2000年02期
9 李燕霞;周井泉;;基于网络流内在特征的P2P业务识别技术研究[J];微型机与应用;2009年21期
10 ;汉王打假身份证[J];每周电脑报;2002年35期
中国重要会议论文全文数据库 前10条
1 刘素萍;;模拟钚部件的模板识别[A];中国工程物理研究院科技年报(2009年版)[C];2010年
2 翟鹏程;高岳权;;结构损伤识别方法研究现状[A];土木建筑教育改革理论与实践[C];2009年
3 郭文川;郭康权;朱新华;;介电特性在番茄和苹果品种识别中的应用[A];农业机械化与新农村建设——中国农业机械学会2006年学术年会论文集(下册)[C];2006年
4 刘杰;秦永强;史元春;;面向交互桌面的高效触点识别方法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 邓玉春;刘世平;;自动步态识别方法研究综述[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 王永军;董海卫;杨涛;;统计与结构并用的工程图纸符号识别方法[A];2001中国控制与决策学术年会论文集[C];2001年
7 范小骞;李福平;张立毅;;软件无线电中调制信号识别技术的研究[A];2005中国通信集成电路技术与应用研讨会论文集[C];2005年
8 陈颖颖;张雁军;贾鑫;;通信信号调制识别方法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
9 殷启新;贾学明;彭宇;;数字声纹识别技术在刑侦工作中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
10 段中钰;王尚旭;;三湖地区天然气藏地震识别技术[A];中国地球物理·2009[C];2009年
中国重要报纸全文数据库 前10条
1 李爽;手写识别 外文不再是难题[N];国际商报;2006年
2 ;汉王天宇朗通达成核心技术合作协议[N];人民邮电;2008年
3 本报记者  刘晓峰 赵槿;档案管理进入信息化快车道[N];经济日报;2006年
4 海峰;“闪念”822快了,所以轻松[N];计算机世界;2001年
5 张飞雪;“不让他们挣走一分钱”[N];中国财经报;2007年
6 吴明;手写识别技术又升一级[N];中国经营报;2001年
7 刘津;手写识别技术:嵌入你的生活[N];北京科技报;2002年
8 樊立新;汉王科技:UMPC阵营里的“中锋”[N];大众科技报;2006年
9 刘富品;紫光文通:识别产品全面推向应用[N];中国计算机报;2004年
10 本报记者  王明峰;自主创新成就汉王神话[N];人民日报海外版;2006年
中国博士学位论文全文数据库 前10条
1 龙腾;旋转方向无关的无约束手写中文词组识别[D];华南理工大学;2008年
2 叶俊勇;人脸检测与识别方法研究[D];重庆大学;2002年
3 丁凯;基于增量学习的中文手写书写者自适应技术研究[D];华南理工大学;2011年
4 邵强;切削加工过程中颤振的监测与识别方法研究[D];大连理工大学;2010年
5 张军;抗噪声语音识别技术的研究[D];华南理工大学;2003年
6 陈倩;多生物特征融合身份识别研究[D];浙江大学;2007年
7 王骐;基于虚拟立体视约束的视角无关手语识别研究[D];哈尔滨工业大学;2008年
8 陈欢;直线阵潜艇噪声源高分辨定位识别方法研究[D];哈尔滨工程大学;2011年
9 刘瑾;人脸识别中的大样本集问题及多模式图像融合方法的研究[D];天津大学;2006年
10 王汇源;基于线性子空间及环形对称GABOR变换的人脸识别算法研究[D];山东大学;2007年
中国硕士学位论文全文数据库 前10条
1 赵冬香;基于BP网络的脱机手写吾美藏文识别技术研究[D];青海师范大学;2009年
2 木塔力甫·沙塔尔;基于训练机制的联机维吾尔手写字母识别技术研究[D];大连海事大学;2010年
3 胡庆安;基于双重特征的协议识别方法研究[D];西南交通大学;2010年
4 孙娟红;车标识别方法研究[D];辽宁师范大学;2011年
5 严军;空间手写识别特征提取研究[D];浙江大学;2012年
6 陈胤子;手写识别算法研究及在移动平台上的应用[D];北京邮电大学;2011年
7 万芳;联机手写维吾尔文字识别技术的研究与实现[D];新疆大学;2007年
8 刘俊芳;人脸识别系统评测方法研究[D];中国石油大学;2008年
9 宁莹莹;基于主成分分析和样本融合的车标识别技术研究[D];辽宁师范大学;2008年
10 王杨;基于主元分析的人耳识别方法的研究[D];河北工业大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026