收藏本站
《华南理工大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

无约束联机手写中文文本识别

麦跃  
【摘要】:由于智能手机的普及,触摸屏已经成为人们日常生活中不可或缺的一部分,而触摸屏尺寸越来越大也为手写文本输入法提供了物质基础。12.5%的用户使用手写输入法,而且这个比例还逐年上升,这也提供了足够的用户基础。联机手写中文文本识别包括重叠手写识别和文本行手写识别。现有的研究主要针对长文本行,但是手写文本输入法更偏向于短文本行,而且目前也缺少重叠手写识别技术的相关研究。针对此真实应用场景,本文希望能研究完整的无约束联机手写中文文本识别技术,并且将其应用于移动设备的手写输入法中。为了完成这个目标,本文主要做了以下工作:(1)本文将传统的文本行识别技术应用于短文本行,同时也将这些技术应用于重叠手写,并且对其中的置信度转换函数、路径评价算法等关键技术进行研究。本文的置信度转换函数实验表明Sigmoidal形式对非字符的拒识能力只适用于文本行手写,并不适用于重叠手写,而证据形式则都能取得最好的效果。本文对不能适用于短文本的路径评价算法进行改进,其中修正的片段宽度加权路径评价准则函数和修正的片段数加权路径评价准则函数都比原来的算法效果要好。(2)因为单字分类器输出的数目(约10000)很多而且其类别也很复杂,本文提出短文本规则过滤来提高短文本的整句识别率。通过本文的规则处理,文本行识别模块的字符准确率相比传统方法从93.78%提升到94.23%,整句首候选识别率也从94.60%提升到95.17%。虽然本文使用的文本行切分算法在召回率方面并不理想,但是整句识别也获得85.98%的字符正确率,85.10%的字符准确率和83.93%的整句首候选识别率。(3)针对重叠手写模式下的单字识别问题,并且提出一种基于线密度的重叠手写判断算法,用于改善其识别率。该算法得到15.25%的单字相对错误率(RER)和1.69的相对错误率比例(RERR),并使单字首候选识别率相比传统方法从90.95%提升到92.33%。在使用该算法来改善单字识别率之后,重叠手写整句识别获得93.75%的字符正确率,93.13%的字符准确率,90.46%的整句首候选识别和92.33%的单字首候选识别率。(4)本文提出了淡化算法,还基于本文的文本识别技术设计了一个文本识别引擎以及相关架构,并且已经应用于基于Android系统的手写输入法——SCUT gPen手写输入法和SCUT gPen繁体版手写输入法,每天为超过5万名用户提供手写输入服务。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.43

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 杨钊;陶大鹏;张树业;金连文;;大数据下的基于深度神经网的相似汉字识别[J];通信学报;2014年09期
2 陈友斌;丁晓青;吴佑寿;;一种新的用于手写汉字识别的非线性规一化方法[J];模式识别与人工智能;1998年03期
3 金连文,徐秉铮;手写体汉字识别中的一种新的特征提取方法——弹性网格方向分解特征[J];电路与系统学报;1997年03期
4 钱跃良;林守勋;刘群;刘洋;刘宏;谢萦;;863计划中文信息处理与智能人机接口基础数据库的设计和实现[J];高技术通讯;2005年01期
中国博士学位论文全文数据库 前2条
1 高岩;基于大规模无约束数据的书写者自适应的中文手写识别系统研究[D];华南理工大学;2013年
2 苏统华;脱机中文手写识别—从孤立汉字到真实文本[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前4条
1 李东辉;重叠手写与左右随意写切分算法研究[D];华南理工大学;2014年
2 卫晓欣;基于长短型记忆递归神经网络的英文手写识别[D];华南理工大学;2014年
3 陈肇欣;联机手写汉字文本行识别算法研究[D];华南理工大学;2013年
4 严汉羽;联机无约束手写汉字文本行识别[D];华南理工大学;2011年
【共引文献】
中国期刊全文数据库 前10条
1 金连文;钟卓耀;杨钊;杨维信;谢泽澄;孙俊;;深度学习在手写汉字识别中的应用综述[J];自动化学报;2016年08期
2 杨颐;张桂刚;王健;黄卫星;苏海霞;;基于云计算的汉字文化数字化平台的架构研究[J];计算机科学;2016年07期
3 冯通;;基于深度学习的航空飞行器故障自助检测研究[J];计算机仿真;2015年11期
4 顾桓;田红;高妍;;一种基于云平台的包装印刷设备增值服务系统[J];包装工程;2015年15期
5 贾建忠;龚声蓉;衣马木艾山·阿布都力克木;;基于弹性网格混合特征的脱机手写维文识别[J];计算机应用与软件;2014年09期
6 姜文;卢朝阳;李静;;基于方向线素特征的手写体维文字符识别[J];微电子学与计算机;2013年10期
7 魏玮;郭向丹;;基于手写体汉字双弹性网格模糊特征的研究[J];控制工程;2012年06期
8 门光福;潘晨;柳长青;;基于弹性网格的西夏文字识别[J];中文信息学报;2011年05期
9 李惠清;;日语假名—汉字的函数特征提取识别技术[J];佛山科学技术学院学报(社会科学版);2011年03期
10 张凯兵;;一种多特征组合与多神经网络分类器集成的手写数字识别新方法[J];西华大学学报(自然科学版);2011年01期
中国博士学位论文全文数据库 前2条
1 高岩;基于大规模无约束数据的书写者自适应的中文手写识别系统研究[D];华南理工大学;2013年
2 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前3条
1 商俊蓓;基于双向长短时记忆递归神经网络的联机手写数字公式字符识别[D];华南理工大学;2015年
2 麦跃;无约束联机手写中文文本识别[D];华南理工大学;2015年
3 陈肇欣;联机手写汉字文本行识别算法研究[D];华南理工大学;2013年
【二级参考文献】
中国博士学位论文全文数据库 前5条
1 苏统华;脱机中文手写识别—从孤立汉字到真实文本[D];哈尔滨工业大学;2008年
2 龙腾;旋转方向无关的无约束手写中文词组识别[D];华南理工大学;2008年
3 杨端端;手写虚拟汉字识别研究及其在多通道短信交互系统中的应用[D];华南理工大学;2007年
4 高学;基于运动图像的手写汉字识别研究[D];华南理工大学;2003年
5 金连文;手写体汉字识别的研究[D];华南理工大学;1996年
中国硕士学位论文全文数据库 前1条
1 严汉羽;联机无约束手写汉字文本行识别[D];华南理工大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 兰杰;在西文状态下阅读中文文本文件[J];电脑知识;1997年02期
2 骆卫华,罗振声,宫小瑾;中文文本自动校对技术的研究[J];计算机研究与发展;2004年01期
3 顾益军,樊孝忠,于江德,李良富;受限领域中文文本主题标引系统研究[J];计算机应用;2004年01期
4 李长荣,阚戈;中文文本2-分类模型在上证指数趋势分析中的应用研究[J];齐齐哈尔大学学报;2005年02期
5 许细清;林世平;;面向中文文本的观点检索技术研究[J];福州大学学报(自然科学版);2010年05期
6 薛丽敏;李殿伟;肖斌;;中文文本情感倾向性五元模型研究[J];通信技术;2011年07期
7 韩清月;;浅谈对外传播中文文本的写作[J];对外传播;2012年10期
8 刘开瑛,薛翠芳,郑家恒,周晓强;中文文本中抽取特征信息的区域与技术[J];中文信息学报;1998年02期
9 刘晶茹,王开铸;中文文本自动校对技术研究及系统组成[J];电脑学习;1999年06期
10 游荣彦;中文文本简易压缩与即时加密研究[J];计算机工程与设计;1999年06期
中国重要会议论文全文数据库 前10条
1 郑天宏;许杭杰;董黎刚;;中文文本抄袭检查技术的研究[A];浙江省电子学会2010学术年会论文集[C];2010年
2 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
3 宋兰;孙茂松;;中文文本全文查重的实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 李思;张浩;徐蔚然;郭军;;基于合并模型的中文文本情感分析[A];第五届全国信息检索学术会议论文集[C];2009年
5 徐幸;王厚峰;;中文文本蕴含的推理模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 徐艳华;;中文文本中时间日期表达形式的自动检索[A];2004年辞书与数字化研讨会论文集[C];2004年
7 张云涛;龚玲;王永成;;识别中文文本中的未登录专有名词的类别[A];2007年中国智能自动化会议论文集[C];2007年
8 甘灿;孙星明;刘玉玲;向凌云;;一种改进的基于同义词替换的中文文本信息隐藏方法[A];第七届全国信息隐藏暨多媒体信息安全学术大会论文集[C];2007年
9 蒙应杰;司蕾;是垚;;基于矢量图形的中文文本零水印算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
10 肖志文;陈伟;梁久祯;雷彬;;基于LZW算法的中文文本压缩算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国重要报纸全文数据库 前4条
1 中国社科院法学所研究员 刘仁文;国际公约中文文本的纠错与重译[N];法制日报;2008年
2 詹亦文;签英文合同谨防陷阱[N];中国改革报;2003年
3 熊建;让汉字插上信息化的翅膀[N];人民日报;2013年
4 绨星;注意合同形式和背面条款[N];中国船舶报;2002年
中国博士学位论文全文数据库 前4条
1 张虎;面向中文文本的欺骗行为检测研究[D];山西大学;2014年
2 王鉴全;基于概念图挖掘的中文文本倾向性研究[D];大连理工大学;2012年
3 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
4 张春菊;中文文本中事件时空与属性信息解析方法研究[D];南京师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 罗广清;基于中文文本情感分类的情感宣泄系统的研究与实现[D];华南理工大学;2015年
2 陈健;自然场景的中文文本定位技术研究[D];华南理工大学;2015年
3 麦跃;无约束联机手写中文文本识别[D];华南理工大学;2015年
4 石敏;中文文本自动校对系统[D];江苏科技大学;2015年
5 孙刚;基于线性回归的中文文本可读性预测方法研究[D];南京大学;2015年
6 钟杰;基于文本语义及结构的中文文本相似度研究[D];江西财经大学;2015年
7 朱万山;中文文本褒贬倾向性分类研究[D];北方工业大学;2015年
8 张宁;基于语义的中文文本预处理研究[D];西安电子科技大学;2011年
9 夏恒;基于沙普利值的中文文本识错研究[D];湖北工业大学;2013年
10 徐琼;面向自然场景图像中的中文文本定位技术研究[D];南京邮电大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026