收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

手写文字识别及相关问题算法研究

甘吉  
【摘要】:作为信息表达和交流的重要工具,文字被广泛地应用于人们的日常生活和工作中。同时,手写也是每个人在社会中赖以生存的技能。随着计算机的发展和普及,手写文字识别作为一种高级的人机交互方式在近几十年来引起了人们的广泛关注。虽然研究者们在手写识别领域已经取得了大量突破性的进展,但是基于深度学习的手写识别算法仍然有很大的改进空间,因此如何设计更为准确高效的手写识别算法是本文的核心研究内容。另外,随着传感技术的发展,一种新型人机交互方式下的空中手写被提出,即用户可以直接使用手或手指在三维空间中自由地书写。然而,目前的空中手写识别研究仍然处于起步阶段,特别是针对空中手写中文文本识别的研究还处于一片空白。因此,空中手写识别也是本文的主要研究目标之一。本文主要的贡献总结如下:1.本文从一个全新的角度提出了一种基于一维卷积网络的联机手写汉字识别算法,即使用一维卷积网络直接对手写汉字轨迹的时序结构进行建模。本文提出的方法完全不同于目前主流的手写识别算法(包括基于二维卷积网络或循环神经网络的识别算法),并且具有显著的优势:(1)相比于二维卷积网络,提出的方法避免了经验化的领域知识来提取复杂的方向特征图,同时我们的模型参数更少且识别精度更高;(2)相比于循环神经网络,提出的方法能够并行地处理时序数据,其对于长序列手写轨迹的识别速度更快。2.本文提出了一种基于注意力机制的手写英文单词识别算法,该方法采用了编码-解码的架构并通过结合注意力机制迭代地输出目标字符串。同时,本文使用以下策略来进一步改进模型,包括:(1)我们使用一维卷积网络替代循环神经网络编码手写轨迹,显著地提升了模型的编码速度;(2)我们采用了词典约束的解码算法,显著地提升了模型的识别准确率。另外,我们构建了首个大规模的空中手写英文单词数据集IAHEW-UCAS2016用于促进后续的空中手写英文单词识别研究。最后,本文搭建了一个实用的空中手写英文单词识别系统。3.为了有效地识别联机手写中文文本,本文提出了一种新颖的时序卷积循环神经网络,其相比于现有的识别算法更具优势:(1)相比于主流的循环神经网络,提出的方法具有更快的计算速度和更高的识别准确率;(2)相比于最先进的全卷积循环网络,提出的方法避免了经验化的领域知识来提取复杂的特征图,同时模型的训练效率更高(包括更低的计算复杂度,更少的内存消耗,更快的收敛速度)且模型参数更少。为了进一步探究新型的空中手写,本文搭建了世界上首个三维空中手写中文文本识别系统。据我们所知,目前学术界还没有任何针对空中手写中文文本识别的研究。为此,我们构建并公开了首个大规模的空中手写中文文本数据集IAHCT-UCAS2018,从而促进后续的空中手写中文文本识别研究。4.本文提出了一种新颖的基于生成对抗网络的手写文本生成算法。现有的手写生成方法还没有完全地解决手写文本生成任务,因为它们都局限于生成较短的手写单词或者随机风格的手写文本图片。相反,本文提出的模型能够根据给定的任意文本生成任意长度的手写图片,其不局限于事先定义好的语料库或任何词汇表外的单词。同时,我们的模型能够从给定的参考样本中准确地提取出书写风格,从而进一步模仿生成具有相似风格的其它手写文本。实验分析表明本文提出的模型针对手写文本生成具有很好的泛化性,而不是单纯地记忆训练集中的真实手写样本。5.针对基于卷积神经网络的手写汉字识别模型,本文提出了新颖的一体化网络压缩算法。本文提出的压缩算法结合了通道裁剪和参数量化两种策略,能够在保证识别精度的前提下最大限度地压缩识别模型。具体地,在通道裁剪阶段,我们采用了粗细粒度相结合的裁剪策略来迭代地裁剪掉卷积网络中冗余的通道;在参数量化阶段,我们引入了权值丢弃和迭代式量化策略来最大限度地量化模型参数。在公开手写数据集(包括ICDAR-2013,IAHCC-UCAS2016,以及MNIST)上的实验结果表明提出的方法能够显著地压缩基于卷积神经网络的手写汉字识别模型。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 张开;岑翠;李林献;谢雨非;;基于蚁群算法的文字识别[J];信息与电脑(理论版);2019年22期
2 闫璟哲;;课程学习方法中文字识别算法研究[J];福建电脑;2020年04期
3 付飞飞;;场景文字识别算法的研究[J];福建电脑;2020年04期
4 蒲海波;潘勇浩;;改进的BP算法在文字识别中的应用[J];信息与电脑(理论版);2013年12期
5 刘水丽;吴恋;吴文宇;严东发;潘承昌;郭倩;;基于深度学习文字识别技术发展现状及展望[J];电脑知识与技术;2019年18期
6 白文荣;寿震坤;;蒙古文字识别之分类器的设计[J];教育教学论坛;2012年20期
7 ;新华智云推出25款媒体机器人,解决媒体人痛点[J];传媒;2019年17期
8 张华萍;黄辰;;文字识别技术研究[J];物联网技术;2018年08期
9 浦世亮;程战战;;基于注意力矫正的自然场景文字识别[J];中国公共安全;2017年09期
10 Jay;文字识别网上行[J];电脑应用文萃;2005年02期
11 盛寁;刘伟;;计算机文字识别的发展及应用[J];科技信息;2008年31期
12 柳玉辉;计算机文字识别的技术探讨与应用前景分析[J];软件工程师;1999年04期
13 郭军,马跃,盛立东,钟义信;发展中的文字识别理论与技术[J];电子学报;1995年10期
14 孙承鉴,张大华;手写文字识别技术及其在图书馆的应用[J];现代图书情报技术;1993年01期
15 徐航;;基于正则表达式的文字识别算法在管制航线文件处理中的应用研究[J];民航管理;2016年12期
16 徐富勇;;基于注意力增强网络的场景文字识别[J];现代计算机;2020年09期
17 弓耀辉;;图像文字识别中的预处理技术研究综述[J];信息通信;2017年09期
中国重要会议论文全文数据库 前20条
1 ;中文信息处理发展报告(2016) 第十七章 文字识别研究进展、现状及趋势[A];中文信息处理发展报告(2016)[C];2016年
2 胡瓯静;;标准数字化的初探[A];标准化助力供给侧结构性改革与创新——第十三届中国标准化论坛论文集[C];2016年
3 孙俊;黄开竹;于浩;岩见田均;;面向中国市场的文字识别技术研发[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 王景中;霍超;;基于OCR技术的盲用阅读器设计[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
5 于江德;肖新峰;樊孝忠;;基于隐马尔可夫模型的中文文本事件信息抽取[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
6 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
7 李思;张浩;徐蔚然;郭军;;基于合并模型的中文文本情感分析[A];第五届全国信息检索学术会议论文集[C];2009年
8 宋兰;孙茂松;;中文文本全文查重的实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 张岩;;中华民族文字识别统一平台(TH-OCR~)系列研究成果及应用[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
10 徐艳华;;中文文本中时间日期表达形式的自动检索[A];2004年辞书与数字化研讨会论文集[C];2004年
11 甘灿;孙星明;刘玉玲;向凌云;;一种改进的基于同义词替换的中文文本信息隐藏方法[A];第七届全国信息隐藏暨多媒体信息安全学术大会论文集[C];2007年
12 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
13 玉素甫.艾白都拉;潘伟民;热孜万;;笔式维吾尔文识别的中的文字切分研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
14 徐一;杨静;任志刚;杨迅幸;;基于学习的烟花算法[A];2018中国自动化大会(CAC2018)论文集[C];2018年
15 姚雪;;基于算法多样化培养学生思维习惯和创新精神[A];2019年“区域优质教育资源的整合研究”研讨会论文集[C];2019年
16 熊薇薇;吴怀宇;;一种改进的角点检测算法[A];中国计量协会冶金分会2009年年会论文集[C];2009年
17 陶丽;张自力;丁晓明;;一种适用于动态重构的联盟形成算法[A];2008年计算机应用技术交流会论文集[C];2008年
18 张兰平;;谈小学一年级算法多样化的优化[A];中华教育理论与实践科研论文成果选编(下)[C];2007年
19 杨红斌;;计划量算法的优化[A];第四届全国医院药剂科建设与管理学术研讨会论文集[C];2012年
20 林克旺;;基于分层网络实现高效的自稳定的选举算法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年
中国博士学位论文全文数据库 前20条
1 甘吉;手写文字识别及相关问题算法研究[D];中国科学院大学(中国科学院计算机科学与技术学院);2021年
2 张伟;基于n-gram的中文文本复制检测研究[D];湖南大学;2014年
3 冯新杰;面向自然场景汉字识别的非平衡性与抗攻击性研究[D];哈尔滨工业大学;2020年
4 王鉴全;基于概念图挖掘的中文文本倾向性研究[D];大连理工大学;2012年
5 王津;基于Valence-Arousal空间的中文文本情感分析方法研究[D];云南大学;2016年
6 姚超;降维算法和手写文字识别中若干问题研究[D];西安电子科技大学;2014年
7 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年
8 浮婷;算法“黑箱”与算法责任机制研究[D];中国社会科学院研究生院;2020年
9 王艳娇;人工蜂群算法的研究与应用[D];哈尔滨工程大学;2013年
10 李美安;普适分布式互斥算法及应用[D];电子科技大学;2007年
11 王小根;粒子群优化算法的改进及其在图像中的应用研究[D];江南大学;2009年
12 张虎;面向中文文本的欺骗行为检测研究[D];山西大学;2014年
13 刘婷;改进人工蜂群算法及其在多用户检测中的应用[D];天津大学;2013年
14 邱剑锋;人工蜂群算法的改进方法与收敛性理论的研究[D];安徽大学;2014年
15 肖建元;保几何结构算法在等离子体物理中的应用[D];中国科学技术大学;2017年
16 盛歆漪;粒子群优化算法及其应用研究[D];江南大学;2015年
17 张冬丽;人工蜂群算法的改进及相关应用研究[D];燕山大学;2014年
18 孔翔宇;几类优化问题的人工蜂群算法[D];西安电子科技大学;2016年
19 谭跃;具有混沌局部搜索策略的粒子群优化算法研究[D];中南大学;2013年
20 赵进慧;膜计算仿生优化算法及应用研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前20条
1 陈星灿;基于深度学习的教育场景文字识别算法研究[D];沈阳师范大学;2020年
2 詹科;基于深度学习的自然场景文字识别与模型加速的算法研究[D];北京工业大学;2020年
3 丁宇;基于深度学习的自然场景文字识别研究[D];山东科技大学;2020年
4 闫红松;基于深度学习的自然场景文字识别与生成算法研究[D];河南大学;2020年
5 杨海林;基于深度学习的古籍文字识别和检测[D];华南理工大学;2019年
6 李小璐;基于优化分割与提取的西夏古籍文字识别研究[D];宁夏大学;2019年
7 杨宏志;基于深度学习的自然场景文字识别[D];重庆邮电大学;2019年
8 游京翰;基于深度学习的文字序列识别系统[D];哈尔滨工业大学;2018年
9 刘兴长;基于改进模糊支持向量机的西夏文字识别研究[D];兰州交通大学;2019年
10 闫昆鹏;基于BiRNN的学生手写文字识别系统设计与实现[D];北京工业大学;2019年
11 陈玉新;基于深度学习的场景文字识别研究[D];内蒙古大学;2019年
12 李科;基于深度学习的路牌文字识别算法的研究与实现[D];湖南大学;2018年
13 高威威;基于深度学习的自然场景文字识别[D];安徽大学;2019年
14 赵星驰;基于深度学习的视频文字检测技术[D];北京邮电大学;2019年
15 张博;基于深度置信网络的图像识别算法研究[D];哈尔滨理工大学;2019年
16 邵文良;基于深度学习的医疗单据图文识别关键技术研究与实现[D];北京邮电大学;2019年
17 邹瑞杰;基于深度学习的自然英文文字识别的研究[D];电子科技大学;2019年
18 李其苏;场景物体与场景文本识别关键技术研究[D];南京大学;2016年
19 华绍君;基于图模型匹配的印章文字识别研究[D];湖南大学;2018年
20 冯玮;应用预处理技术的深度学习特征融合的文字识别算法[D];曲阜师范大学;2018年
中国重要报纸全文数据库 前20条
1 本报记者 计红梅;文字识别进入2.0时代[N];中国科学报;2015年
2 敬松 本报记者 熊筱伟;人工智能做数学还得跨过辨识应用题这道槛[N];四川日报;2017年
3 ;阿拉伯文文字识别系统[N];科技日报;2000年
4 清萱;清华东方文字识别技术(OCR)达国际领先水平[N];人民日报海外版;2002年
5 ;我国文字识别技术进入应用新阶段[N];人民邮电;2004年
6 记者 张建琛;文字识别技术为手机“扫盲”[N];科技日报;2005年
7 记者  赵凤华;少数民族文字识别系统研制成功[N];科技日报;2007年
8 ;文字识别技术成为搜索服务核心竞争力[N];人民邮电;2008年
9 ;中晶科技MICROTEK Phantom e7 拥有48位高色彩位深[N];中国计算机报;2002年
10 本报记者 武晓莉;给冰冷的算法注入温暖[N];中国消费者报;2021年
11 中青报·中青网见习记者 罗希;中青校媒联合上交大媒体与传播学院发起《提高“算法素养”倡议》[N];中国青年报;2021年
12 记者 任震宇;强化算法实施方的举证责任[N];中国消费者报;2021年
13 见习记者 陈友敏;消保委呼吁尽快出台算法规制[N];上海法治报;2021年
14 证券时报记者 江聃;网信办规范算法推荐 禁止实施流量造假控制热搜[N];证券时报;2021年
15 ;厘清滥用边界 九部门联手“算法治理”[N];北京商报;2021年
16 赵熙熙;科学家开发出纠错新算法[N];中国科学报;2017年
17 重庆市第四中级人民法院 艾庆平;赛博世界的算法规制[N];人民法院报;2020年
18 本报记者 张建军;“7G”智慧算法来了[N];经济日报;2019年
19 本报记者 倪弋;网络时代,应如何规范“算法”[N];人民日报;2018年
20 记者 张梦然;自动计算算法首次实现“虚拟展信”[N];科技日报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978