收藏本站
《北方工业大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

简化特征值的汉字识别研究

叶锋  
【摘要】:研发智能阅读器(盲人阅读器)的功用就是让眼疾患者能够阅读书籍,其中,文字识别技术(OCR)是其核心技术之一,也是计算机应用的一个方向。汉字识别是基于图像预处理,然后制定可行性解决方案来解决实际问题,其中特征的提取是关键。根据汉字图像的特征,使用一种编码方式,编出的码值表征这个汉字,码值与汉字具有一一对应关系,提取简化的特征值来实现汉字的识别,是本文的主要研究内容。 本文主要的研究内容包括:汉字图像预处理和汉字识别两大部分,其中预处理部分包括有图像灰度化、二值化、图像矫正、文字切分、归一化和细化等部分,最后输出的是骨架化的单字;识别部分主要包括特征提取和识别。在本文的讨论过程中,首先概述一些图像预处理的算法,预处理结果的好坏是识别率高低的关键因素之一,然后根据汉字图像预处理的结果,选取合适的简化的特征值,本文根据汉字结构特征提取得来。首先,根据汉字的结构特征,提取汉字图像的横子图、竖子图、撇子图和捺子图,其次,由这四幅子图组合,得到交点数;第三,由各自的子图,得到横笔划数、竖笔划数、撇笔划数和捺笔划数;第四,根据笔划像素,得到各笔划的长度,一共十种笔划长度类型。下一步,根据这些特征向量进行编码,根据本文所提取的特征值进行编码,可以得到较短的码值,不仅节省了内存空间,而且在后续进行模板匹配的时候,计算欧式距离也可以得到较快的速度,提高了识别速率。依照这个提取汉字图像特征值的方法,使用训练图像样本,建立标准汉字库。待识别汉字与特征库汉字进行匹配,采用模板匹配算法,最终达到识别的结果,输出汉字字符信息。通过实验比较与分析,得出此算法的识别率。 根据测试结果表明,本文所使用的一系列识别算法具有较高的识别速率,以及一定的准确度。为今后盲人阅读器更进一步的研发工作奠定了基础。
【学位授予单位】:北方工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.41

【参考文献】
中国期刊全文数据库 前10条
1 张世辉,孔令富;汉字识别及现状分析[J];燕山大学学报;2003年04期
2 丁晓青;汉字识别研究的回顾[J];电子学报;2002年09期
3 郭戈,闫继宏,蒋红梅,王君;基于结构特征的汉字识别[J];甘肃工业大学学报;2003年01期
4 许春晔,郭宝兰;基于Gabor函数的汉字字体识别[J];河北大学学报(自然科学版);2001年02期
5 倪桂博;张国立;;一种快速有效的印刷体汉字识别方法[J];华北电力大学学报(自然科学版);2008年03期
6 王琳琬,杨扬,颉斌,杨毅;基于连通域单元和穿越算法的汉字切分[J];信息技术;2004年04期
7 谢蓄芬,刘泊,王德军;一种改进BP神经网络在模式识别中的应用[J];哈尔滨理工大学学报;2004年05期
8 张鸽,陈书开;基于SVM的手写体阿拉伯数字识别[J];军民两用技术与产品;2005年09期
9 肖国强,陆枫,王多强;二值点阵图像的放大与缩小方法研究[J];华中理工大学学报;1994年12期
10 吴冰,秦志远;自动确定图像二值化最佳阈值的新方法[J];测绘学院学报;2001年04期
中国硕士学位论文全文数据库 前9条
1 张志彬;中文版面分析的研究[D];河北大学;2002年
2 黄春艳;图像分割若干算法研究[D];河南大学;2005年
3 梁涌;印刷体汉字识别系统的研究与实现[D];西北工业大学;2006年
4 李一舒;车牌字符识别的改进算法研究[D];浙江大学;2007年
5 刘维平;中文印刷体文档内容识别系统研究[D];哈尔滨工程大学;2007年
6 倪桂博;印刷体文字识别的研究[D];华北电力大学(河北);2008年
7 赵洋;基于图像分析的钢管厚度测量技术的研究[D];北方工业大学;2008年
8 王宏;印刷体汉字识别预处理的研究[D];大连理工大学;2008年
9 聂玖星;印刷体汉字识别系统的特征提取和匹配识别研究[D];大连理工大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 贺超英;黄美成;;一种基于无线通信技术的防盗系统[J];安防科技;2006年09期
2 张亚婷;;快速3D激光扫描技术中数据采集系统的设计[J];安防科技;2007年11期
3 谷曙媚;刘志坚;方厚辉;;基于ROI检测的视频监控图像增强方法[J];安防科技;2011年11期
4 周鸣争,汪军;基于直方图变换的弹痕图像增强技术及实现[J];安徽机电学院学报;2002年04期
5 周元一;王建平;;汉字多属性认知特征提取研究及应用[J];安徽工程科技学院学报(自然科学版);2006年02期
6 邱望标;朱金亮;;基于OpenCV的烟叶图像处理技术[J];安徽农业科学;2010年26期
7 王镇东;孙红星;邓永娣;赵楠楠;;手背静脉识别的图像处理算法[J];辽宁科技大学学报;2010年05期
8 谭定忠;邱英;高明;张厚琛;师柱;;基于CCD的激光扫描测距技术研究[J];半导体光电;2010年03期
9 桂志国;张鹏程;韩焱;王明泉;;基于拉格朗日插值的射线图像增强技术[J];半导体技术;2009年11期
10 钱大琳,孙艳丰;离散非平衡公交网络优化模型及其求解算法[J];北方交通大学学报;2001年02期
中国重要会议论文全文数据库 前10条
1 刘青峰;纪斌义;谢基龙;缪龙秀;;断裂力学裂纹扩展仿真技术-研究进展[A];第七届中国CAE工程分析技术年会暨2011全国计算机辅助工程(CAE)技术与应用高级研讨会论文集[C];2011年
2 谭守标;霍剑青;郝建;王晓蒲;赵永飞;谢行恕;;高分辨率软X射线显微成像下细胞的自动提取?[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 张友华;叶勇;;苹果形色特征的自动提取[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
4 卢韶芳;王琨;李瑜芳;陈运聪;;基于B样条曲线拟合的边界提取方法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
5 周灿林;李剑峰;徐建强;李方义;高成勇;司书春;王红星;;铝盖质量光学在线检测研究[A];中国光学学会2010年光学大会论文集[C];2010年
6 杨飞;刘刚;刘寅;孟庆宽;王泷;刘兆祥;;基于机器视觉的农机具自动导航系统[A];中国农业工程学会2011年学术年会论文集[C];2011年
7 代群;李晴;;ALOS卫星遥感影像的处理与图像解译[A];全国农业遥感技术研讨会论文集[C];2009年
8 王斐斐;魏建兵;文雅;吴志峰;;遥感湿地信息提取方法研究评述[A];全国国土资源与环境遥感应用技术研讨会论文集[C];2009年
9 陈光明;姚力;张家才;;图像非均匀像素技术[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
10 范科峰;曾庆宁;许钢;陈理光;;一种基于神经网络的虹膜识别算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 杨长强;激光扫描仪检校及车载激光点云的分类与矢量化研究[D];山东科技大学;2010年
2 李岳阳;彩色图像滤波算法的研究[D];江南大学;2010年
3 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
4 包健;有限精度权值神经网络优化的研究与应用[D];华东理工大学;2011年
5 黄永林;PCB光电检孔机关键技术研究及其系统实现[D];电子科技大学;2010年
6 鲁志波;医学图像增强与插值的算法研究[D];解放军信息工程大学;2007年
7 张寿明;基于冶炼过程及终点判断技术的烟化炉智能控制系统研究[D];昆明理工大学;2009年
8 陈家乾;移动机器人自主创建环境地图的研究[D];浙江大学;2009年
9 孙韶杰;模糊图像中感兴趣信息的盲复原方法研究[D];国防科学技术大学;2010年
10 王丹;多维多分辨仿生识别方法研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 陈国强;准双曲面齿轮接触图像齿形轮廓和接触斑点的二维重构[D];河南理工大学;2010年
2 黄冬琴;航空发动机精密铸件射线CR工艺研究[D];南昌航空大学;2010年
3 李瑞波;图像阴影的检测与去除算法研究[D];山东科技大学;2010年
4 蒲锰;非侵入式矿井提升机PLC电控系统实时故障诊断方法的研究[D];山东科技大学;2010年
5 张君通;基于FPGA的图像采集处理系统研究[D];长春理工大学;2010年
6 张亚军;有限状态设备的移动监视与识别方法的研究[D];浙江理工大学;2010年
7 韩亚丽;图像精密测量算法研究[D];郑州大学;2010年
8 姚慧娟;光视觉球形目标识别技术的研究[D];哈尔滨工程大学;2010年
9 仇晨光;动态场景中的运动目标检测与跟踪技术[D];哈尔滨工程大学;2010年
10 王孟岩;工程领域中虚拟现实艺术理论研究与实践[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 赵楠楠,欧阳鑫玉,吴庆洪;线性回归与Hough变换在计算图像倾斜角度中的应用[J];鞍山科技大学学报;2003年06期
2 李全信;圆曲线的拟合方法与精度分析[J];北京测绘;2001年03期
3 张少军,艾矫健,李忠富,李长江,李庆利;利用数字图像处理技术测量几何尺寸[J];北京科技大学学报;2002年03期
4 刘峡壁,贾云得;用于手写体汉字识别的汉字结构模型[J];北京理工大学学报;2003年03期
5 刘立波;基于数学形态学的二值图象细化算法[J];湖南文理学院学报(自然科学版);2004年02期
6 周颜军,王双成,王辉;基于贝叶斯网络的分类器研究[J];东北师大学报(自然科学版);2003年02期
7 张世辉,孔令富;汉字识别及现状分析[J];燕山大学学报;2003年04期
8 黄华贵;王巍;杜凤山;张芳;;基于数字图像处理的钢管自动识别计数系统开发[J];燕山大学学报;2006年01期
9 曹铁勇,杨吉斌,张雄伟;基于势能平衡的图像骨架抽取算法[J];东南大学学报(自然科学版);2003年06期
10 王军,周伟达;贝叶斯网络的研究与进展[J];电子科技;1999年15期
中国博士学位论文全文数据库 前2条
1 王正群;手写体汉字识别研究[D];南京理工大学;2001年
2 金连文;手写体汉字识别的研究[D];华南理工大学;1996年
中国硕士学位论文全文数据库 前10条
1 魏晓燕;基于数字图像处理的椭圆型孔径自动检测系统[D];南京师范大学;2002年
2 张志彬;中文版面分析的研究[D];河北大学;2002年
3 王宇;中文版面分析与重构研究[D];河北大学;2003年
4 陈浩;捆扎线材图像处理的识别方法研究[D];北方工业大学;2004年
5 曾洛军;圆钢端部图像识别的研究与处理[D];中南大学;2004年
6 丁慧东;脱机手写体汉字识别研究[D];东北师范大学;2005年
7 黄春艳;图像分割若干算法研究[D];河南大学;2005年
8 刘斌;基于奇异值分解的显微图像重叠细胞识别[D];吉林大学;2005年
9 高天孚;中文印刷体文档中的数学公式识别[D];哈尔滨工程大学;2005年
10 徐晓蓉;印刷体数学表达式识别系统的设计与实现[D];广西师范大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 ;汉语信息处理的三大技术[J];电脑知识与技术;1994年01期
2 范承亚,张素智,袁爱萍;汉字识别的预处理技术[J];郑州轻工业学院学报(自然科学版);1998年01期
3 丁晓青,刘长松;汉字识别的新突破和新进展──THOCR-97综合集成汉字识别系统和THOCR-2000自动电子出版系统研制成功[J];中国信息导报;1999年12期
4 张德喜,赵秋雨;神经-模糊技术在相似汉字识别中的应用[J];许昌学院学报;2005年02期
5 胡予濮;二指标隐马尔可夫过程及其在汉字识别中的应用[J];电子学报;1992年01期
6 张彩录,郭宝兰,张宇桐,韩勇,张宇铮;交替运用两种信源模型的汉字识别法[J];自动化学报;1994年01期
7 郭宝兰,张彩录,马颖丽,李素琴;可回溯点跟踪包含配选法印刷汉字识别[J];中国科学A辑;1989年05期
8 ;汉字识别技术的最新进展——清华文通THOCR-97综合集成汉字识别系统研制成功[J];电脑编程技巧与维护;1997年08期
9 刘宏申;用于研究汉字识别的软件平台[J];微机发展;2000年01期
10 韩燮,张永梅,刘幼立;汉字识别的方法及Rosen细化算法的改进[J];华北工学院学报;1997年01期
中国重要会议论文全文数据库 前10条
1 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 金奕江;马少平;;采用“否定概率和”合成两类判别的汉字识别方法[A];第八届全国汉字识别学术会议论文集[C];2002年
3 陆庆杭;张彬;盛立东;;基于PCI总线下的汉字识别加速硬件卡的实现[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
4 刘昌平;;汉字识别技术现状与展望[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 黎红;陈烜之;;汉字识别中的部件加工:错觉性结合实验的证据[A];第八届全国心理学学术会议文摘选集[C];1997年
6 邹寿颐;吴望名;;汉字识别的图形分析方法[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年
7 崔怀林;;一种手写汉字识别的笔划直接抽取算法[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
8 高学;金连文;尹俊勋;;基于笔划密度的弹性网格特征提取方法[A];2001年中国智能自动化会议论文集(上册)[C];2001年
9 管益杰;方富熹;;单字词的获得年龄对小学生汉字识别的影响[A];第九届全国心理学学术会议文摘选集[C];2001年
10 应宏微;;基于分形维数特征的车牌汉字识别[A];第二十四届中国控制会议论文集(下册)[C];2005年
中国重要报纸全文数据库 前10条
1 ;汉字识别的里程碑[N];中国计算机报;2000年
2 本报记者 朱烨洋;刘迎建 走科技创新之路[N];中国新闻出版报;2010年
3 王立群;教电脑识中文[N];中国计算机报;2005年
4 本报记者 顾雪林;梦想:让计算机具有人类的感知能力[N];中国教育报;2002年
5 王宇;技术开拓市场文通推动OCR产业化[N];科技日报;2006年
6 本报记者 向杰;刘迎建:昂首阔步三十年[N];科技日报;2008年
7 李典;汉王科技刘迎建:在电纸书的肩膀上眺望未来[N];经理日报;2009年
8 李将辉 高君明;创新发展是我们生存的唯一方式[N];人民政协报;2008年
9 记者 嵩文;OCR打出中国牌[N];计算机世界;2004年
10 柯文;二十步变一步怎么可能呢?[N];科技日报;2002年
中国博士学位论文全文数据库 前10条
1 陆燕玉;视觉假体中人工视觉最小信息需求及其优化研究[D];上海交通大学;2012年
2 苏统华;脱机中文手写识别—从孤立汉字到真实文本[D];哈尔滨工业大学;2008年
3 鲁斌;广义智能系统柔性超拓扑空间模型研究与应用[D];西北工业大学;2003年
4 林存真;汉字字体识别与公共空间应用性研究[D];中央美术学院;2012年
5 王建勤;外国学生汉字构形意识发展的模拟研究[D];北京语言大学;2005年
6 贡京京;面孔与汉字认知加工机制中的倒置效应—行为学及ERP研究[D];第四军医大学;2008年
7 李宁;认知发展:汉字输入中信息代码加工的理论与实践[D];华东师范大学;2009年
8 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
9 陈光;特定领域OCR系统的精度与速度问题研究[D];北京邮电大学;2007年
10 孙羽菲;低质量文本图像OCR技术的研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 叶锋;简化特征值的汉字识别研究[D];北方工业大学;2012年
2 曹琎;自然场景中汉字识别关键技术研究[D];西安电子科技大学;2010年
3 余成武;汉字识别的正字法加工方式[D];杭州师范大学;2011年
4 张晓戍;不同实验任务下东南亚留学生汉字识别中形音义的激活[D];福建师范大学;2012年
5 张臻;纳西族儿童汉字识别中的形、音、义激活[D];云南师范大学;2011年
6 蔡治;视角对汉字识别影响的研究[D];西南师范大学;2003年
7 刘煜星;基于MapReduce的汉字识别的研究与实现[D];华南理工大学;2011年
8 戴聪;基于仿真不规则光幻视阵列的汉字校正研究[D];上海交通大学;2010年
9 李鑫;基于神经网络分类器的汉字识别系统研究[D];辽宁工程技术大学;2005年
10 彭涛;基于统计的汉字识别后处理研究[D];河北大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026