收藏本站
《青岛大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的手写体字符识别

丁胜  
【摘要】:光学字符识别(OCR)是指将纸上的文字转化为计算机所能处理的形式(如ASCII码)的过程。手写体字符识别是光学字符识别的一个分支,手写体字符识别在邮政信件分拣、银行票据的自动处理、手机和掌上电脑的输入等领域有着巨大的作用。由于手写体字符的随意性,使其识别难度大于印刷体字符。而诞生于上世纪九十年代的支持向量机是一种基于小样本的新的统计学习方法,在许多方面(包括字符识别),都取得了优秀的效果。但是,传统的支持向量机训练算法在时间复杂度上面的表现不尽如人意,如果训练样本的数量过大,消耗的训练时间和存储空间会急剧增大。针对这种情况,本文提出一种改进算法,即尽量选择那些有可能成为支持向量的训练样本来具有针对性地加以训练,从而可以减少时间与空间的消耗。 本文主要做了以下工作: 1 由于核函数的存在,使得训练样本之间的距离在由输入空间到特征空间的映射之中产生了变化。为此,本文分析了训练样本之间的距离在输入空间与特征空间的联系。 2 本文针对不同的核函数,探讨并证明了训练样本在输入空间和特征空间的两个空间的距离之间的联系,并在此基础之上,提出一种基于KNN(K Nearest Neighbors)属性的训练样本选择方法,通过减少参加训练的样本数来减少训练所需要的时间。本文探讨了算法所选择的样本数。由于选择的样本数要小于原训练样本集而包含的支持向量却与原样本集相当,从而在减少训练时间的同时保持了分类正确率。 3 在MNIST和UCI的数据库上对本算法与SMO算法进行了对比实验,得到的结果是在辨识正确率基本不变的情况下,消耗的时间大量减少。
【关键词】:支持向量机 核函数 字符识别
【学位授予单位】:青岛大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.43
【目录】:
  • 第一章 绪论5-7
  • 1.1 研究背景及意义5-6
  • 1.2 本文的所做工作及内容安排6-7
  • 第二章 字符识别技术7-13
  • 2.1 预处理7-8
  • 2.2 特征提取8-12
  • 2.2.1 结构特征9-10
  • 2.2.2 统计特征10-11
  • 2.2.3 融合11-12
  • 2.3 分类12-13
  • 第三章 支持向量机(SVM)13-31
  • 3.1 支持向量机的理论基础13-20
  • 3.1.1 机器学习理论13-15
  • 3.1.2 统计学习理论与结构风险最小原理15-20
  • 3.2 标准支持向量机20-27
  • 3.2.1 线性可分的情况20-22
  • 3.2.2 非线性可分情况22-23
  • 3.2.3 线性不可分情况23-27
  • 3.3 支持向量机常见改进算法27-30
  • 3.4 支持向量机的多类分类方法30-31
  • 第四章 基于KNN的支持向量机改进算法31-43
  • 4.1 传统改进算法31-32
  • 4.2 本文算法32-37
  • 4.2.1 算法思想32-33
  • 4.2.2 输入空间与特征空间33-37
  • 4.3 本文算法37-43
  • 4.3.1 算法描述37-40
  • 4.3.2 算法40-43
  • 第五章 算法分析43-47
  • 5.1 引理43-45
  • 5.2 算法分析45-46
  • 5.3 算法吸纳样本数分析46-47
  • 第六章 算法实验47-53
  • 6.1 算法环境47-49
  • 6.2 算法结果49-53
  • 第七章算法总结与展望53-54
  • 参考文献54-57
  • 攻读学位期间的研究成果57-58
  • 致谢58-59
  • 学位论文独创性声明59
  • 学位论文知识产权权属声明59

【引证文献】
中国硕士学位论文全文数据库 前8条
1 莫咏柳;基于支持向量机的联机手写汉字识别的研究[D];太原理工大学;2011年
2 高保平;嵌入式字符识别技术的研究与开发[D];江南大学;2012年
3 杜晶;基于支持向量机的车牌字符识别研究[D];河北工程大学;2008年
4 郭宇;增强型成本分析自动入侵响应系统的研究[D];山西大学;2008年
5 薛晓军;触摸屏控制器设计及手写字符识别技术研究[D];浙江大学;2008年
6 李庆昌;基于神经树的英文字符识别技术研究[D];山东师范大学;2009年
7 李奎;基于HCC-SVM的字符识别技术研究[D];南京理工大学;2009年
8 温振市;轴承表面品质监测系统的研究与开发[D];江南大学;2013年
【参考文献】
中国期刊全文数据库 前2条
1 郑松峰,徐维朴,刘维湘,郑南宁;基于无监督聚类的约简支撑向量机[J];计算机工程与应用;2004年14期
2 杜彦蕊,杜海明;手写字符识别方法的研究[J];应用科技;2004年02期
中国博士学位论文全文数据库 前1条
1 陈才扣;基于核的非线性特征抽取与图象识别研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前1条
1 郭世杰;基于支持向量机的多类分类问题的研究[D];上海师范大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 刘兴远,方顺兴,姚忠国;建筑结构试验数据处理的几种方法[J];四川建筑科学研究;1993年02期
2 张燕平;提取特征规则的重复覆盖算法(RCA)[J];安徽大学学报(自然科学版);2002年02期
3 高湘萍;吴小培;沈谦;;基于脑电的意识活动特征提取与识别[J];安徽大学学报(自然科学版);2006年02期
4 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
5 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
6 吴凤凰;;模式识别在植物叶片识别中的应用[J];安徽农业科学;2007年01期
7 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
8 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
9 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
10 王继昌;庞祥武;;联机签名Bayes分类器设计算法[J];鞍山师范学院学报;2005年06期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
4 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
5 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九届中国控制会议论文集[C];2010年
6 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
7 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中国自动化学会控制理论专业委员会D卷[C];2011年
8 刘友强;李斌;奚宁;陈家骏;;基于双语平行语料的中文缩略语提取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 陈龙;吴志勇;袁春;蒙美玲;蔡莲红;;面向数字版权管理的声纹辅助认证系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
10 颜七笙;;基于PCA-SVM的动态联盟候选伙伴绩效评价方法[A];第十三届中国管理科学学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
3 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
4 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
5 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
6 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
7 许伟;基于进化算法的复杂化工过程智能建模方法及其应用[D];华东理工大学;2011年
8 吴锋;基于GPU并行计算的数值模拟与燃煤锅炉系统的优化研究[D];浙江大学;2010年
9 向国齐;支持向量回归机代理模型设计优化及应用研究[D];电子科技大学;2010年
10 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
3 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
4 韩冬振;远程诊断中心的设计与实现[D];郑州大学;2010年
5 刘磊;多泥沙河流水库优化调度研究[D];郑州大学;2010年
6 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
7 王巧立;微生物发酵过程的建模与优化控制研究[D];郑州大学;2010年
8 林天威;基于视频流的人脸识别系统研究[D];哈尔滨工程大学;2010年
9 韩艳;基于支持向量机的发酵过程建模研究[D];大连理工大学;2010年
10 马稳;基于支持向量机的模拟电路故障诊断研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 杨东林;于正林;;轴承钢球表面缺陷的快速检测方法[J];兵工学报;2009年06期
2 李倩;;文档图像的二值化算法综述[J];中国传媒大学学报(自然科学版);2008年04期
3 郭代飞,杨义先,胡正名;基于大规模网络的自适应入侵响应模型研究[J];北京邮电大学学报;2004年01期
4 董辛酉;姚砺;万燕;曾培峰;吴雄英;;纤维图像光照不均迭代修正算法[J];东华大学学报(自然科学版);2008年05期
5 宫蓉蓉;;基于SVM的手写体相似汉字识别[J];电脑与信息技术;2008年04期
6 金伟健;;手写体相似字识别方法研究[J];电脑知识与技术;2009年08期
7 龚雪容 ,马鸣锦 ,蒋烈辉 ,杜威;用ADS7846设计嵌入系统的触摸屏[J];电子产品世界;2002年17期
8 郭勇,吴乐南;行驶车辆的牌照识别系统[J];电子工程师;2000年11期
9 张耀麒;;应用于电阻式触摸屏的ADS7846控制器[J];电子科技;2006年09期
10 丁晓青;汉字识别研究的回顾[J];电子学报;2002年09期
中国博士学位论文全文数据库 前4条
1 王义文;钢球表面缺陷检测关键技术研究及样机研制[D];哈尔滨理工大学;2010年
2 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
3 龙腾;旋转方向无关的无约束手写中文词组识别[D];华南理工大学;2008年
4 李建美;标牌压印字符图像获取与处理中的关键技术研究[D];山东大学;2008年
中国硕士学位论文全文数据库 前10条
1 李杜;字符识别技术研究及其在机器视觉测控中的应用[D];江南大学;2011年
2 王昆;图像融合技术在微小轴承表面缺陷检测中的应用[D];吉林大学;2011年
3 顾晶;基于实虚笔段方向特征粗分方法的联机手写汉字识别[D];南京理工大学;2002年
4 沈培华;支持矢量机的算法研究和应用[D];南京理工大学;2002年
5 李了了;工业现场字符识别方法的研究[D];合肥工业大学;2003年
6 苏玉彬;基于神经网络的手写体字符识别技术研究[D];汕头大学;2003年
7 杜彦蕊;限制性手写体字符OCR识别方法的研究[D];哈尔滨工程大学;2003年
8 宋建锋;基于支撑向量机的手写英文字符识别[D];西安电子科技大学;2004年
9 王丽苹;自适应的分布式网络入侵检测及防御系统的研究与实现[D];西北大学;2004年
10 肖进;多神经网络在车牌字符识别中的应用[D];东南大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 高保平;白瑞林;温振市;;基于轮廓层次和小波分析的工业字符识别[J];计算机工程与设计;2012年06期
中国硕士学位论文全文数据库 前10条
1 许莉;基于网络风险评估的自动入侵响应系统的研究[D];电子科技大学;2011年
2 谢玉芯;手写体汉字识别方法研究[D];天津大学;2010年
3 吕轶超;结合底层特征和高层语义的图像检索技术研究[D];重庆大学;2011年
4 高保平;嵌入式字符识别技术的研究与开发[D];江南大学;2012年
5 刘静;基于小波分析的支持向量机车牌识别技术研究与实现[D];西北大学;2010年
6 赵晓娟;手写体数字及英文字符的识别研究[D];东北师范大学;2010年
7 赵少敏;尿沉渣图像的分割与识别算法的研究[D];重庆大学;2010年
8 薛瑞恒;基于计算机视觉的手写字符输入及识别[D];西北大学;2012年
9 邢佳莹;基于维度约简的木材含水率建模及回归预测方法研究[D];东北林业大学;2012年
10 高丽清;基于神经网络的车牌汉字识别方法研究[D];东北师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 刘党辉,沈兰荪,Kin-Man Lam;人脸识别研究进展[J];电路与系统学报;2004年01期
2 高西奇,周洪祥,何振亚;基于小波变换的主元分析人脸图象识别[J];东南大学学报;1996年02期
3 周杰,卢春雨,张长水,李衍达;人脸自动识别方法综述[J];电子学报;2000年04期
4 章高清,王申康;人脸的层次化描述模型及识别研究[J];计算机研究与发展;1999年12期
5 金忠,胡钟山,杨静宇,刘克,孙靖夷;手写体数字有效鉴别特征的抽取与识别[J];计算机研究与发展;1999年12期
6 杨健,杨静宇,金忠;最优鉴别特征的抽取及图像识别[J];计算机研究与发展;2001年11期
7 庄越挺,毛祎,吴飞,潘云鹤;基于隐马尔可夫链的广播新闻分割分类[J];计算机研究与发展;2002年09期
8 洪子泉,杨静宇;基于奇异值特征和统计模型的人像识别算法[J];计算机研究与发展;1994年03期
9 卢坚 ,陈毅松 ,孙正兴 ,张福炎;语音/音乐自动分类中的特征分析[J];计算机辅助设计与图形学学报;2002年03期
10 胡钟山,娄震,杨静宇,刘克,孙靖夷;基于多分类器组合的手写体数字识别[J];计算机学报;1999年04期
【相似文献】
中国期刊全文数据库 前10条
1 宁朝;基于SVM技术的英文字符识别方法[J];大众科技;2005年08期
2 严萍;曾金明;;一种有效的车牌字符识别法——模板匹配—特征点匹配相结合的车牌字符识别法[J];西昌学院学报(自然科学版);2011年01期
3 卢峥;史习智;王学军;;建筑工程中手写体常用数学符号的神经网络识别[J];模式识别与人工智能;1995年04期
4 陈振湘;帅建伟;刘瑞堂;吴伯僖;;运用四元数神经网络模型识别16色彩色字符[J];模式识别与人工智能;1995年S1期
5 胡健,汪庆宝,涂承宇;多层前向神经网络在手写体数字识别应用中的研究[J];北京工业大学学报;1996年04期
6 闫巧,王世军,谢维信,伍忠东;基于遗传-神经网络的字符识别[J];兰州铁道学院学报;2001年04期
7 高伟,刘喜平;基于粗糙集的车牌字符识别方法[J];山西大学学报(自然科学版);2005年03期
8 蔡文培;基于BP神经网络的车牌字符识别方法[J];福建电脑;2005年11期
9 胡乃平;王丽;;字符识别中改进的神经网络算法设计[J];自动化与仪器仪表;2006年02期
10 李知菲;胡平;;小波技术在车牌识别中的应用[J];黑龙江交通科技;2006年05期
中国重要会议论文全文数据库 前10条
1 岳思聪;王庆;赵荣椿;;基于骨架特征的手写体数字的结构化表示[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
2 孙羽菲;张玉志;;一种应用于字符识别的特征评价新方法[A];第八届全国汉字识别学术会议论文集[C];2002年
3 车扬;郑智捷;;速记字符识别的预处理模式和方法探讨[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
4 肖敏;黄磊;刘迎建;;数学公式识别系统[A];第八届全国汉字识别学术会议论文集[C];2002年
5 龙波;杨丽芳;肖健;梁莹;;大规模图文资料数字化的实现方法[A];广西计算机学会2007年年会论文集[C];2007年
6 赵杜娟;刘高平;黄华;齐春;;自编码神经网络车牌字符识别研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
7 许旭萍;臧道青;;采用Hopfield神经网络实施缸盖表面点阵字符识别[A];第十五届全国汽车检测技术年会论文集[C];2011年
8 庞云福;贲可荣;张秀山;;基于视频的英文字符识别系统设计[A];2006年全国理论计算机科学学术年会论文集[C];2006年
9 汤茂斌;谢渝平;李就好;;基于神经网络算法的字符识别方法研究[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
10 柳阳;刘峡壁;贾云得;;基于手势的文本输入方法及其在穿戴计算机中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 王庆国;票据印刷视觉字符检测系统中硬件的选择[N];中国包装报;2008年
2 张楠;安信信托旗下实业交大股东托管[N];中国证券报;2007年
3 记者  李锐;*ST安信能否被拯救?[N];上海证券报;2006年
4 记者 贠相忠 通讯员 孙启超 屈郁茗;应用档案系统,车辆过户只需三分钟[N];中国税务报;2010年
5 李将辉 高君明;创新发展是我们生存的唯一方式[N];人民政协报;2008年
6 ;纸质文档一键电子化[N];中国计算机报;2006年
7 李开复;搜索之路才刚刚起步[N];经济观察报;2006年
8 ;汉王OCR票据\表格\单据识别系统[N];电脑商报;2005年
9 钟彩;安信信托委托大股东管理银晨网讯[N];证券时报;2007年
10 杨艳群;标准尚未统一 技术仍需完善[N];中国交通报;2001年
中国博士学位论文全文数据库 前10条
1 张重阳;票据自动处理系统中的预处理技术研究[D];南京理工大学;2004年
2 刘杨;事件相关电位脑—机接口的最优设计[D];国防科学技术大学;2010年
3 李学勇;金属标牌压印凹凸字符的特征提取和识别方法研究[D];山东大学;2008年
4 彭健;多类小字符集自适应字符识别技术及系统的研究[D];重庆大学;2002年
5 李国平;基于莫尔技术的标牌凹凸字符图像获取与识别研究[D];山东大学;2007年
6 陈振学;基于特征显著性的目标识别方法及其应用研究[D];华中科技大学;2007年
7 张楠;低秩鉴别分析与回归分类方法研究[D];南京理工大学;2012年
8 郑晓东;基于样条模板滤波和双函数法的车牌自动识别[D];华中科技大学;2007年
9 李建美;标牌压印字符图像获取与处理中的关键技术研究[D];山东大学;2008年
10 丛键;视频流分层传输与流中文本识别[D];电子科技大学;2001年
中国硕士学位论文全文数据库 前10条
1 胡莹;联机手写数学公式识别系统的研究与实现[D];广州大学;2007年
2 周翟和;纸币读入识别系统的研究和实现[D];南京航空航天大学;2002年
3 谢晓艳;基于神经网络的车牌自动识别系统研究[D];湖南大学;2004年
4 贾志勇;汽车牌照自动识别技术研究[D];浙江工业大学;2005年
5 郭娟;车辆牌照自动识别系统[D];东北大学;2005年
6 李占斌;不停车收费系统中的车牌识别技术研究[D];中国海洋大学;2005年
7 董五洲;基于统计分类的混排字符切分算法的研究[D];燕山大学;2006年
8 陈军;基于支持向量机的脱机手写体汉字识别方法的研究[D];合肥工业大学;2006年
9 花蕾;智能园区车牌识别系统中关键技术的研究[D];西北大学;2006年
10 陈路;基于射影不变量的车牌字符识别[D];西安电子科技大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026